ChemAgent: didelių kalbų modelių tobulinimas sudėtingam cheminiam samprotavimui naudojant dinaminės atminties sistemas

Cheminis samprotavimas apima sudėtingus, kelių etapų procesus, reikalaujančius tikslių skaičiavimų, kai mažos klaidos gali sukelti didelių problemų. LLM dažnai susiduria su specifiniais domeno iššūkiais, pvz., Tikslus cheminių formulių valdymas, sudėtingų žingsnių samprotavimas ir efektyvus kodo integravimas. Nepaisant mokslinių samprotavimų pažangos, tokie etalonai kaip „SciBench“ atskleidžia LLM apribojimus sprendžiant chemines problemas ir pabrėžia naujoviškų metodų poreikį. Naujausios sistemos, tokios kaip StructChem, bando spręsti šiuos iššūkius struktūrizuodami problemų sprendimą į tokius etapus kaip formulių generavimas ir pasitikėjimu pagrįstos peržiūros. Taip pat buvo ištirtos kitos technikos, įskaitant pažangias raginimo strategijas ir Python pagrindu veikiančius samprotavimo įrankius. Pavyzdžiui, „ChemCrow“ naudoja funkcijų iškvietimą ir tikslų kodų generavimą, kad būtų galima išspręsti su chemija susijusias užduotis, o LLM derinimas su išoriniais įrankiais, tokiais kaip Wolfram Alpha, rodo potencialą pagerinti mokslinių problemų sprendimo tikslumą, nors integracija tebėra iššūkis.

Sudėtingų problemų išskaidymas į mažesnes užduotis pagerino modelio samprotavimą ir tikslumą, ypač daugiapakopėse cheminėse problemose. Tyrimai pabrėžia užklausų suskaidymo į valdomus komponentus, supratimo ir našumo gerinimą tokiose srityse kaip skaitymo supratimas ir sudėtingų atsakymų į klausimus pranašumai. Be to, savaiminės evoliucijos metodai, kai LLM patobulina savo rezultatus kartodami tobulėjimą ir greitą evoliuciją, parodė pažadą. Atmintis patobulintos sistemos, įrankių pagalba atliekama kritika ir savęs patikrinimo metodai sustiprina LLM galimybes, įgalindami klaidų taisymą ir tobulinimą. Šios pažangos sudaro pagrindą kurti keičiamo dydžio sistemas, galinčias susidoroti su sudėtingais cheminiais samprotavimais, išlaikant tikslumą ir efektyvumą.

Tyrėjai iš Jeilio universiteto, UIUC, Stanfordo universiteto ir Šanchajaus Jiao Tong universiteto pristatė ChemAgent – sistemą, kuri pagerina LLM našumą per dinamišką, savaime atnaujinamą biblioteką. ChemAgent išskaido chemines užduotis į papildomas užduotis, išsaugodamas jas ir jų sprendimus struktūrinėje atminties sistemoje. Ši sistema apima planavimo atmintį strategijoms, vykdymo atmintį konkrečioms užduotims skirtiems sprendimams ir žinių atmintį pagrindiniams principams. Sprendžiant naujas problemas, „ChemAgent“ nuskaito, patikslina ir atnaujina atitinkamą informaciją, kad būtų galima mokytis kartotiniu būdu. Išbandyta naudojant „SciBench“ duomenų rinkinius, „ChemAgent“ pagerino tikslumą iki 46 % (GPT-4), pranokdama naujausius metodus ir parodydama, kad galima naudoti tokias programas kaip vaistų atradimas.

ChemAgent yra sistema, skirta tobulinti LLM sudėtingoms cheminėms problemoms spręsti. Jis organizuoja užduotis į struktūrizuotą atmintį, kurią sudaro trys komponentai: planavimo atmintis (strategijos), vykdymo atmintis (sprendimai) ir žinių atmintis (cheminiai principai). Bibliotekoje, sukurtoje iš patikrintų sprendimų, problemos suskirstytos į smulkesnes užduotis. Atitinkamos užduotys yra nuskaitomos, tobulinamos ir dinamiškai atnaujinamos atliekant išvadas, kad būtų padidintas prisitaikymas. ChemAgent pranoksta bazinius modelius (Few-shot, StructChem) keturiuose duomenų rinkiniuose, todėl pasiekiamas didelis tikslumas dėl struktūrinės atminties ir kartotinio tobulinimo. Jo hierarchinis požiūris ir atminties integravimas sukuria veiksmingą pažangių cheminio samprotavimo užduočių pagrindą.

Tyrime įvertinami „ChemAgent“ atminties komponentai (Mp, Me, Mk), siekiant nustatyti jų indėlį, naudojant GPT-4 kaip pagrindinį modelį. Rezultatai rodo, kad pašalinus bet kurį komponentą sumažėja našumas, o Mk yra labiausiai paveikiamas, ypač duomenų rinkiniuose, tokiuose kaip ATKINS su ribotais atminties telkiniais. Atminties kokybė yra labai svarbi, nes GPT-4 sugeneruotos atmintinės pranoksta GPT-3.5, o hibridinės atminties pablogina tikslumą dėl prieštaringų įvesties duomenų. „ChemAgent“ demonstruoja nuoseklų įvairių LLM našumo gerinimą, o ryškiausius galingų modelių, tokių kaip GPT-4, pranašumus. Savaime atsinaujinantis atminties mechanizmas pagerina problemų sprendimo galimybes, ypač sudėtinguose duomenų rinkiniuose, kuriems reikalingos specialios cheminės žinios ir loginis samprotavimas.

Apibendrinant galima pasakyti, kad „ChemAgent“ yra sistema, kuri pagerina LLM sprendžiant sudėtingas chemines problemas per savarankišką tyrinėjimą ir dinamišką, savaime atnaujinamą atminties biblioteką. Išskaidydama užduotis į planavimo, vykdymo ir žinių komponentus, „ChemAgent“ sukuria struktūrinę biblioteką, kad pagerintų užduočių skaidymą ir sprendimų generavimą. Eksperimentai su duomenų rinkiniais, tokiais kaip „SciBench“, rodo reikšmingą našumo padidėjimą, ty iki 46 % pagerėjimo naudojant GPT-4. Sistema veiksmingai sprendžia cheminio samprotavimo iššūkius, tokius kaip konkrečios srities formulių ir kelių etapų procesų tvarkymas. Jis žada platesnį pritaikymą vaistų atradimui ir medžiagų mokslui.

Patikrinkite Popierius ir GitHub puslapis. Visi nuopelnai už šį tyrimą tenka šio projekto tyrėjams. Taip pat nepamirškite sekti mūsų Twitter ir prisijunk prie mūsų Telegramos kanalas ir LinkedIn group. Nepamirškite prisijungti prie mūsų 65k+ ML SubReddit.

🚨 Rekomenduokite atvirojo kodo platformą: „Parlant“ yra sistema, pakeičianti tai, kaip dirbtinio intelekto agentai priima sprendimus klientams skirtuose scenarijuose. ^{(Paaukštintas)}

Sana Hassan, „Marktechpost“ konsultacinė praktikantė ir „IIT Madras“ dviejų laipsnių studentė, aistringai taiko technologijas ir dirbtinį intelektą sprendžiant realaus pasaulio iššūkius. Labai domisi praktinių problemų sprendimu, jis atneša naują požiūrį į AI ir realaus gyvenimo sprendimų sankirtą.

📄 Susipažinkite su „Aukštis”: vienintelis savarankiškas projektų valdymo įrankis (remiama)

Source link

ChemAgent: didelių kalbų modelių tobulinimas sudėtingam cheminiam samprotavimui naudojant dinaminės atminties sistemas

Latest News

Kauno miesto savivaldybė Dėl asfaltavimo darbų – eismo ribojimai Birželio 23-iosios gatvėje

„Claude Chrome“ plėtinio trūkumas leidžia kenkėjiškiems plėtiniams suaktyvinti AI veiksmus

Kauno miesto savivaldybė Kauno miesto savivaldybė skelbia pakartotinį Kauno miesto savivaldybei nuosavybės teise priklausančių viešosios įstaigos „Prisikėlimo projektai“ dalininko teisių pardavimą viešo aukciono būdu

Geriausi generaciniai AI įrankiai, kuriuos turėtumėte išbandyti 2026 m

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Latest News

Kauno miesto savivaldybė Dėl asfaltavimo darbų – eismo ribojimai Birželio 23-iosios gatvėje

„Claude Chrome“ plėtinio trūkumas leidžia kenkėjiškiems plėtiniams suaktyvinti AI veiksmus

Kauno miesto savivaldybė Kauno miesto savivaldybė skelbia pakartotinį Kauno miesto savivaldybei nuosavybės teise priklausančių viešosios įstaigos „Prisikėlimo projektai“ dalininko teisių pardavimą viešo aukciono būdu

Geriausi generaciniai AI įrankiai, kuriuos turėtumėte išbandyti 2026 m