„WARC-GPT” változatai közötti eltérés
(Új oldal, tartalma: „A Harvard Law School Library kísérleti laboratóriuma által fejlesztett eszköz a nagy nyelvi modellek (LLM) felhasználására a webarchívumokban való természete…”) |
|||
6. sor: | 6. sor: | ||
* [https://lil.law.harvard.edu/blog/2024/02/12/warc-gpt-an-open-source-tool-for-exploring-web-archives-with-ai/ Matteo Cargnelutti - Kristi Mukk - Clare Stanton: WARC-GPT: An Open-Source Tool for Exploring Web Archives Using AI] |
* [https://lil.law.harvard.edu/blog/2024/02/12/warc-gpt-an-open-source-tool-for-exploring-web-archives-with-ai/ Matteo Cargnelutti - Kristi Mukk - Clare Stanton: WARC-GPT: An Open-Source Tool for Exploring Web Archives Using AI] |
||
* [https://lil.law.harvard.edu/blog/2024/04/04/a-modest-improvement-to-warc-gpt/ Ben Steinberg: A modest improvement to WARC-GPT] |
* [https://lil.law.harvard.edu/blog/2024/04/04/a-modest-improvement-to-warc-gpt/ Ben Steinberg: A modest improvement to WARC-GPT] |
||
+ | * [https://www.youtube.com/watch?v=Wq7gzmLjjz0 Matteo Cargnelutti - Kristi Mukk: WARC-GPT: An Open-Source Tool for Exploring Web Archives Using AI] |
||
[[Category:SZOFTVEREK]] |
[[Category:SZOFTVEREK]] |
A lap jelenlegi, 2024. szeptember 1., 18:12-kori változata
A Harvard Law School Library kísérleti laboratóriuma által fejlesztett eszköz a nagy nyelvi modellek (LLM) felhasználására a webarchívumokban való természetes nyelvű kereséshez. A WARC-GPT többféle LLM rendszerrel is összekapcsolható és azok tudásbázisát RAG (Retrieval Augmented Generation) technikával egészíti ki a WARC fájlokból kinyert információkkal, így csökkentve a „hallucinálás” jelenségét. A nyílt forráskódú szoftver nagyrészt Python és JavaScript nyelven íródott, saját API és webes felület tartozik hozzá, és interaktív pontfelhődiagram formájában vizualizálni is tudja a vektor beágyazásokat. A chatbot a válasz mellett megadja a felhasznált forrásokat is a releváns szövegrészletekkel együtt, így a felhasználó ellenőrizheti a válasz helyességét és megtalálhatja a számára érdekes részeket a webarchívumon belül.