„WARC-GPT” változatai közötti eltérés

Innen: MIA
(Új oldal, tartalma: „A Harvard Law School Library kísérleti laboratóriuma által fejlesztett eszköz a nagy nyelvi modellek (LLM) felhasználására a webarchívumokban való természete…”)
 
 
6. sor: 6. sor:
 
* [https://lil.law.harvard.edu/blog/2024/02/12/warc-gpt-an-open-source-tool-for-exploring-web-archives-with-ai/ Matteo Cargnelutti - Kristi Mukk - Clare Stanton: WARC-GPT: An Open-Source Tool for Exploring Web Archives Using AI]
 
* [https://lil.law.harvard.edu/blog/2024/02/12/warc-gpt-an-open-source-tool-for-exploring-web-archives-with-ai/ Matteo Cargnelutti - Kristi Mukk - Clare Stanton: WARC-GPT: An Open-Source Tool for Exploring Web Archives Using AI]
 
* [https://lil.law.harvard.edu/blog/2024/04/04/a-modest-improvement-to-warc-gpt/ Ben Steinberg: A modest improvement to WARC-GPT]
 
* [https://lil.law.harvard.edu/blog/2024/04/04/a-modest-improvement-to-warc-gpt/ Ben Steinberg: A modest improvement to WARC-GPT]
  +
* [https://www.youtube.com/watch?v=Wq7gzmLjjz0 Matteo Cargnelutti - Kristi Mukk: WARC-GPT: An Open-Source Tool for Exploring Web Archives Using AI]
   
 
[[Category:SZOFTVEREK]]
 
[[Category:SZOFTVEREK]]

A lap jelenlegi, 2024. szeptember 1., 18:12-kori változata

A Harvard Law School Library kísérleti laboratóriuma által fejlesztett eszköz a nagy nyelvi modellek (LLM) felhasználására a webarchívumokban való természetes nyelvű kereséshez. A WARC-GPT többféle LLM rendszerrel is összekapcsolható és azok tudásbázisát RAG (Retrieval Augmented Generation) technikával egészíti ki a WARC fájlokból kinyert információkkal, így csökkentve a „hallucinálás” jelenségét. A nyílt forráskódú szoftver nagyrészt Python és JavaScript nyelven íródott, saját API és webes felület tartozik hozzá, és interaktív pontfelhődiagram formájában vizualizálni is tudja a vektor beágyazásokat. A chatbot a válasz mellett megadja a felhasznált forrásokat is a releváns szövegrészletekkel együtt, így a felhasználó ellenőrizheti a válasz helyességét és megtalálhatja a számára érdekes részeket a webarchívumon belül.