„OSCAR” változatai közötti eltérés

Innen: MIA
(Új oldal, tartalma: „= (Open Super-large Crawled Aggregated coRpus) = Gépi tanuláshoz és mesterséges intelligencia alkalmazásokhoz használható nyers (nem annotált), de jó minősé…”)
 
 
1. sor: 1. sor:
 
= (Open Super-large Crawled Aggregated coRpus) =
 
= (Open Super-large Crawled Aggregated coRpus) =
   
Gépi tanuláshoz és mesterséges intelligencia alkalmazásokhoz használható nyers (nem annotált), de jó minőségű szövegkorpuszok, melyeket nagy tömegű webes tartalomból szűrtek ki. Minden aratás anyaga külön korpuszként érhető el, a tárolási formátum tömörített JSON fájl. 2023-ban már 166 különböző nyelvre terjedt ki a gyűjtemény, mely ingyenesen használható, de a hozzáféréshez engedélyt kell kérni a cél megjelölésével. Az adatfájlok a Huma-Num vagy a HuggingFace platformon át érhetők el. A projektet német és francia intézmények finanszírozzák.
+
Gépi tanuláshoz és mesterséges intelligencia alkalmazásokhoz használható nyers (nem annotált), de jó minőségű szövegkorpuszok, melyeket nagy tömegű webes tartalomból szűrtek ki. Minden aratás anyaga külön korpuszként érhető el, a tárolási formátum tömörített JSON fájl. 2023-ban már 166 különböző nyelvre terjedt ki a gyűjtemény, mely ingyenesen használható, de a hozzáféréshez engedélyt kell kérni a cél megjelölésével. Az adatfájlok a Huma-Num vagy a HuggingFace platformon át érhetők el. A projektet német és francia intézmények finanszírozzák.
   
 
----
 
----

A lap jelenlegi, 2023. július 11., 10:28-kori változata

(Open Super-large Crawled Aggregated coRpus)

Gépi tanuláshoz és mesterséges intelligencia alkalmazásokhoz használható nyers (nem annotált), de jó minőségű szövegkorpuszok, melyeket nagy tömegű webes tartalomból szűrtek ki. Minden aratás anyaga külön korpuszként érhető el, a tárolási formátum tömörített JSON fájl. 2023-ban már 166 különböző nyelvre terjedt ki a gyűjtemény, mely ingyenesen használható, de a hozzáféréshez engedélyt kell kérni a cél megjelölésével. Az adatfájlok a Huma-Num vagy a HuggingFace platformon át érhetők el. A projektet német és francia intézmények finanszírozzák.