[nlp-infra-devel] POS modell és Szeged Korpusz letöltés
Veronika Vincze
vinczev at inf.u-szeged.hu
Fri Sep 9 21:41:02 CEST 2016
Kedves Balázs!
Egyelőre a korpuszos megjegyzésre reagálok:
On 2016.09.09. 21:01, Indig Balázs wrote:
> Kedves Mindenki!
>
> "Csak a modellek lesznek nyilvánosan elérhetők, a Szeged Korpusz
> szövegeinek eredeti tulajdonosai anno nem engedélyezték a nyilvános
> hozzáférhetőséget."
>
> Ezt a választ csak részben tudom elfogadni.
> Nyilván az "anno" óta eltelt már némi idő, valamint más a leányzó
> fekvése minekutána immár egy teljes nyílt forrású szoftver stack épül rá.
> Kár, hogy pont az alapja nem nyílt.
Én (illetve Szeged) továbbra is külön kezelné(m) a modelleket és a
korpuszt annak ellenére, hogy alapvetően mi is a szabad hozzáférés hívei
vagyunk. 1998-ban zajlott a Szeged Korpusz szövegeinek gyűjtése.
Akkoriban nyilván teljesen máshogy állt hozzá mindenki a szövegek szabad
publikálásához, mint manapság, és az újságírók is ragaszkodtak a szerzői
jogaikhoz. Azonban az akkori feltételek továbbra is köteleznek minket,
ha tetszik, ha nem... Különben pedig aki akarja, kutatási célokra
teljesen ingyenesen megkaphatja.
>
> Lehet, hogy túl későn, illetve túl könnyen beszélek (és a nyílt forrás
> náci szól belőlem), de lehet hogy felül kellene vizsgálni ezt a
> kérdést: azaz teljesen nyílt alapokra helyezni az egész rendszert.
>
Mi is örülnénk, ha lenne alternatív adatforrásunk, azaz megfelelően nagy
méretű, *kézzel annotál**t* szabad forrású korpuszunk POS-taggelve, dep
és konst elemzéssel, valamint NER-rel ellátva, de ennek hiányában a
Szeged Korpusszal kell beérni, és ha jól tudom, az INFRÁ-ba sem volt
dedikált korpuszépítés tervezve... De ha van valakinek jobb ötlete, vagy
egy titkos korpusza elfekvőben, szóljon! :)
Üdv:
Vera
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://corpus.nytud.hu/pipermail/nlp-infra-devel/attachments/20160909/688c681f/attachment.html>
More information about the nlp-infra-devel
mailing list