[nlp-infra-devel] POS modell és Szeged Korpusz letöltés

Veronika Vincze vinczev at inf.u-szeged.hu
Fri Sep 9 21:41:02 CEST 2016


Kedves Balázs!

Egyelőre a korpuszos megjegyzésre reagálok:

On 2016.09.09. 21:01, Indig Balázs wrote:
> Kedves Mindenki!
>
> "Csak a modellek lesznek nyilvánosan elérhetők, a Szeged Korpusz 
> szövegeinek eredeti tulajdonosai anno nem engedélyezték a nyilvános 
> hozzáférhetőséget."
>
> Ezt a választ csak részben tudom elfogadni.
> Nyilván az "anno" óta eltelt már némi idő, valamint más a leányzó 
> fekvése minekutána immár egy teljes nyílt forrású szoftver stack épül rá.
> Kár, hogy pont az alapja nem nyílt.
Én (illetve Szeged) továbbra is külön kezelné(m) a modelleket és a 
korpuszt annak ellenére, hogy alapvetően mi is a szabad hozzáférés hívei 
vagyunk. 1998-ban zajlott a Szeged Korpusz szövegeinek gyűjtése. 
Akkoriban nyilván teljesen máshogy állt hozzá mindenki a szövegek szabad 
publikálásához, mint manapság, és az újságírók is ragaszkodtak a szerzői 
jogaikhoz. Azonban az akkori feltételek továbbra is köteleznek minket, 
ha tetszik, ha nem... Különben pedig aki akarja, kutatási célokra 
teljesen ingyenesen megkaphatja.
>
> Lehet, hogy túl későn, illetve túl könnyen beszélek (és a nyílt forrás 
> náci szól belőlem), de lehet hogy felül kellene vizsgálni ezt a 
> kérdést: azaz teljesen nyílt alapokra helyezni az egész rendszert.
>
Mi is örülnénk, ha lenne alternatív adatforrásunk, azaz megfelelően nagy 
méretű, *kézzel annotál**t* szabad forrású korpuszunk POS-taggelve, dep 
és konst elemzéssel, valamint NER-rel ellátva, de ennek hiányában a 
Szeged Korpusszal kell beérni, és ha jól tudom, az INFRÁ-ba sem volt 
dedikált korpuszépítés tervezve... De ha van valakinek jobb ötlete, vagy 
egy titkos korpusza elfekvőben, szóljon! :)

Üdv:
Vera

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://corpus.nytud.hu/pipermail/nlp-infra-devel/attachments/20160909/688c681f/attachment.html>


More information about the nlp-infra-devel mailing list