[nlp-infra-devel] POS modell és Szeged Korpusz letöltés

Indig Balázs indig.balazs at itk.ppke.hu
Fri Sep 9 22:32:14 CEST 2016


Csak a flame kedvéért:

"1998-ban zajlott a Szeged Korpusz szövegeinek gyűjtése. Akkoriban nyilván
teljesen máshogy állt hozzá mindenki a szövegek szabad publikálásához, mint
manapság, és az újságírók is ragaszkodtak a szerzői jogaikhoz. Azonban az
akkori feltételek továbbra is köteleznek minket, ha tetszik, ha nem..."

Hipotetikusan, mivel nincs realitása már csak azért sem mert "az INFRÁ-ba
sem volt dedikált korpuszépítés tervezve", újra lehetne tárgyalni a
feltételeket az eredeti szerzőkkel. Legalább részlegesen:

1984:
http://mek.oszk.hu/00800/00896/

Utas és a holdvilág:
http://mek.oszk.hu/01000/01080/

Piszkos Fred, a kapitány:
http://mek.oszk.hu/01000/01064/

Ebből egy szabadon elérhető demo részkorpusz kijönne...
És akkor "bárki játszhatna" kedvére...


A technikai kérdésre továbbra is várom a megoldást.
Előre is köszönöm!

Balázs


2016. szeptember 9. 21:41 Veronika Vincze írta, <vinczev at inf.u-szeged.hu>:

> Kedves Balázs!
>
> Egyelőre a korpuszos megjegyzésre reagálok:
>
> On 2016.09.09. 21:01, Indig Balázs wrote:
>
> Kedves Mindenki!
>
> "Csak a modellek lesznek nyilvánosan elérhetők, a Szeged Korpusz
> szövegeinek eredeti tulajdonosai anno nem engedélyezték a nyilvános
> hozzáférhetőséget."
>
> Ezt a választ csak részben tudom elfogadni.
> Nyilván az "anno" óta eltelt már némi idő, valamint más a leányzó fekvése
> minekutána immár egy teljes nyílt forrású szoftver stack épül rá.
> Kár, hogy pont az alapja nem nyílt.
>
> Én (illetve Szeged) továbbra is külön kezelné(m) a modelleket és a
> korpuszt annak ellenére, hogy alapvetően mi is a szabad hozzáférés hívei
> vagyunk. 1998-ban zajlott a Szeged Korpusz szövegeinek gyűjtése. Akkoriban
> nyilván teljesen máshogy állt hozzá mindenki a szövegek szabad
> publikálásához, mint manapság, és az újságírók is ragaszkodtak a szerzői
> jogaikhoz. Azonban az akkori feltételek továbbra is köteleznek minket, ha
> tetszik, ha nem... Különben pedig aki akarja, kutatási célokra teljesen
> ingyenesen megkaphatja.
>
>
> Lehet, hogy túl későn, illetve túl könnyen beszélek (és a nyílt forrás
> náci szól belőlem), de lehet hogy felül kellene vizsgálni ezt a kérdést:
> azaz teljesen nyílt alapokra helyezni az egész rendszert.
>
> Mi is örülnénk, ha lenne alternatív adatforrásunk, azaz megfelelően nagy
> méretű, *kézzel annotál**t* szabad forrású korpuszunk POS-taggelve, dep
> és konst elemzéssel, valamint NER-rel ellátva, de ennek hiányában a Szeged
> Korpusszal kell beérni, és ha jól tudom, az INFRÁ-ba sem volt dedikált
> korpuszépítés tervezve... De ha van valakinek jobb ötlete, vagy egy titkos
> korpusza elfekvőben, szóljon! :)
>
> Üdv:
> Vera
>
>
> _______________________________________________
> nlp-infra-devel mailing list
> nlp-infra-devel at nytud.mta.hu
> http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel
>
>
--------- k�vetkez� r�sz ---------
Egy csatolt HTML �llom�ny �t lett konvert�lva...
URL: <http://corpus.nytud.hu/pipermail/nlp-infra-devel/attachments/20160909/20eadca3/attachment-0001.html>


More information about the nlp-infra-devel mailing list