[nlp-infra-devel] kérés: írjatok a listára, amint vmi elkészül -- newsml korpusz, tanítás

Sass Bálint joker at nytud.hu
Tue Aug 2 14:01:58 CEST 2016


Kösz szépen! :)
Bálint

Ezt írta ma Jani:
> Sziasztok,
>
> Mellékeltem a java kódot.
>
> 2016.08.02. 12:13 keltezéssel, Sass Bálint írta:
>> Kedves Jani!
>> 
>> Ez tök jó!
>> Küldd el légyszi a java kódot, az nagyon is járható út. :)
>> 
>> Az 'Adv' és a 'SubPos=x' között még van egy TAB, azaz 8 mező van, ugye?
>> Ezek: id token lemma pos feat depTarget depType
>> 
>> A token/lemma/pos/feat formátum a dep-re és konst-ra is vonatkozik, 
>> ugye?
>> 
>> Kösz szépen:
>> Bálint
>> 
>> Ezt írtad ma:
>>> Sziasztok,
>>> 
>>> Egy példasor a trainből:
>>> 
>>> 19 ismét ismét AdvSubPOS=x|Deg=none|Num=none|Per=none 20 MODE
>>> 
>>> ahol
>>> - az Adv a hfst által megadott szófaj
>>> - a SubPOS=x|Deg=none|Num=none|Per=none pedig a morfológiai jegyekből 
>>> kinyert feature-ök
>>> 
>>> A szófafaj kinyerése viszonylag egyszerű, 1-2 (egyelőre) hibás hfts 
>>> output esetet (pl. [Adj][Nom]) leszámítva.
>>> A morfológiai feature-ök a mate számára pedig a CoNLL 2009 formátum 
>>> alapján történnek.
>>> 
>>> Mindkettőre van nagyon megírt, egyszerű java kódom, amit el tudok 
>>> küldeni, amennyiben a java járható út.




More information about the nlp-infra-devel mailing list