[nlp-infra-devel] kérés: írjatok a listára, amint vmi elkészül -- newsml korpusz, tanítás

Sass Bálint joker at nytud.hu
Tue Aug 2 12:13:31 CEST 2016


Kedves Jani!

Ez tök jó!
Küldd el légyszi a java kódot, az nagyon is járható út. :)

Az 'Adv' és a 'SubPos=x' között még van egy TAB, azaz 8 mező van, ugye?
Ezek: id token lemma pos feat depTarget depType

A token/lemma/pos/feat formátum a dep-re és konst-ra is vonatkozik, ugye?

Kösz szépen:
Bálint

Ezt írtad ma:
> Sziasztok,
>
> Egy példasor a trainből:
>
> 19 ismét ismét AdvSubPOS=x|Deg=none|Num=none|Per=none 20 MODE
>
> ahol
> - az Adv a hfst által megadott szófaj
> - a SubPOS=x|Deg=none|Num=none|Per=none pedig a morfológiai jegyekből 
> kinyert feature-ök
>
> A szófafaj kinyerése viszonylag egyszerű, 1-2 (egyelőre) hibás hfts output 
> esetet (pl. [Adj][Nom]) leszámítva.
> A morfológiai feature-ök a mate számára pedig a CoNLL 2009 formátum 
> alapján történnek.
>
> Mindkettőre van nagyon megírt, egyszerű java kódom, amit el tudok küldeni, 
> amennyiben a java járható út.




More information about the nlp-infra-devel mailing list