[nlp-infra-devel] kérés: írjatok a listára, amint vmi elkészül -- newsml korpusz, tanítás
Sass Bálint
joker at nytud.hu
Tue Aug 2 12:13:31 CEST 2016
Kedves Jani!
Ez tök jó!
Küldd el légyszi a java kódot, az nagyon is járható út. :)
Az 'Adv' és a 'SubPos=x' között még van egy TAB, azaz 8 mező van, ugye?
Ezek: id token lemma pos feat depTarget depType
A token/lemma/pos/feat formátum a dep-re és konst-ra is vonatkozik, ugye?
Kösz szépen:
Bálint
Ezt írtad ma:
> Sziasztok,
>
> Egy példasor a trainből:
>
> 19 ismét ismét AdvSubPOS=x|Deg=none|Num=none|Per=none 20 MODE
>
> ahol
> - az Adv a hfst által megadott szófaj
> - a SubPOS=x|Deg=none|Num=none|Per=none pedig a morfológiai jegyekből
> kinyert feature-ök
>
> A szófafaj kinyerése viszonylag egyszerű, 1-2 (egyelőre) hibás hfts output
> esetet (pl. [Adj][Nom]) leszámítva.
> A morfológiai feature-ök a mate számára pedig a CoNLL 2009 formátum
> alapján történnek.
>
> Mindkettőre van nagyon megírt, egyszerű java kódom, amit el tudok küldeni,
> amennyiben a java járható út.
More information about the nlp-infra-devel
mailing list