[nlp-infra-devel] kérés: írjatok a listára, amint vmi elkészül -- newsml korpusz, tanítás
Sass Bálint
joker at nytud.hu
Tue Aug 2 14:01:58 CEST 2016
Kösz szépen! :)
Bálint
Ezt írta ma Jani:
> Sziasztok,
>
> Mellékeltem a java kódot.
>
> 2016.08.02. 12:13 keltezéssel, Sass Bálint írta:
>> Kedves Jani!
>>
>> Ez tök jó!
>> Küldd el légyszi a java kódot, az nagyon is járható út. :)
>>
>> Az 'Adv' és a 'SubPos=x' között még van egy TAB, azaz 8 mező van, ugye?
>> Ezek: id token lemma pos feat depTarget depType
>>
>> A token/lemma/pos/feat formátum a dep-re és konst-ra is vonatkozik,
>> ugye?
>>
>> Kösz szépen:
>> Bálint
>>
>> Ezt írtad ma:
>>> Sziasztok,
>>>
>>> Egy példasor a trainből:
>>>
>>> 19 ismét ismét AdvSubPOS=x|Deg=none|Num=none|Per=none 20 MODE
>>>
>>> ahol
>>> - az Adv a hfst által megadott szófaj
>>> - a SubPOS=x|Deg=none|Num=none|Per=none pedig a morfológiai jegyekből
>>> kinyert feature-ök
>>>
>>> A szófafaj kinyerése viszonylag egyszerű, 1-2 (egyelőre) hibás hfts
>>> output esetet (pl. [Adj][Nom]) leszámítva.
>>> A morfológiai feature-ök a mate számára pedig a CoNLL 2009 formátum
>>> alapján történnek.
>>>
>>> Mindkettőre van nagyon megírt, egyszerű java kódom, amit el tudok
>>> küldeni, amennyiben a java járható út.
More information about the nlp-infra-devel
mailing list