[nlp-infra-devel] részletes leírás az összes morfológiai kódról
Sass Bálint
joker at nytud.hu
Wed Jul 27 14:48:46 CEST 2016
sziasztok
egyelőre, ha lehet, maradjon minden, ahogy van.
legyenek készen a betanított modellek
a legelső verzióban.
a pos taggerrel mi a helyzet?
kösz, üdv:
Bálint
Ezt írta ma:
> Sziasztok!
>
> Csináltam egy részletes leírást a hfst-s elemző jelenlegi
> címkekészletéről. Egyelőre ez angolul van, négyoszlopos
> formátumban. Az oszlopokat tabulátorok választják el.
> A négy oszlop: tag description example example analysis
>
> Közben rájöttem, hogy öt címke nem egészen úgy néz ki, ahogy
> szerettem volna. A bal oldali, ahogy van, a jobb oldali, ahogy
> inkább kellene, hogy legyen. Az utóbbi formában szerepelnek a
> leírásban. Viszont a betanított modellek nyilván az előbbi
> formátumban vannak kész. Az a kérdésem, hogy mennyi idő/mekkora
> galiba újratanítani őket. Igazából csak a /Det|Art.Def és a
> /Det|Art.NDef számít igazán (ezek a határozott és a határozatlan
> névelő). A Loc még szórványosan előfordulhat (a Győrött típusú
> helyhatározók címkéje), illetve a /Det|Q.NDef a minden
> determináns címkéje.
>
> [Inl] [Loc]
> [_EssFor:kéntMA/Adj] [_Adjz_Type:forma/Adj]
> [/Det|art.Def] [/Det|Art.Def]
> [/Det|art.NDef] [/Det|Art.NDef]
> [/Det|Q|indef] [/Det|Q.NDef]
>
> Egyelőre akár maradhat minden úgy is, ahogy van, de lesznek még
> revíziók, gondolom, és ahhoz úgyis érdemes lenne bejáratni az
> összes modell összehangolásának a koreográfiáját.
>
> Attila
>
>
>
>
--
Üdvözlettel:
Sass Bálint
PhD, tud mts, MTA NYTI
Utónévkereső: http://corpus.nytud.hu/utonevportal
személyes oldal: http://digitus.itk.ppke.hu/~sass
More information about the nlp-infra-devel
mailing list