[nlp-infra-devel] részletes leírás az összes morfológiai kódról

Sass Bálint joker at nytud.hu
Wed Jul 27 14:48:46 CEST 2016


sziasztok

egyelőre, ha lehet, maradjon minden, ahogy van.
legyenek készen a betanított modellek
a legelső verzióban.

a pos taggerrel mi a helyzet?

kösz, üdv:
Bálint
Ezt írta ma:

> Sziasztok!
> 
> Csináltam egy részletes leírást a hfst-s elemző jelenlegi
> címkekészletéről. Egyelőre ez angolul van, négyoszlopos
> formátumban. Az oszlopokat tabulátorok választják el.
> A négy oszlop: tag    description    example    example analysis
> 
> Közben rájöttem, hogy öt címke nem egészen úgy néz ki, ahogy
> szerettem volna. A bal oldali, ahogy van, a jobb oldali, ahogy
> inkább kellene, hogy legyen. Az utóbbi formában szerepelnek a
> leírásban. Viszont a betanított modellek nyilván az előbbi
> formátumban vannak kész. Az a kérdésem, hogy mennyi idő/mekkora
> galiba újratanítani őket. Igazából csak a /Det|Art.Def és a
> /Det|Art.NDef számít igazán (ezek a határozott és a határozatlan
> névelő). A Loc még szórványosan előfordulhat (a Győrött típusú
> helyhatározók címkéje), illetve a /Det|Q.NDef a minden
> determináns címkéje.
> 
> [Inl]    [Loc]
> [_EssFor:kéntMA/Adj]    [_Adjz_Type:forma/Adj]
> [/Det|art.Def]    [/Det|Art.Def]
> [/Det|art.NDef]    [/Det|Art.NDef]
> [/Det|Q|indef]    [/Det|Q.NDef]
> 
> Egyelőre akár maradhat minden úgy is, ahogy van, de lesznek még
> revíziók, gondolom, és ahhoz úgyis érdemes lenne bejáratni az
> összes modell összehangolásának a koreográfiáját.
> 
> Attila
> 
> 
> 
>

-- 

Üdvözlettel:
Sass Bálint

PhD, tud mts, MTA NYTI

Utónévkereső: http://corpus.nytud.hu/utonevportal
személyes oldal: http://digitus.itk.ppke.hu/~sass



More information about the nlp-infra-devel mailing list