<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
</head>
<body bgcolor="#FFFFFF" text="#000000">
Sziasztok!<br>
<br>
Csináltam egy részletes leírást a hfst-s elemző jelenlegi
címkekészletéről. Egyelőre ez angolul van, négyoszlopos formátumban.
Az oszlopokat tabulátorok választják el.<br>
A négy oszlop: tag description example example analysis<br>
<br>
Közben rájöttem, hogy öt címke nem egészen úgy néz ki, ahogy
szerettem volna. A bal oldali, ahogy van, a jobb oldali, ahogy
inkább kellene, hogy legyen. Az utóbbi formában szerepelnek a
leírásban. Viszont a betanított modellek nyilván az előbbi
formátumban vannak kész. Az a kérdésem, hogy mennyi idő/mekkora
galiba újratanítani őket. Igazából csak a /Det|Art.Def és a
/Det|Art.NDef számít igazán (ezek a határozott és a határozatlan
névelő). A Loc még szórványosan előfordulhat (a <i>Győrött</i>
típusú helyhatározók címkéje), illetve a /Det|Q.NDef a <i>minden</i>
determináns címkéje.<br>
<i><br>
[</i>Inl] [Loc]<br>
[_EssFor:kéntMA/Adj] [_Adjz_Type:forma/Adj]<br>
[/Det|art.Def] [/Det|Art.Def]<br>
[/Det|art.NDef] [/Det|Art.NDef]<br>
[/Det|Q|indef] [/Det|Q.NDef]<br>
<br>
Egyelőre akár maradhat minden úgy is, ahogy van, de lesznek még
revíziók, gondolom, és ahhoz úgyis érdemes lenne bejáratni az összes
modell összehangolásának a koreográfiáját.<br>
<br>
Attila<br>
<i><br>
</i><br>
</body>
</html>