<html>
  <head>

    <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Sziasztok!<br>
    <br>
    Csináltam egy részletes leírást a hfst-s elemző jelenlegi
    címkekészletéről. Egyelőre ez angolul van, négyoszlopos formátumban.
    Az oszlopokat tabulátorok választják el.<br>
    A négy oszlop: tag    description    example    example analysis<br>
    <br>
    Közben rájöttem, hogy öt címke nem egészen úgy néz ki, ahogy
    szerettem volna. A bal oldali, ahogy van, a jobb oldali, ahogy
    inkább kellene, hogy legyen. Az utóbbi formában szerepelnek a
    leírásban. Viszont a betanított modellek nyilván az előbbi
    formátumban vannak kész. Az a kérdésem, hogy mennyi idő/mekkora
    galiba újratanítani őket. Igazából csak a /Det|Art.Def és a
    /Det|Art.NDef számít igazán (ezek a határozott és a határozatlan
    névelő). A Loc még szórványosan előfordulhat (a <i>Győrött</i>
    típusú helyhatározók címkéje), illetve a /Det|Q.NDef a <i>minden</i>
    determináns címkéje.<br>
    <i><br>
      [</i>Inl]    [Loc]<br>
    [_EssFor:kéntMA/Adj]    [_Adjz_Type:forma/Adj]<br>
    [/Det|art.Def]    [/Det|Art.Def]<br>
    [/Det|art.NDef]    [/Det|Art.NDef]<br>
    [/Det|Q|indef]    [/Det|Q.NDef]<br>
    <br>
    Egyelőre akár maradhat minden úgy is, ahogy van, de lesznek még
    revíziók, gondolom, és ahhoz úgyis érdemes lenne bejáratni az összes
    modell összehangolásának a koreográfiáját.<br>
    <br>
    Attila<br>
    <i><br>
    </i><br>
  </body>
</html>