<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
</head>
<body bgcolor="#FFFFFF" text="#000000">
Sziasztok!<br>
<br>
Ide raktam fel az elemző újabb verzióját<br>
<br>
<a class="moz-txt-link-freetext" href="http://tmk.nytud.hu/inframorpho/huXlgcnormhfst.zip">http://tmk.nytud.hu/inframorpho/huXlgcnormhfst.zip</a><br>
<br>
A felhasználónév/jelszó: warga/wargawarga<br>
<br>
A kis-nagybetűkezelés ebben már működik. Nagy kezdőbetűvel és csupa
nagybetűvel írva is. A case-normalizáló transducert dinamikusan
komponálja a morfológiával, így a memóriaigénye gyakorlatilag azonos
az alapmorfológiáéval. Egyelőre csak a hfst-lookuppal működik, a
hfst-optimized-lookuppal nem. Kértem a fejlesztőket, hogy abban is
csinálják meg. Remélem, összejön.<br>
<br>
Ehhez le kell tölteni a hfst friss változatát:<br>
wget <a class="moz-txt-link-freetext"
href="http://apertium.projectjj.com/rpm/install-nightly.sh">http://apertium.projectjj.com/rpm/install-nightly.sh</a>
-O - | sudo bash
<br>
aztán <br>
sudo apt-get install hfst<br>
<br>
Ha korábban már futtattad az <a class="moz-txt-link-freetext"
href="http://apertium.projectjj.com/rpm/install-nightly.sh">install-nightly.sh</a>-t,
akkor csak a <i>sudo apt-get install hfst</i><i> </i>kell.<br>
<br>
Tegnap letöltöttem a windows-os verziót
(<a class="moz-txt-link-freetext" href="http://apertium.projectjj.com/win32/nightly/hfst-latest.7z">http://apertium.projectjj.com/win32/nightly/hfst-latest.7z</a>), az
sajnos nem működött. Kértem a fejlesztőket, hogy javítsák. Linuxon
megy.<br>
<br>
Futtatás:<br>
hfst-lookup --cascade=composition huXlgcnorm.hfst<br>
<br>
<blockquote type="cite">> ALMA<br>
ALMA Alma[/N][Nom] 0,000000<br>
ALMA alma[/N][Nom] 0,000000<br>
ALMA alom[/N]a[Poss.3Sg][Nom] 0,000000<br>
<br>
> Alma<br>
Alma Alma[/N][Nom] 0,000000<br>
Alma alma[/N][Nom] 0,000000<br>
Alma alom[/N]a[Poss.3Sg][Nom] 0,000000<br>
<br>
> alma<br>
alma alma[/N][Nom] 0,000000<br>
alma alom[/N]a[Poss.3Sg][Nom] 0,000000<br>
</blockquote>
<br>
File-ból olvasáshoz:<br>
hfst-lookup --pipe-mode=input --cascade=composition huXlgcnorm.hfst
<intext >outtext<br>
<br>
Így futtatva a lemmatizáláshoz szükséges felszíni alak is
kiolvasható (de ez nem igazán emberi fogyasztásra alkalmas
formátum):<br>
hfst-lookup --cascade=composition --xfst=print-pairs
--xfst=print-space huXlgcnorm.hfst<br>
<br>
<blockquote type="cite">> ALMA<br>
ALMA A:A l:l m:m a:a :[/N] :[Nom] 0,000000<br>
<br>
ALMA a:a l:l :o m:m :[/N] a:a :[Poss.3Sg] :[Nom] 0,000000<br>
ALMA a:a l:l m:m a:a :[/N] :[Nom] 0,000000<br>
</blockquote>
<br>
<br>
Attila<br>
<br>
<br>
</body>
</html>