[nlp-infra-devel] újabb verzió
Novák Attila
novakat at gmail.com
Fri Jun 24 10:43:15 CEST 2016
Sziasztok!
Ide raktam fel az elemző újabb verzióját
http://tmk.nytud.hu/inframorpho/huXlgcnormhfst.zip
A felhasználónév/jelszó: warga/wargawarga
A kis-nagybetűkezelés ebben már működik. Nagy kezdőbetűvel és csupa
nagybetűvel írva is. A case-normalizáló transducert dinamikusan
komponálja a morfológiával, így a memóriaigénye gyakorlatilag azonos az
alapmorfológiáéval. Egyelőre csak a hfst-lookuppal működik, a
hfst-optimized-lookuppal nem. Kértem a fejlesztőket, hogy abban is
csinálják meg. Remélem, összejön.
Ehhez le kell tölteni a hfst friss változatát:
wget http://apertium.projectjj.com/rpm/install-nightly.sh -O - | sudo bash
aztán
sudo apt-get install hfst
Ha korábban már futtattad az install-nightly.sh-t, akkor csak a /sudo
apt-get install hfst///kell.
Tegnap letöltöttem a windows-os verziót
(http://apertium.projectjj.com/win32/nightly/hfst-latest.7z), az sajnos
nem működött. Kértem a fejlesztőket, hogy javítsák. Linuxon megy.
Futtatás:
hfst-lookup --cascade=composition huXlgcnorm.hfst
> > ALMA
> ALMA Alma[/N][Nom] 0,000000
> ALMA alma[/N][Nom] 0,000000
> ALMA alom[/N]a[Poss.3Sg][Nom] 0,000000
>
> > Alma
> Alma Alma[/N][Nom] 0,000000
> Alma alma[/N][Nom] 0,000000
> Alma alom[/N]a[Poss.3Sg][Nom] 0,000000
>
> > alma
> alma alma[/N][Nom] 0,000000
> alma alom[/N]a[Poss.3Sg][Nom] 0,000000
File-ból olvasáshoz:
hfst-lookup --pipe-mode=input --cascade=composition huXlgcnorm.hfst
<intext >outtext
Így futtatva a lemmatizáláshoz szükséges felszíni alak is kiolvasható
(de ez nem igazán emberi fogyasztásra alkalmas formátum):
hfst-lookup --cascade=composition --xfst=print-pairs --xfst=print-space
huXlgcnorm.hfst
> > ALMA
> ALMA A:A l:l m:m a:a :[/N] :[Nom] 0,000000
>
> ALMA a:a l:l :o m:m :[/N] a:a :[Poss.3Sg] :[Nom] 0,000000
> ALMA a:a l:l m:m a:a :[/N] :[Nom] 0,000000
Attila
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://corpus.nytud.hu/pipermail/nlp-infra-devel/attachments/20160624/920acca6/attachment.html>
More information about the nlp-infra-devel
mailing list