<div dir="ltr">Sziasztok!<br><br>Megerősítem, hogy a wget megáll letöltés közben. Mindenféle wait és random-wait paraméterek esetén is kb a 3. fájl körül.<div>Ha sorban töltögetem le a fájlokat böngészőből akkor hasonlóan meghal a letöltés kb a 3. fájlnál.<br>Ez valami webszerver beállítás lehet... <div><div><br></div><div><br></div><div><div>Én ezt futtatom:</div><div>wget -r -l1 -A disamb --random-wait <a href="http://www.inf.u-szeged.hu/~vinczev/infra/konvertalt_morf/">http://www.inf.u-szeged.hu/~vinczev/infra/konvertalt_morf/</a></div></div><div><br></div><div>Ha valakinek van működő változata, akkor posztolja be! Köszönöm!</div><div><br></div><div>Ami a formátumot illeti:</div><div><br></div><div>Vannak olyan sorok, ahol nem 5 hanem 9 mezőből áll a token.</div><div><br>Az 5 mezősnél rájöttem, hogy 1. mező a szóalak 2. a szótő és az 5. mező elejéről le kell szedni a szótőt, hogy a tag-hoz jussak, de a 9 mezős változatnál csak sejtem, hogy nincs rajta tag és csak a szótő van az 5. mezőben. De akkor azt minek taggelje a PurePOS? X, Z vagy mi legyen?  Notóriusan a PUNCT-oknál van ilyen például...</div><div><br></div><div>Ha ezeken a formátumbeli dolgokon sikerül túljutni, akkor elvileg ma kész a PurePOS modell.</div><div><br></div><div><br></div><div>Köszönöm a segítséget előre is!</div><div><br></div><div><br></div><div>Balázs</div><div><br></div></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">2016. július 27. 14:48 Sass Bálint írta, <span dir="ltr"><<a href="mailto:joker@nytud.hu" target="_blank">joker@nytud.hu</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">sziasztok<br>
<br>
egyelőre, ha lehet, maradjon minden, ahogy van.<br>
legyenek készen a betanított modellek<br>
a legelső verzióban.<br>
<br>
a pos taggerrel mi a helyzet?<br>
<br>
kösz, üdv:<br>
Bálint<br>
Ezt írta ma:<div><div class="h5"><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Sziasztok!<br>
<br>
Csináltam egy részletes leírást a hfst-s elemző jelenlegi<br>
címkekészletéről. Egyelőre ez angolul van, négyoszlopos<br>
formátumban. Az oszlopokat tabulátorok választják el.<br>
A négy oszlop: tag    description    example    example analysis<br>
<br>
Közben rájöttem, hogy öt címke nem egészen úgy néz ki, ahogy<br>
szerettem volna. A bal oldali, ahogy van, a jobb oldali, ahogy<br>
inkább kellene, hogy legyen. Az utóbbi formában szerepelnek a<br>
leírásban. Viszont a betanított modellek nyilván az előbbi<br>
formátumban vannak kész. Az a kérdésem, hogy mennyi idő/mekkora<br>
galiba újratanítani őket. Igazából csak a /Det|Art.Def és a<br>
/Det|Art.NDef számít igazán (ezek a határozott és a határozatlan<br>
névelő). A Loc még szórványosan előfordulhat (a Győrött típusú<br>
helyhatározók címkéje), illetve a /Det|Q.NDef a minden<br>
determináns címkéje.<br>
<br>
[Inl]    [Loc]<br>
[_EssFor:kéntMA/Adj]    [_Adjz_Type:forma/Adj]<br>
[/Det|art.Def]    [/Det|Art.Def]<br>
[/Det|art.NDef]    [/Det|Art.NDef]<br>
[/Det|Q|indef]    [/Det|Q.NDef]<br>
<br>
Egyelőre akár maradhat minden úgy is, ahogy van, de lesznek még<br>
revíziók, gondolom, és ahhoz úgyis érdemes lenne bejáratni az<br>
összes modell összehangolásának a koreográfiáját.<br>
<br>
Attila<br>
<br>
<br>
<br>
<br>
</blockquote>
<br></div></div>
-- <br>
<br>
Üdvözlettel:<br>
Sass Bálint<br>
<br>
PhD, tud mts, MTA NYTI<br>
<br>
Utónévkereső: <a href="http://corpus.nytud.hu/utonevportal" rel="noreferrer" target="_blank">http://corpus.nytud.hu/utonevportal</a><br>
személyes oldal: <a href="http://digitus.itk.ppke.hu/~sass" rel="noreferrer" target="_blank">http://digitus.itk.ppke.hu/~sass</a><br>
<br>
_______________________________________________<br>
nlp-infra-devel mailing list<br>
<a href="mailto:nlp-infra-devel@nytud.mta.hu" target="_blank">nlp-infra-devel@nytud.mta.hu</a><br>
<a href="http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel" rel="noreferrer" target="_blank">http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel</a><br>
</blockquote></div><br></div>