<div dir="ltr">Kedves Mindenki!<br><br><div>"Csak a modellek lesznek nyilvánosan elérhetők, a Szeged Korpusz szövegeinek eredeti tulajdonosai anno nem engedélyezték a nyilvános hozzáférhetőséget."<br style="font-size:12.8px"></div><div><br></div><div>Ezt a választ csak részben tudom elfogadni.</div><div>Nyilván az "anno" óta eltelt már némi idő, valamint más a leányzó fekvése minekutána immár egy teljes nyílt forrású szoftver stack épül rá.</div><div>Kár, hogy pont az alapja nem nyílt.</div><div><br></div><div>Lehet, hogy túl későn, illetve túl könnyen beszélek (és a nyílt forrás náci szól belőlem), de lehet hogy felül kellene vizsgálni ezt a kérdést: azaz teljesen nyílt alapokra helyezni az egész rendszert.<br></div><div><br></div><div><br></div><div>A technikai dologról, amiről érdemben is tudok nyilatkozni:</div><div><br></div><div>Egy fájl letöltése megy. De mind böngészőből mind wget-ttel, ha az összes fájlt letölteném, akkor a 4-5.-körül lelassul és megáll a letöltés és utána eléggé nehézkessé válik a dolog, mert mindig újra kell kezdeni, mert megáll... Valami "intelligens" DoS védelmet látok mögé.</div><div><br></div><div>Ahogy júliusban is írtam, az alábbi parancsot futtatom (kiterjesztés aktualizálva):</div><div><br></div><div><div style="font-size:12.8px">wget -r -l1 -A disamb.new --random-wait <a href="http://www.inf.u-szeged.hu/~vinczev/infra/konvertalt_morf/" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf/</a></div></div><div><br></div><div>Ezzel le kellene jönnie az összes disamb.new fájlnak, 1 mélységben a linken belül és ráadásul véletlen időt vár, tehát még az sincs, hogy DoS-olom a szervert.</div><div><br></div><div>Ha ez a parancs működésre bírható valami trükkel, vagy ezzel ekvivalens működő változatról van tudomásotok, akkor kíváncsi vagyok.</div><div><br></div><div><br></div><div>Balázs</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">2016. szeptember 9. 11:33 Veronika Vincze írta, <span dir="ltr"><<a href="mailto:vinczev@inf.u-szeged.hu" target="_blank">vinczev@inf.u-szeged.hu</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div bgcolor="#FFFFFF" text="#000000">
<p>Kedves Mindenki,</p>
<p>Alább néhány válasz:<br>
</p><span class="">
<br>
<div>On 2016.09.08. 10:53, Sass Bálint
wrote:<br>
</div>
<blockquote type="cite"><br>
2.
<br>
Balázs mondja:
<br>
"Óva intenék mindenkit, hogy a morfológia a PUNCT-ra azt mondja,
<br>
hogy OTHER... Nem biztos, hogy jó így."
<br>
</blockquote></span>
Részünkről lehet PUNCT is, ha Attila is jónak látja.<span class=""><br>
<blockquote type="cite">
<br>
3.
<br>
Balázs kérdezi:
<br>
"A szeged korpusz is nyilvánosan elérhetővé válik most vagy csak a
modellek?
<br>
Ha a korpusz is, hol elérhető? (amiről rendesen le lehet tölteni
<br>
remélhetőleg...)"
<br>
</blockquote></span>
Csak a modellek lesznek nyilvánosan elérhetők, a Szeged Korpusz
szövegeinek eredeti tulajdonosai anno nem engedélyezték a nyilvános
hozzáférhetőséget.<span class=""><br>
<blockquote type="cite">Ide kapcsolódik: a
<a href="http://www.inf.u-szeged.hu/~vinczev/infra/konvertalt_morf" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf</a>
<br>
címről továbbra sem lehet wget-tel letölteni a dolgokat, megáll.
<br>
</blockquote>
<br></span>
Itt nálunk technikailag rendben van a letöltés:<br>
<br>
------------------<br>
<br>
wget
<a href="http://www.inf.u-szeged.hu/%7Evinczev/infra/konvertalt_morf/newsml.conll-2009_ready.disamb.new" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf/<wbr>newsml.conll-2009_ready.<wbr>disamb.new</a><br>
--2016-09-08 17:15:17--
<a href="http://www.inf.u-szeged.hu/%7Evinczev/infra/konvertalt_morf/newsml.conll-2009_ready.disamb.new" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf/<wbr>newsml.conll-2009_ready.<wbr>disamb.new</a><br>
Resolving <a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a> (<a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a>)...
10.2.0.33<br>
Connecting to <a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a> (<a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a>)|10.2.0.<wbr>33|:80...
connected.<br>
HTTP request sent, awaiting response... 200 OK<br>
Length: 16424207 (16M) [text/plain]<br>
Saving to: ‘newsml.conll-2009_ready.<wbr>disamb.new’<br>
<br>
newsml.conll-2009_ready.<wbr>disamb.new
100%[=========================<wbr>==============================<wbr>============>]
15.66M 46.2MB/s in 0.3s<br>
<br>
2016-09-08 17:15:17 (46.2 MB/s) -
‘newsml.conll-2009_ready.<wbr>disamb.new’ saved [16424207/16424207]<br>
<br>
------------------<br>
<br>
<b>Esetleg nem a wget timeout-ol?</b><b><br>
</b><b> <a href="http://stackoverflow.com/questions/2291524/does-wget-timeout" target="_blank">http://stackoverflow.com/<wbr>questions/2291524/does-wget-<wbr>timeout</a></b><b><br>
</b><b> </b><b><br>
</b>Üdv:<br>
Vera<span class=""><br>
<blockquote type="cite">
<br>
Üdv:
<br>
Bálint
<br>
<br>
<br>
______________________________<wbr>_________________
<br>
nlp-infra-devel mailing list
<br>
<a href="mailto:nlp-infra-devel@nytud.mta.hu" target="_blank">nlp-infra-devel@nytud.mta.hu</a>
<br>
<a href="http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel" target="_blank">http://corpus.nytud.hu/<wbr>dltlist/listinfo/nlp-infra-<wbr>devel</a>
<br>
</blockquote>
<br>
</span></div>
<br>______________________________<wbr>_________________<br>
nlp-infra-devel mailing list<br>
<a href="mailto:nlp-infra-devel@nytud.mta.hu">nlp-infra-devel@nytud.mta.hu</a><br>
<a href="http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel" rel="noreferrer" target="_blank">http://corpus.nytud.hu/<wbr>dltlist/listinfo/nlp-infra-<wbr>devel</a><br>
<br></blockquote></div><br></div>