<div dir="ltr">Kedves Mindenki!<br><br><div>"Csak a modellek lesznek nyilvánosan elérhetők, a Szeged Korpusz szövegeinek eredeti tulajdonosai anno nem engedélyezték a nyilvános hozzáférhetőséget."<br style="font-size:12.8px"></div><div><br></div><div>Ezt a választ csak részben tudom elfogadni.</div><div>Nyilván az "anno" óta eltelt már némi idő, valamint más a leányzó fekvése minekutána immár egy teljes nyílt forrású szoftver stack épül rá.</div><div>Kár, hogy pont az alapja nem nyílt.</div><div><br></div><div>Lehet, hogy túl későn, illetve túl könnyen beszélek (és a nyílt forrás náci szól belőlem), de lehet hogy felül kellene vizsgálni ezt a kérdést: azaz teljesen nyílt alapokra helyezni az egész rendszert.<br></div><div><br></div><div><br></div><div>A technikai dologról, amiről érdemben is tudok nyilatkozni:</div><div><br></div><div>Egy fájl letöltése megy. De mind böngészőből mind wget-ttel, ha az összes fájlt letölteném, akkor a 4-5.-körül lelassul és megáll a letöltés és utána eléggé nehézkessé válik a dolog, mert mindig újra kell kezdeni, mert megáll... Valami "intelligens" DoS védelmet látok mögé.</div><div><br></div><div>Ahogy júliusban is írtam, az alábbi parancsot futtatom (kiterjesztés aktualizálva):</div><div><br></div><div><div style="font-size:12.8px">wget -r -l1 -A disamb.new --random-wait <a href="http://www.inf.u-szeged.hu/~vinczev/infra/konvertalt_morf/" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf/</a></div></div><div><br></div><div>Ezzel le kellene jönnie az összes disamb.new fájlnak, 1 mélységben a linken belül és ráadásul véletlen időt vár, tehát még az sincs, hogy DoS-olom a szervert.</div><div><br></div><div>Ha ez a parancs működésre bírható valami trükkel, vagy ezzel ekvivalens működő változatról van tudomásotok, akkor kíváncsi vagyok.</div><div><br></div><div><br></div><div>Balázs</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">2016. szeptember 9. 11:33 Veronika Vincze írta, <span dir="ltr"><<a href="mailto:vinczev@inf.u-szeged.hu" target="_blank">vinczev@inf.u-szeged.hu</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
  
    
  
  <div bgcolor="#FFFFFF" text="#000000">
    <p>Kedves Mindenki,</p>
    <p>Alább néhány válasz:<br>
    </p><span class="">
    <br>
    <div>On 2016.09.08. 10:53, Sass Bálint
      wrote:<br>
    </div>
    <blockquote type="cite"><br>
      2.
      <br>
      Balázs mondja:
      <br>
      "Óva intenék mindenkit, hogy a morfológia a PUNCT-ra azt mondja,
      <br>
       hogy OTHER... Nem biztos, hogy jó így."
      <br>
    </blockquote></span>
    Részünkről lehet PUNCT is, ha Attila is jónak látja.<span class=""><br>
    <blockquote type="cite">
      <br>
      3.
      <br>
      Balázs kérdezi:
      <br>
      "A szeged korpusz is nyilvánosan elérhetővé válik most vagy csak a
      modellek?
      <br>
       Ha a korpusz is, hol elérhető? (amiről rendesen le lehet tölteni
      <br>
       remélhetőleg...)"
      <br>
    </blockquote></span>
    Csak a modellek lesznek nyilvánosan elérhetők, a Szeged Korpusz
    szövegeinek eredeti tulajdonosai anno nem engedélyezték a nyilvános
    hozzáférhetőséget.<span class=""><br>
    <blockquote type="cite">Ide kapcsolódik: a
      <a href="http://www.inf.u-szeged.hu/~vinczev/infra/konvertalt_morf" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf</a>
      <br>
      címről továbbra sem lehet wget-tel letölteni a dolgokat, megáll.
      <br>
    </blockquote>
    <br></span>
    Itt nálunk technikailag rendben van a letöltés:<br>
    <br>
    ------------------<br>
    <br>
     wget
    <a href="http://www.inf.u-szeged.hu/%7Evinczev/infra/konvertalt_morf/newsml.conll-2009_ready.disamb.new" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf/<wbr>newsml.conll-2009_ready.<wbr>disamb.new</a><br>
    --2016-09-08 17:15:17-- 
    <a href="http://www.inf.u-szeged.hu/%7Evinczev/infra/konvertalt_morf/newsml.conll-2009_ready.disamb.new" target="_blank">http://www.inf.u-szeged.hu/~<wbr>vinczev/infra/konvertalt_morf/<wbr>newsml.conll-2009_ready.<wbr>disamb.new</a><br>
    Resolving <a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a> (<a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a>)...
    10.2.0.33<br>
    Connecting to <a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a> (<a href="http://www.inf.u-szeged.hu" target="_blank">www.inf.u-szeged.hu</a>)|10.2.0.<wbr>33|:80...
    connected.<br>
    HTTP request sent, awaiting response... 200 OK<br>
    Length: 16424207 (16M) [text/plain]<br>
    Saving to: ‘newsml.conll-2009_ready.<wbr>disamb.new’<br>
    <br>
    newsml.conll-2009_ready.<wbr>disamb.new 
100%[=========================<wbr>==============================<wbr>============>] 
    15.66M  46.2MB/s   in 0.3s<br>
    <br>
    2016-09-08 17:15:17 (46.2 MB/s) -
    ‘newsml.conll-2009_ready.<wbr>disamb.new’ saved [16424207/16424207]<br>
    <br>
    ------------------<br>
    <br>
    <b>Esetleg nem a wget timeout-ol?</b><b><br>
    </b><b> <a href="http://stackoverflow.com/questions/2291524/does-wget-timeout" target="_blank">http://stackoverflow.com/<wbr>questions/2291524/does-wget-<wbr>timeout</a></b><b><br>
    </b><b> </b><b><br>
    </b>Üdv:<br>
    Vera<span class=""><br>
    <blockquote type="cite">
      <br>
      Üdv:
      <br>
      Bálint
      <br>
      <br>
      <br>
      ______________________________<wbr>_________________
      <br>
      nlp-infra-devel mailing list
      <br>
      <a href="mailto:nlp-infra-devel@nytud.mta.hu" target="_blank">nlp-infra-devel@nytud.mta.hu</a>
      <br>
      <a href="http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel" target="_blank">http://corpus.nytud.hu/<wbr>dltlist/listinfo/nlp-infra-<wbr>devel</a>
      <br>
    </blockquote>
    <br>
  </span></div>

<br>______________________________<wbr>_________________<br>
nlp-infra-devel mailing list<br>
<a href="mailto:nlp-infra-devel@nytud.mta.hu">nlp-infra-devel@nytud.mta.hu</a><br>
<a href="http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel" rel="noreferrer" target="_blank">http://corpus.nytud.hu/<wbr>dltlist/listinfo/nlp-infra-<wbr>devel</a><br>
<br></blockquote></div><br></div>