<html>
  <head>
    <meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Kedves Balázs!<br>
    <br>
    Egyelőre a korpuszos megjegyzésre reagálok:<br>
    <br>
    <div class="moz-cite-prefix">On 2016.09.09. 21:01, Indig Balázs
      wrote:<br>
    </div>
    <blockquote
cite="mid:CAFSpsSBo3sN0+7DrXjOg13HSChczurgC3xY4UKwX+29Su9Nfbg@mail.gmail.com"
      type="cite">
      <div dir="ltr">Kedves Mindenki!<br>
        <br>
        <div>"Csak a modellek lesznek nyilvánosan elérhetők, a Szeged
          Korpusz szövegeinek eredeti tulajdonosai anno nem
          engedélyezték a nyilvános hozzáférhetőséget."<br
            style="font-size:12.8px">
        </div>
        <div><br>
        </div>
        <div>Ezt a választ csak részben tudom elfogadni.</div>
        <div>Nyilván az "anno" óta eltelt már némi idő, valamint más a
          leányzó fekvése minekutána immár egy teljes nyílt forrású
          szoftver stack épül rá.</div>
        <div>Kár, hogy pont az alapja nem nyílt.</div>
      </div>
    </blockquote>
    Én (illetve Szeged) továbbra is külön kezelné(m) a modelleket és a
    korpuszt annak ellenére, hogy alapvetően mi is a szabad hozzáférés
    hívei vagyunk. 1998-ban zajlott a Szeged Korpusz szövegeinek
    gyűjtése. Akkoriban nyilván teljesen máshogy állt hozzá mindenki a
    szövegek szabad publikálásához, mint manapság, és az újságírók is
    ragaszkodtak a szerzői jogaikhoz. Azonban az akkori feltételek
    továbbra is köteleznek minket, ha tetszik, ha nem... Különben pedig
    aki akarja, kutatási célokra teljesen ingyenesen megkaphatja.<br>
    <blockquote
cite="mid:CAFSpsSBo3sN0+7DrXjOg13HSChczurgC3xY4UKwX+29Su9Nfbg@mail.gmail.com"
      type="cite">
      <div dir="ltr">
        <div><br>
        </div>
        <div>Lehet, hogy túl későn, illetve túl könnyen beszélek (és a
          nyílt forrás náci szól belőlem), de lehet hogy felül kellene
          vizsgálni ezt a kérdést: azaz teljesen nyílt alapokra helyezni
          az egész rendszert.<br>
        </div>
        <div><br>
        </div>
      </div>
    </blockquote>
    Mi is örülnénk, ha lenne alternatív adatforrásunk, azaz megfelelően
    nagy méretű, <b>kézzel annotál</b><b>t</b> szabad forrású
    korpuszunk POS-taggelve, dep és konst elemzéssel, valamint NER-rel
    ellátva, de ennek hiányában a Szeged Korpusszal kell beérni, és ha
    jól tudom, az INFRÁ-ba sem volt dedikált korpuszépítés tervezve...
    De ha van valakinek jobb ötlete, vagy egy titkos korpusza
    elfekvőben, szóljon! :)<br>
    <br>
    Üdv:<br>
    Vera<br>
    <br>
  </body>
</html>