[nlp-infra-devel] ünnepi pillanat
Tamás Váradi
tavaradi at gmail.com
Thu Aug 4 08:14:10 CEST 2016
ÉLJEN, ÉLJEN, HURRÁ!!
Köszönet mindenkinek, aki ebben a koncentrált, összehangolt munkában részt
vett, és Bálintnak, aki az egészet egybefogta és fogja fogni!
Ezt most megünnepeljük, mint egyfajta mérföldkő, és aztán dolgozunk tovább,
hogy beérjünk a célba:
Tehát:
- ugyanezt előállítani teljes korpuszon betanítva
- morfológiai elemző javítása a Helsinki csapattal közreműködve
- hatékonyság emelés (emToken és a többi eszköznél, ahol csak lehetséges)
- platformfüggetlenség (emToken windows-os változat)
- eszköz leírások népszerűbb, érthetőbb változatainak elkészítése
- az emMorph emDep és emCons kódkészletének részletes közzététele
- a szövegelemző kapacitásának (jelenleg 3000 kar) növelése
Hogy a *beszéd oldalon található 0 adat*ról (nem meta-adatról) ne is ejtsek
szót, mert az önmagáért beszél ...
Hajrá!
Üdv.
T
ᐧ
2016-08-03 18:23 GMT+02:00 Sass Bálint <joker at nytud.hu>:
> Kedves mindenki!
>
> A mai naptól a valódi "újkódos" infra2 avagy e-magyar lánc fut a
> http://www.e-magyar.hu
> oldal mögött.
>
> Benne:
> * emToken (QunToken)
> * emMorph = az új HFST-s elemző
> * emLem = a HFST-re épülő lemmatizáló
> * emTag = PurePOS az újkódos modellel
> * emDep = ML függőségi elemző az újkódos modellel
> * emCons = ML összetevős elemző az újkódos modellel
> * emNer = huntag3 NER szintén az újkódos modellel
> * emChunk = huntag3 NP felismerő az újkódos modellel
>
> Köszönet minden közreműködőnek! :)
>
> Üdv:
> Bálint
>
> Ezt írtam, 2016-07-22:
>
>> Kedves mindenki!
>>
>> Kérem, hogy ide a listára írjátok meg,
>> amint az az alábbiak bármelyike elkészül.
>>
>> * újkódos tanítókorpusz (Ricsi, Vera, Attila)
>>
>> * újkódos modell a PurePOS-hoz (Balázs)
>> * újkódos modell a Dep elemzőhöz (Ricsi, Vera)
>> * újkódos modell a Cons elemzőhöz (Ricsi, Vera)
>> * újkódos modell az NP chunkerhez (Eszter)
>> * újkódos modell a NER-hez (Eszter)
>>
>> Kösz szépen:
>> Bálint
>>
>
>
> _______________________________________________
> nlp-infra-devel mailing list
> nlp-infra-devel at nytud.mta.hu
> http://corpus.nytud.hu/dltlist/listinfo/nlp-infra-devel
>
--
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Tamás Váradi
Research Institute for Linguistics
Hungarian Academy of Sciences
H-1068 Benczur u. 33. Budapest, Hungary
Tel.: (+36 1) 321 4830 / ext. 126
Fax: (+36 1) 322 9297
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://corpus.nytud.hu/pipermail/nlp-infra-devel/attachments/20160804/a878b4d1/attachment.html>
More information about the nlp-infra-devel
mailing list