[nlp-infra-devel] Fwd: minden infrás cikkbe közös
Tamás Váradi
tavaradi at gmail.com
Tue Nov 29 21:04:36 CET 2016
Kedves Mindnyájan!
Az MSZNY-re beadott e-magyar tárgyú cikkeket elolvasva kiderült, hogy
előfordul bennük néhány pontatlanság, következetlenség, amelyeket jó lenne
nem csak a végleges változat számára, hanem az egységes branding végett ki
kellene javítani.
Ma az Intézetben tartottunk egy házi kupaktanácsot, és megállapodtunk a
javasolt egységes alakokban.
Ennek megfelelően szeretném kérni, hogy a továbbiakban (MSZNY2017 cikkekben
és minden további nyilvános előadásban, publikációkban az alábbi 5 pontban
felsorolt elemeket az itt leírtak szerint használjátok egységesen:
1) A név: e-magyar, \texttt{}-ben.
Az elemző láncot tehát *e-magyar*-nak hívjuk, és hogy jobban elkülönítsük a
folyó szövegtől, használjunk typewriter fontot (ahol ez lehet). Lehet hívni
e-magyar rendszernek, keretrendszernek, elemzőnek, elemzőrendszernek vagy
elemzőláncnak stb.
Magára a projektre is hivatkozhatunk e-magyar projektként (de semmiképpen
ne infra2 projektként !)
2) Az egyes modulok neveinek a prefixe: em, kisbetűvel, egybeírva, utána
nagybetűvel következik a név második része, pl. emToken, emMorph.
3) Kérjük a köszönetnyilvánításba beletenni az alábbi mondatot:
"Az \texttt{e-magyar} eszközlánc az MTA 2015.~évi
Infrastruktúra-fejlesztési Pályázat 2.~kategóriájában elnyert támogatás
segítségével valósult meg."
4) Az infra cikkek bib entry-jei:
@inproceedings{nagykozos,
author = {Váradi, Tamás and Simon, Eszter and Sass, Bálint and Gerőcs,
Mátyás and Mittelholcz, Iván and Novák, Attila and Indig, Balázs and
Prószéky, Gábor and Farkas, Richárd and Vincze, Veronika},
title = {\texttt{e-magyar}: digitális nyelvfeldolgozó rendszer},
booktitle = {{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)},
year = 2017,
pages = {(jelen kötetben)},
address = {Szeged},
}
@inproceedings{sass2017emagyar,
author = "Sass, B\'alint and Mih\'altz, M\'arton and Kundr\'ath, P\'eter",
title = "Az \texttt{e-magyar} GATE keretrendszerbe integr\'alt magyar
sz{\"o}vegfeldolgoz\'o eszk{\"o}zl\'anca",
booktitle = "{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)",
year = 2017,
pages = "(jelen k{\"o}tetben)",
address = "Szeged",
}
@inproceedings{kornai2017emagyar,
author = "Kornai, András and
Szekrényes, István ",
title = "\texttt{e-magyar} beszédarchívum",
booktitle = "{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)",
year = 2017,
pages = "(jelen k{\"o}tetben)",
address = "Szeged",
}
@inproceedings{mivan,
author = {Mittelholcz, Iván},
title = {{\texttt{emToken}: Unicode-képes tokenizáló magyar nyelvre}},
booktitle = {{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)},
year = 2017,
pages = {(jelen kötetben)},
address = {Szeged},
}
@inproceedings{emmorphana,
author = {Novák, Attila and Rebrus, Péter and Ludányi, {\relax Zs}ófia},
title = {Az \texttt{emMorph} morfológiai elemző annotációs formalizmusa},
booktitle = {{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)},
year = 2017,
pages = {(jelen kötetben)},
address = {Szeged},
}
5) Az egyes github repozitóriumok nyitólapján ((ami github esetében a
README.md) helyezzétek el az alábbi hivatkozást az e-magyar.hu-ra. A
szöveg picit különbözik a szövegfeldolgozós és a beszédfeldolgozós
modulokban (a GATE integrációra való hivatkozás miatt).
Amint látjátok, a szöveg csak annyit mond, hogy az X eszköz az e-magyar
rendszernek _is_ része. Nem lett bekebelezve, megmaradt önálló léte.
Remélem, ez mindenki számára elfogadható formula.
A)
A szövegfeldolgozós repozitóriumok/URL-ek:
https://github.com/dlt-rilmta/quntoken
https://github.com/dlt-rilmta/emMorph
https://github.com/ppke-nlpg/purepos
http://rgai.inf.u-szeged.hu/magyarlanc
https://github.com/ppke-nlpg/HunTag3
This tool is also [integrated](https://github.com/dlt-rilmta/hunlp-GATE)
into the [e-magyar](http://www.e-magyar.hu) language processing system.
B)
A beszédfeldolgozós repozitóriumok/URL-ek:
https://github.com/juditacs/hunspeech/blob/master/speech_act
ivity_detection/sad.py
https://github.com/juditacs/hunspeech/blob/master/speaker_di
arization/em-dia.py
https://github.com/szekrenyesi/prosotool
This tool is also integrated
into the [e-magyar](http://www.e-magyar.hu) language processing system.
Köszönöm az együttműködést!
Üdv.
VT
Tamás Váradi
Research Institute for Linguistics
Hungarian Academy of Sciences
H-1068 Benczur u. 33. Budapest, Hungary
Tel.: (+36 1) 321 4830 / ext. 126
Fax: (+36 1) 322 9297
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
ᐧ
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://corpus.nytud.hu/pipermail/nlp-infra-devel/attachments/20161129/e0da31ec/attachment.html>
More information about the nlp-infra-devel
mailing list