[nlp-infra-devel] Fwd: minden infrás cikkbe közös

Tamás Váradi tavaradi at gmail.com
Tue Nov 29 21:04:36 CET 2016


Kedves Mindnyájan!

Az MSZNY-re beadott e-magyar tárgyú cikkeket elolvasva kiderült, hogy
előfordul bennük néhány pontatlanság, következetlenség, amelyeket jó lenne
nem csak a végleges változat számára, hanem az egységes branding végett ki
kellene javítani.

Ma az Intézetben tartottunk egy házi kupaktanácsot, és megállapodtunk a
javasolt egységes alakokban.

Ennek megfelelően szeretném kérni, hogy a továbbiakban (MSZNY2017 cikkekben
és minden további nyilvános  előadásban, publikációkban az alábbi 5 pontban
felsorolt elemeket az itt leírtak szerint használjátok egységesen:

1) A név: e-magyar, \texttt{}-ben.
Az elemző láncot tehát *e-magyar*-nak hívjuk, és hogy jobban elkülönítsük a
folyó szövegtől, használjunk typewriter fontot (ahol ez lehet). Lehet hívni
e-magyar rendszernek, keretrendszernek, elemzőnek, elemzőrendszernek vagy
elemzőláncnak stb.

Magára a projektre is hivatkozhatunk e-magyar projektként (de semmiképpen
ne infra2 projektként !)


2) Az egyes modulok neveinek a prefixe: em, kisbetűvel, egybeírva, utána
nagybetűvel következik a név második része, pl. emToken, emMorph.

3) Kérjük a köszönetnyilvánításba beletenni az alábbi mondatot:

"Az \texttt{e-magyar} eszközlánc az MTA 2015.~évi
Infrastruktúra-fejlesztési Pályázat 2.~kategóriájában elnyert támogatás
segítségével valósult meg."

4) Az infra cikkek bib entry-jei:

@inproceedings{nagykozos,
  author = {Váradi, Tamás and Simon, Eszter and Sass, Bálint and Gerőcs,
Mátyás and Mittelholcz, Iván and Novák, Attila and Indig, Balázs and
Prószéky, Gábor and Farkas, Richárd and Vincze, Veronika},
  title = {\texttt{e-magyar}: digitális nyelvfeldolgozó rendszer},
  booktitle = {{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)},
  year = 2017,
  pages = {(jelen kötetben)},
  address = {Szeged},
}

@inproceedings{sass2017emagyar,
  author = "Sass, B\'alint and Mih\'altz, M\'arton and Kundr\'ath, P\'eter",
  title = "Az \texttt{e-magyar} GATE keretrendszerbe integr\'alt magyar
sz{\"o}vegfeldolgoz\'o eszk{\"o}zl\'anca",
  booktitle = "{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)",
  year = 2017,
  pages = "(jelen k{\"o}tetben)",
  address = "Szeged",
}

@inproceedings{kornai2017emagyar,
  author = "Kornai, András and
  Szekrényes, István ",
  title = "\texttt{e-magyar} beszédarchívum",
  booktitle = "{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)",
  year = 2017,
  pages = "(jelen k{\"o}tetben)",
  address = "Szeged",
}

@inproceedings{mivan,
  author = {Mittelholcz, Iván},
  title = {{\texttt{emToken}: Unicode-képes tokenizáló magyar nyelvre}},
  booktitle = {{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)},
  year = 2017,
  pages = {(jelen kötetben)},
  address = {Szeged},
}

@inproceedings{emmorphana,
  author = {Novák, Attila and Rebrus, Péter and Ludányi, {\relax Zs}ófia},
  title = {Az \texttt{emMorph} morfológiai elemző annotációs formalizmusa},
  booktitle = {{XIII}.\ Magyar Sz{\'a}m{\'\i}t{\'o}g{\'e}pes
Nyelv{\'e}szeti Konferencia ({MSZNY}2017)},
  year = 2017,
  pages = {(jelen kötetben)},
  address = {Szeged},
}


5) Az egyes github repozitóriumok nyitólapján ((ami github esetében a
README.md)  helyezzétek el az alábbi hivatkozást az e-magyar.hu-ra. A
szöveg picit különbözik  a szövegfeldolgozós és a beszédfeldolgozós
modulokban (a GATE integrációra való hivatkozás miatt).

Amint látjátok, a szöveg csak annyit mond, hogy az X eszköz az e-magyar
rendszernek _is_ része. Nem lett bekebelezve, megmaradt önálló léte.
Remélem, ez mindenki számára elfogadható formula.


A)

A szövegfeldolgozós repozitóriumok/URL-ek:
https://github.com/dlt-rilmta/quntoken
https://github.com/dlt-rilmta/emMorph
https://github.com/ppke-nlpg/purepos
http://rgai.inf.u-szeged.hu/magyarlanc
https://github.com/ppke-nlpg/HunTag3


This tool is also [integrated](https://github.com/dlt-rilmta/hunlp-GATE)
into the [e-magyar](http://www.e-magyar.hu) language processing system.

B)

A beszédfeldolgozós repozitóriumok/URL-ek:
https://github.com/juditacs/hunspeech/blob/master/speech_act
ivity_detection/sad.py
https://github.com/juditacs/hunspeech/blob/master/speaker_di
arization/em-dia.py
https://github.com/szekrenyesi/prosotool

This tool is also integrated
into the [e-magyar](http://www.e-magyar.hu) language processing system.

Köszönöm az együttműködést!

Üdv.
VT




Tamás Váradi
Research Institute for Linguistics
Hungarian Academy of Sciences
H-1068 Benczur u. 33. Budapest, Hungary
Tel.: (+36 1) 321 4830 / ext. 126
Fax: (+36 1) 322 9297
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
ᐧ
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://corpus.nytud.hu/pipermail/nlp-infra-devel/attachments/20161129/e0da31ec/attachment.html>


More information about the nlp-infra-devel mailing list