<div dir="ltr">Sziasztok!<div style><br></div><div style>Köszönöm Juli és Attila elemzéseit. Ezek alapján a <a href="http://helyesiras.mta.hu/helyesiras/default/suggest#">http://helyesiras.mta.hu/helyesiras/default/suggest</a> oldalon kipróbálható a módosított Helyes-e így, ami csak a hunspellt használja, illetve ismeretlen szavaknál csak az első 5 javaslatot mutatja (de mindenképpen kihagyja a szóközöket tartalmazó, szerintem zavaró javaslatokat.)</div>
<div style><br></div><div style>További variációk (humor + hunspell konjunkció, ajánlatokra is valami kombináció) is lehetnek, de egyelőre ezt kéne tesztelni.</div><div style>Emlékeztető: ezen az oldalon kipróbálható hogy mit mond külön-külön mind2 motor:</div>
<div style><a href="https://htp-devel.nytud.hu/helyesiras_test/default/spell_test#" target="_blank" style="font-family:arial,sans-serif;font-size:12.727272033691406px">http://htp-devel.nytud.hu/helyesiras_test/default/spell_test</a><br>
</div><div style><br></div><div style>Üdv,</div><div style>Marci</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2013/5/9 Mártonfi Attila <span dir="ltr"><<a href="mailto:martonfi@gmail.com" target="_blank">martonfi@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Sziasztok!<br>
<br>
Összefoglalom az eddigieket:<br>
<br>
A mindkét elemző által elutasított szavak közül egyetlen van, amit el<br>
kellene fogadni: kultrovat. A többi esetben jó az eredmény.<br>
<br>
A csak a HUMor által elfogadott tételek közül majdnem mind hibás,<br>
néhány viszont extrém olvasattal menthető:<br>
gója ('kínai táblás játéka')<br>
karmól ('6*10^23 db kar mint mértékegység')<br>
Ivett-tel (Ez jelenleg még helytelen, de a 12. kiadásban vsz. ez lesz<br>
már a helyes.)<br>
<br>
Mindössze két esetben utasít el a HUMor, amikor a hunspell elfogad.<br>
Ebből az egyik hibás: 2-őt; a másik helyes: műkancatompor. Igazából az<br>
ilyen szavak bővebb listája alapján lehetne dönteni arról, hogy<br>
hunspell vagy konjunkció. Egyelőre döntetlen e tekintetben az állás.<br>
<br>
A mindkét elemző által elfogadott alakok közül problémásak,<br>
kifejezetten helytelen outputtal:<br>
vinyetta<br>
videóajánló<br>
videóanyag<br>
videóinstalláció<br>
videólejátszás<br>
videólejátszó<br>
videólemez<br>
videóművészet<br>
videószerű<br>
Churchill-el<br>
1-el<br>
5-el<br>
6-el<br>
dezoxi-ribonukleinsav<br>
biobrikett-projekt<br>
Itt tehát néhány típussal állunk szemben:<br>
1. Vannak olyan latin eredetű szavak, pontosabban önállósulóban levő<br>
előtagok (legjellemzőbb a videó), amelyek önmagukban vagy toldalékolva<br>
ó-ra végződnek, de összetételi előtagként rövid o-sak (nem ilyen a<br>
foto/auto, hiszen ott az o hosszúságát értelemtükröztetésre<br>
használjuk: foto- 'fény', fotó- 'fénykép'; auto- 'ön', autó-<br>
'személygépkocsi'). Minthogy a fn+fn típusú összetételek produktívak,<br>
az ilyesféle letiltást külön utószabállyal lehet csak megoldani.<br>
2. Az -el utótagot ne tartsuk elfogadhatónak, láthatólag a -vAl rag<br>
hibás alakváltozata, ezeket -- a gyakori hibák okán -- külön is<br>
lekezelhetnénk.<br>
3. A fn+fn összetételek kötőjellel látszólag még az egybeírásnál is<br>
produktívabbak: laza mellérendelő összetételként is értelmezhetők. De<br>
ezek valójában csak azonos szemantikai kategóriájú elemekre<br>
érvényesülhetnek. Ezért fura a biobrikett és a projekt laza<br>
összetétele. Az ilyes kötőjeles dolgokat általában elfogadják az<br>
elemzők, lehet, hogy ezeket valahogy vissza kéne nyesni. Hogy miként,<br>
azt nem tudom. Erre mindenképpen csak hosszú távú megoldást lehet<br>
találni. (Mindazonáltal a 7 szótagot meg nem haladó kötőjeles<br>
alakulatok esetében lehet, hogy érdemes lenne utószűrést végezni, és<br>
ha az adott tétel nincs benn az OH.-ban, akkor csak azokban az<br>
esetekben engedni a kötőjelet, ha a kötőjel előtt -- esetleg után --<br>
kimutathatóan különírt szókapcsolat alkalmi egybeírása található, vagy<br>
három egyforma mássalhangzót kell elkülöníteni, vagy<br>
tulajdonnév/betűszó/rövidítés az összetétel egyik tagja.)<br>
<br>
A mindkét elemző által elfogadott alakok közül problémásak, extrém, de<br>
lehetséges outputtal:<br>
ellem (Épp most ellem ezt a kisborjút – mondta a tehén.)<br>
jól esik (Jól esik az eső; a 12. kiadásban viszont vsz. a mai jólesik<br>
helyett is ez fog állni.)<br>
kőr ('piros szívvel jelölt lap a francia kártyában')<br>
mellet (A mellet kevésbé ajánlom gung bao csirke készítéséhez, mint a<br>
felsőcombfilét.)<br>
brossúra (Ezt a jelmezt nagy brossúra tervezd!)<br>
eltusol (A műszaki rajzoló ezt az illusztrációt durván eltusolta.)<br>
<br>
Attila<br>
<br>
Pajzs Julia <<a href="mailto:pajzs.julia@nytud.mta.hu">pajzs.julia@nytud.mta.hu</a>> írta (2013. május 9. 11:57):<br>
<div class="HOEnZb"><div class="h5">> Sziasztok,<br>
> Még néhány szót teszteltem, Tibor listájából, meg a sajtó alapján.<br>
> Egyre inkább Attilával értek egyet: Hunspell párti lettem. Ha a<br>
> javaslatokból is csak az általuk adottakat (vagy azoknak egy részét,<br>
> pl. az első kettőt-hármat, vagy azokat, amiket szótárban is<br>
> megtalálunk) vesszük figyelembe, valószínűleg jobban járunk, mint most.<br>
> Juli<br>
><br>
><br>
>><br>
>> Kedves Juli,<br>
>><br>
>> csatolok még szavakat, illetve a redmine-ban az általam beírtak<br>
> között<br>
>> találsz hasonlókat.<br>
>><br>
>> Üdv,<br>
>> tibor<br>
>><br>
>><br>
>> 2013. május 8. 9:37 Pajzs Julia írta, <<a href="mailto:pajzs.julia@nytud.mta.hu">pajzs.julia@nytud.mta.hu</a>>:<br>
>><br>
>> > Sziasztok!<br>
>> > Csatolom az első 100 szónyi teszt eredményét. A szavak a Marci<br>
> által<br>
>> > küldöttek, plusz a redmine-ból bányásztam, meg ami csakúgy eszembe<br>
>> > jutott.<br>
>> > 1-el jelöltem, ha az adott program felismeri a szót.<br>
>> > Nekem az eddigiek alapján a HUNSpell a meggyőzőbb, de szívesen<br>
>> > próbálgatom még, küldjetek szavakat, ha vannak.<br>
>> > A fel nem ismert szavaknál a javaslatok közül úgy tűnik, a HUNSpell<br>
>> > első, néha második javaslata jó, legalábbis ebben a néhány szóban,<br>
>> > néha persze a Humoré is.<br>
>> ><br>
>> > Örömmel várom a véleményeket és az újabb tesztelni valót,<br>
>> > Juli<br>
>> ><br>
>> ><br>
>> ><br>
>> > ><br>
>> > > Kedves Juli!<br>
>> > ><br>
>> > > Ezen az oldalon tudod a humor és hunspell motorokat<br>
> összehasonlítani:<br>
>> > ><br>
>> > > <a href="https://htp-devel.nytud.hu/helyesiras_test/default/spell_test#" target="_blank">https://htp-devel.nytud.hu/helyesiras_test/default/spell_test#</a><br>
>> > ><br>
>> > > Tesztszavak a csatolt tsv fájlban: 1. oszlop a helytelen alak<br>
> (ha 2.<br>
>> > > oszlopban 0 volt), 3. oszlop az általunk megadott javasolt alak.<br>
>> > Először<br>
>> > > akkor az 1. oszlopbeli szavakat kellene végignézni.<br>
>> > ><br>
>> > > Kérdések:<br>
>> > > 1. helyes/helytelen: melyik motor mit mond<br>
>> > > 2. javaslatok: melyik motor mond használhatóbb javaslatokat<br>
>> > ><br>
>> > > Jelenleg a 2 motor eredményeinek az uniója jelenik meg a<br>
>> > helyesiras.hu-n:<br>
>> > > ha valamelyik a 2 közül elfogadja, akkor elfogadjuk, ha egyik sem<br>
>> > fogadja<br>
>> > > el, akkor a 2 motor javaslatainak unióját adjuk vissza (de<br>
> először a<br>
>> > humor<br>
>> > > javaslatait).<br>
>> > > A cél, hogy ennél esetleg jobb algoritmust találjunk a 2 motor<br>
>> > ötvözésére,<br>
>> > > pl.<br>
>> > > - metszet? (Attila)<br>
>> > > - csak az egyik?<br>
>> > > - ...?<br>
>> > ><br>
>> > > További tesztszavakat Tibor tud majd szállítani.<br>
>> > ><br>
>> > > Másoktól is várunk ötleteket, nyugodtan lehet segíteni tesztelni.<br>
>> > ><br>
>> > > Üdv,<br>
>> > > Marci<br>
>> > ><br>
>> > ><br>
>> ><br>
>> ><br>
>> > **********************************<br>
>> > Julia Pajzs<br>
>> > senior research fellow<br>
>> > Research Institute for Linguistics<br>
>> > **********************************<br>
>> ><br>
>><br>
>><br>
>><br>
>> --<br>
>> Research Institute for Linguistics,<br>
>> Hungarian Academy of Sciences<br>
>> Department of Language Technology and Applied Linguistics<br>
>> <a href="http://ny01.nytud.hu/~tpinter/" target="_blank">http://ny01.nytud.hu/~tpinter/</a><br>
>><br>
>> H-1068 Benczúr u. 33., Budapest, Hungary<br>
>> tel: <a href="tel:%2836-1%29%20321-4830" value="+3613214830">(36-1) 321-4830</a><br>
>> fax: <a href="tel:%2836-1%29%20322-9297" value="+3613229297">(36-1) 322-9297</a><br>
>> ------------------------------------<br>
>><br>
>> Gramma Language Office<br>
>> Sk-929 01 Bacsákova 240/13, Dunajská Streda, Slovakia<br>
>><br>
>><br>
><br>
><br>
> **********************************<br>
> Julia Pajzs<br>
> senior research fellow<br>
> Research Institute for Linguistics<br>
> **********************************<br>
</div></div></blockquote></div><br></div>