28 millió szintaktikailag elemzett mondat és 500000 igei szerkezet
Ezen az oldalon
két nagy méretű magyar nyelvi erőforrás
t teszünk közzé.
Felhasználási feltételek:
Az erőforrások oktatási, kutatási és magáncélra használhatók fel.
Felhasználáskor hivatkozni kell az alábbi publikációra:
Sass Bálint:
28 millió szintaktikailag elemzett mondat és 500000 igei szerkezet.
In: Tanács Attila, Varga Viktor, Vincze Veronika (szerk.):
MSZNY 2015, XI. Magyar Számítógépes Nyelvészeti Konferencia
, SZTE, Szeged, 2015, 303-308.
Az eredeti erőforrásokat újraközölni nem szabad.
Az erőforrások felhasználásával készült új erőforrást/eszközt a jelen felhasználási feltételekkel azonos feltételek mellett kell közreadni.
Az üzleti felhasználás külön megállapodás tárgyát képezheti, forduljon hozzánk a lenti elérhetőségen.
Az erőforrások az
MNSZ-szel közös regisztráció
után érhetők el a fenti feltételekkel.
Mazsola adatbázis
az
MNSZ1
tagmondatainak sekély szintaktikai elemzéssel ellátott változata
– mely a
Mazsola
lekérdező adatbázisaként szolgál
→
Letöltés
(27970403 elemzett tagmondat, zippel tömörítve 652 MB)
Igeiszerkezet-lista
a Mazsola adatbázisból automatikusan származtatott igeiszerkezet-lista
– melyből a
Magyar igei szerkezetek
című szótár is született
→
Letöltés
(535609 igei szerkezet, zippel tömörítve 3 MB)
További információk:
2015-04-29 –
előadás
az
NLP meetup
-on
2015-01-15 –
poszter
+
cikk
a
XI. MSZNY konferencián