Magyar Nemzeti Szövegtár

Kárpát-medencei Magyar Nyelvi Korpusz

Résztvevők | Workshop | Letöltés | Linkek | Hírek | Nyitólap

Szlovákiai magyar nyelvváltozatok

Korpuszépítés

A Kárpát-medencei Szövegtárban a szlovákiai magyar nyelvváltozatokat a tervek szerint 4 millió szó reprezentálja. Feladat: validált egységek létrehozása, ill. leadása a Nyelvtudományi Intézetnek. A legkisebb összetevőnek, értsd: nyelvi változatnak is legalább 10%-osnak kell lennie. A gyűjtésben - lehetőség szerint - az internetes kell feldolgozást alkalmazni.

Eddigi munka (2003. február 1. - április 24.)

1. Források kijelölése gyűjtésre (lásd alább).

2. Állandó kapcsolat kiépítése lapszerkesztőségekkel.

3. Megfelelő számítógépes szakember biztosítása.

4. Megkezdődött a számítógépes program segítségével történő gyűjtés.

5. Folyamatosan zajlik az egyéb regiszterekbe (főleg szépirodalom) való gyűjtés.

Gyűjtött - gyűjtendő korpusz
  1. Sajtó

    1. NAPILAP

      1. Új Szó független napilap. Megvan az 1998-as anyagból kb. 19MB mennyiségű válogatás, ill. megkezdődött az anyag számítógépes programmal való gyűjtése az Internetről. (2003. ápr. 22-én kb. két heti anyagot gyűjtöttünk fel). Van remény az Új Szó elektronikus változatú archívanyagának megszerzésére is. Ezt a kb. 1995 óta tárolt anyagot azonban természetesen nagyobb előkészítő munka elvégzéséve l lehetne beemelni a korpuszba. (Tóth Károly a Fórum Intézet igazgatója megbeszélte Szilvássy József főszerkesztővel, hogy a lapot gyűjthetjük a szövegtárba.)

    2. HETILAP

      1. Szabad Újság. Simon Szabolcs a lap elektronikus változatának készítőjével, Hajdú Mónikával elektronikusan elmentett próbaanyagot készíttetett a hetilap f. é. januári évfolyamából. Kiderült, hogy a lap közvetlenül a szerkesztőségből való beszerzése bonyolultabb és költségesebb, mint az Internetről lehúzása. Emellett S. Sz. megbeszélte Fónod Zoltán főszerkesztővel, hogy a lapot gyűjthetjük a szövegtárba. A lap számítógépes gyűjtése a meglévő gyűjtőprogram adaptálása után napokon belül megkezdődik.

    3. HAVILAP

      1. Új Nő női magazin. A lap teljes mennyiségében a Gramma birtokában van, közvetlenül a szerkesztőségből kaptuk CD-n, txt-s és bak-os kiterjesztésű változatokban. Annak kérdése még nincs eldöntve, hogy a lapot továbbra is a szerkesztős égből szerezzük be mechanikusan, vagy térjünk át az internetről lehúzásos változatra.

      2. Katedra pedagógusok és szülők lapja 1998-as évfolyama lecsupaszított szöveges, rtf-változatban megvan, a szerkesztőségben Nagy Attila készítette el S. Sz. kérésére.

      3. Heti Ifi ifjúsági lap. Internetről lehúzásos üzemmódban a napokban meg kezdődik a gyűjtése a megfelelő program adaptálásával. Pintér Tibor megbeszéli a főszerkesztővel, Bárány Jánossal.

      4. Szőrös Kő ifjúsági szépirodalmi-irodalomkritikai szakfolyóirat. Gyűjtése, internetes változat hiányában, közvetlenül a szerkesztőségből lehetséges. Elvi akadálya nincs, S. Sz. megbeszélte a főszerkesztővel, Haraszti Máriával.

      5. Irodalmi Szemle. Internetről lehúzás-os üzemmódban a napokban megkezdődik a gyűjtése a megfelelő program adaptálásával.

      6. Gömörország regionális kulturális-társadalmi folyóirat.

    4. REGIONÁLIS LAPOK

      1. Csallóköz regionális hetilap. Internetről lehúzásos üzemmódban a napok ban megkezdődik a gyűjtése a megfelelő program adaptálásával.

      2. Párkány és Vidéke regionális nyugat-szlovákiai hetilap. Gyűjtése, internetről lehúzásos üzemmódban a napokban megkezdődik. Elvi akadálya nincs, S. Sz. megbeszélte a főszerkesztővel, Himmler Györggyel.

      3. Gömöri Hírlap regionális hetilap. Gyűjtése, internetről lehúzásos üzemmódban a napokban megkezdődik, amennyiben még megjelennek az interneten. Elvi akadálya nincs, S. Sz. megbeszélte a főszerkesztővel, Hacsi Attilával.

      4. Keleti napló regionális hetilap. Gyűjtése tervbe van véve, a begyűjtés mó dja azonban még nem tisztázott. S. Sz. ez ügyben levelezést folytat a kompetens személyekkel.

    5. DIÁKLAPOK

      1. Kristály. A Dunaszerdahelyi Szabó Gyula utcai középiskola diklapja. Gyűjtése, internetes változat hiányában, közvetlenül a szerkesztőségből lehetséges. S. Sz. a kéziratok rendszeres leadását a korpusz számára megbeszélte Juhos Mónika főszerkesztővel.

      2. Su-su-suli. A Dunaszerdahelyi Kodály Zoltán Alapiskola diáklapja. Gyűjtése, internetes változat hiányában, közvetlenül a szerkesztőségből lehetséges. A kéziratok rendszeres leadását a korpusz számára S. Sz. megbeszélte Patai József pedagógussal mint a lapért felelős személlyel.

      3. IZÉ. A Dunaszerdahelyi Vámbéry Ármin Gimnázium diáklapja.Gyűjtése, internetes változat hiányában, közvetlenül a szerkesztőségből lehetséges. A kéziratok rendszeres leadását a korpusz számára P. T. megbeszéli a lapért felelős személlyel.

  2. Szépirodalmi szövegek

    1. Győri Attila: Ütközés - regény (S. Sz. gyűjtötte be közvetlenül a szerzőtől )

    2. Kerékkutya - regény (S. Sz. gyűjtötte be közvetlenül a szerzőtől).

  3. Tudományos és ismeretterjesztő irodalom

    1. Fórum Társadalomtudományi Szemle. Internetről lehúzásos üzemmódban a napokban megkezdődik a gyűjtése a megfelelő program adaptálásával.

    2. Mayer Judit 2003. A legújabb nyelvművelő könyve. Lilium Aurum: Dunaszerdahely. (S. Sz. gyűjtötte be rtf-es változatban a Lilium Aurum Kiadóból.)

    3. Jakab István 2000. Érthetően, alkalomhoz illően. Nap Kiadó: Dunaszerdahely. (S. Sz. gyűjtötte be rtf-es változatban a Lilium Aurum Kiadóból.)

  4. Hivatali nyelv

    1. A dunaszerdahelyi polgármesteri hivatal kisdokumentumait tervezzük begyűjteni. Pintér Tibor végzi a feladatot.

  5. Személyes közlés

    1. A pozsonyi Comenius Egyetemen a 60-as évektől a 80-as évek elejéig Sima Ferenc professzor vezetésével felgyűjtött nyelvjárási anyag elhelyezése és elektronikus formában való átmentése (magnetofonszalagokról) a somorjai Fórum Intézetben valósul meg. Erről S. Sz. megállapodott a pozsonyi magyar tanszék és a somorjai Fórum Intézet illetékes személyeivel.

Vajdasági Nyelvi Korpusz

Feladatok
  1. A 2003. évi munkaterv műszaki részének első félévi munkafeladatai a nyelvi korpusz működéséhez szükséges műszaki feltételek létrehozása, a szükséges szoftverek telepítése és a számítógép hálózatba kötése a meglévő számítógéppel. A számítógép Internet kapcsolatának létrehozása, a munkafolyamat első fázisának megkezdése. (első fázis: 1. Anyaggyűjtés és 2. Nyersanyag rendszerezése)

  2. A VAJDASÁGI MAGYAR NYELVI KORPUSZ honlapjának kidolgozása az OZORAY ÁRPÁD MAGYAR MŰVELŐDÉSI EGYESÜLET honlapjának részeként. A honlap elkészítésének határideje 2003. június 1.

  3. A 2003. évi munkaterv műszaki részének második félévi munkafeladatai a nyelvi korpusz munkafolyamatában a második és harmadik fázis megkezdése (nyersanyag tisztítása, nyers (HTML) fájl konverziója nyers SGML (XML) fájlba és befejező fázis).

  4. 2003. december 31-ével befejezően a Vajdasági Magyar Nyelvi Korpusz 350.000 szó feldolgozására vállalkozik a vajdasági magyar internetes letöltésből (a nyersanyag 75%-a), nyomdai anyaggyűjtésből (a nyersanyag 20%-a), egyéb - kézirat, hanganyag stb. digitalizálásával kapott nyersanyagból (a nyersanyag 5%-a): Magyar Szó, hetilapjaink, a Hétnap, Családi Kör, helyi lapjaink (Új Kanizsai Újság), valamint: Alapkő, Aracs - a délvidéki magyarság közéleti, Képes Ifjúság, Jó Pajtás, Hitélet, Sulibuli a temerini Kókai Imre Általános Iskola diáklapja, Dunatáj Zombor község hetilapja, Vajdasági Vidám Cimborák Új Egészség, Új Kép; a Szabadkai Rádió, Újvidéki Rádió, Újvidéki Televízió, szöveg- és hanganyagának számbavétele, rögzítése, feldolgozása, de megkörvonalazódott a kiadóházakkal való kapcsolat is egy elektronikus könyvtár létrehozására (Forum, Életjel, Logos Grafikai Műhely, Grafoprodukt, Vajdasági Magyar Közművelődési Társaság stb.).

Kárpátaljai Nyelvi Korpusz

Feladatok
  • A Kárpátaljai Nyelvi Iroda feladata, hogy 3 millió szóval bővítse a MNSZ adatbázisát. A validált egységeket a Nyelvtudományi Intézetbe kell továbbítani. A gyűjtött anyag öt kategóriát kell hogy felöleljen: sajtó, tudományos ismeretterjesztő irodalom, szépirodalomi szövegek, hivatalos nyelv és személyes közlés. Mindegyik kategória legalább 10%-át kell hogy alkossa a gyűjtendő mennyiségnek.

  • 2003. február 1. - április 24. között a következő feladatokat végeztük el:

    • Megtörtént a számítógépes programok installálása.

    • Megkezdődött a források kijelölése, az anyag begyűjtése.

    • Felvettük a kapcsolatot többek között a KMTF -fel, KMTF HÖK -kel, Balla D. Károllyal, akik rendelkezésünkre bocsátották anyagaikat és hozzájárultak a Korpuszba való beépítésükhöz.

    • Felvettük a kapcsolatot kárpátaljai magyar lapok szerkesztőségeivel.

Korpuszépítés

Az egyes kategóriákba az anyagot a következő források szolgáltatják:

  1. Sajtó

    1. Kárpátalja

      Megbeszéléseket folytattunk a szerkesztőséggel, minek eredményeként rendelkezésünkre bocsátják az újság teljes archívumát, melyet CD-n kapunk meg.

    2. Kárpáti Igaz Szó

      Engedélyt kaptunk a Kárpátai Igaz Szó szerkesztőségétől az általuk publikált anyagok Korpuszba való elhelyezésére.

    3. Bereginfo

      A Bereginfo szerkesztősége szintén engedélyt adott a lap tartalmának a Korpuszba való elhelyezésére.

    4. Kárpátinfo

      Kárpátalja legnagyobb magyar nyelvű információs portálja.

  2. Szépirodalmi szövegek

    1. Ungparty honlap

      Balla D. Károly neves Kárpátaljai költő honlapja, melyen számos Kárpátaljai és külföldi szerző művei megtalálhatóak.

    2. Pánsíp

      Az irodalmi folyóirat archívuma a 2001 -es számoktól kezdődően áll rendelkezésünkre.

  3. Tudományos és ismeretterjesztő irodalom

    1. Acta Beregsasiensis kiadványai

    2. A KMTF által rendezett konferenciák anyagai

    3. TDK- vagy más konferenciákon elhangzott előadások anyagai, melyek Word dokumentum formátumban állnak rendelkezésünkre.

    4. A KMTF tanárainak és diákjainak publikációi

  4. Hivatali nyelv

    1. Ukrajna Alkotmányának magyar fordítása

    2. A KMTF munkatársai által fordított és használt hivatalos szabványok.

    3. A KMTF HÖK alapszabályának szövege, mely szintén Microsoft Word formátumban áll rendelkezésünkre.

  5. Személyes közlés

    1. A Limes Társadalomkutató Intézet által felvett hanganyagok digitalizálása és Word formátumba alakítása, később validálása.

    2. Kárpátinfo információs portálon működő fórum.

Erdélyi magyar nyelvváltozatok

Feladatok

Last modified: Wed Jun 23 14:31:31 CEST 2004