Mint minden nyelv, a magyar is mutat területi jellegzetességeket, hangzásbeli, grammatikai vagy éppen a szókészletben jelentkező különbségeket az egyes régiók, települések nyelvhasználata között. A nyelv területi változatai a nyelvjárások. Az egyes nyelvjárások természetesen nem egymástól függetlenül léteznek, érintkeznek, hatnak egymásra, folyton változnak. A nyelvben lévő területi különbségekkel, illetve azok változásaival, társadalmi megítélésével foglalkozik a dialektológia vagy nyelvjáráskutatás és a szociolingvisztika vagy társasnyelvészet.
A magyar számítógépes dialektológia közel húszéves múltra tekinthet vissza, 1995-ben kezdődött meg ugyanis a magyar nyelvjárási adattárak, a nyelvi adatokat térképlapokon bemutató nyelvatlaszoknak számítógépes feldolgozása. Az informatikailag is megalapozott módszerek jelentősen megnövelték az adatok felhasználási lehetőségeit, sokkal egyszerűbbé tették a kvantitatív elemzéseket.
Nyelvföldrajz és dialektometria
A magyar nyelvjárások atlasza (MNyA.) és A romániai magyar nyelvjárások atlasza (RMNyA.) azonos tárgyú térképeinek egyesítésével a teljes magyar nyelvterületet áttekinthetjük, ahogyan azt a kacsa különböző nyelvjárási változatait bemutató térkép [1.] szemlélteti. A különböző változatok közti eltérések lehetnek lexikaiak (például kacsa – réce), de lehetnek csupán egy-két hangot érintő eltérések is (például kacsa – kácsa). Azt, hogy az egyes kutatópontokon – azokon a településeken, jellemzően minden tizediken, ahol az ötvenes-hatvanas években az adatgyűjtést elvégezték – mely változatok fordulnak elő, a kutatópontokat szimbolizáló körök színe mutatja meg a térkép magyarázatának megfelelően. Maguk a nyelvjárási adatok, amelyek alapján a térkép készült, természetesen sokkal nagyobb változatosságot mutatnak, főleg a magánhangzók ejtése lehet más és más az egyes nyelvjárásokra jellemző hangrendszer függvényében (a Palócföldön például a kacsa magánhangzói a köznyelvi á-hoz hasonló minőségűek, a réce első magánhangzója pedig sok nyelvjárásban diftongus, kettőshangzó: riéce vagy réice).
Természetesen számtalan más példát említhetnénk, gondoljunk csak a burgonyára, amelyet hívhatnak pityókának vagy krumplinak, sőt, kolompérnak is, vagy a lepkére, amelynek sok helyen pillangó, esetleg pillancs, netán lepe a neve (a felsorolás korántsem teljes). Az egyes változatok területi elterjedtsége azonban térképenként más és más, vagyis minden térképen máshová esnek a különböző változatok közti határok (nyelvjárási térképek megtekinthetők itt: http://geolingua.elte.hu).
A földrajzi változatosság persze nem jelenti azt, hogy ne értenénk legalább egy részét azoknak a nyelvi jelenségeknek, amelyek lakóhelyünktől távolabb honosak. Az irodalmi nyelv, illetve a szaknyelvek gyakran merítenek a változatos nyelvjárási jelenségekből, és így számos táji kötöttségű szó vagy kifejezés szélesebb körben is ismertté válik.
A nyelvjárások összevetése, a köztük lévő hasonlóság mértékének megállapítása a célja a nyelvjárásmérésnek, szakszóval élve dialektometriának. A dialektometria több száz (esetleg több ezer), egy-egy jelenség területi változatait bemutató térképlap adatai alapján állapítja meg a kutatópontok közti nyelvi hasonlóság mértékét. Hans Goebl és munkatársai a térképlapok adatainak osztályozásával, csoportosításával végeztek ilyen vizsgálatokat (www.dialectometry.com). Újabban a groningeni (Hollandia) egyetem kutatói, John Nerbonne és Wilbert Heeringa egy matematikai eljárás, Levenshtein algoritmusának alkalmazásával számszerűsítik a nyelvi adtok hasonlóságának mértékét (www.let.rug.nl/alfa/dialect/index.html.en). A hasonlóság 100% két teljesen azonos adat esetén, és 0% akkor, ha egyetlen közös hang sincs bennük (a kacsa és a kácsa igen hasonló, a réce mindkettőtől maximálisan különbözik). Ezt az algoritmust használja a helyesírás-ellenőrző is, amikor megnézi, hogy a rendelkezésére álló szótárban megtalálható-e az, amit beírtunk, és ha nem, összevetésekkel megkeresi a szótár leghasonlóbb elemeit.
Népességmozgások
A dialektometriai vizsgálatokban több száz térképlap adatait hasonlítjuk össze páronként, az adatpárok hasonlósági értékeit pedig minden egyes kutatópont-pár esetében átlagoljuk, így megtudjuk, hogy egy kutatópont minden más kutatóponttal rendre átlagosan milyen mértékű hasonlóságot mutat. Az adatok összevetésének eredménye egy olyan térkép, amely egy színskála mentén megmutatja, hogy egy kiválasztott kutatópont mely kutatópontokkal mutat nagyobb, melyekkel kisebb hasonlóságot (saját magával minden kutatópont 100%-os, a többivel kisebb hasonlóságot mutathat).
Az alábbiakban Levenshtein algoritmusát alkalmazva, A magyar nyelvjárások atlasza 476 térképlapjának felhasználásával, illetve A magyar nyelvjárások atlasza és A romániai magyar nyelvjárások atlasza 165 térképlapjának egyesítésével, néhány példán mutatom be a magyar nyelvjárások dialektometriai vizsgálatában rejlő lehetőségeket.
A dialektometriai térképeken a kijelölt kutatópontot vastag fekete karika jelöli. Színskála érzékelteti a többi település nyelvi távolságát a kijelölt kutatóponttól: minél melegebb (bordó, piros) egy kutatópont színe, adatai annál nagyobb arányban mutatnak egyezést a kiválasztott kutatópont adataival. Minél hidegebb színt kap egy kutatópont, illetve minél sötétebb kék vagy fekete, annál kisebb a nyelvi hasonlóság közte és a kiválasztott kutatópont között. Így minden egyes térkép egy-egy település nyelvi hasonlósági viszonyait mutatja meg.
Az első dialektometriai térképen [2.] a rábaközi Mihályi a kijelölt kutatópont, jól látszik, hogy leginkább közvetlen környezete nyelvjárásaival mutat egyezéseket. A palócföldi Ecseg kiválasztásával [3.] fölvillan az egész palóc nyelvjárásterület, sőt, délen is több helyen látszanak nagyobb hasonlóságot mutató kutatópontok, évszázadokkal ezelőtti észak-déli irányú népességmozgásokra utalva.
A történettudomány és a helynévkutatás régóta vizsgálja a Székelyföld és a Dunántúl egyes régiói közti településtörténeti kapcsolatokat. A magyar nyelvjárások atlasza igen kevés székelyföldi kutatópontot tartalmaz, ezen kutatópontok feltehetőleg településtörténeti kapcsolatokra visszamenő nyelvi hasonlósági viszonyai jól vizsgálhatók módszerünkkel. Csíkrákos adatai például a Balaton környékével, annak is inkább északi területeivel mutatnak nagyobb arányú egyezést [4.]. (Ne tévesszenek meg senkit a bordóba hajló dél-dunántúli kutatópontok, hiszen azok nem a dunántúliak, hanem az áttelepített bukovinai székelyek nyelvjárását képviselik.)
Legszebben beszélő területek
A magyar nyelvjárások atlasza és A romániai magyar nyelvjárások atlasza azonos tárgyú térképlapjainak összekapcsolásával lehetőségünk van arra, hogy a teljes magyar nyelvterületet egészében szemléljük (az érdeklődők akár az interneten keresztül is kipróbálhatják az egyelőre 165 térképlap alapján elkészített interaktív térkép internetes változatát, ahol az egyes kutatópontokra kattintva választhatjuk ki, mely település nyelvi hasonlósági viszonyait szeretnénk megnézni: www.bihalbocs.hu/dialektometria_demo.html).
Utolsó térképünk [5.] azonban nem egy konkrét település nyelvi hasonlóságát mutatja meg, hanem a kutatópontok köznyelvtől való távolságát. A térkép elkészítéséhez valamennyi kutatópont összes adatát egy olyan lista megfelelő elemeivel vetettük egybe, amely a köznyelvinek tekinthető változatokat tartalmazza. A térkép tehát azt mutatja meg, milyen arányban mutatnak egyezést az egyes kutatópontok adatai a köznyelvinek tekinthető megfelelőikkel. A köznyelvtől való legnagyobb arányú eltérés a Nyugat-Dunántúlon figyelhető meg, viszonylag nagyobb nyelvi távolság mutatkozik keleten a Székelyföld és a hozzá közeli települések esetében, valamint jól elkülönülnek északon a palócföldi nyelvjárások is. Egyezést leginkább Sárospatak környéke mutat; nem meglepő ez, ha belegondolunk, hogy a magyar nyelvújítás meghatározó alakja, Kazinczy Ferenc éppen itt töltötte iskolás éveit, vagyis ez volt tudatos nyelvi fejlődésének legfőbb állomása, és így a magyar köznyelv alakításakor a legfőbb viszonyítás.
A rendszerváltás előtt száz magyarországi település bevonásával készített Magyar Nemzeti Szociolingvisztikai Vizsgálat (Nyelv és társadalom a rendszerváltáskori Magyarországon, Osiris Kiadó) adatfelvételekor sok más, a nyelvhasználatra vonatkozó és azt vizsgáló kérdés mellett azt is megkérdezték az adatközlőktől, hol beszélnek a legszebben magyarul és hol a legcsúnyábban. A vizsgálat (amely a nyelvterületnek csak a magyarországi részére korlátozódott) az adatközlők nyelvjárásterületek szerinti csoportosításával mutatja be a kérdésre adott válaszokat. Adódik az összevetés a köznyelvtől való távolságot megmutató dialektometriai térképpel, azaz fölmerül a kérdés, mennyire tartják saját nyelvjárásukat szépnek a magyar beszélők anyanyelvjárásuk köznyelvtől való távolságának függvényében.
Az adatközlők többnyire saját lakóhelyükhöz igazodva választottak legszebben beszélő területet: a déli nyelvjárásterülethez tartozók Bács-Kiskun megyét, a tiszaihoz tartozók Békés megyét, a Közép-Dunántúlon élők a Dunántúlt, az északkeletiek Szabolcs megyét. Éppen ezért feltűnő, hogy azok az adatközlők, akik a dialektometriai térkép tanúsága szerint a köznyelvitől legtávolabbi, legeredetibb nyelvváltozatokat beszélő területek lakói (Nyugat-Dunántúl, Palócföld) nem saját nyelvváltozatukat ítélték legszebbnek. A palóc nyelvjárásterület adatközlői Pest megyét tették az első helyre, a nyelvjárásnak leginkább megfelelő Nógrád megyét – Budapest után – csak harmadikként említették. A köznyelvtől legtávolabbi, nyugati nyelvjárásterület adatközlői már egyenesen Vas megye nyelvhasználatát ítélték a legcsúnyábbnak, az első két helyen itt is Pest megye és Budapest áll.
Fontos tanulság lehet ez nemcsak az anyanyelv-pedagógia számára, hanem mindazoknak, akiknek lényeges, hogy a magyar nyelvjárások megítélése és maga a nyelv, közös nyelvünk olyan irányban fejlődjék, hogy mindannyian egyformán otthon legyünk benne.
VARGHA FRUZSINA SÁRA
2014/11