A Google cég Fordító szolgáltatása – mely 2009 januárjától vált elérhetővé magyarul is (http://translate.google.hu/#), s immár 52 nyelven, 44 nyelvpárban fordít – más fordító programokkal szemben nem nyelvtani, hanem statisztikai elemzést alkalmaz. Ez nagy mennyiségű eredeti nyelvű és lefordított szöveg statisztikai elemzésén alapul1. A következőkben azt fogjuk megvizsgálni, hogy – magyarról angolra történő fordítás esetén – mire képes a Google Fordító, hol húzódnak használhatóságának határai, és milyen típusú mondatokkal és kifejezésekkel nem boldogul.
Következzék a teljesség igénye nélkül néhány nyelvtani szerkezet, mely problémát okozhat a mechanikus fordításban.
A táblázat szerkezete (egy példa kivételével):
| Magyar példamondat | A Google Fordító fordítása angolra |
| Délután el kell mennem bevásárolni. | In the afternoon I have to go shopping. |
| A valaha gondozott kertet mára ellepte a gyom és a gizgaz. | The once well-kept garden, today was full of weeds and the weed. |
A Fordító az egyszerű szókincsű, nem összetett magyar mondatokat általában helyesen ülteti át angolra, ám néha hibázik mind az igei, mind a névszói-igei állítmányok esetén. A fordításban az állítmány sok esetben hiányzik, ha létige. Egyéb, érthetetlen eltérések is tapasztalhatóak (az alany cseréjétől megváltozik a lefordított mondat szerkezete). Ezekért valószínűleg a statisztikai elemzés szabályai felelősek.
| A bicikliző kisfiú megcsúszott és elesett. | The biking boy slipped and fell. |
| Hat alma van az asztalon. | Six apples on the table. |
| Békések a téli esték. | Peaceful in the winter evenings. |
| Tavasszal zöldek a fák. | Spring green of the trees. |
| Tavasszal zöldek a levelek. | Spring green leaves. |
A határozott alanyú mondatokat általában helyesen fordítja a program, a határozatlan és általános alanyú mondatokat nem mindig. A hiányos szerkezetű mondatokat (ahol hiányzik a harmadik személyű határozott alany) gyakran nem tudja értelmezni, mivel a személyragokat nem veszi figyelembe, így ezeket a mondatokat az ige szótári alakjának tekinti.
Műveltető igéket nem tud értelmezni. Sokszor azokkal az igékkel sem tud mit kezdeni, melyeknél az igekötő a közvetlenül az igéhez tapad.
| A katonák körülvették az erődítményt. | The soldiers surrounded the fort. |
Nagyrészt felismeri a többes számot, de itt is vannak következetlenségek. Például a „denevér” fordítása „bat”, ám a szintén egyes számú „bőregér” megfelelője már „bats”.
Koránt sem ismer fel minden szót vagy kifejezést.
| Ma éjjel a kastélyban alszunk. | Tonight we sleep in the castle. |
| Ma a kastélyban éjszakázunk. | Today the castle the night. |
A toldalékok terén igen vegyes a kép. Előfordul, hogy az igeképzővel ellátott főneveket nem ismeri föl (pl. terefere – tereferél). A folyamatos és befejezett melléknévi igeneveket át tudja ültetni angolra, a beállókat gyakran nem.
| Ez a megírandó dolgozat. | This megírandó students. |
| Eszter szebb, mint a másik lány. | Esther is better than the other girls. |
Míg a felsőfok jele általában nem okoz gondot a programnak, addig a középfok jelét és a kiemelőjelet nem tolerálja.
| A másik sütemény édesebb volt. | The other was a sweet cake. |
A birtoktöbbesítő jelet és a birtokos személyjelet ismeri a program, a birtokjelet nem.
| A bicikli Katié. | The bike was Katie. |
A ragok is nehézséget okozhatnak.
| Virágot a virágnak. | Flowers in the flower. |
A -val, -vel raggal ellátott személyneveket nem tudja szabályosan lefordítani.
Az alábbi esetben pedig a főnévhez tapasztott határozórag lefordíthatatlanná teszi azt a program számára. Mint majd egy későbbi példában a személynévhez kapcsolt birtokos személyjel esetén is látjuk, a Fordító felismeri a kifejezendő nyelvtani viszonyt, ám a szótőhöz tapadó toldalékot nem vágja le („my Glaukónom”). A hibás alakról azonban a helyes eredményre jut.
| Ez a történet a nevetésről szól. | This is the story of nevetésről about. |
| Ez a történet a nevetés szól. | This is a story about the laughter. |
Hasonló módon ad eredményt a „lovagkor” szóra, de a „lovagkorban”-ra már nem.
A Fordító esetenként összetéveszti a hasonló alakú szavakat.
| Egyenlőre vágd a szeleteket! | Time being cut in slices! |
Az „egyenlőre” helyett az „egyelőre” szó megfelelőjét kínálja a program. Ezt bizonyítja az is, ha az angol mondatot ismét magyarra fordíttatjuk vele: „Egyelőre csökkentése szelet!“ Nyugodjunk meg: a „gondatlan“ és a „gondtalan“ szavak közti különbséget ismeri.
Az azonos alakú szavak egy része között képes különbséget tenni (vár, hét, nyelv, nap, fog), más részüket összetéveszti (egy, körte, hullám, ért).
| Hányadik vagy a névsorban? | Th or névsorban? |
| Hófehér lett a ruha. | Latvian snow-white dress. |
| Fáradtság lett úrrá rajta. | Latvian fatigue overcame her. |
Ugyanakkor:
| A lettek éhesek lettek. | The have been hungry. |
Egy példa ugyanerre a jelenségre angolból magyarra történő fordítás esetén:
| „Then God said, ’Let there be light,’ and there was light.”2 | Aztán Isten azt mondta: "Legyen világosság", és nem volt könnyű. |
Fényt teremteni tehát nehéz feladat.
Az alábbi példában a program nem tévesztette össze az azonos szóalakok jelentését, ám rossz sorrendben szerepeltette őket.
| Már eheti az eheti tortáját. | Already this week to eat cake. |
A következő esetben helyesen fordított, és feltételezte, hogy egy hölgyről van szó.
| Sírt, miközben gondozta a sírt. | She cried while taking care of the grave. |
Itt is felismerte a négy hasonló alakú szó más-más jelentését, de a mondat értelmét nem tudta megtartani:
| Fogat fog fogni a fogatban. | Teeth will hold the horses. |
A Fordító – ahogy mi emberek is – szövegkörnyezettől függően tulajdonít jelentést a szóalaknak. Az alábbi feladatot részben helyesen oldotta meg, de a speciális kifejezéseket és szólásokat nem ismerte fel.
| Fáj a hasad? | Does it hurt your stomach? |
| Hasad a hajnal. | Split the dawn. |
| Hasadra süt a nap. | Splitting the sun. |
Általánosságban megállapíthatjuk, hogy a Fordító a kifejezések egy részét ismeri (pl. „a teljesség igénye nélkül”, „egyre megy”), ám itt is találkozhatunk hibákkal.
| A szóban forgó gépkocsi kétüléses. | The two-seater car in question. |
| A szóban forgó autó kék. | That car is blue. |
A speciális kifejezések másik részét és a szólásokat, közmondásokat szó szerint fordítja le, ám ezáltal a legtöbb esetben elveszik az értelmük idegen nyelven.
| Hármat találhatsz. | Three can be found. |
| Megalszik a szájában a tej. | Curdle the milk in his mouth. |
| Szemen szedett hazugság. | Eye taking a lie. |
Hasonló a helyzet a szójátékokkal és nyelvtörőkkel.
| Az ipafai papnak fapipája van, ezért az ipafai papi pipa papi fapipa. | The ipafai priest fapipája is, therefore, the pipe ipafai Pop Pop fapipa. |
A Fordító képes a kötőjellel kapcsolt szószerkezetek és szóösszetételek értelmezésére, ám néhány esetben egészen sajátságos megoldásokat kapunk:
| Petőfi-verseket szívesen olvasok. | Please read the Petőfi-poems. |
| Szívesen olvasok Babits-verseket. | We read poems, Babits. |
| A Gellért-hegyre fogunk sétálni menni. | The Gellért Hill will go for a walk. |
Le tudja fordítani az ismertebb mozaikszókat (DNS, ENSZ).
Bizonyos esetekben felismeri a személyneveket, ám nem mindig.
| Kovács Péter mindig későn ér haza. | Péter Kovács always late to come home. |
| Angyal Katalin elment vásárolni. | Catherine went to buy an angel. |
| Kolléganőm, Angyal Katalin elment vásárolni. | Colleague, Catherine Angel went shopping. |
A Fordító nem törődik a szigorú értelembe vett szórenddel vagy a toldalékokkal: inkább a meglévő szavakból egy számára értelmesnek tűnő mondatot állít össze – mint tudjuk, statisztikai alapon.
| A tavak kristálytiszta vize kékeszölden szikrázott a napsütésben. | The lakes are crystal clear blue-green waters sparkled in the sunlight. |
| A megevett alma érett volt. | The ripe apple was eaten. |
A fenti angol mondat pontos jelentése: „Az érett almát ették meg.” Tehát több alma is volt az asztalon, köztük éretlenek. Az eredeti magyar mondat ezt a jelentéstöbbletet nem tartalmazza.
A nyelvtani szabályok és toldalékok ismeretének hiánya sokszor pontatlan vagy téves fordítást eredményez. Ezen felül ismét találkozunk azzal a sajátos jelenséggel, hogy egy alany cseréjével érthetetlen okból a fordítás mondatszerkezete is megváltozik.
| A krumpli sok étel alapanyaga. | The potato dish in many materials. |
| A burgonya sok étel alapanyaga. | Potatoes are a lot of food material. |
| A pityóka sok étel alapanyaga. | The pityóka many food materials. |
| A kolompér sok étel alapanyaga. | The kolompér many food materials. |
Láthatjuk, hogy a Fordító nem ismeri a nyelvjárások speciális szókincsét (pl. tikmony).
Az archaikus szóalakok egy részét fölismeri, más részüket azonban nem. Példánkban a „monda” nem okozott különösebb nehézséget, ellenben a „vala” alakot, melyet a program a „valamennyi” szóhoz érzett hasonlónak, „all”-ra fordított.
| A kígyó pedig ravaszabb vala minden mezei vadnál, melyet az Úr Isten teremtett vala, és monda az asszonynak: Csakugyan azt mondta az Isten, hogy a kertnek egy fájáról se egyetek?3 | The snake was more cunning wild beast all in all land which the Lord God created all, and said the woman told me to God, indeed, that the garden is a tree not eat? |
Természetesen a Halotti beszéd és könyörgéssel nem tud mit kezdeni, ám ezt túlzás volna elvárnunk. Egy gépi fordító szempontjából valószínűleg nem is tekinthető ugyanannak a nyelvnek az ősmagyar és a ma használt nyelv.
A szleng kifejezések nagy általánosságban nem ismeretlenek a program számára, ám a képzett alakjaik néha igen (pl. ismeri a „kaja” szót, de a „kajálni”-t már nem).
Szaknyelvi szöveg esetén – bár a szakkifejezéseket többnyire helyesen fordítja – azáltal, hogy a szavak közti viszonyokat figyelmen kívül hagyja, alapvetően változtatja meg a szöveg értelmét. Ezért semmiképpen nem ajánlatos tudományos szöveget csak a Google Fordítóra hagyatkozva olvasni.
| „Az animus és az anima alakjában a kollektív tudattalan autonómiája fejeződik ki. A tudattalan tartalmát személyesítik meg, amely a projekcióból visszahozva integrálódik a tudatba. Ennyiben a két alak olyan funkciókat mutat fel, amelyek a kollektív tudattalan tartalmát juttatják el a tudathoz. Ők azonban mint olyan csak akkor jelennek meg vagy addig működnek, ameddig a tudat és a tudattalan tendenciái nem válnak el túlságosan.”4 | The animus and anima in the form of the collective unconscious autonomy is expressed. The personalized content of the unconscious, which is integrated into the consciousness of the projekcióból visszahozva. To that extent, the two figures show functions that are transmitted to the contents of the collective unconscious to consciousness. However, they only appear as a long or work as long as the mind and the unconscious tendencies do not become too much. |
Tapasztalatunk szerint a nyelvfelismerés (a programban szereplő nyelvek esetén) általában helyesen működik. A program másik előnye, hogy a beírt szöveg mennyisége gyakorlatilag nincs korlátozva.
A Fordító a megfelelő igeidő kiválasztására sem képes, mert az a mondat jelentésétől függ, amivel a statisztikai elemzést végző gép nincs tisztában. Ez a hiányosság is torzít a fordítás jelentésén.
Bonyolult tartalmú összetett magyar mondatokkal nem tud megbirkózni a Fordító.
Merániai János esztergomi érsek kétértelmű válasza az írásjelek által eltérően tagolva:
| „A királynőt megölni nem kell félnetek, jó lesz, ha mindenki beleegyezik, én nem ellenzem.”5 | The Queen does not need to kill fear, will be good if everyone agrees, I do not oppose. |
| „A királynőt megölni nem kell, félnetek jó lesz, ha mindenki beleegyezik, én nem, ellenzem.”6 | The Queen does not need to kill him, fear would be good if everyone agrees, I will not, oppose. |
Ugyanakkor egyetlen betű megváltoztatásának hatására (királynő → királyné) a Fordító a szavak közti viszonyt is felcseréli.
| A királynét megölni nem kell félnetek, jó lesz, ha mindenki beleegyezik, én nem ellenzem. | The fear must not kill the queen, will be good if everyone agrees, I do not oppose it. |
Mint az alábbi példák is mutatják, az ehhez hasonló szövegek esetén az értelmi torzulás elkerülhetetlen.
| „Éppen azért van, kedves Glaukónom, olyan óriási fontossága a zenei nevelésnek, mert a ritmus és a dallam hatolnak be legjobban a lélek belsejébe, azt hatalmas erővel megragadják, s jó rendet hozva magukkal, azt, aki helyes elvek szerint nevelkedik, rendezett lelkű emberré teszik (…)”7 „(…) a zene nem végződhetik másutt, mint a szép szeretetében.”8 | That is why I have my Glaukónom, a great importance of music education, because rhythm and melody penetrate into the interior of most of the soul, it is great to seize power, and bringing with them a good order, the one who brought up according to the principles of good, sound-minded man made (...) (...) The music does not end with elsewhere, such as the beautiful love. |
Hosszas fejtörés árán nagyjából rájöhetünk, hogy Platón és Hesse mit akart mondani, de a kapott eredmény nem felel meg teljesen az eredetinek, és ezáltal félreértéseket eredményezhet.
| „… mert ha bizonyos szempontból s főleg meggondolatlan embereknek könnyebbség és felelőtlenebb vállalkozás is a létezők helyett nemlétező dolgokat jeleníteni meg szóban, ez azért a jóravaló és lelkiismeretes történetíró esetében épp fordítva van: semmi sem szegül annyira ellene a szóban való ábrázolásnak, s mégis mit sem szükségesebb úgy az emberek szeme elé állítani, mint az olyasféle dolgokat, amelyeknek létezése nem bizonyítható és nem is valószínű, de épp azáltal, hogy jóravaló és lelkiismeretes emberek bizonyos mértékig létező dolgokként tárgyalják őket, egy lépéssel közelebb visznek létükhöz és megszületésük lehetőségéhez.”9 | ... Because if in some respects, and particularly ill people relief and felelőtlenebb undertakings instead of the existing non-existent things in the show, this is a good-natured and conscientious historian, for there is just vice versa: there is nothing so much against the nail in the representation, and yet nothing more necessary be presented to the human eye, such as the sort of things, the existence of which can not be proved and not likely, but just by being good-natured and conscientious people to a certain extent the existing dolgokként discuss them one step closer to the birth of their existence and possibility. |
Fordíttassuk ismét magyarra az angol szöveget:
... Mert ha bizonyos szempontból, és különösen a beteg emberek segélyezési és felelőtlenebb vállalkozások helyett a meglévő, nem létező dolgok a show-ban, ez egy jóindulatú és lelkiismeretes történész, mert éppen fordítva: nincs annyi ellen szög a képviseleti, és még nagyobb szükség van, semmi sem kell bemutatni az emberi szem számára, mint például az a fajta dolog, amelynek létezése nem bizonyítható, és nem valószínű, de éppen azáltal, hogy jóindulatú és lelkiismeretes emberek egy bizonyos mértékig A meglévő dolgokként megvitassa velük egy lépéssel közelebb a születési ezek létezéséről és a lehetőséget.
Programunk ezt értette az eredeti idézet alatt.
Az eddigiekben megismerkedtünk a statisztikai elemzésen alapuló gépi fordítás erősségeivel és gyengéivel. Láthattuk, hogy elég jó eredményeket képes elérni, ám a szavak és tagmondatok közötti pontos viszony megragadására való képtelenség miatt hosszú mondatoknál, bonyolult szöveg esetén szinte elkerülhetetlenek a fordítási hibák.
Bár más nyelvek esetén a Google Fordító jobb teljesítményt nyújt, nem szabad elfelejtenünk, hogy a fordítás intellektuális tevékenység, mely nem végezhető mechanikusan, és ez által gépek sosem fogják tudni tökéletesen végrehajtani. A Fordító alkalmas arra, hogy egyszerűbb mondatokat lefordítson, vagy egy dokumentum tartalmába a kulcsszavakon keresztül betekintést nyújtson, ám a nyelvtudást vagy a hagyományos fordítást sosem fogja tudni helyettesíteni.
[1] Google Translate GYIK. A hozzáférés módja: http://www.google.hu/intl/hu/help/faq_translation.html.
A megtekintés ideje: 2009. november 14.
[2] Bible. New Living Translation. Genesis. 1, 3. A hozzáférés módja: http://bibleresources.bible.com/passagesearchresults2.php?passage1=Genesis+1&book_id=1&version1=51&tp=50&c=1. A megtekintés ideje: 2009. november 14.
[3] Biblia. Fordította Károli Gáspár. Mózes első könyve. 3, 1. A hozzáférés módja: http://biblia.hu/biblia_k/k_1_3.htm. A megtekintés ideje: 2009. november 14.
[4] JUNG, C. G.: Aión. Adalékok a mély-én jelképiségéhez. 1. kiad. Budapest: Akadémiai Kiadó, 1993. p. 25.
[5] Árpád-kori és Anjou-kori levelek. XI-XIV. század. Sajtó alá rendezte MAKKAI László és MEZEY László. Budapest: Gondolat kiadó, 1960. p. 117.
[6] Uo.
[7] Platón összes művei. Második kötet. Budapest: Európa Könyvkiadó, 1984. Állam. Harmadik könyv. p. 188.
[8] Platón összes művei. Második kötet. Budapest: Európa Könyvkiadó, 1984. Állam. Harmadik könyv. p. 193.
[9] HESSE, Hermann: Az üveggyöngyjáték. Budapest: Európa Könyvkiadó, 1984. p. 9-10.



