Szerző: Úr Balázs, 2024. 12. 16.
A címben szereplő mondat gépi fordítás eredménye. Úgy tűnik, hogy a gép hibázott, és értelmetlen magyar mondatot hozott létre. Jobban megvizsgálva azonban látni fogjuk, hogy a gép hibázott ugyan, de nem abban, amire először gondolnánk. Tökéletesen lefordította a bemenetként kapott értelmetlen angol mondatot értelmetlen magyar mondattá. Hiányzott ugyanis egy lényeges információ, a szövegkörnyezet. Ha minőségi fordításra van szükség, akkor a gépek nem fogják elvenni az emberi fordítók munkáját. Legfeljebb gyorsabbá teszik azt.
A gépi fordítás nagymértékben leegyszerűsíti a fordítók munkáját. A fordítások minősége megfelelő, sokszor egyáltalán nem is kell módosítani a javaslatokon. Vannak azonban olyan esetek, amikor egy szó több jelentéséből a szövegkörnyezetnek megfelelőt kell kiválasztani, illetve ha nem tükörfordításra van szükség, hanem kreatívan kell megoldani a feladatot. Ezeket a gépi fordítók még nem tudják, és a fordítás eredménye szinte használhatatlan lesz.
A szoftverek fordításai nyelvi fájlokban találhatók. Ezek a fájlok a szoftverben megjelenített karakterláncokat (szavakat, mondatokat stb.) tartalmazzák, de csak egy listában, egymás után felsorolva azokat. Sokszor az egymás után következő karakterláncok sorrendje is eltérő a szoftverben megjelenő helyétől. Ennek az az oka, hogy a nyelvi fájlokban az azonos karakterláncok csak egyszer fordulnak elő, a karakterláncok összegyűjtése pedig a forráskódban lévő fájlok sorrendjétől függ. Ráadásul a fordítók a karakterláncokat a legtöbb esetben szövegkörnyezet nélkül látják.
Gyakori probléma az azonos alakú, de több jelentéssel bíró szavak hibás fordítása. Ha a fordítás úgy készül, hogy a fordító nem nézi azt, hogy a karakterlánc hol és mikor jeleik meg a szoftverben, akkor magáról a szóról lehetetlen eldönteni, hogy melyik jelentését kell magyarra fordítani. Egy kis többletmunkával a fordító ezt tudja ellenőrizni, azonban gépi fordítás használatakor ez a lépés biztosan kimarad. Így lesz a kriptovaluta-tárcának tőkesúlya egyenleg helyett (balance = egyenleg, tőkesúly), így kerülhet tábornok a beállítások általános lapjára (general = általános, tábornok), így lehet egy személynek címe a regisztrációs lapon titulus helyett (title = titulus, cím), vagy így lehet egy objektumnak állama állapot helyett (state = állapot, állam). Sok ilyen szó van még, lehetne még folytatni a felsorolást.
Most térjünk vissza a címben lévő mondatra. Ezzel a mondattal a Xeonjia játék fordítása közben találkoztam. A játék története nagyszerűen fordítható géppel. Sok szöveget tartalmaz, egyáltalán nincsenek benne műszaki szakszavak, a párbeszédek nagyon közel állnak az emberek közötti természetes beszédhez. Van azonban a történetben néhány olyan rész, amelyet nem szabad szó szerint lefordítani, hanem figyelembe kell venni a szövegkörnyezetet, ahol a mondatok elhangzottak.
Nézzünk erre egy példát. A hős elérkezett a gonoszhoz a társával együtt, és az alábbi párbeszéd zajlott le köztük:
[Főgonosz]
My glacial domination is about to begin, and you will watch the
dawn of this new era while your hopes turn into frozen tears.
[Hős a társához]
I liked his speech.
[Hős, a gonosz hangját utánozva]
Your copes turn into chosen fears.
[Hős társa]
I don't recall him saying that.
[Hős, a gonosz hangját utánozva]
Your soaps turn into frozen pears.
[Hős társa]
Mmh… It wasn't even like that.
[Hős a főgonoszhoz]
Let’s fight.
A gépi fordítás az alábbi magyar szöveget adta eredményül:
[Főgonosz]
Jéghideg uralmam hamarosan elkezdődik, és ti végignézitek majd ennek az
új korszaknak a hajnalát, miközben reményeitek fagyott könnyekké válnak.
[Hős a társához]
Tetszett a beszéde.
[Hős, a gonosz hangját utánozva]
Küzdelmeitek választott félelmekké válnak.
[Hős társa]
Nem emlékszem, hogy ezt mondta volna.
[Hős, a gonosz hangját utánozva]
Szappanjaitok fagyasztott körtékké válnak.
[Hős társa]
Mmh… Még csak nem is így volt.
[Hős a főgonoszhoz]
Harcoljunk!
Nem lehetne okunk a panaszra, mert a gépi fordítás nagyon jól visszaadta magyarul az angol szöveget. Csakhogy itt ez nem megfelelő, pontosan a lényeget nem tudja visszaadni, mert a mondatokat egymástól függetlenül fordítja, nem tudja azokat egységben kezelni. Adatot kapunk információ helyett, a mondatokat egyesével, különálló bemeneti adatként kapja meg, és dolgozza fel.
Jó pár perc gondolkodás után a gépi fordítást felülbírálva, az alábbi magyar mondatok kerültek be a játékba:
[Főgonosz]
Jéghideg uralmam hamarosan elkezdődik, és ti végignézitek majd ennek az
új korszaknak a hajnalát, miközben reményeitek fagyott könnyekké válnak.
[Hős a társához]
Tetszett a beszéde.
[Hős, a gonosz hangját utánozva]
Regényeitek faragott könyvekké válnak.
[Hős társa]
Nem emlékszem, hogy ezt mondta volna.
[Hős, a gonosz hangját utánozva]
Eredményeitek hagyott környékké fájnak.
[Hős társa]
Mmh… Még csak nem is így volt.
[Hős a főgonoszhoz]
Harcoljunk!
Más így, ugye? Aki magyarul játszik a játékkal, így ő is megérti a hős gúnyolódását az olvasott szöveg alapján. Ez a kreativitás hiányzik a gépi fordítókból. Kérdés, hogy ez változik-e majd a jövőben, vagy megmaradnak ezek a rendszerek egyszerű fordítónak. Mindenesetre ha jó minőségű fordításra van igény, akkor az emberi fordítónak át kell olvasni a gépi fordítás eredményét. Az emberek visszaveszik a gépek munkáját.
A Xeonjia játék fordítását Úr Balázs, az FSF.hu Alapítvány önkéntese készítette. Élvezetes játékot kívánunk mindenkinek!
Szerző: Kiszel Kristóf (ulysses), 2023. 11. 11.
Az FSF.hu Alapítvány támogatásával az elmúlt hónapokban elkészült a Qt 6.6-os ágának honosítása. A munka magában foglalta a meglévő fordítások teljes ellenőrzését és javítását, a hiányzó szövegek fordítását, majd a kész fájlok feltöltését a Qt kódáttekintő rendszerébe, a Gerritbe. A beolvasztás előtt szükség volt legalább két szavazatra magyar közreműködőktől, ebben Meskó Balázs és Gyuris Gellért segített.
A feladat nagysága miatt egyesével történt a fájlok fordítása és feltöltése, hogy az ellenőrzés is kisebb adagokban történhessen meg, ne egyszerre zúduljon sok szöveg a jóváhagyókra. Sajnos a fordítás csúszása miatt a 6.6-os végső kiadása hamarabb jelent meg, minthogy beolvasztásra került volna a fordítása, de a november 23-án érkező 6.6.1-es verzióban már elérhető lesz, illetve a Linux disztribúciók a csomagok készítése során is már a teljes magyar honosítást fogják a felhasználóknak nyújtani.
Szerző: Meskó Balázs, 2023. 09. 16.
Idén összesen 12 pályázatot kaptunk, amelyből 5 esetén döntöttünk úgy, hogy támogatni fogjuk, ezek az alábbiak:
Pályázók | Cím | Támogatás összege |
---|---|---|
Baldaszti Zoltán Tamás | Rendszerbetöltő szoftver fejlesztése | 500 000 Ft |
Gajdos Tamás | Rack szekrény légcserélő fejlesztése Arduino és Raspberry Pi alapokon | 90 000 Ft |
Dr. Kovács Zoltán | JGEX | 500 000 Ft |
Kuszing János, Szalai Kálmán | A linuxmint.hu verziófrissítése | 600 000 Ft |
Palócz István | A https://drupal.wdh.hu oldal továbbfejlesztése | 500 000 Ft |
A többi beküldött, de támogatásban nem részesült pályázat borítója itt található:
Köszönjük mindenkinek, aki küldött be pályázatot! A mai napokban felvesszük a kapcsolatot a pályázókkal, és minél hamarabb megkötjük a támogatási szerződéseket. A pályázatban vállalt feladatok 2023. december 30-ig fognak elkészülni, így az eredményekről jövő januárban fogunk beszámolni.
Szerző: Meskó Balázs, 2023. 09. 09.
A megkeresésekre való tekintettel négy nappal meghosszabbítjuk a pályázatok leadási határidejét, amely így szeptember 13. éjfele lesz. A kuratóriummal csütörtökön fogjuk elbírálni a pályázatokat, pénteken pedig nyilvánosságra hozzuk az eredményeket.
Szerző: Meskó Balázs, 2023. 08. 24.
Az FSF.hu Alapítvány pályázatot ír ki szabad szoftverek fejlesztése, népszerűsítése és honosítása témakörben. A pályázók köre: bármely magyarországi természetes vagy jogi személy. A pályázatra biztosított keretösszeg 4 millió forint. Egy pályázó több pályázatot is nyújthat be. Egy pályázat maximális támogatási összege 1 millió forint. A támogatott projektek várható száma: 4-12 pályázat.
A pályázatok kivonatát tartalmazó fedlapokat a tavalyi évhez hasonlóan közzétesszük itt a blogunkon. Illetve a pályázat lezárultával saját összefoglalóval is készülünk az egyes pályázatok eredményéről.
A pályázatok leadási határideje szeptember 9-e, míg a projektek elkészülésének határideje december 30-a. A részletes pályázati kiírás innen tölthető le.
Minta a pályázat fedlapjához:
Jótanácsok a pályázatokhoz:
Szerző: Úr Balázs, 2023. 03. 22.
Az előzetes ütemterv szerint szerdán megjelent a GNOME 44, amely az eddigi legjobb magyar támogatással rendelkezik. A korábbi kiadásokhoz hasonlóan a felhasználói felület 100%-ban lefordított, és ebben a kiadásban az FSF.hu Alapítvány önkénteseinek köszönhetően a felhasználói útmutató is teljes egészében elérhető magyar nyelven.
A GNOME asztali környezetet számos Linux disztribúció használja alapértelmezett asztali környezetként, valamint a többinél is elérhető mint választható összetevő. Az asztali környezetek közül egyedül a GNOME rendelkezik teljes egészében magyarra lefordított felhasználói felülettel és dokumentációval. Ez nagyon fontos feltétel a magyar felhasználóknak, mert sokan csak az anyanyelvükön beszélnek.
A GNOME az Ubuntu Linux alapértelmezett asztali környezete, és az Ubuntu szolgál az FSF.hu Alapítvány támogatásával karbantartott Ubuntu Érettségi Remix alapjául. A mostantól elérhető magyar nyelvű felhasználói útmutató segítséget nyújt a rendszer használatának elsajátításában, így bátra ajánljuk mindenkinek, aki ezzel a rendszerrel szeretne érettségi vizsgát tenni. A felhasználói útmutató a tevékenységek áttekintésből a Súgó szó beírásával érhető el.
A magyar nyelvű felhasználói útmutató idősebb emberek – szüleink, nagyszüleink – számára is hatalmas segítség. Az ő számítógépüket jellemzően a gyermekeik tartják karban. Mindenképp javasoljuk az új felhasználói kézikönyvvel való ismerkedést, mert a számítógép hatékonyabb használatát teszi lehetővé a benne található ismeretek elsajátítása. Az újdonságokról a kiadási megjegyzésben lehet olvasni (angol nyelven).
A GNOME 44 és a vele érkező magyar nyelvű felhasználói útmutató a 2023 áprilisában megjelenő Fedora 38 és Ubuntu 23.04 disztribúciókban lesz elérhető. Az LTS (hosszan támogatott) Ubuntu verziót használóknak sajnos várniuk kell még egy évet az Ubuntu 24.04 megjelenéséig.
Szerző: Úr Balázs, 2022. 12. 20.
Az FSF.hu Alapítványtól a „Szabad Szoftver Pályázat 2022” keretében elnyert támogatással elkészült a Rocket.Chat honosítása. Nemcsak a hiányzó karakterláncokat kellett lefordítani, hanem a meglévőket is át kellett nézni, ugyanis a meglévő nyelvi fájl gépi fordítással készült. A fordítás az ütemtervnek megfelelően, időben elkészült.
A fordítást Kiss Kinga végezte a pályázat keretében, a lektorálást pedig Úr Balázs társadalmi munkában.
Sajnos nem egyedi eset, hogy a fejlesztő megpróbál segíteni a fordítóknak a gépi fordítással, de magyar nyelvre ez még nem az igazi, és inkább árt mint használ. A fordító azt látja, hogy 90%-ban le van fordítva, ezért nem nézi át a meglévőt, csak a hiányzót pótolja. A Rocket.Chat esetén ez 78%-os készenlétet jelentett, amikor elkezdtük dolgozni rajta, de az összes fordítást át kell nézni. A tapasztalat az, hogy az egyszavas karakterláncok szinte mindig jók, a kétszavasok többé-kevésbé, a hosszabbak pedig teljesen magyartalanok.
A Rocket.Chat JSON-fájlt használ a fordításhoz. Ez egy nagyon egyszerű, kulcs-érték párt használó formátum, például: “String_key”: “Magyar fordítás”.
Az általunk előnyben részesített fordítóprogram a Lokalize. A funkcióiról a magyarul is elérhető kézikönyvében található bővebb információ.
A Lokalize PO-fájlokkal dolgozik. A JSON-fájlt parancssori eszközökkel (json2po) alakítottuk át PO-fájlra, majd vissza (po2json). Ezek a parancssori eszközök jól bevált, egyszerűen használható programok.
A munkafolyamat az volt, hogy előállítottunk egy teljesen üres nyelvi fájlt, elkezdtük az elejéről fordítani úgy, hogy a Lokalize szinkronizálási funkciójával minden karakterlánchoz megnéztük, hogy a meglévő fordítás használható-e. Ha igen, akkor egyszerűen átmásoltuk a meglévő fordítást, ha nem, akkor bedobtuk DeepL-be, majd a kapott eredményt tettük valódi magyar mondattá. Általában csak ragozást vagy szórendet kellett javítani, sok gépeléstől kímélt meg minket. Alapvetően az a fő probléma a DeepL javaslataival, hogy az egyes karakterláncok fordítása egymás után, egymástól különállóan történt, ezért a DeepL ugyan jó fordítást ad vissza, de összességében nem lenne konzisztens a nyelvezet. Jelenleg az emberi átnézés és javítás elengedhetetlen a jó minőségű, konzisztens fordítás létrehozásához.
Próbáltunk a DeepL-nek is segíteni, és a javításokat a webes felületen végeztük el, hogy tanuljon belőle. Általában az átfogalmazni kívánt szóra kattintva az első javaslata pont az, amit inkább szerettünk volna látni.
Kontextus nélkül azokat nehéz fordítani, ahol a szó egyszerre lehet ige és főnév is. Egy „Group View Settings” lehet „Csoportnézet beállításai” és „Nézetbeállítások csoportosítása” is. Elég sok mindet fordítunk, és sokszor nincs lehetőségünk vagy időnk működés közben is kipróbálni, vagy nem találjuk meg benne a keresett karakterláncot. Emiatt van, hogy tippelni kell, ha a forráskód sem segít.
A meglévő magyar nyelvi fájl nagyrészt gépi fordítással készült. Sajnos a Rocket.Chat fejlesztői továbbra is gépi fordítást használnak az új karakterláncokra. Nehezen hihető, hogy a hozzáadott új karakterláncok egyszerre az összes támogatott nyelven lefordításra kerültek, azért ennyire nem aktívak a nyelvi csapatok. Egy ember pedig nem fog ilyet fordítani:
Mielőtt bejelentkezés fiókját manuálisan kell aktiválni a rendszergazda.
A gépi fordítás másik problémája, hogy a több jelentésű szavak a környezet ismerete nélkül elég gyakran más jelentést kapnak ahhoz képest, ami az adott környezetben elvárt. Íme néhány gyöngyszem ezek közül:
File removed by automatic prune = A fájl eltávolítása automatikus prúzással történik
Pruning files = Metszési fájlok
User Left Room = A felhasználó bal oldala
Message starring = Üzenet főszereplésével
Prune = Aszalt szilva
Send request on lead capture = Küldje el a kérést az ólom rögzítéskor
Unread Count = Olvasatlan gróf
A gépi fordítás sokszor nyelvújítással is próbálkozik, és új szavakat alkot. Ez a fordítás kicsit lórum ipsésre sikerült:
Comma-separated list of domains allowed to embed the livechat widget = Vonalkomástól elválasztott tartományok listája, amelyek lehetővé teszik az élőcsat widget beépítését
És végül vannak azok az esetek, amikor egy karakterlánc valójában több részletből áll össze. A magyar nyelvi fájlban ez a fordítás volt:
From = Ból ből
to = nak nek
Ebből a „From 2022-11-21 to 2022-11-22” angol mondat lett megszerkesztve, ami magyar fordítással „Ból ből 2022-11-21 nak nek 2022-11-22” lett.
A fenti hibák az átnézett és javított fordításban természetesen már nem szerepelnek. Ha valaki csemegézni szeretne a gépi fordítású szörnyűségeken, akkor a beküldött pull request tartalmazza, hogy mi változott.
A honosítók gyakran kapnak kritikát a magyar fordítással kapcsolatban. Sokan azt vallják, hogy a szoftvereket eredeti angol nyelven kell használni, mert így az esetleges hibás fordítás nem okoz problémát. Sokszor viszont nem az angol az eredeti nyelve a szoftvernek, hanem indiai, kazak, afgán vagy ki tudja, hogy a közreműködők melyik országból származnak. A honosításellenesek figyelmébe ajánlom az alábbi, angolnak látszó mondatot:
It True sync process will be import all LDAP users <br/> Caution! Specify search filter to not import excess users.
Az értelmetlen mondat és a hibás igealak ellenére szerintem magyarul mégiscsak érthetőbb (ha jól értelmeztük, hogy mire gondolhatott a költő):
Ha igaz, akkor a szinkronizálási folyamat az összes LDAP-felhasználót importálni fogja<br/>Vigyázat! Adjon meg egy keresési szűrőt, hogy ne importálja a felesleges felhasználókat.
A fenti hibás angol szövegek az igazán kemény diók a gépi fordítás számára. A legtöbb értelmetlen fordítás a hibás angol szövegeknél található.
A fordítási munkáknál sokszor jelent gondot az elvégzendő feladat költségének becslése. Általában 15 Ft/szó vagy 2,5 Ft/karakter (szóközökkel együtt) szoktunk számolni.
Nézzük akkor a számokat a Rocket.Chat fordítása esetében:
A Rocket.Chat fordítását Úr Balázs fogja karbantartani. A karbantartás azt jelenti, hogy új karakterláncok érkezésekor vagy a meglévő karakterláncok megváltozásakor a magyar fordítást is rendszeresen kiegészíti vagy hozzáigazítja az angol szöveghez.
Fordítási hibát találtál? Jelezd Balázsnak az ur pötty balazs giliszta fsf pötty hu e-mail-címen.
A gép (és mások) hibás fordítása ellen Balázsnak ez a munkafolyamata:
A 0. lépést csak egyszer kell megcsinálni, az 1-6 lépést pedig mindig, ha valamilyen szöveg változott a forráskódban. Nagyjából ez lenne a feladata a fordítás karbantartójának. A fájlok szinkronizálását, pontosabban két nyelvi fájl közötti különbséget a Lokalize-on kívül más szoftverrel nem sikerült még elvégezni, még a parancssori eszközökkel sem.
Szerző: Meskó Balázs, 2022. 11. 07.
Elérkezett az idei Szabad Szoftver Pályázatunk leadási ideje. Összesen 18 pályázatot kaptunk, amelyből 5 esetén döntöttünk úgy, hogy támogatni fogjuk, ezek az alábbiak:
Pályázók | Cím | Támogatás összege |
---|---|---|
Hollósi Balázs, Szalai Kálmán, Vásony Tamás | OSM POI Matchmaker | 800 000 Ft |
Kiss Kinga Zita | Rocket.Chat honosítása | 350 000 Ft |
Kiszel Kristóf | Krusader honosítása | 75 210 Ft |
Dr. Nagy Elemér Károly | Gépírást oktató program | 825 000 Ft |
Palócz István | CMS oktatási segédanyagok tanároknak | 900 000 Ft |
A többi beküldött, de támogatásban nem részesült pályázat borítója itt található:
Köszönjük mindenkinek, aki küldött be pályázatot! A következő napokban felvesszük a kapcsolatot a pályázókkal, és megkötjük a támogatási szerződéseket. A pályázatban vállalt feladatok 2022. december 25.-ig fognak elkészülni, így az eredményekről jövő januárban fogunk beszámolni.
Szerző: Meskó Balázs, 2022. 10. 20.
Az FSF.hu Alapítvány pályázatot ír ki szabad szoftverek fejlesztése, népszerűsítése és honosítása témakörben. A pályázók köre: bármely magyarországi természetes vagy jogi személy. A pályázatra biztosított keretösszeg 4 millió forint. Egy pályázó több pályázatot is nyújthat be. Egy pályázat maximális támogatási összege 1 millió forint. A támogatott projektek várható száma: 4-12 pályázat.
Az idei évben újdonság, hogy a pályázatok kivonatát tartalmazó fedlapokat (illetve ha a beküldők hozzájárulnak, akkor a teljes pályázati anyagukat) közzé fogjuk tenni a blogunkon. Illetve a pályázat lezárultával saját összefoglalóval is készülünk az egyes pályázatok eredményéről.
A pályázatok leadási határideje november 5-e, míg a projektek elkészülésének határideje december 25-e. A részletes pályázati kiírás innen tölthető le.
Minta a pályázat fedlapjához:
Szerző: Kiszel Kristóf, 2021. 12. 29.
A KDE magyar fordítása jól, de nem tökéletesen áll. Az alapul szolgáló KDE Frameworks 5, a felhasználók által használt Plasma asztali környezet és a legutóbbi marketing innovációnak hála KDE Gear néven futó alkalmazásgyűjtemény több-kevesebb hiányosságot tartalmazott. Ezért az FSF.hu Alapítvánnyal közösen meghatároztuk ezekből azt a minimumot, amit célként kitűztünk erre évre, alapul pedig a Kubuntut vettük, hogy egy telepítés a következő kiadás teljesen magyarul szóljon a felhasználóhoz. Az év során ezért a hiányzó fordítások pótlásán, és a már készek karbantartásán dolgoztam az Alapítvány támogatásával, amit ezúton is köszönök nekik.
Milyen alkalmazásokról van szó? A spektrum elég széles, a Dolphin fájlkezelőtől kezdve az Elisa zenelejátszón, játékokon és rendszeradminisztrációs eszközökön (partíciókezelő, naplómegjelenítő) a KTorrentig. A munka során egy virtuális gépbe telepített Neon disztribúciót használtam, hogy a fordítási fájlok konvertálása és másolgatása nélkül is tesztelni tudjam az eredményt, és igazítani, vagy akár nyomkodni az alkalmazásokat, hogy jobban kiismerjem az adott szöveg kontextusát (nagyon hasznos segítséget tudnak írni egyes fejlesztők…).
Mikor lesz látható az eredménye ennek? Ha valaki rolling release disztribúciót használ, annak hamarabb, a többieknek a saját disztribúciójuk következő kiadásakor, erről kérdezze meg mindenki csomagolóját és karbantartóját.
2022-ben a terv az eddigi eredmények megtartása, és újabb alkalmazások, illetve a dokumentáció fordítása. Szívesen fogadom a közösség javaslatait, mik azok a sokak által használt alkalmazások, amik esetleg rosszul jelennek meg magyarul.