Szerző szerinti archívum

Márciusi beszámoló

nemeth, 2010. április 3. szombat

Ősszel Budapest ad otthont az OpenOffice.org éves nemzetközi konferenciájának, és egyben az OpenOffice.org 10 éves születésnapi ünnepségének. Az FSF.hu Alapítvány támogatásával az OpenOffice.org javításán, kiegészítésén dolgozom, és már most látszik, hogy a konferencián sok szép magyar eredményről is beszámolhatunk. A nyílt forráskód rendkívüli előnyt jelent az irodai csomag honosításában, fejlesztésében. Csak márciusban Tímár András és Szalai Kálmán segítségével új magyar betűkészlet (Magyar Linux Libertine), új helyesírás-ellenőrző-változat (Hunspell 1.2.9), új magyar szótárváltozat (Szabad magyar szótár 1.6.1), új magyar eszköztár került az OpenOffice.org, illetve Go-oo változatának forrásfájába, vagy a központi OpenOffice.org-kiegészítők közé. Készül a szabad OpenOffice.org Writer-jegyzet is, ami részben tankönyv, részben fejlesztési dokumentáció a párhuzamosan készülő OpenOffice.org-javításokról, kiegészítésekről. Hírekkel bemutatva a fejlesztéseket:

  • 2010-03-01. Magyar Linux Libertine (valószínűleg az első professzionális szabad magyar betűcsalád, OpenOffice.org-ban is jól használható kiskapitálissal, megfelelő spáciummal a felkiáltójel, kérdőjel, kettőspont és pontosvessző előtt, fj és ffj ligatúrákkal, az új kiadás ugráló számos változatban is használható, része lesz az OpenOffice.org 3.2.1-nek);
  • 2010-03-04. Hunspell 1.2.9 kiadás. Ahogy az előző hírben szerepelt (Magyar helyesírás-ellenőrzés a Google Chrome-ban és az Index címoldalán), sínen van az integrálás, és véletlenül még indexes hír is lett belőle.
  • 2010-03-26. Új magyar eszköztár (évek óta igényelt problémára nyújt megoldást: a kereszthivatkozásokhoz kapcsolódó magyar névelők konzisztenciájának biztosítására);
  • 2010-03-29. Új helyesírási szótár (már letölthető a Firefoxhoz is);
  • 2010-04-01. Új fejlesztések (A Writer jegyzet több javítást is tartalmaz. Többek között Németh Krisztiántól, Szabó Pétertől és Gyuris Gellérttől kaptam hasznos javaslatokat, amelyek egy része örvendetes módon egybecsengett az általam is problémásnak talált részekkel. A jegyzetben most már egységesek az ugráló számok, köszönhetően az új Magyar Linux Libertine N betűknek. A vázlatszintek számozásának ismertetése – ahogy Gellért is írta, az általános megoldás a speciális helyett – került a számozások ikon és helyi menüvel való címsorszámozás helyére. Kiderült az is Tímár Andrással való levelezés közben, hogy az OpenOffice.org 3-ban megjelent térközös pozicionálás még nem egyenértékű a címsorok számázásánál az Utána: mezőben megadott szóközökkel, ha kereszthivatkozásról van szó.)

Amiről hír még nem jelent meg: Javított angol nyelvi állományok. A kvirtmínusz (és kevésbé a nagykötőjel) használata súlyos problémát okoz a helyesírás-ellenőrzésben, de az új szótárak javítják ezt. Az OpenOffice.org módosított szótördelő algoritmusa még az angol elválasztásban is problémát okozott, erre is megoldást nyújtanak az új szótárak. A ligatúrákat is támogatja mind a helyesírási, mind az elválasztási szótár. Ez utóbbi kapcsán tervbe van véve egy tipográfiai kiegészítő az angol és magyar nyelvhez is.

Hírt adtam arról is a HUP-on, hogy elhunyt Kass János. Pár éve kértem tőle segítséget egy szabad számítógépes betűkészlet elkészítéséhez. Zseniális gyermekkönyv-illusztrációi, Dilemma c. kisfilmje, bélyegei miatt gyerekkorom óta ismerem a nevét. Szegeden örömmel fedeztem a Kass-galériát, és a Kass János születésnapjára készített szegedi albumot. A Nem túl rövid bevezető a LaTeX 2ε használatába c. jegyzet fordítása után Knuth MetaFont programjával is próbát tettem. Tótfalusi Kis Miklós betűmintalapjának másolatát kinagyítva elkészítettem egy leírást az a betűről, de az eredménnyel nem voltam elégedett. Amikor legközelebb a Kass Galéria mellett vitt el az utam, megkérdeztem a galéria munkatársától, hogy esetleg itt van-e Kass János, és hogy zavarhatom-e. A válasz igen volt, de kicsit zavarban voltam, hogyan szólítsam meg. Egy kis helyiségben ült és dolgozott. Megkérdezte, hogy az olajosoknál vagyok-e informatikus, amikor elmondtam, hogy mit szeretnék. A betűtervezéssel kapcsolatban azt válaszolta, hogy sajnos akiket ismert (most utólag már tudom, hogy Szántó Tiborra gondolhatott, akivel közös albuma jelent meg Betű & Géniusz címmel), már nem élnek.
A történelem elsodorta családját Szegedről, de nem tudott elszakadni a várostól. A Délmagyarország nekrológja. Ha az OpenOffice.org-javításokkal és a készülő jegyzettel sikerül hozzájárulnom a szebb kiadványok, dokumentumok készítéséhez, Kass Jánosnak is köszönhető.

Magyar helyesírás-ellenőrzés a Google Chrome-ban és az Index címoldalán

nemeth, 2010. április 3. szombat

A Hunspell 1.2.9-es hibajavító kiadása (amiről egy előző hírben már volt szó) bekerül az OpenOffice.org 3.2.1-be. Több súlyos (bár ritkán előforduló) hiba javítását tartalmazza, de nem ezért lett belőle országos hír: A Google Chrome böngészőben, ami a Hunspell helyesírás-ellenőrzőt tartalmazza némileg módosított formában, végre megjelenik a magyar nyelv támogatása. A hírt Balla Péter írta meg a Kocka blogon (Chrome: Végre megjött a magyar nyelvi ellenőrzés), közölve a válaszlevelemet is, amiben a Hunspell 1.2.9-re gyanakszom, mint a fejlemény hátterére. Barna József is megkeresett, majd a Kocka blogra hivatkozott az ITCafe hírében (Chrome: jön a magyar helyesírás-ellenőrző). Innen meg már csak egy ugrás volt az Index címoldala (Jön a magyar helyesírás-ellenőrző a Chrome-ba). A hír érdekes útját Balla Péter is visszajelezte mosolyogva nekem, Tímár András pedig a mikroblogján adott hírt róla.

Hunspell 1.2.9

nemeth, 2010. március 4. csütörtök

Caolan MacNamara (Red Hat) teljes jogú adminisztrátorként csatlakozott a Hunspell helyesírás-ellenőrző/morfológiai elemző fejlesztéséhez (eddig is az egyik legaktívabb együttműködő volt a Hunspell javítások, foltok beküldésével). Miután a CVS verziókezelő rendszer alá helyezte a kódot a múlt héten, egy tucat foltot integrált. Ennek örömére még három fagyást, illetve kvázi lefagyást okozó problémát javítottam. Az eredmény a Hunspell 1.2.9-es változata.

A CVS-ben közben frissült a kód, a Hunspell saját fejlesztői változatából áttettem a MAP javaslattevő algoritmus bővítését. Ebben a MAP ekvivalenciaosztályokba most már nem csak karaktereket, hanem karaktersorozatokat is meg lehet adni egyszerű zárójelezéssel. A magyar szótárban a MAP eddig csak az ékezetesítésre szolgált. Az affixumállományban található MAP definíciót a következő sorral bővítve  a j és ly is egy osztályba kerül:

MAP j(ly)

A régi helyesírási javaslatok a hűjéje szóra:

& hűjéje 9 0: hűjére, hűjébe, hájéje, hajéje, héjéje, Hrabjéje, hűbérije, hűbére, hűdése

Az újak:

& hűjéje 3 0: hülyéje, hűjére, hűjébe

Ékezet nélküli szó javításánál még feltűnőbb a különbség:

Az előző változattal:

& hujeje 4 0: Huetje, hejehuja, Hummerje, Höveje

Most:

& hujeje 1 0: hülyéje

A fejlesztés eredetileg a többszörös  ékezetes betűket tartalmazó nyelvek, mint a vietnami vagy a joruba számára készült,  lehetőséget nyújtva a több UTF-8 karakterrel leírt betűk (pl. mint az ó alatt még pontot is tartalmazó joruba ọ́) MAP osztályokba sorolására is (de a német ß/ss, vagy a fi/fi ligatúrát tartalmazó szavak kezelésére is jó).

Fejlesztési beszámoló

nemeth, 2010. március 2. kedd

Kiadások:

A Kiadványkészítés OpenOffice.org Writer szövegszerkesztővel könyv 0.1-es változata a bejelentésben:

http://www.openoffice.hu/2010/03/kiadvanykeszites-openoffice-org-writerrel-elozetes/
http://hup.hu/cikkek/20100301/kiadvanykeszites_openoffice.org_writerrel_elozetes

A visszajelzés pozitív. Szabó Péter, a kiváló Magyar nyelvű műszaki–tudományos tipográfia szerzője  is megkeresett (személyesen 2006-ban ismerkedtünk meg a debreceni EuroTeX konferencián). Péter sok más mellett javasolta a címsor behúzásának megváltoztatását. Ezzel nekem is gondom volt, de megláttam  egy orvosi szövegek helyesírásával foglalkozó kiadványban a következő sávos címsor és bekezdésformázást, amit az OpenOffice.org is képes automatikusan kezelni a bekezdésstílusokkal (nem magától értetődő módon, hanem háttérképként, de tipográfiai pontra pontosan az adott helyre és méretre téve a fekete sávot): http://numbertext.org/tmp/teszt.pdf. Ezt a megoldást Péter is sokkal elfogadhatóbbnak találta.
A Hunspell forráskódját CVS-be tette a  SouceForge-on Caolan McNamara (Red Hat). Hozzáadta a Red Hat Hunspell foltjait, én is beletettem pár javítást, pl. a következő hibára:

http://www.openoffice.org/issues/show_bug.cgi?id=106267

Még lesz benne egy-két javítás, és ki lesz adva hivatalosan is, de a CVS-ből már a javított kód érhető el.  (Nagyon jó hír, mivel az utóbbi egy évben nem volt kiadás, pedig olyan vezető cégek  is, mint az Apple és a Trados, építették be a Hunspellt termékeikbe.)

Készül egy nem német umlautos, a betűváltozatokban jobban egalizált, az azokból helyenként hiányzó fj/ffj ligatúrákat is tartalmazó változatot a Linux Libertine betűkészletből, amivel a magyar szakszövegek igényes és nyílt forráskódú eszközökkel és betűkészletekkel történő szedése is jobban megvalósítható lesz.

Az új elválasztási programkönyvtárat bejelentettem a Sunnál is:

http://www.openoffice.org/issues/show_bug.cgi?id=109543

Rene Engerhard (Debian) meg is nézte már, ő volt, aki anno külön szedte a Hyphen és Hunspell programkönyvtárakat az OpenOffice.org-ban, hogy könnyebben frissíthetők legyenek. A frissítés több helyen szükséges, mivel a Linux-terjesztések OpenOffice.org-jai általában rendszerszintű elválasztási programkönyvtárat és helyesírás-ellenőrzőt tartalmaznak.

A Lightproof 1.4 is kiadásra került az új magyar nyelvi szabályok forrásával, bejelentés:

http://www.openoffice.hu/2010/02/lightproof-1-4/

(Ha még a nemzetközi bejelentés is megtörténne végre, közelebb kerülne a Lightproof az OpenOffice.org-integrációhoz, de ehhez nem ártana az angol nyelvi ellenőrző modult kicsit összekapni. Az amerikai angol elválasztási szótárból készült egy Unicode-ligatúrás változat is, azzal és a Hunspell-lel együtt be lesz jelentve valamikor a közeljövőben terveim szerint az OpenOffice.org Lingucomponent levelezési listáján.)

Kami és Kéménczy Kálmán a Go-oo és OpenSUSE irányában frissítették a magyar szótárakat. Tímár András a hu_dicts OpenOffice.org kiterjesztésben és a Mozilla AMO-ban (ahol most kivételesen gyorsan ellenőrizték a kiterjesztést).

Bővített magyar elválasztási minták az unicode-os f-ligatúrát tartalmazó szavak  elválasztásával (nem választ el hibás helyen ligatúrák esetén sem). A minták megint Unicode (UTF-8) karakterkódolásúak, mivel sikerült unicode-osítani a feltételes elválasztójelek beszúrását segítő párbeszédablakot Orvietóból visszafele).:

https://sourceforge.net/projects/magyarispell/files/OOo%20Huhyphn/v20060713-0.2/

Hyphen 2.5 elválasztási programkönyvtár az unicode-os elválasztás és a ligatúrát tartalmazó szavak elválasztásának javításával.:  A ligatúrás fejlesztés  derült ki, hogy bizonyos szavaknál, pl. “miért”,  hiányozhat az első elválasztási pont, mindez az unicode-os lefthyphenmin, vagyis a balról vett  minimális elválasztási távolságot kezelő függvény hibája miatt.  A ligatúrák támogatása annyit tesz, hogy három betűt helyettesítő ligatúrák két karakternek számítanak a hyphenmin értékek számításánál (a kétkarakteresek egyet, ami nem igényelt külön fejlesztést, de tesztelési céllal beállítható egy makró, hogy az unicode-os  f-ligatúrák annyi karakternek számítsanak, mint amennyit helyettesítenek, pl. az fi-ligatúra kettőt, az ffi-ligatúra hármat). Mindez azért, hogy a fi-atal elválasztás ligatúra esetén ne működjön, de az effi-ciency igen lefthyphenmin=3 elválasztási küszöb esetén is). Ehhez még az OpenOffice.org oldaláról is javítani kell a kódot valószínűleg.

https://sourceforge.net/projects/hunspell/files/Hyphen/2.5/

A Szabad magyar szótár új változatának bejelentése is késik, pedig igen jelentősen bővült a szótár. Addig is itt vannak az állományok és a változások listája:

http://sourceforge.net/projects/magyarispell/files/Magyar Ispell/1.6/