Szabad magyar szótár
A Szabad magyar szótár a Hunspell
helyesírás-ellenőrző és morfológiai elemző programhoz készített, szabadon felhasználható magyar szótár. Egyedülállóan pontos helyesírás-ellenőrzést biztosít az ingyenes LibreOffice irodai csomag, a Mozilla Firefox böngésző és Thunderbird levelezőprogram, Google Chrome, Internet Explorer (kiegészítésként), Opera, SDL Trados, MemoQ és macOS (telepítő) felhasználói számára.
Fejlesztői kód: https://github.com/laszlonemeth/magyarispell/
2015–2018. 1.7-es kiadás
Részletek: Magyar nyelvi fejlesztések az FSF.hu Alapítvány támogatásával.
2010-03-29. 1.6.1-es kiadás
Az új kiadás Kass János grafikusművészre emlékezik az új Kass szóval. Az OpenOffice.org 3.2-es változatába bekerült 1.6-os kiadáshoz képest több toldalékolási javítást is tartalmaz, valamint pár új szót, mint a Gdańsk (a Gdansk helyett), citosztatikum, nanoanyag stb. L. a változások listáját.
2010-02-04. 1.6.-os kiadás
Jelentős szótárbővítését tartalmazó kiadás.
- Közel ezer egyszerű összetett szó került be külön szóként a szótárba, hogy a korrektorok munkáját segítse (az OpenOffice.org Lightproof
magyar nyelvi ellenőrző moduljával lehetőség van a nem szótári összetett szavak felismerésének teljes vagy részleges korlátozására. Részleges korlátozás esetén az
egyszerű nem szótári összetett szavakat kékkel aláhúzza az OpenOffice.org, ezért ilyen új szavak kerültek a szótárba (pl. adóív, agyér, árrés).
- Több száz új szó került felvételre. Példák: addiktológus,
algoritmizál,
aktuárius,
alufelni,
Ancsa,
alulképzett,
androgén,
antiallergén,
antivirális,
botox,
bölcsi,
b.-pengő,
cafeteria,
csakra,
csocsó,
csontsovány,
éjfekete,
elektroencefalográf,
érmész,
fémzárolt,
fogyatékosügy,
fradista, futsal,
génkezelt,
guargumi,
gyúelegy,
H1N1,
hadügyér,
intifáda,
izmolt,
Jocó,
Juci,
kábszer,
kromatográf,
madarászat,
madzsong, maflás,
magyarigazolvány,
nyuszkó,
önironikus,
összvonalas,
plazmon,
rokonul, sms-ezik,
szöszmösz,
szuperbruttó,
túláram,
zanzásít.
- Rengeteg javítás: *eképpen; *múlandó, *múlandóság, dobermann (*doberman törlése); pláza, Plaza szavak hozzáadása (plaza helyett);
Lichtenstein személynév kivétele az alapszókincsből a Liechtenstein országnév javításához; hibás összetételek tiltása: *egyivású, *szervízkönyv,
*legelőszőr, *mellékhelység, *nemár, *nembiztos, *neméri; *bűzős, *bőrős, *előnyős, *kővetkező, *gőgős, *gőzős, *közős, *szőrnyű, *főlényes, *főnők, *tőrvény (ez utóbbiak az ö/ő csere figyelésével).
- Unicode-os szavak. Mikro- jelet tartalmazó rövidítések: µl (mikroliter), µg (mikrogramm), µV (mikrovolt) stb.
Nem a kis mű görög betűvel (μ), hanem a külön unicode-os mikro- karakterrel kerültek a szótárba a rövidítések, megakadályozva például, hogy egy véletlen nagybetűsítés a szövegszerkesztőben a kis mű helyére egy nagy műt (Μ) tegyen, megváltoztatva a mértékegységet (így pl. ezerszeresére növelve a dózist, hasonló ok miatt jött létre a nem szabványos mcg rövidítés a mikrogrammra, amit a kézírás számára javasol a JCAHO amerikai egészségügyi szervezeteket képviselő alapítvány).
- Ligatúratámogatás. Az ff, fi, fl, ffi, ffl karaktersorozatokat tartalmazó szavak mostantól unicode-os f-ligatúrákkal is felismerésre kerülnek, ami lehetővé teszi a tipográfiailag igényesebb szövegek készítését és helyesírás-ellenőrzését is pl. az OpenOffice.org-ban.
Lásd még a
változások listáját.
2009-09-18. 1.5-ös kiadás
Bejelentés az OpenOffice.hu-n: Új helyesírási szótár az MR2 és a Sláger Rádió hallgatóinak (is).
Az új szótár részben az OpenOffice.org tövező-toldalékoló szinonimaszótárának működését javítja, részben pedig bővített és javított szókincset tartalmaz. Példák az új szavakra:
ABBA, afrodiziákum, allergológia, árvaellátás, blog, blogol, cigányellenesség, dekupázs, episztémé, feta, fröccsöntött, íjászkodik, immunanyag, impaktfaktor, infokommunikáció, Jobbik, középszürke, lovári, mediáció, melegfelvonulás, mém, MR2, narratíva, netbook, Obama, offshore, ORFK, ökogazdálkodás, pita, plakátol, PSZÁF, Renée, romológia, szender, szexel, szupercella, szuperóriás, szitár, szonár, szopizik, szórványmagyar, sztenderdizál, szútra, talajvesztett, tangram, társasozik, tenyésztojás, termálkút, tofu, vegykezelt stb.
A változások részletes listája.
2008-11-20. 1.4-es kiadás
Az új változat elsősorban az összetett szavak kezelését javítja. Példák a szótár új szavaira:
agyament, android, antiglobalista, árpádsáv, bassethound, bodyzik, collie, dalmata,
elitista, globalista, hatszemközti, humanoid, ilang-ilang, kiborg,
legsokatígérőbb, mantra, piackonform, pritamin, progeszteron, rap, rappel,
szektorsemleges, taoista, tiritarka, uncsi, vacsi, western.
A változások részletes listája.
2008-09-24. Szövegszerkesztők helyesírásversenye
Az Origo összehasonlította a Microsoft Office és az OpenOffice.org helyesírás-ellenőrzőjét (l. még az Index korábbi tesztjét: Szabad a helyesírás). A tesztben „meglepően elhúzott az OpenOffice.org ellenőrzője: 18,5 pontot kapott, míg a Microsoft Office mínusz egyet.” Az Origo tesztelői, Rátonyi Gábor Tamás és Ungár Péter a tesztadatok közzétételével lehetővé tették a Magyar Ispell helyesírási szótár javítását. Az OpenOffice.org 3 FSF.hu Alapítvány gondozásában megjelenő magyar változata már a nyílt forráskódú magyar helyesírási szótár legfrissebb, javított változatát tartalmazza.
2008-03-15. Hitelesített, 1.3-as kiadású
szótár
Az új kiadás hitelesített alapszókincset tartalmaz. A hitelesítés Godó Ferenc segítségével készült, és a szótár nagyobb részének, mintegy 45 ezer tőszónak az ellenőrzését jelentette.
A több mint ezer javítással az alapszókincs kisebbé és egyben pontosabbá is vált, amellett, hogy sok új szó is bekerült a szótárba. A hitelesítés az OpenTaal projekt mintájára történt, ami megbízható holland helyesírási szótárat készített a nyílt forráskódot használó holland közigazgatás számára.
Változások:
- A hitelesítés során javított hibák: adressz (*adresz), *álható,
bobby (*bobi), enthuziazmus (*entuziazmus), HB (*hábé), *interieur (enteriőr, eredetileg intérieur), liebling (*libling), lycra (*likra), mannschaft (*mancsaft), *szankszkrit (szanszkrit), szanszeviéria (*szanszevéria), szkunk (*szkunksz), *termo, *zéhá (zh), ziherejsztű (*ziherhájsztű) stb.
- Új szavak: agroturizmus, aukciósház, Dacia,
dezinfláció, endorfin, fajgazdag,
génpiszka, HIV-pozitív, idared, Intel, jujuba, jüan,
kapitalizáció, kontraktus, kungfu, LCD, logisztikus,
makroadat, mikrohitel, nominálérték, ökoiskola,
összfelület, melegkedvelő,
peszticid, portugieser, puzzle-ozik, reiki,
remediáció, rostdús, sneci, thm, tiszavirágzás, üzletorientált,
volatilitás, zakuszka, zöldmozgalom, zöldtárca stb.
- Unicode-os szavak: román ékezetes betűk javítása a Chișinău, Ceaușescu szavakban
(vesszős ékezet a hibás cedillás *Chişinău és *Ceauşescu helyett); ezrelékjel felvétele toldalékolt alakjaival: ‰-kel; valódi aposztróf betűértékű karakterként való jelölése (McDonald’s, N’Djamena).
- Toldalékolással kapcsolatos javítások:
- Az előző változatokban hibásan megjelent *nagyk, *szépön alakok javítása;
- A bonszai, thai és az új Hyundai helyes toldalékolása a j végű ejtésnek és a javasolt egybeírásnak megfelelően: bonszaijal, bonszaiom (és nem *bonszaival, *bonszaim).
- a névszókhoz kapcsolódó -södő, -zhető, -zgető, -zgethető, -ztető,
-ztetendő toldalékok is ajakkerekítéses toldalékokat vonzanak
(-höz és nem -hez), ahogy a -z toldalék is, ha
a tő ezt kívánja (a *fűzek, mint a fű hibásan toldalékolt alakja már nem él).
- A morfológiai leírás pontosítása számos rendhagyó ragozású szónál.
A változások részletes listája, telepítés az OpenOffice.org-ban
2007-10-26. 1.2.2-es kiadású
szótár morfológiai elemzéshez, tövezéshez és generáláshoz
Az új kiadás a Hunspell program 1.2-es változatával a morfológiai elemzés és a tövezés mellett lehetővé teszi a morfológiai generálást is, azaz a szavak toldalékolt alakjainak előállítását a megadott toldaléktípus vagy toldalékolt példa alapján.
A fejlesztést az FSF.hu Alapítvány
támogatta azzal a céllal, hogy a nyitott irodai csomagok, kiemelten az OpenOffice.org teljes honosítása elkészüljön.
A tövezés és a morfológiai generálás képessége a szöveges dokumentumok indexelését, a szinonimakereséshez kijelölt szó tövezését és a szinonimajavaslatok toldalékolását teszi lehetővé többek között, a tervek szerint már az OpenOffice.org következő nagyobb változatában. A magyar honosítás szempontjából pedig további érdekes lehetőség, hogy a morfológiai generálás szófaji elemzéssel kiegészítve alkalmas a tegező, a semleges többes számú első személyű illetve a magázó erőforrásállományok közötti automatikus átalakításra, így a jövőben a magyar felhasználók szabadon választhatnak a tegező, magázó vagy semleges programüzenetek és súgó között.
A helyesírási szótár változásai:
- FreeBSD kompatibilitási javítások a keretrendszerben.
- A szótárformátum kibővítése, a szótár javítása a morfológiai generáláshoz.
- Új szavak: animátor, effekt, ötletel. Javítások: sutyorgás
*sutyorogás helyett, edinburgh-i (nem *edinburghi),
illinois-i (kisbetűvel is).
- Új unicode-os szó: Babeș. Victor Babeș neves román fizikus, biológus, bakteriológus
nevének leírásához Unicode-ra vagy az ISO 8859-16-ra van szükség, mivel a mai román
weboldalak, sőt iskolai tankönyvek (az Unicode-támogatás lassú terjedése miatt kényszerű)
gyakori írásmódja ellenére nem cedillát, hanem vesszőt írunk
az ș és ț betűk alá a mai román helyesírás szerint. Tehát helyesen
Babeș–Bolyai Tudományegyetem és nem *Babeş–Bolyai (vagy
*Babeş-Bolyai).
A változások részletes listája, telepítés az OpenOffice.org-ban
2007-09-18. 1.2.1-es kiadású
szótár az OpenOffice.org-hoz és a Firefoxhoz
Az új kiadás kihasználja a Hunspell helyesírás-ellenőrző újdonságait.
Ilyen a kiejtésen és a billentyűzetkiosztáson alapuló javaslattevés. A Hunspell a Magyar Ispell helyesírási szótárral párhuzamosan fejlesztett helyesírás-ellenőrző program. Az
FSF.hu Alapítvány támogatásával az elmúlt pár hónapban nyolc egymást követő Hunspell kiadás jelent. Lezárult a Hunspell és a Mozilla integrációja. Az OpenOffice.org 2.3 hamarosan megjelenő magyar kiadása, a Mozilla Thunderbird levelezőprogram következő változata és a várhatóan novemberben megjelenő Firefox 3-as böngésző a Hunspell legutolsó változatát fogják tartalmazni, ami
azt jelenti, hogy magyar változataik a legújabb Magyar Ispell helyesírási szótárral kerülhetnek kiadásra.
A helyesírási szótár változásai:
- A magyar billentyűzetkiosztás megadása az elütésekre
adott javaslatok rangsorolásához (a Hunspell helyesírás-ellenőrző 1.1.10-es változatától).
- A szótár pár száz rendhagyó kiejtésű szóalaknál megadja a kiejtést is, ami
lehetővé teszi, hogy a helyesírás-ellenőrző a kiejtés szerint leírt hibás szóalakra
a helyesírásnak megfelelő szóalakot javasolja, akár toldalékolva is. Például a *csivavákat szóra az ellenőrző már a helyes chihuahuákat alakot javasolja a korábbi csimotákat helyett, a chihuahua szótári szónál megadott [csivava] kiejtésnek
köszönhetően (a Hunspell 1.1.12-es változatától).
- Autizmussal kapcsolatos szavak: Asperger-szindróma, autisztikus, pszichopedagógus stb.
A szógyűjtemény létrehozása kapcsolódik a Telekom Adományvonal július-augusztusi tevékenységéhez, amelyben a Szív és Kéz Alapítvány számára gyűjtött adományokat.
- A magyar helységnevek pontosítása a 2007. januári KSH adatok alapján.
Ezzel több mint 11 ezer ritka történelmi helységnév, kisebb részben
hibás szóalak került ki az alapértelmezett szótárból.
- Tovább bővült a javaslatokból kizárt vulgáris szavak köre az ifjúsági nyelvi szókincsben.
- Tipikus tévesztések kiválogatása és javítása. A szótár javító modulja lehetőséget nyújt
arra, hogy egyedileg felülbíráljuk egy-egy szó előfordulását vagy toldalékolását
a helyesírás-ellenőrzés céljából (más cél esetén a javító modul kikapcsolható). A következő szavak, illetve szóalakok lettek tiltottak ebben a szótárváltozatban: befojt, bizik, bízottság (de elbízottság, megbízottság), bíztat,
csínos, disz, diszes, díszit, fesz, fojtatott, fordit, hires (Hir tulajdonnévből
képezve), hídd,
hírtelen, hísz, hítt, hívatásos, ívóvíz, kisértett, kisértés,
kisértő, nyílván, nyítok, píros, pírul, szakit, tiz (ti szolmizációs
hang plusz -z igeképző).
- Unicode-os szavak: œuvre (oeuvre-ről javítva), Nukuʻalofa: nem aposztróf,
hanem a tongai kibővített latin ábécé fakauʻa betűje szerepel Tonga
fővárosának nevében, a hivatalos U+20BB Unicode karakterkóddal megadva.
- Fővárosok listájának kiegészítése: Abu-Dzabi, Abuja, Accra,
Addisz-Abeba, Algír, Ammán, Antananarivo, Aşgabat, Asunción stb.
-
Orosz tagköztársaságok: Adigeföld, Baskíria, Burjátföld, Csuvasföld,
Dagesztán, Észak-Oszétia stb.
- Egyéb szavak: ainu, al-Káida, Alzheimer, ambubaba, ammonita, Athéné, ATM, automatice,
Avogadro, axiálvektor, axolotl, axonometria, balliszta, capoeira, fengsuj, himba, kecsua, mangold, OpenDocument, pidzsin, Saint-Exupéry, Schwarzenegger stb.
- Új választható nyílt forráskódú licenc: GNU GPL3.
A forrás tartalmazza az FSF.hu Alapítvány és a Novell Magyarország által
készített szabad szoftveres licencek előzetes fordításait is.
A fordításokkal kapcsolatos észrevételeket a következő
HUP fórumon
várják a fordítók. A végleges változat a http://www.gnu.org
oldalon lesz elérhető.
A változások részletes listája, telepítés az OpenOffice.org-ban
2007-05-15. Megjelent az 1.2-es kiadás
az FSF.hu Alapítvány támogatásával.
Összefoglalás:
- A szótár a forrásból előállítható unicode-os és a GNU segédprogramok legújabb változatát használó operációs rendszereken is (vagyis a legújabb Linuxokon).
- Javítások, illetve kiegészítések a toldalékolásban: 1. Az -ae, -ee végű szavak helyes toldalékolása: curriculum
vitaével helyett curriculum vitaevel,
Leével helyett Leevel.
2. A szótár jelenlegi változatába került be
a Che (Guevara) név és hasonlóan különleges toldalékolású alakjai:
Chet, Chevel stb. 3. Az „o” kötőhangzó helyett csak „a”-t kapó
névszók (alkalmazottam, sokak,
összesen mintegy 100 szó)
-hoz, -on esetragjainak javítására is sor került:
*sokakhaz -> sokakhoz. 4. A késik
ige késitek alakja a tárgyas igeragok hiányossága miatt nem
nem került korábban felismerésre.
- Számos javítás a szókincsben. Példák (nagyrészt az Osiris Helyesírás alapján
javítva):
apple-ös, google-ös, oracle-ös
helyett apple-es, google-os, oracle-os
(a javasolt „epl”, „gugl” és „orákl” kiejtés szerint),
*bonszaj helyett bonszai (hibás átírás a Magyar helyesírási szótárban),
*curação helyett curaçao (hibásan az Osirisban),
*gó helyett go,
irásos tiltása (Irás családnévből képezte a szótár),
reverzibilis, irreverzibilis (reverzíbilis, irreverzíbilis
változatok is helyesek a Magyar helyesírási szótárnak megfelelően),
*sztupa helyett sztúpa,
*testreszabott helyett testre szabott (de a testreszabás helyes),
*winchester helyett vincseszter.
- A szókincs több mint 2000 szóval bővült. Példák:
- Unicode karakterkódolást igénylő szavak:
São Paulo (javítva *Sao Paulóról), déjà vu, voilà, görög ábécé (matematikai szakszavak):
α-ról, ε-nal, μ-höz; összetételekben is, pl. β-sugárzás.
- A Wikipédia közel 60 ezer magyar
szócikkének fel nem ismert címszavaiból (a Magyar Webkorpusz alapján)
a leggyakoribbak kerültek felvételre:
aflatoxin, agapé, aikidó, allél, amfetamin, anorexia, antihős,
apartheid, apoptózis, asztrobiológia, autoimmun, Ágost, Ámon,
biodízel, bioetanol, bioinformatika, biopszia, biostatisztika,
bozonok, cache, cianobaktériumok, civilszervezet, country,
curry, dekonstrukció, dekriminalizáció, denzitás, disztális,
dodó, domén, dopamin, előgerinchúrosok, előváladék,
episztemológia, eszperente, exobolygó, ezotéria, faktorálás,
filiszteusok, filogenetikus, finnugrisztika, firmware,
fotoeffektus, földönkívüli, freeware,
gasztroenterológia, genomika, gírosz, glikolízis, Greenpeace,
gyógyszálloda, hangoskönyv, haszidizmus, henna, hiperaktivitás,
hiperinfláció, hipermédia, hiperszöveg, hipotalamusz,
historizálás, hiszterézis, hrivnya, inkontinencia, kabasólyom,
kalkopirit, karitász, klezmer, konfucianizmus, konzumidióta,
krampampuli, kromatika, latex, likopin, lingvicizmus, logosz,
maltodextrin, mandala, maoizmus, Megasztár, meiózis, mezolitikum,
mikrokontroller, mikroökonómia, mitózis, mudi, nagylábujj,
nanotechnológia, neopozitivizmus, netikett, neuropszichológia,
nooszféra, objektumorientált, onkogén, oxiológia, oxitocin,
paintball, paracetamol, pektin, pellet, perdület, piercing, pszi,
pszilocibin, retrovírus, Ré, sajtburger, shareware, streetball,
szerkők, sziklaszoros, szociobiológia, szuburbanizáció,
szuperorganizmus, szupravezető, szünbiológia, tajkonauta, taurin,
taxonómia, tequila, terminátor, Tesco, tiroxin, tradicionalizmus,
transzszexuális, tritikálé, uniformizmus, utánégető,
vesztibuláris, vöröseltolódás, vulkanizmus, vulkanológia,
werkfilm, xenofóbia, zsurnalizmus.
- Biológiai szakszavak (védett gerincesek, kiemelten védett
egyéb hazai állat- és növényfajok listája alapján többek között):
acsa, aldrovanda, alka, aneuploid, aneuploidia,
árnika, baing, balin, barkóscinege,
batla, benge, bibircsvirág, billegetőcankó, bióta,
Bonelli-füzike, borsikafű, borzamag, bucó, bukó, cankógoda,
cankópartfutó, celler, cigánycsuk, cigányréce,
cincor, csabak, cselling, csér, csicserilednek, csicsörke,
csilpcsalpfüzike stb.
- Kémiai és fizikai szakszavak (szerves és szervetlen
vegyületek, atomfizikai fogalmak):
acetaldol, acetamid, acetanilid, acetecetészter, acetecetsav, acetofenon,
acil, adamantán, adenozin, adipinsav, Airy, akrolein, aktedron, aktin,
alanil, alanin, aldimin, aldol, aldotrióz, aldóz, alizarinsárga,
alkanal, alkén, aluminát, aminoplaszt, anhidrit, anhidron,
annihiláció, antikoincidencia, antikorreláció, antimonát,
arabinóz, aragonit, arginin, arzenát, arzénessav, arzénsav,
aszparagin, aszparaginsav, aurát, auxin, azid, azoibolya, azorubin,
barbitursav, baritvíz, barnapát, benzamid, benzedrin, benzil, benzoesav stb.
- Informatikai szakszavak:
autentikáció, autokonfiguráció, BIOS, cache, codec, CPU, előfeldolgozás,
életlenít, fehéregyensúly, gyorstipp, hotplug,
inicializáció, interoperabilitás, iPod, megapixel, mutex,
összmemória, paravirtualizáció, replikál, replikátor,
szuperkiszolgáló, Ubuntu, utófeldolgozás, vektorizál, vékonykliens,
virtualizáció, XP stb.
- Egyéb szavak:
apparatcsik, Ájurvéda,
álvéletlen, árérzékeny, bagett, baranta,
barlangászik, bazsevál, Beatrice,
biogeográfia, biom, chardonnay, csánk,
cserkészkedik, Enéh (kivételes toldalékolás: Enéhvel),
ételérzékeny, fantasy,
feladatcentrikus, félillegális, félretétel,
félrészeg, figyelmeztetőleg, finomhangol, fogász
(korábban összetételként elfogadva),
fotoszintetizál, fraktál, gajra,
gargalizál, glett, H2O, hetedel, hiperkocka,
hipertér,
hipó, horrorisztikus,
humánerőforrás, hungaricum, hungarikum, Hungaroring,
interferál, iskolaelső, iszlamista,
jakuzzi, Joli, karaoke, kendó, kisajak, kisállat,
kislámpa, kisőrlő, kiúttalan, kjokusin, koprocesszor,
kölykedzik,
kultiváció, külkereskedő,
lényegít, limerick, lőtábla,
másolásvédett, mediterráneum, metál,
nehézatléta, nemeuklideszi,
nonverbális,
öregujj, Örzse, összteljesítmény, palindroma, papája (gyümölcs),
parajelenség, pentagramma,
pityer, pótelőadás,
redoxireakció, referenciális, RNS, rogyaszt,
serpa, slisszan, sőre, szerfölött, szélsőbaloldal,
szociálpszichológus, szocpol,
szolmizáció, szusi,
szürkebegy, tachográf, taekwondo,
teleszkopikus, titkosszolga, Tolkien, Töhötöm,
újrafeldolgoz, újrafelhasznál, Viagra, vicsor,
vízitúra, wiki, Wikipédia, zagy,
zoom, zoomol, Zsazsa, zsírdús stb.
- Részletes lista
a változásokról, a közreműködők nevével.
2006-07-27. 1.1.1-es kiadás.
Összefoglalás:
- Választható LGPL és MPL nyílt forráskódú licenc a GPL mellett.
A Magyar Ispell szótár így bekerülhetett az OpenOffice.org forráskódjába és a magyar StarOffice-ba,
valamint része lehet a Mozilla forráskódján alapuló alkalmazásoknak, például a magyar Firefoxnak és Thunderbirdnek.
- A morfológiai leírás ellenőrzése és javítása. A hibák feltárását a BME MOKK
Kutatóközpont segítette a MorphDB.hu magyar nyelvi adatbázis fejlesztésével.
Eredmény: a *gömbölyűhez, *metszőhez, *tönkjükéhöz,
*motorös, *sósnek típushibák javítása. A -kénti,
-szörözték, -szörte toldalék pótlása (például tanúkénti meghallgatása, tizenötszörözték, tizenötszörte).
- A szókincs bővítése: zrt., nyrt. (zártkörűen és nyilvánosan működő
részvénytársaság);
új idegen szavak: barbecue, Barbie, cabernet, cellulitis,
csevapcsicsa, dzadzíki, ecstasy, graffiti, hiphop, husky,
merlot, mozzarella, nuncsaku, reggae, tálib, tamagoccsi, több
csak az Unicode-karakterkódolású szótárban: crô-magnoni,
Nexø, El Niño, Camões, € (euró, 10 €-val stb.);
új tulajdonnevek: ArchiCAD,
Firefox, Google stb.;
további szókincsjavítás és -bővítés sokak hibajelzése alapján.
- Az idegen szavak kezelésének javítása: Bushsal (kötőjel nélkül); *Łódz, *Łódzzal helyett Łódź, Łódźdzsal;
*kecsöp, *juppi, *OpenOffice.org-os helyett ketchup, yuppie és
openoffice.org-os;
show-műsor, merlot-rendelés (nem *showműsor, *merlotrendelés);
- Ékezetesítés engedélyezése a MAP beállítással a szótárban, pl. a hibás *arvizturo
szóra az árvíztúró, árvíztűrő szavakat javasolja a Hunspell a Magyar Ispell 1.1.1-et használva.
- Részletes lista
a változásokról.
2005-12-22. Megjelent az 1.0-s kiadás. Fontosabb változások:
- A Ft, kg, dkg, mg, km,
cm, mm és egyéb rövidítések nagybetűs és (kis kezdőbetű esetén)
nagy kezdőbetűs alakjának tiltása. (A magyar helyesírás szabályai 277. pontjának megfelelően
a szabványokban előírt rövidítések még csupa nagybetűs szövegben sem írhatók másképpen: AZ
ÁR 25 Ft. MAGASSÁGA 15 km.)
- A *milye, *milyük és toldalékolt alakjainak tiltása.
Papp Gábor jelezte a mily hibás toldalékolását: *milyem, milyed stb.
A mily határozószó gyakori az irodalmi nyelvben (mily szép!),
míg kérdő névmásként leginkább csak tárgyragos alakja található meg a köznyelvben: milyet.
A hiba olyan ly-os hibához vezetett, mint a mije, mijük és
toldalékolt alakjaik ly-nal való elfogadása. A hiba javításával a Magyar Ispell nem tartalmaz ismert
ly-os hibát. (A mily hibásan toldalékolt alakjait az MS Word is elfogadja, sok
egyéb ismert ly-os hiba mellett, például ilyen az *estéji, *karvaj,
*szeméji,
*ünnepéjes,
*csevely,
*bolyár,
*bolytár,
*súlytó elfogadása. Ennél súlyosabb hiba, hogy a csevej esetében
csak a hibás alakot (*csevely) fogadja el az MS Word, illetve az MS Wordben működő
MorphoLogic Helyes-e? program.)
- A szókincs bővítése (metaadat, szalakóta, teljeskörűség stb.),
valamint a morfológiai leírás javítása Goldman Eleonóra és Németh Krisztián hibajelzései alapján.
- Egyes trágár és durva minősítésű szavak jelölése, amelyet a Hunspell helyesírás-ellenőrző
a hibás szavakra adott javaslatok szűrésére használ (nem javasol ilyen szavakat). (Ezek a szavak
oly mértékben tabusítva voltak, hogy a Magyar Értelmező Kéziszótárban sem szerepeltek, egészen
mostanáig.)
- Toldalékolás javítása. Az e-re végződő, mély hangrendű toldalékot vonzó
szavak toldalékolása „elromlott” az Unicode karakterkódolásra áttérés során.
A fordított vesszős à-ra végződő szavak (jelenleg ez csak a pietà szóra
illik a szótárban) toldalékolása a csak esetragos alakokra nem működött a hibás ragozási szabályok miatt.
Ezek a hibák javítva lettek, így a mangrovét, pietàt stb. toldalékolt
alakokat is felismeri a helyesírás-ellenőrző, nem csak a töveket, illetve a pietà
személyragos alakjait (pietàja).
2005-10-24. Megjelent az 1.0-RC3-as kiadás. Fontosabb változások:
- Javított szabályok. Laczkó Krisztina és Mártonfi Attila Helyesírás c. műve
(Osiris Kiadó, 2004) alapján több hibát is javít az új Magyar Ispell szótár. Például a korábbi
Waterloóval és Macintosh-t helyett a Waterlooval és
Macintosht formát támogatja. Mártonfi Attila
sok hasznos javaslattal segítette a munkánkat, miközben megvizsgálta és
kiemelkedően jónak találta a Magyar Ispell szótárat.
- Bővített szókincs. A Magyar Webkorpusz gyakorisági adatai alapján került be több új tulajdonnév
a szótárba: Cerbona, Friderikusz, Gyurcsány, Lékó, Maastricht, Malév, Putyin, Schobert, Tourinform stb.
- Unicode-támogatás. A Hunspell látványos
Unicode-támogatásának köszönhetően elkészült a Magyar Ispell szótár kibővített karakterkészletű, unicode-os változata. Az unicode-os Magyar Ispell szótár több olyan idegen ékezetes szót is tartalmaz már, amelyet korábban nem lehetett kezelni. Ezek a szavak toldalékolva is felismerésre kerülnek: Ångströmről, Molière-től, pietàval stb.
- Hunspell-támogatás. A szótár együttműködik a legújabb Hunspell változattal. A Hunspell az OpenOffice.org irodai programcsomag hivatalos helyesírás-ellenőrzője lesz a közeljövőben,
ami megkönnyíti a Magyar Ispell szótár fejlesztését és használatát is.
A Szószablya fejlesztés (cikk az V. GNU/Linux szakmai konferenciára – 6 oldal, PDF, 55 kB)
A Hunmorph morfológiai elemző és a Magyar Webkorpusz.
Magyar Ispell levelezőlista: magyarispell kukac yahoogroups.com
Szószablya felhasználói levelezőlista: szoszablya-user kukac lists.mokk.bme.hu
Dokumentáció (81 oldal, PDF, 416 kB)
Magyar Ispell helyesírási és morfológiai szótár (2005. december 22.). Változások listája
1.0-s szótár forrása (829 kB)
Latin–2-es és unicode-os
(UTF-8) affixum és szótárállományok (1,7 MB)
Magyar Ispell helyesírási és morfológiai szótár (2005. október 24.). Változások listája
1.0-RC3-as szótár forrása (828 kB)
Latin–2-es és unicode-os
(UTF-8) affixum és szótárállományok (1,7 MB)
Hunspell helyesírás-ellenőrző és Hunmorph morfológiai elemző (2005. január 11.):
Hunspell 1.0-RC2 (177 kB)
Magyar Ispell helyesírási és morfológiai szótár (2004. október 7.):
1.0-RC2-es szótár forrása (839 kB)
1.0-RC2-es affixum és szótárállomány (505 kB)
1.0-RC2-es affixum és szótárállomány morfológiai kódokkal (683 kB)
Hunspell helyesírás-ellenőrző és Hunmorph morfológiai elemző (2004. június 29.):
Hunspell 1.0-RC1, a Magyar Ispell 1.0-RC1-es szótárral (857 kB)
Magyar Ispell helyesírási és morfológiai szótár (2004. június 29.):
1.0-RC1-es szótár forrása (699 kB)
Hunspell helyesírás-ellenőrző és Hunmorph morfológiai elemző (2004. június 9.):
Hunspell 0.9.9, a Magyar Ispell 0.99.6-os szótárral (732 kB)
Magyar Ispell helyesírási és morfológiai szótár (2004. június 9.):
0.99.6-as szótár morfológiai kódokkal (640 kB)
0.99.6-as szótár forrása (668 kB)
Hunspell ellenőrző 0.9.7-es javított változat (2003. december 18.):
Hunspell 0.9.7 (117 kB)
Hunspell 0.9.7, a 0.99.4-es szótárral (1,1 MB)
Magyar Ispell helyesírási szótár (2003. szeptember):
Magyar Ispell 0.99.4 (775 kB)
Futtatható állományok és függvénykönyvtár Windowsra, 0.98-as
szótárral: hunspell-0.9.0.zip (2 MB)
Korábbi változatok...
Támogatók:
Mátó Péter
Kapcsolódó oldalak:
Szószablya fejlesztés (gyakorisági szótár, szótövező, morfológiai elemző)
Magyar OpenOffice.org ingyenes irodai csomag (Linux, Windows)
TKLSpell
helyesírás-ellenőrző
(Linux)
MyspellX helyesírás-ellenőrző (Mac OS X)
Tipográl.hu (Huhyphn magyar elválasztási szótár)
Előző honlap (KDE, Vim beállítások leírása)
NUMBERTEXT.org (számok magyarul és más nyelveken)
2009 © Németh László (nemeth kukac openoffice pont org) és Godó Ferenc.