Magyar Ispell levlistamagyarispell@yahoogroups.com
Jeletkezés a magyarispell-subscribe@yahoogroups.com címre küldött levéllel.
Németh László (02/01/11):
.
,,A Magyar Ispell az Ispell helyesírás-ellenõrzõhöz készült magyar szótármodul, illetve keretrendszer.
Kiegészítõ programjai révén nemcsak szöveges, TeX, nroff, hanem HTML állományok ellenõrzésére is alkalmas. Együttmûködik a LyX, KLyX, KWord, AbiWord, OpenOffice, Emacs, stb. programokkal is.
A programot a Szofi Education Center of Computer Science oktatója, Németh László
fejleszti, most már egy kis csapat segítségével.Reméljük, hogy a Magyar Ispell bemutatkozása sikeres lesz, és még többen
csatlakoznak hozzánk! Magyar Ispell honlap"
GYIK
Godó Ferenc:,,A Magyar Ispell nyilvános megjelenése lehetõvé tette az OpenOffice-hoz illeszkedõ szótári állományok elkészítését.
Szótári állományok és installálási útmutató: trillian"
Jó a helyesírásellenõrzõ (SzGy, 02/04/16):A clphx-re foltettem a kurrens verziot (huhy401.zip),
melyben megprobaltam a kereteit megteremteni annak, hogy
-- mikent a szabalyzat irja -- tobbfele lehetoseg
kozul lehessen valasztani.
Kerem, hogy a dokumentaciot is olvassa el, aki raer,
es tegye meg megjegyzeseit.Mivel a huhyph.tex fajl szolista alapjan keszult,
nem pedig kezzel, mint korabban, ezert lehetnek (es sajnos vannak is)
meglepo dolgok benne (ezert beta2).Észrevételek, javaslatok küldhetõk a szerzõhöz és/vagy a MaTeX-hez.]
Esszeru keretek kozott hajlando vagyok segiteni.
Régebben volt a listán, de ismét megismétlem.
Szólisták érhetõek el a
http://sourceforge.net/projects/wordlist-hu/
címen. Ezeket Müller Kevével szedtük össze.
Hogy milyen listák? Lásd:
http://www.szgti.bmf.hu/harp/Forras.txt
Készülõben van az új szó lista
a WinEdt helyesírásellenõrzõjéhez
(TD,
02/04/23):
Egy kb. 300 000 szóból álló lista áll rendelkezésünkre, melyet ellenõrizni kellene (TD, 02/04/29).
Csináltam egy honlapot tájékoztatásul a
helyesírásellenõrzés után érdeklõdõknek:
http://www.szgti.bmf.hu/harp/helyes
Igyekeztem leírni azt amit a helyesírásellenõrzési
lehetõségekrõl megtudtam, illetve hogy szerintem mit
hogyan, hol kellene csinálni.
A véleményeket kiváncsian várom.
------------------------------
Egy kis beszámoló saját sikereimrõl elsõsorban
Linux-felhasználóknak.
Én letöltöttem az Ispell/MySpell honlapról
a csomagot, és azóta tudok helyesírást ellenõrizni
Ispellel. A telepítés különösebb gond
nélkül ment. Ehhez a honlap tökéletes eligazítást
nyújtott.
Egyelõre TeX és HTML fájlokon próbáltam
az ellenõrzést. Kitûnõen mûködik
16MB RAM-mal is, és elegendõ hozzá a karakteres felület.
A ? gombbal kapott súgó nekem bõven elegendõnek
bizonyult a használathoz.
(Remélhetõleg az angol nyelvezet nem sokaknak nagyon
riasztó.)
Remélem másoknak
is tetszik majd.
Üdvözlettel:
Horváth Árpád
A gond az ispell hívásával van: a -d kapcsoló
után a szótárállományt adjuk meg, ami
magyar, esetleg hungarian.
Helyesen:
ispell -t -d magyar valami.tex
A /usr/lib-be másolásra kerül a magyar.aff is, ami
valóban szövegfájl.
Ott kell lennie viszont a magyar.hash-nek is, ha van hely azon a partíción
(9 Mb-os az állomány).
A Magyar Ispell amúgy rendelkezik matematikai modullal (Bíró Árpád munkája), így különösen érdekes lehet a TeX használók szempontjából. A TypoTeX egyébként mintha már átállt volna más szedõrendszerre, vagy nem?
Tikk Domonkos listája, ha jól látom, külön is letölthetõ. Ha ráeresztjük az ispellt, gyorsan kiszûrhetõ az a szókincs, ami nincs a Magyar Ispellben, a bõvítés tehát úgy tûnik, hogy lehetséges, ha a szerzõnek nincs kifogása :)
Az aspell-hu projektrõl hallottam, de még nem került beillesztésre a szóanyaga. Godó Ferenctõl különösen nagy saját gyûjtésû szókincset kaptam, aminek feldolgozása nagyrészt megtörtént.
A Magyar Ispell valóban ragozza a szavakat, ráadásul
igyekszik ezt helyesen megtenni. :)
Különösen érdekes a jelenleg még csak
függvénykönyvtárként mûködõ,
OpenOffice.orghoz készült platformfüggetlen MySpell
(http://www.szofi.hu/gnu/magyarispell/newmyspell.tar.gz),
amit már sikerült olyan egyedülálló tulajdonsággal
bõvíteni, mint pl. helyes javaslattevés tetszõleges
hasonulásból eredõ hibákra
(pl. annyát->anyját, maracc->maradsz).
Most készül egy kifinomult szóösszetétel-ellenõrzõ
rész a Myspellhez, ami a magyar helyesírási szabályoknak
megfelelõen a többszörös szóösszetételeknél
figyelembe veszi a tagok igetõjének hosszát (az egy
szótagúak ugyanis nem számítanak bele a szótagszámba),
valamint a képzõket (ezek beleszámítanak),
stb. Jelenleg a 99-es lenyomatú helyesírási szabályzathoz
kapcsolt,
firssített szókincs alapján szeretnénk
leellenõrizni, illetve bõvíteni a Magyar Ispell szókincsét.
Mostani állapotában is úgy tûnik
(talán nem vagyok elfogult :), hogy a Magyar Ispell/Myspell
a jelenlegi legjobb magyar helyesírás-ellenõrzõ,
vagy igen közel áll hozzá... :)
Segítséget szívesen várunk a MaTeX csoporttól
is, akár olyanformán is, hogy használják az
ellenõrzõt, és az észlelt hibákat jelzik
a magyarispell@yahoogroups.com listán.
(Feliratkozás: magyarispell-subscribe@yahoogroups.com)
A DOS-os ispellrõl nem tudok biztosat mondani, de az Abiword
(http://www.abisource.com), és
a magyar OpenOffice.org (http://office.fsf.hu)
használja a Magyar Ispell szótárat. Az utóbbi
a jobb, mivel az tartalmazza a bõvített MySpellt.
Az Abiword elõnye, hogy nem erõforrásigényes,
mindössze pár megabájt, és erõsen emlékeztet
a Wordre. Szerintem TeX forrás szerkesztésére is jól
használható Windows alatt.
Ha persze van rá kapacitás, a magyar OpenOffice.org javasolt!
A(z Abiword) szótár letöltési helye: http://www.szofi.hu/gnu/magyarispell
![]()
http://www.ToolsCenter.org/products/texniccenter/
\newcommand{\Z}{\mbox{Z\hspace*{-0.3em}Z}}illetve a
\newcommand{\N}{\mbox{I\hspace*{-0.2em}N}}
\def\N{{\mathchoice{\hbox{\rm I\kern-0.2emN}}típusú barkácsolásokat.
{\hbox{\rm I\kern-0.2emN}}
{\hbox{\sevenrm I\kern-0.2emN}}
{\hbox{\fiverm I\kern-0.2emN}}}}
Tud valaki arról, hogy a TeX-hez létezik-e olyen karakterkészlet, amelyben ezek benne vannak?
![]()
7/0. Ahhoz, hogy magyar elválasztást
használjak, texconfigot kell futtatnom
(vagy más módon átírni az
/etc/texmf/language.dat fájlt és valami más
progit lefuttatni). Megoldható valahogyan, hogy
tudjak magyarul
elválasztó LaTeX-dokumentumokat fordítani
olyan gépen, ahol nem vagyok
rendszergazda?
Egmontnak formálisan válaszolva, pro-gramma szószerint
`elõ-írás',
vagyis `napirend, hirdetmény, rendelet' stb.
A görögös elválasztás mellett azzal lehetne
érvelni, hogy a szónak
legalább az egyik eleme a magyar nyelvérzék számára
is világosan
elkülönül, mivel sok -gram (és -gráfia)
utótagú összetételt használunk
(és egyébként a pro- elõtag sem ritka,
még ha a latin eredetû
pre- sokkal gyakoribb és élõbb is). Tehát
a magyar beszélõ tudja,
hogy a -gram és a -gráfia önálló elem,
noha nem használatos
mint önálló szó.
Ha pedig mondjuk a holo-gram és a sztrati-gráfia szót
így választjuk
el, akkor ez húzza maga után a pro-gram elválasztást
is.
Nem vitatom, hogy ebben az érvelésben van egy kis nevelõ
jelleg,
de én nyilván úgy gondolom, hogy ha a szavakat
tudatosabban
alkalmazzuk, az mindenkinek csak jó.
A görögös elválasztás ellen nyilván
azzal lehetne érvelni, hogy az
összetétel úgymond elhomályosult, és
eredeti jelentése nem tudatos a
használókban. Azonban a szabályzat szerint
a homályosodó
összetételeket is az összetétel határán
kell elválasztani. Még az
olyan közönséges szavak esetében is, mint a
,feladat', a beszélõ nem
mindig gondol az alkotóelemekre, s nyilván lehet még
homályosabb
példát is találni.
Gyöngyi utalt rá, hogy a szabályzat a nem-szóelemzó
írásmódra
a prog-ram elválasztást (is) hozza példának.
Be kell vallanom, hogy éppen ezért van az, hogy a jelen
huhyph 3.x
az ellenkezõ elvet követi ... :-)
En ugy erzem, sot szinte bizonyos vagyok abban, hogy DEK is ezt a format
latna' helyesnek. Akar fogadni is merne'k...
En azt elfogadom, hogy nem minden szabaly tetszik mindenkinek.
Nekem sem tetszik pl. az, hogy a gondolatjel es a hosszu kotojel ugyanolyan
hosszu, vastag es ugyanolyan magassagban van. Igy hasznalom azonban oket,
mert ez a szabaly.
Kezdetben az is remes volt peldaul, hogy a file-t fajl alakban, a software-t
szoftver alakban kell leirni. A tablara betunkent irtam fel oket legalabb
egy evig, de honositottak, tehat igy kell irni.
Egyebkent sem varhato el minden embertol, hogy ismerje a latin, gorog,
angol, francia, nemet stb.
nyelvekbol a magyarban meghonosodott minden szo eredeti jelenteset,
osszetetelekre lebontva.
Szerintem nem rossz ez, hiszen tomerdek olyan szo van, amit eredetiben
biztosan senki sem ismer
kozulunk.
Nezzunk utana minden egyes jovevenyszonak, hogy melyik nyelvbol, milyen
szobol szarmazott, osszetetel-e es ha igen milyen, es annak alapjan csinaljuk
meg az elvalasztasi szabalyt sutba dobva a szabalyzatot?
Fura dolog jonne ki belole, azt hiszem.
A magam reszerol, ha a pro-gram format hagyjatok benne, mindenkeppen
fogok irni egy
\hyphenation{prog-ram} modositast a sajat makrofajljaimba.
7/4. A varioref csomag definiál bõbeszédû
hivatkozásokat, amely oldalszámot is
elhelyez, méghozzá így:
See in section \vref{label}
-> See in section 1.2 (ha ugyanazon
az oldalon van)
-> See in section 1.2 on the next page
(ha a következõ oldalon van)
-> See in section 1.2 on page 27 (ha
messzebb van)
Az "on the next page" és társai szövegek
le is vannak magyarra fordítva a
varioref.sty fájlban, azonban ez három oknál
fogva is használhatatlan:
a. A csomag feltételezi, hogy egy "\aza" nevû makró
definiálva van, holott
ilyet senki sem definiált. Magyarul
nem kompatibilis a magyar.ldf-fel.
Ezt a problémát viszonylag könnyû
megoldani.
b. Az angol, német és egyéb ilyesmi nyelvek
szórendje olyan, hogy a makró
által helyettesítendõ
két dolog (tehát a hivatkozott cucc sorszáma
illetve oldalszáma) egymás mellé
kerül a mondatban. A magyar nem ilyen.
Tehát ha azt írod, hogy
Lásd még a \vref{label}.
fejezetben is, ahol...
akkor ez kerülhet a könyvbe:
-> Lásd még a 3.4
a következõ oldalon. fejezetben is, ahol... (!!!)
Könnyen átgondolható, hogy
ez egyargumentumú \vref makróval nem oldható
meg a magyarban, hiszen meg kell adnunk a
LaTeX-nek, hogy milyen szöveg
kerüljön a sorszám mögé,
de még az oldalszám elé. Kétargumentumú
\vref
makróra van szükség, amely
így mûködik:
Lásd még a \vref{label}{fejezetben
is}, ahol...
-> Lásd még a 3.4.
fejezetben is a következõ oldalon, ahol...
c. Természetesen az elõbb a névelõ
használata igen cinkes volt. A
magyar.def által definiált \aref
és \Aref mintájára szükség van
\avref és \Avref makróra is:
Lásd még \avref{label}{fejezetben
is}, ahol...
7/5. A nameref.sty csomag definiál egy \nameref makrót, amely a fejezetKE (03/28):
Ami a "hivatalos" magyar.ldf-ben meg van oldva, az az \aref es \Aref
makrok. Ezek jol vannak megoldva, habar az altaluk hasznlat \az makrot jo
lenne kiegesziteni, hogy "\az{x.y.}"-ra "az"-t adjon vissza "a" helyett.A \vref, \avref, \anameref stb. makrok vagy nincsenek megoldva, vagy
hibasak, de ez nem a magyar.ldf hibaja, hanem a varioref csomage. Persze a
hianyossagokat jo volna a magyar.ldf-ben potolni.
Amikor egy fejezet címe saját maga névelõvel
kezdõdik, akkor nagyon
rosszul néz ki egy újabb névelõ
berakása. Tehát ha a \label{label} egy
"A valami" nevû fejezetben van, akkor a
Lapozz \anameref{label} fejezethez
makrónak a triviális
-> Lapozz az A valami fejezethez
helyett azt kellene produkálnia, hogy
-> Lapozz A valami fejezethez
A magyar.ldf-ben a mostani \aref-cuccok kivitelezését
elnézve ezt igen
nagy munka lenne ilyenre megcsinálni (gyökeresen
át kell dolgozni az
egészet), de szerintem fontos lenne. Az már
csak hab a tortán, hogy
kellene egy opcionális argumentum az \anameref
és társai makróknak,
amellyel ezt a névelõ kihagyást letilthatjuk,
hiszen néha szükség lehet
erre:
Lapozz \anameref{rigo} fejezethez
-> Lapozz A típusú nyelvvizsga
fejezethez
de
Lapozz \anameref[-]{rigo} fejezethez
-> Lapozz az A típusú nyelvvizsga
fejezethez
7/6. A makeindex parancsot meg kellene tanítani
arra, hogy hogyan lehet
magyarul ábécérendbe rakni a tárgymutató
bejegyzéseit.
BGy: Ennek már vannak megoldásai. Lásd Xindy. MGy: Ezt a problemat Sudar Csaba megoldotta a xindy segitsegevel,
a leiras megtalalhato a Wettl es bandaja LaTeX konyveben.
Ha Csaba vagy mas nem akad, aki kozzeteszi, akkor piszkaljatok
engem ez ugyben.
5/(1) magyar plain TeX EC fontokkal.
A regi motorosok szamara tok trivialis a kerdes, mert ezt szinte mindnyajan megcsinaltuk magunknak. A gond csak ott van, hogy mind a mai napig a TeX disztribuciok nem tartalmazzak a megoldast egy kanonikus es barki szamara konnyen beallithato formaban.
A kerdes megoldasat az indokolja, hogy a LaTeX szamos esetben nem alkalmas eszkoz, igy tovabbra is szukseg van a plain TeX-re.
5/(2) TOC es magyar.ldf defenzivebbe tetele.
A jelenseg a kovetkezo: Szabó Péter (pts@math.bme.hu) nagyon elegansan megoldotta, hogy minden chapter es section tartalmazhasson egy lokalis tartalomjegyzeket, a megoldasa egy nagysagrenddel jobb a hivatalos minitoc-nal.
5/(2/a) a standard TOC-ot inzertalo parancs eleg bugyuta modon a dolga vegeztevel O_TRUNC lenullazo jelleggel megnyitja irasra az aktualis *.toc fajlt, --- ahelyett, hogy csak elojegyzesbe venne, hogy \enddocument eseten tortenjek ez meg. Ez elejet veszi annak a termeszetes igenynek, hogy egy konyv tobb kulonbozo szintu tartalomjegyzeket tartalmazzon.
A hivatalos minitoc attol feleslegesen bonyolult, hogy kerulgeti ezt a hibat.
5/(2/b) a magyar.ldf az igazi szivas. Egy listara gyujti, hogy magyarra kapcsolaskor a chapter, section es hasonlo makrok mely reszmakroit kell atdefinialni es mire. Az ebbol adodo termeszetes megoldas az lenne, hogy e listara tegyuk fel az erintett reszmakrok uj verzioit is.
Amde a magyar.ldf es BABEL csomag elhagyasa utan hiaba modositom a szobanforgo listat, az mar nem hat ki a valtaskori definiciokra.
Ez nekem azert baj, mert igy jelenleg a magyar.ldf eseten nem tehetem ra a chapter es section makrokra a lokalis TOC automatikus inzertalasat.
A hivatalos minitoc azert nem kinalja fel az automatikus inzertalast, mert csak angol eseten tudna buhera nelkul megtenni, az elso nyelvvaltas mar keresztbe tenne.
=================================================
Mar nagyon keservesen megbantam, hogy a ket uj GNU-s szemleletu konyvemet nem plain TeX-ben, hanem a hallgatok unszolasara LaTeX-ben csinalom.
LaTeX pontosan akkor szuper jo, amikor egy Windows-szeru rendszer, nevezetesen amikor a vagyaim a FELKINALT lehetosegek keretein belul kielegithetem, vagy ha egy professzionalis egyseg feladata engem kiszolgalni.
Azaz LaTeX tokeletesen alkalmas sajat aprobb keziratokhoz es nagy kiadok
nagy ujsagjaihoz valo bekuldozgeteshez. Azonban a teljesen sajat kivitelezesu
nagyobb projektekhez
kifejezetten alkalmatlan.
A problema oka onnet ered, hogy a LaTeX hianyos doksija is mar tobb, mint 17 GB, mikozben a plain TeX eseten mindent tudsz, ha azt a kb fel-ezer oldalas kek konyvet ismered.
Ez nagyon nagy elvi kulonbseg.
Es most azt szenvedem, hogy egyuttal gyakorlati is a kulonbseg.
![]()
Kutatótársaim jelentõs része a számítógépet
még mindig csak "okos" írógépként (MS-World)
használja. Egy egységes, akár más formátumokba
is könnyen konvertálható szövegleírónyelv
nem csupán gyakorlati szempontból lenne fontos, de a szövegelméleti
kutatásokat is nagyban segítené. Angolszász
és német nyelvterületen már készültek
ilyenek Tex-hez (Edmac
és Tustep).
Ezek nem minden esetben alkalmazhatók magyar nyelvû szövegek
kritikai kiadásához (a Tustep ráadásul fizetõs).
Én jelenleg 18. századi magyar hexameterek kiadását
készítem LaTeX-hel, különbözõ csomagokkal
ûvészkedve.
De már látom, hogy mi az, amit nem tudok megcsinálni.
Javaslatom illetve elképzelésem szerint létre
kellene hozni egy informatikusokból, TeX szakértõkbõl
és irodalomtörténészekbõl álló
csoportot, akik közösen készíthetnének LaTeX
alá egy régi magyar szövegek kiadására
is alkalmas csomagot.
[...]KE: ...a legujabb magyar.ldf-ben mar javitva van: http://www.tex.ac.uk/tex-archive/macros/latex/required/babel/
Itt magyar.dtx es magyar.ins fajlok vannak, amibol a magyar.ldf-et
generalni lehet. A SuSE Linux disztribucioban peldaul a 7.2-es ota (2001 kozepen
jelent meg) az ebbol keszitett magyar.ldf van. Szoval szerintem most ez
"a hivatalos" valtozat.SzF: A régi verziók javítására a http://ebizlab.hit.bme.hu/~tisanyi/latex/ címen található megoldás.
Ezek szerint egyszerûen ki kell %-olni az illetõ sort.
Szerintem az is jót tenne a TeX/LaTeX használhatóságának,
ha a disztribúciók valamimódon segítenének
a magyar / egyéb helyi elválasztási szabályok
érdekében való konfigurálásban. Nekem
körülbelül ötszöri nekifutásra is
csak annyi sikerült, hogy összesen huszonvalahány órát
töltöttem el zöld-könyv bújással, interneten
kutakodással, kísérletezéssel, bosszankodással,
fmtutil --all
! ==> Fatal error occurred
hibaüzenetek megfejtésével. Aztán mikor egyszercsak
létrejött rendesen a szükséges latex.fmt fájl,
csak
azt nem tudtam hónapokig, hogy hová kell tennem ahhoz, hogy
hasson is. Véletlenül láttam végül a texnh
listán írva, hogy a web2c könyvtárba. Pedig szerintem
nem vagyok hülye, csak éppen nem találtam használható
útmutatót. Így esett, hogy nem tudtam használni
a magyar elválasztást két éven át, õrült
sokat bíbelõdtem egyfajta szemi-manuális feltételes
elválasztással :), mert amúgy szeretem a LaTeX-et,
mindenemet azzal nyomtatom.
Ami a tipográfiát illeti, nem tudom, hogy min múlik,
de a látványt tekintve problémának tartom,
hogy bizonyos betûtípusok esetében, pl a zöld
LaTeX könyvben használt times-ban hamis õ és
û betûk jelennek meg, amelyeknek a dupla ékezetei két
szimpla ékezet egymás mellé tevésébõl
származnak. Az igazi, tipográfusok által tervezett
õ és û betûkön számos betûfajtánál
(pl. a Népszabadság cikkeinek általános betûtípusánál)
nem az áéíóú betûk ékezetébõl
van kettõ egymás mellett.
Ilyenkor a szimpla ékezet ferdébb, mint a dupla. Ugyancsak
szép, helyesen különbözõ ékezetek vannak
a TeX kezdõlépések c. könyvükben. A hamisított
duplaékezetnél (ami egyébként a Népszabadság
címeiben is
megjelenik) a valódi duplaékezet keskenyebb helyet foglal
el, mivel meredekebb. A hamis õ és û betû azért
csúnya, mivel a két ékezet néha ugyanolyan
széles, mint a betû, s a hamis betûnek a baloldali ékezete
nem az o hasa illetve az u lyuka felé mutat, hanem az elõzõ
betû felé.
Nem értek a \H parancs mibenlétéhez, csak az eredményre
mondom, hogy nem mindig jó. Például az utopia (putb8r)
fontnál eltérnek a szimpla és dupla ékezetek.
Persze vannak olyan eredeti betûfajták is, amelyeknél
a
dupla ékezet a szimpla ékezet megduplázása,
csak ott eleve a szimpla ékezet is viszonylag meredek, ezért
nem állnak elõ az elõbb bírált effektusok.
El tudom képzelni, hogy a TeX teljesen ártatlan ebben a problémában. Ez akkor lenne így, ha a \H parancs által a betû fölé rakott objektumnak (a dupla ékezetnek) per definitionem semmi köze nem lenne a \' által rakott szimpla ékezethez. S ha a fontkészletben nincs elõre tervezett dupla ékezet, akkor a TeX hamisítás helyett sípolna. Tanácstalan vagyok, mivel a zöld LaTeX könyv 291-297. oldalának karaktertáblázatában megtalálható a duplaékezet, de nincs benne a szimpla...
Mindehhez képest újabb teljesen más kérdés, hogy mi lenne, ha valaki olyan fontot szerezne és akarna használni TeX-hel, amelynek külön tervezett ékezetes betûi vannak, azaz amelyek nem az "alapbetû + szimpla vagy dupla ékezet" recepttel készültek, hanem egyedileg vannak tervezve. Tehát ahol mondjuk az á és az é betû ékezetei nem is egyformák. És némely betûhöz vannak különleges ligatúrák is, például kurzív "gy". Lehetne egyáltalán ilyeneket használni TeX-hel?
![]()
Amit látok, hogy hiányzik, az diplomatervek és
PhD értekezések
készítéséhez tanácsok, és
legalább egy egyszerû template.