krono.inaplo.hu

  • A betűméret növelése
  • Alapértelmezett betűméret
  • A betűméret csökkentése
iNapló / iNter / Kultúra a hálón / A szanszkrit nyelv és a dévanágarí írás a neten

A szanszkrit nyelv és a dévanágarí írás a neten

Tags: betűtípus | digitalizálás | kódolás | szanszkrit | UTF

„A szanszkrit a világ legkötöttebb nyelve, a legszorosabban ölelkező, kétségen kívül az indiai szellem legszebb alkotása. Kitárulkozóan látványos nyelv, amit hallgatni is gyönyörűség, töprengő és töprengésre indító, gondolkodók nyelve, hajlékony, érzékeny és tapintatos, előrelátó, csak úgy hemzseg az esetektől és ragozásoktól.” - Henri Michaux: Egy barbár Indiában

A hindu szentírások nyelve a szanszkrit. Ez az ősi nyelv az ókori India és a hindu vallás máig használt liturgikus nyelve. A legkorábbi ismert szanszkrit nyelvű szöveg a Rig-véda. Valójában a Védák nyelve nem szanszkrit, hanem a szanszkrithoz nagyon közel álló, és vele közös őstől származó védikus óind. A tényleges szanszkrit nyelv az i. e. IV. században kristályosodott ki. A legtöbb szanszkrit szöveget az ókori és középkori Indiában írták. Mivel a szanszkrit nyelvet igen hosszú időn át hatalmas területen használták, szanszkrit írás nem létezik; különböző korokban és területeken más-más ábécét használtak a leírására. Manapság leggyakoribb az észak-indiai dévanágarí nevű betűírás, amely feltételezések szerint az i.e. IX. sz.-i föníciai ábécére vezethető vissza. Az írás balról jobbra irányú. A szanszkrit nyelvben leggyakoribb "a" hangot nem jelölik, ha csak egyéb jelölés nincs.

A szanszkrit nyelv természetes úton fejlődött ki, majd a szanszkritot kodifikálták. A régi – ma védikus óindnek nevezett – nyelven írt szent iratokat, a Védákat, változatlan formában őrizték meg, miközben a beszélt nyelv egyre jobban eltávolodott az ezekben használt nyelvezettől. Ekkor még megvolt a társadalomban az igény arra, hogy értsék is ezeket a szövegeket, és ne csak mechanikusan felhasználják a szertartásokhoz; sőt, írjanak is hasonló nyelven új műveket. Ezért – a rituálé rendjének segédtudományaként – kifejlődött a grammatika. Gyakorlatilag ekkortól mondható az óind nyelv szanszkritnak.

A szanszkrit nyelv napjainkban holt nyelvnek tekinthető. Beszédben igen kevéssé használatos, azonban továbbra is megmaradt a hagyományos kultúra nyelvének: ma is születik kis mennyiségű szanszkrit irodalom. Gyakorlatilag holt nyelvnek mondhatjuk attól a pillanattól fogva, hogy grammatikája megszületett és szentségre emelkedett – hiszen ekkortól élesen elvált az élő, szervesen fejlődő beszédtől.A dévanágarí írás modern formáját már az i.sz. XI. századból származó kéziratokon is megtalálták, tehát már ekkor ugyanígy nézett ki ez az írás, mint mai formájában. Manapság a szanszkrit szövegeket leginkább latin betűs átírásban vagy dévanágarí írással adják ki.

A dévanágarí írás digitalizálása

Mind a szanszkrit nyelv latin átírása, mind a dévanágarí írás különleges karaktereket tartalmaz, melyek számítógépes, internetes megjelenítése nem lehetséges speciális kódolás, kibővített betűtípusok használata nélkül.

Kódolás

A legtöbb internetes honlap a Unicode kódolási szabványt használja. Unicode a világ összes élő, holt és mesterséges nyelvének karakterkészletét, írásjeleit és egyéb szimbólumokat magában foglaló kódtábla. A Unicode egy viszonylag új keletű rendszer, amely a karaktereket nem egy bájton tárolja, hanem szükség szerint több bájtos kódolást is engedélyez. Így az egy betűtípusban megjeleníthető karakterek száma a nemzetközi viszonylatban nevetségesen kevés kétszázegynéhányról több milliárdra nő. Ezen hatalmas kódtábla karaktereinek ábrázolására fejlesztette ki Ken Thompson és Rob Pike az UTF-8 kódolást.

Az UTF-8 (8-bit Unicode Transformation Format, 8 bites Unicode átalakítási formátum) változó hosszúságú kódolással jeleníti meg a Unicode jeleit. Lehetővé teszi egyetlen kódtábla használatát, melynek előnyeit a nemzetköziséget támogató szoftverek, weblapok programozói és ’szkripterei’ oly régen áhítottak. Ez lehetővé teszi, hogy egységes – hardvertől, operációs rendszertől függetlenül működő – kódolással jelenítsük meg nemcsak az összes ma létező írott nyelv teljes ábécéjét, de szükség esetén az óperzsa ékírástól a magyar rovásíráson át a tolkieni tengwákig vagy a klingonig bármit. A speciális karaktereket használó írások megjelenítéséhez böngészőnk karakterkódolását Unicode-ra (UTF-8) kell állítani.

Betűtípusok

 Alapértelmezésben a honlapok a mellékjeles betűk megjelenítéséhez alkalmas betűtípusokat használnak. E betűkészletek (leggyakoribb a Tahoma betűkészlet) tartalmaznak minden mellékjelet és karaktert, amire szükség van a helyes megjelenítéshez. Ezek a betűtípusok Windows XP-től felfelé részei az installációs csomagnak, és Windows rendszerhez ingyenesen letölthetők. A Mac OS X a 10.5 (Leopard) változat megjelenése óta szintén gyárilag tartalmazza ezeket a betűtípusokat.Helyettesítésére alkalmas – bár kevésbé szép – megoldás az Arial Unicode, illetve Mac OS-hez a Lucida Grande betűtípus. Az előbbit tartalmazza a Microsoft Office és a Mac OS X Leopard telepítőkészlete.Az internetes honlapokon különleges mellékjelekkel ellátott betűket láthatunk. A modern operációs rendszereket használók gépeire valószínűleg az ezek korrekt megjelenítéséhez szükséges betűtípusok már telepítve vannak.Ha saját számítógépünkön szükségünk van ind mellékjeles betűtípusokra, a fentieken kívül hasznos lehet még az Gentium, a Times Extended Roman és Courier Extended Roman betűkészletek. Bármely betűtípus megteszi, amely tartalmazza a dévanágarí, a tamil ábécé vagy egyéb ind írások karaktereit; a korszerű operációs rendszerek gyárilag tartalmaznak ilyeneket.
 
 
inapimag002.jpg