krono.inaplo.hu

  • A betűméret növelése
  • Alapértelmezett betűméret
  • A betűméret csökkentése
iNapló / iNter / Könyvtár és hálózat / Könyvek, arcok, karakterek: optikai képfelismerés

Könyvek, arcok, karakterek: optikai képfelismerés

Tags: digitalizálás | kép | mesterséges intelligencia

A képfelismerésnek köszönhetően bizonyos kérdésekre sikeresen kaphatunk választ, egyelőre azonban gépeink még nem képesek úgy „általában” megérteni, mit ábrázolnak a képek. A különféle módszerek speciális szempontok alapján próbálnak meg információt kinyerni az álló- és mozgóképekből (sőt, akár 3 dimenziós képekből is). A gépi látás témaköre igen tág és sok ponton kapcsolódik egyéb tudományterületekkel: használják orvosi képfeldolgozásnál, ipari minőségellenőrzésre, katonai célokra, robotok irányításánál, kamerás megfigyelésnél stb.

Keresés képeket tartalmazó adatbázisban

Bár a számítógépek még nem alkalmasak a képek felismerésére úgy általában, kellően behatárolt feladatkörben jól alkalmazhatóak. Az emberi arc vagy ujjlenyomat felismerése jó példa erre: bizonyos – előre megadott – jegyek alapján könnyen megállapítható algoritmikusan, hogy két arc/ujjlenyomat hasonlít-e vagy sem. A felismerés alapjául szolgáló jellemzők (feature) kinyerése kulcsfontosságú, ha ez jól történik meg, nem nehéz a felismerés. (forrás: ld. lejjebb, 1.)

Arcfelismerés, biometria

A biometria az emberek testi jellemzőinek egyediségén alapuló azonosítás tudománya. Ilyen egyedi jellemző lehet az ember ujjlenyomata, DNS kódja, retinája, arcformája, érhálózata, hangja és még rengeteg egyéb jellemzője. Az A.R.Hungária Rt. a mesterséges intelligencia alkalmazásával fejlesztette ki arcfelismerő szoftverjét, az SDK-t. (forrás: ld. lejjebb, 2.)

Szinte mindig célszerű a képeket egyszerű transzformációkkal, szűrőkkel előfeldolgozni. Az így kapott kép valószínűleg tartalmaz fontos és lényegtelen területeket is. Ezeket a szegmentáció során választjuk szét egymástól. Így megkaptuk a kép számunkra fontos területét, de ez még mindig pixelek ezreit (akár millióit) jelentheti, ami a legtöbb algoritmus számára túl sok feldolgozandó adatot jelent. A sűrű képpontfelhőből kezelhető mennyiségű adatot az ún. feature-ök, vagy „vizuális jellemzők” kinyerésével kapunk. Ez legtöbbször vonalak, sarkok vagy egyéb szempontból speciális elemek detektálását jelenti. Így már nem pixelekkel, hanem kezelhető mennyiségű képi jellemzővel kell dolgoznunk. Ezek alapján már megkereshetjük az előre eltárolt adatbázisban a jellemzőkhöz legjobban hasonlító objektumot (felismerés), vagy kiszámíthatjuk a legjobban illeszkedő (mozgás, pozíció) paramétereket. Ne felejtsük el azt sem, hogy a képi jellemzők kinyerése során hamis találatokat is kaphatunk, amiket fel kell ismerni, és ki kell szűrni az adathalmazból. (forrás: ld. lejjebb, 1.)

OCR - analóg könyvből digitális szöveg

Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) a számítástechnikában azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón (leggyakrabban papíron) szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.

A felismerési folyamat részei:

  • az írás képének beolvasása (scanning);
  • a képen szereplő szövegblokkok, szövegsorok vizsgálata;
  • a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
  • a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés).

Ezen részek nem mindegyike kell, hogy szerepeljen egy OCR-programban, azonban mellőzésük rontja a felismerés hatékonyságát. (forrás: ld. lejjebb, 3.)

A karakterfelismerés jelentőségét talán nem kell hangsúlyozni. A nyomtatott és a kézzel írott írás felismerése is régóta kutatott téma, igen jelentős, és a gyakorlatban is bevált eredményekkel. Gondoljunk csak a postai küldemények címzésének felismerésére, kitöltött nyomtatványok automatikus feldolgozására, vagy könyvek és dokumentumok gyors digitalizálására. (forrás: ld. lejjebb, 1.)

Könyvtári szolgáltatások

Az EOD-projekt az "E-könyvek igény szerint" szolgáltatás beindítására és kidolgozására jött létre 8 ország 13 könyvtárának együttműködésével. Az EOD hiánypótló szolgáltatás, amelynek célja, hogy elősegítse az európai kulturális örökség digitalizálását, ezáltal mindenki számára elérhetővé tegye a rejtett könyvritkaságokat. A szolgáltatás keretében kizárólag a szerzői jogi védelem alatt nem álló, 1500 és 1900 között megjelent művek digitalizálását lehet megrendelni. A könyvek kora és értéke miatt a hozzáférés sok esetben korlátozott: csak bizonyos könyvtárakban, meghatározott feltételek mellett olvashatók. Az EOD keretében a figyelem középpontján kívül eső művek kerülnek előtérbe, amelyeket a gyűjtők vagy kutatók keresnek.

A szolgáltatásban a távhasználók számára teljes körű online környezet áll rendelkezésre a megrendelés, fizetés és szállítás bonyolításához. Az olvasók a könyvtári katalógusokon keresztül rendelhetnek e-könyveket az EOD-gombra kattintva. Ekkor az űrlapba a rendeléshez szükséges adatok automatikusan bekerülnek. A digitalizálást a könyvtárak végzik el, majd FTP kapcsolaton keresztül feltöltik a képfájlokat a központi szerverre. A PDF fájl létrehozása, az optikai karakterfelismerés és a borító generálása a központi rendszeren keresztül történik. Majd az elkészült e-könyvet elküldik az ODM elnevezésű megrendelés-kezelő rendszeren keresztül a vásárlónak.

Az EOD e-könyv egy borítóval ellátott egységes PDF fájl, amelyben rövid útmutató található az e-könyv használatáról. Az e-könyv kétféle, normál és extra minőségben készül, attól függően, hogy a megrendelő kért-e optikai karakterfelismertetést. Az extra változat visszaadja az eredeti könyv kinézetét, és lehetőséget ad a teljes szövegű keresésre is. A szolgáltatás teljes mértékben megfelel a készülő A könyvtárügy stratégiája 2008-2013 alapelveinek, amely szerint kiemelten fontos a könyvtárakban őrzött szellemi javak digitalizálásának felgyorsítása, a dokumentumok hozzáférhetővé tételének folyamatos növelése. (forrás: ld. lejjebb, 4.)

Források:

1. Vass Gergő: Gépi látás I. rész: http://www.vassg.hu/pdf/gepilatas1.pdf

2. A.R.Hungária: Biometria, arcfelismerő: http://www.arhungaria.hu/bio1.htm

3. Wikipédia: Optikai karakterfelismerés: http://hu.wikipedia.org/wiki/Optikai_karakterfelismer%C3%A9s

4. Szalóki Gabriella: Az "E-könyvek igény szerint" (EOD) szolgáltatás használói szemmel: http://tmt.omikk.bme.hu/show_news.html?id=4985&issue_id=498

További linkek:

EOD: Gyakran ismételt kérdések: http://www.books2ebooks.eu/faq.php5?lang=hu

Vass Gergő: Gépi látás II. rész: http://www.vassg.hu/pdf/gepilatas2.pdf

agent.ai portal: Mi van a képen? – Képfelismerés kevés információ alapján: http://www.agent.ai/main.php?folderID=4&articleID=2180&ctag=articlelist&iid=1

TinEye: http://www.tineye.com/

webisztán.blog.hu: TinEye: összehasonlító képkereső, Firefox-kiterjesztésként: http://webisztan.blog.hu/2008/06/07/tineye_keposszehasonlito_kereso_firefox_kiterjeszteskent

webisztán.blog.hu: A Google letapogat 1 billió képet: http://webisztan.blog.hu/2008/07/02/a_google_letapogat_1_trillio_kepet

sg.hu: Képfelismerő szoftverrel a biztonságos hidakért: http://www.sg.hu/cikkek/63780/kepfelismero_szoftverrel_a_biztonsagos_hidakert

sg.hu: Mobillal a műkincstolvajok ellen: http://www.sg.hu/cikkek/50833/mobillal_a_mukincstolvajok_ellen

sg.hu: Képfelismerő program a pingvinek azonosítására: http://www.sg.hu/cikkek/61465/kepfelismero_program_pingvinek_azonositasara

sg.hu: eye-Phone – mobilból idegenvezető: http://www.sg.hu/cikkek/59798/eye_phone_mobilbol_idegenvezeto

sg.hu: Helymeghatározás képfelismerő rendszerrel: http://www.sg.hu/cikkek/31860/helymeghatarozas_kepfelismero_rendszerrel

sg.hu: CAPTCHA – Ha beírja a szót, megkapja: http://www.sg.hu/cikkek/54315/captcha_ha_beirja_a_szot_megkapja
 
inapimag008.jpg

Kapcsolódó írások