Tantárgy azonosító adatok
1. A tárgy címe Írásfelismerés
2. A tárgy angol címe Optical Character Recognition
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 2 + 0 + 0 v Kredit 3
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Algebra Tanszék
7. A tantárgy felelős oktatója Dr. Kornai András beosztása tudományos főmunkatárs
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2011.11.10. Akkreditációs bizottság döntési időpontja 2011.12.05.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
Programozási ismeretek: unix / linux python (C++ hasznos lehet)
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
Felsőbbéves, MSc matematikus, doktorandusz hallgatóknak, illetve informatikusoknak
11. A tárgy részletes tematikája
1. Áttekintés: Mitől optikai az optikai karakterfelismerés? Az OCR alapvető fajtái: dinamikus vagy kép-alapú, nyomtatott vagy kézírásos. Szöveg és ábra-típusok, írások, betűtípusok. Zajszűrés, binarizálás, a dokumentum felbontása. Egy konkrét feladat: matematikakönyvből LaTeX kód. Mit lehet automatizálni, és mit nem? 2. Az alacsonyszintű képfeldolgozás alapjai. Zajszűrés, határkeresés, szinredukció, binarizálás, csontvázépítés, vektorizáció , lánckódolás. Poligonok, kritikus pontok. Iránykeresés, dőlésbecslés, zónákra bontás. 3. A szövegzóna elemzése: sorok, iniciálé. A latin alapú ábécék struktúrája. Alapvető font-osztályok. A binárisés az általános osztályozási feladat. Standard adatbázisok. 4. A jegyszámítás (feature extraction). A legfontosabb jegyosztályok, geometriai momentumok, Zernike momentumok. Szegmentálás és osztályozás mint egymást követő feladatok, típushibák. Adattömörítés, a legegyszerűbb nyelvmodellek. 5. Az osztályozók főbb típusai. Hasonlósági (nearest neighbor), ideghálózati (neural network), lineáris, határszélesítő (max margin), maxent, és egyéb osztályozási módszerek. 6. A szegmentálási, osztályozási, és nyelvmodellezési problémák közös megoldása rejtett Markov modellekkel. Szavazás, tényező k integrálása, modellek integrálása.
12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
Projekt készítése (75%). vizsga-
időszakban
Szóbeli vizsga (25%).
13. Pótlási lehetőségek
A TVSz-ben előírtak szerint
14. Konzultációs lehetőségek
Az oktatóval előzetesen egyeztetve, igény szerint.
15. Jegyzet, tankönyv, felhasználható irodalom
http://people.mokk.bme.hu/~kornai/ocr alatt
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
28
16.2 Félévközi felkészülés órákra
0
16.3 Felkészülés zárthelyire
0
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
0
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
0
16.7 Egyéb elfoglaltság
47
16.8 Vizsgafelkészülés
15
16.9 Összesen
90
17. Ellenőrző adat Kredit * 30
90
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Dr. Kornai András
tudományos főmunkatárs
Algebra Tanszék
A tanszékvezető
19. Neve aláírása
Dr. Rónyai Lajos