Tantárgy azonosító adatok
1. A tárgy címe Bevezetés a nyelvmérnökségbe 1 – Szószintű eszközök
2. A tárgy angol címe Introduction to Language Engeneering 1 – Processing of Words
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 2 + 0 + 0 v Kredit 3
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Algebra Tanszék
7. A tantárgy felelős oktatója Dr. Rónyai Lajos beosztása egyetemi tanár
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2010.10.13. Akkreditációs bizottság döntési időpontja 2010.12.20.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
Nyelvek és automaták, programozási alapismeretek, minimális valószínűségszámítás
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
Választható tárgy MSc hallgatóknak
11. A tárgy részletes tematikája
A természetes nyelvek, főként a magyar feldolgozásának problámái elsősorban mérnöki, megvalósíthatósági szempontból. 1. A számítógépes nyelvészet helye, feladata. 2. Nyelvtörténet, nyelvosztályozás 3. Karakterek, kódolások. Betűstatisztikák, és hasznuk, Shannon-féle nyelvazonosítás. 4. Sorrendezési algoritmusok – gyors betűfák: béta- és gammatree. 5. A nyelvi statisztikák megbízhatósági kérdései és korlátai. 6. Szótan – szavak, szóalakok. Miből mennyi van? Aktív és passzív nyelv 7. Generatív modellek morfológiára. Generatív modelltől az gyors analízisig – hatékony szóanalízis eszközei (Ispell, Humor, véges és több szintű automaták, Frey algoritmus). Hely- és időigény viszonya az implementációkban 8. Statisztikai módszerek helyesírás-ellenőrzésnél, korrekciónál és generálásnál. (n-gramok, Markov láncok, shake and bake) 9. Szószintű helyesírás-ellenőrzők minősítése, tesztelése 10. Mérhető-e a mérhetetlen – a helyesírás-ellenőrző minőségének elvi és gyakorlati korlátja 11. Többértelműség a szavak szintjén, annak kiküszöbölése. 12. Szóalaktan alkalmazásai – szótárak, intelligens keresés…
12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
Részvétel az órákon. Mintaprogram készítése. Beszámoló egy választott témából. vizsga-
időszakban
Szóbeli vizsga.
13. Pótlási lehetőségek
A TVSz-ben leírtak szerint
14. Konzultációs lehetőségek
Igény szerint
15. Jegyzet, tankönyv, felhasználható irodalom
Farkas Ernő/Naszódi Mátyás: Magyar nyelvű mondatok elemzése természetes nyelvű interfész céljából. SzTAKI-kiadvány, 1993
Naszódi Mátyás: Saját kiadatlan 40 oldalas jegyzet
Több magyar és angol nyelvű témábavágó cikk
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
28
16.2 Félévközi felkészülés órákra
12
16.3 Felkészülés zárthelyire
0
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
0
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
20
16.7 Egyéb elfoglaltság
15
16.8 Vizsgafelkészülés
15
16.9 Összesen
90
17. Ellenőrző adat Kredit * 30
90
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Naszódi Mátyás
tanársegéd
Volt Sztaki, Szit(Vik), Morphologic
A tanszékvezető
19. Neve aláírása
Dr. Rónyai Lajos