Budapesti Műszaki és Gazdaságtudományi Egyetem Természettudományi Kar |
Tantárgy Adatlap |
Tantárgy kód | BMETE91MX12 |
Tantárgy azonosító adatok | |||||||||
1. | A tárgy címe | Bevezetés a nyelvmérnökségbe 1 – Szószintű eszközök | |||||||
2. | A tárgy angol címe | Introduction to Language Engeneering 1 – Processing of Words |
3. | Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa | 2 | + | 0 | + | 0 | v | Kredit | 3 |
4. | Ajánlott/kötelező előtanulmányi rend | ||||||||
vagy | Tantárgy kód 1 | Rövid cím 1 | Tantárgy kód 2 | Rövid cím 2 | Tantárgy kód 3 | Rövid cím 3 | |||
4.1 | |||||||||
4.2 | |||||||||
4.3 | |||||||||
5. | Kizáró tantárgyak | ||||||||
6. | A tantárgy felelős tanszéke | Algebra Tanszék | |||||||
7. | A tantárgy felelős oktatója | Dr. Rónyai Lajos | beosztása | egyetemi tanár |
Akkreditációs adatok | ||||
8. | Akkreditációra benyújtás időpontja | 2010.10.13. | Akkreditációs bizottság döntési időpontja | 2010.12.20. |
Tematika | |||||||||
9. | A tantárgy az alábbi témakörök ismeretére épít | ||||||||
Nyelvek és automaták, programozási alapismeretek, minimális valószínűségszámítás |
|||||||||
10. | A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható) | ||||||||
Választható tárgy MSc hallgatóknak |
|||||||||
11. | A tárgy részletes tematikája | ||||||||
A természetes nyelvek, főként a magyar feldolgozásának problámái elsősorban mérnöki, megvalósíthatósági szempontból.
1. A számítógépes nyelvészet helye, feladata.
2. Nyelvtörténet, nyelvosztályozás
3. Karakterek, kódolások. Betűstatisztikák, és hasznuk, Shannon-féle nyelvazonosítás.
4. Sorrendezési algoritmusok – gyors betűfák: béta- és gammatree.
5. A nyelvi statisztikák megbízhatósági kérdései és korlátai.
6. Szótan – szavak, szóalakok. Miből mennyi van? Aktív és passzív nyelv
7. Generatív modellek morfológiára. Generatív modelltől az gyors analízisig – hatékony szóanalízis eszközei (Ispell, Humor, véges és több szintű automaták, Frey algoritmus). Hely- és időigény viszonya az implementációkban
8. Statisztikai módszerek helyesírás-ellenőrzésnél, korrekciónál és generálásnál. (n-gramok, Markov láncok, shake and bake)
9. Szószintű helyesírás-ellenőrzők minősítése, tesztelése
10. Mérhető-e a mérhetetlen – a helyesírás-ellenőrző minőségének elvi és gyakorlati korlátja
11. Többértelműség a szavak szintjén, annak kiküszöbölése.
12. Szóalaktan alkalmazásai – szótárak, intelligens keresés… |
|||||||||
12. | Követelmények, az osztályzat (aláírás) kialakításának módja | ||||||||
szorgalmi időszakban |
Részvétel az órákon. Mintaprogram készítése. Beszámoló egy választott témából. | vizsga- időszakban |
Szóbeli vizsga. | ||||||
13. | Pótlási lehetőségek | ||||||||
A TVSz-ben leírtak szerint |
|||||||||
14. | Konzultációs lehetőségek | ||||||||
Igény szerint |
|||||||||
15. | Jegyzet, tankönyv, felhasználható irodalom | ||||||||
Farkas Ernő/Naszódi Mátyás: Magyar nyelvű mondatok elemzése természetes nyelvű interfész céljából. SzTAKI-kiadvány, 1993 |
|||||||||
Naszódi Mátyás: Saját kiadatlan 40 oldalas jegyzet |
|||||||||
Több magyar és angol nyelvű témábavágó cikk |
|||||||||
16. | A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva) | ||||||||
16.1 | Kontakt óra | 28 |
|||||||
16.2 | Félévközi felkészülés órákra | 12 |
|||||||
16.3 | Felkészülés zárthelyire | 0 |
|||||||
16.4 | Zárthelyik megírása | 0 |
|||||||
16.5 | Házi feladat elkészítése | 0 |
|||||||
16.6 | Kijelölt írásos tananyag elsajátítása (beszámoló) | 20 |
|||||||
16.7 | Egyéb elfoglaltság | 15 |
|||||||
16.8 | Vizsgafelkészülés | 15 |
|||||||
16.9 | Összesen | 90 |
|||||||
17. | Ellenőrző adat | Kredit * 30 | 90 |
A tárgy tematikáját kidolgozta | |||||||||
18. | Név | beosztás | Munkahely (tanszék, kutatóintézet, stb.) | ||||||
Naszódi Mátyás |
tanársegéd |
Volt Sztaki, Szit(Vik), Morphologic |
|||||||
A tanszékvezető | |||||||||
19. | Neve | aláírása | |||||||
Dr. Rónyai Lajos |