Tantárgy azonosító adatok
1. A tárgy címe Nyelvi adatok feldolgozása
2. A tárgy angol címe Natural Language Processing
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 2 + 0 + 0 v Kredit 2
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1 BMETE95AM36 BevAdattud1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Algebra Tanszék
7. A tantárgy felelős oktatója Dr. Kornai András beosztása egyetemi tanár
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2015.02.16. Akkreditációs bizottság döntési időpontja 2016.04.18.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
Python programnyelv, statisztika, lineáris algebra
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
TTK Matematika (BSc) képzés Adattudományi sávjának kötelezően választható tárgya.
11. A tárgy részletes tematikája
A tárgy célja, hogy a nem numerikus, szöveges adatok (web, digitális könyvtárak, blogok) vagy a strukturálatlan (szabad szöve ges) mezők nélkül nem értelmezhető strukturált, numerikus, képi adatok feldolgozásához szükséges nyelvi elemzési módszereket megismertesse a hallgatókkal. Tematika: Adatgyűjtés. Végesállapotú technológiák. Környezetfüggetlen nyelvtanok. A szavak megszámolása. Zipf törvényei, hatványtörvények. Indexépítés. A keresőmotorok alapjai. Amit a nyelvészetből tudni kell. A szavak osztályozása. Szótárépítés. Kollokációk, idió mák, többértelműség. Nyelvmodellezés. Súlyozott automaták, Markov modellek, rejtett Markov, n-gram. Helyesírás-ellenőrzés, nyelvtan-ellenőrzés. Beszédfelismerés, írásfelismerés, beszédkeltés. Névelemfelismerés. Funkcionális mondatelemzés. Mondat feletti egységek. Érzület -elemzés. Jelentésreprezentáció. Szójelentés, mondatjelentés, diskurzus-jelentés. Logikai modellek, vektormodellek. Gépi fordítás.
12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
programozási feladatok beadása vizsga-
időszakban
írásbeli vizsga
13. Pótlási lehetőségek
TVSZ szerint
14. Konzultációs lehetőségek
TVSZ szerint
15. Jegyzet, tankönyv, felhasználható irodalom
D Jurafsky, JH Martin: An Introduction to Natural Language Processing, Prentice Hall, 2009
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
28
16.2 Félévközi felkészülés órákra
8
16.3 Felkészülés zárthelyire
0
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
14
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
0
16.7 Egyéb elfoglaltság
0
16.8 Vizsgafelkészülés
10
16.9 Összesen
60
17. Ellenőrző adat Kredit * 30
60
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Dr. Kornai András
egyetemi tanár
Algebra Tanszék
A tanszékvezető
19. Neve aláírása
Dr. Nagy Attila