Nyomtatóbarát változatTantárgy azonosító adatokA tárgy címe: Bevezetés a nyelvmérnökségbe 1 – Szószintű eszközökA tárgy angol címe: Introduction to Language Engeneering 1 – Processing of WordsA tárgy rövid címe: NyelvmérnökségI200vKredit: 3A tantárgy felelős tanszéke: Algebra TanszékA tantárgy felelős oktatója: Dr. Rónyai LajosA tantárgy felelős oktatójának beosztása: egyetemi tanár Akkreditációs adatokAkkreditációra benyújtás időpontja: 2010.10.13.Akkreditációs bizottság döntési időpontja: 2010.12.20. TematikaA tantárgy az alábbi témakörök ismeretére épít: Nyelvek és automaták, programozási alapismeretek, minimális valószínűségszámításA tantárgy szerepe a képzés céljának megvalósításában: Választható tárgy MSc hallgatóknakA tantárgy részletes tematikája magyarul és angolul: A természetes nyelvek, főként a magyar feldolgozásának problámái elsősorban mérnöki, megvalósíthatósági szempontból. 1. A számítógépes nyelvészet helye, feladata. 2. Nyelvtörténet, nyelvosztályozás 3. Karakterek, kódolások. Betűstatisztikák, és hasznuk, Shannon-féle nyelvazonosítás. 4. Sorrendezési algoritmusok – gyors betűfák: béta- és gammatree. 5. A nyelvi statisztikák megbízhatósági kérdései és korlátai. 6. Szótan – szavak, szóalakok. Miből mennyi van? Aktív és passzív nyelv 7. Generatív modellek morfológiára. Generatív modelltől az gyors analízisig – hatékony szóanalízis eszközei (Ispell, Humor, véges és több szintű automaták, Frey algoritmus). Hely- és időigény viszonya az implementációkban 8. Statisztikai módszerek helyesírás-ellenőrzésnél, korrekciónál és generálásnál. (n-gramok, Markov láncok, shake and bake) 9. Szószintű helyesírás-ellenőrzők minősítése, tesztelése 10. Mérhető-e a mérhetetlen – a helyesírás-ellenőrző minőségének elvi és gyakorlati korlátja 11. Többértelműség a szavak szintjén, annak kiküszöbölése. 12. Szóalaktan alkalmazásai – szótárak, intelligens keresés… Követelmények szorgalmi időszakban: Részvétel az órákon. Mintaprogram készítése. Beszámoló egy választott témából.Követelmények vizsgaidőszakban: Szóbeli vizsga.Pótlási lehetőségek: A TVSz-ben leírtak szerintKonzultációs lehetőségek: Igény szerintJegyzet, tankönyv, felhasználható irodalom: Farkas Ernő/Naszódi Mátyás: Magyar nyelvű mondatok elemzése természetes nyelvű interfész céljából. SzTAKI-kiadvány, 1993Naszódi Mátyás: Saját kiadatlan 40 oldalas jegyzetTöbb magyar és angol nyelvű témábavágó cikk A tárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)Kontakt óra: 28Félévközi felkészülés órákra: 12Felkészülés zárthelyire: 0Zárthelyik megírása: 0Házi feladat elkészítése: 0Kijelölt írásos tananyag elsajátítása (beszámoló): 20Egyéb elfoglaltság: 15Vizsgafelkészülés: 15Összesen: 90Ellenőrző adat: 90 A tárgy tematikáját kidolgoztaNév: Naszódi MátyásBeosztás: tanársegédMunkahely (tanszék, kutatóintézet, stb.): Volt Sztaki, Szit(Vik), Morphologic A tanszékvezető neve: Dr. Rónyai LajosA tantárgy adatlapja PDF-ben: BMETE91MX12.pdf Nyomtatóbarát változat