Tantárgy azonosító adatok
1. A tárgy címe Bevezetés az adattudományba 1
2. A tárgy angol címe Introduction to data science 1
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 3 + 0 + 1 v Kredit 4
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1 BMETE91AM43 Informatika2 BMETE95AM31 Statisztika1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Sztochasztika Tanszék
7. A tantárgy felelős oktatója Dr. Simon Károly beosztása egyetemi tanár
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2015.02.16. Akkreditációs bizottság döntési időpontja 2016.04.18.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
Statisztika, ineáris algebra, Python programozás
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
TTK Matematika (BSc) képzés Adattudományi sávjának kötelező tárgya.
11. A tárgy részletes tematikája
A tárgy célja az adattudomány alapfogalmainak a korábban megszerzett matematikai ismeretekre épülő, gyakorlati megközelítésű megismertetése. A hallgatók a kezdetektől teljes, a gyakorlati életből vett valós alkalmazási példákon keresztül az ismereteket megtapasztalva, egyfajta spirál mentén egyre mélyebbre haladva precíz elméleti és egyúttal praktikus gyakorlati ismeretekhez jutnak. Az elméleti ismeretek ge rincét a gépi tanulás algoritmusai adják, a gyakorlati feladatok építenek a Python nyelv ismeretére. Előadás: Történet, példák, esettanulmányok, az adattudományba sorolható diszciplínák. Ellenőrzött tanulás - Lineáris Modellek + modell validálás. Legkisebb négyzetek módszere. Lineáris Regresszió. Gradiens módszer, maximum-likelihood becslés. Polinomiális regresszió, logisztikus regresszió, Perceptron, Newton-módszer, Naive-Bayes. Általánosított lineáris modellek (Exponenciális család), tanulási/validációs/tesztelési halmaz, cross-validáció, Bias-Variance tradeoff, regularizáció, Precision-Recall, F1-score, ROC görbe. SVM, lineáris SVM, kernel trükk. Neurális hálók. Döntési fák. Véletlen erdők. Boosting. Nem Ellenőrzött tanulás. Klaszterezés. K-means klaszterezés. EM algoritmus. PCA, ICA. Nagyobb esettanulmányok, kitekintés. Gyakorlat: Az adatmanipulálás, prediktív analízis, megjelenítés lépései valódi adatokkal (pl. kaggle) elsősorban Python-csomagok (pandas, scikit- learn, matplotlib, ggplot) és R használatával.
12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
házi feladatok, részvétel a tanórákon vizsga-
időszakban
vizsga
13. Pótlási lehetőségek
TVSZ szerint
14. Konzultációs lehetőségek
TVSZ szerint
15. Jegyzet, tankönyv, felhasználható irodalom
legfrissebb online jegyzetek
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
56
16.2 Félévközi felkészülés órákra
14
16.3 Felkészülés zárthelyire
0
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
28
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
0
16.7 Egyéb elfoglaltság
0
16.8 Vizsgafelkészülés
22
16.9 Összesen
120
17. Ellenőrző adat Kredit * 30
120
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Dr. Simon Károly
egyetemi tanár
Sztochasztika Tanszék
A tanszékvezető
19. Neve aláírása
Dr. Simon Károly