Tantárgy azonosító adatok
1. A tárgy címe Hatékony adatelemzés kdb+ alapokon
2. A tárgy angol címe Efficient Data Analysis with kdb+
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 2 + 0 + 0 f Kredit 3
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Sztochasztika Tanszék
7. A tantárgy felelős oktatója Dr. Sándor Csaba beosztása egyetemi docens
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2022.12.12. Akkreditációs bizottság döntési időpontja 2022.12.19.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
SQL, Python
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
Szabadon választható tantárgy
11. A tárgy részletes tematikája
Time series analysis addresses different problems that classic database solutions cannot cope with.
Problems include joining by non-matching timestamps (asof and window joins), moving aggregates,
bucketing by time interval, fill forward and executing statistical and machine learning methods close
to the data to avoid huge data transfers. The expressiveness of the query language is critical in
solving these tasks.
 
Q/kdb+ has dominated data analysis for the last twenty years in the financial industry and gains
more popularity in IOT, telco, automotive, pharma, etc. This Turing-complete programming language
is extremely fast and easy to express complex logic. Simplicity comes from its vectorial nature
(implicit iteration), support for functional programming and that tables are first class citizens of the
language. In this course, you will get an introduction to the q language and the kdb+ ecosystem
including Python integration and cloud tools.
 
• Introduction to q/kdb+, history, specialties of the language, aspects of time series analyses,
examples, introduction to vector and functional programming
• q basics 1: atoms, temporal type, lists, operators, functions, vector programming
• q basics 2: Dictionaries, tables, persisting data
 
• q basics 3: functional programming, casting, execution control, IO, interprocess
communication
• Special joins for time series analysis: asof and window join
• q-sql, a powerful extension of ANSI SQL for complex analysis
• Data visualization and interactive data analysis by Jupyter notebooks,
• Interoperability: mixing Python and q code
• Time series statistical methods
• Applying machine learning algorithms on time series
• Building powerful, interactive, real-time ticking dashboards
• Bringing data and analytics into the cloud - how cloud can help data scientists? What are the
main challenges the cloud can introduce? kdb+ and the cloud

 

12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
zárthelyi dolgozat, 2 db házi feladat vizsga-
időszakban
13. Pótlási lehetőségek
TVSZ szerint
14. Konzultációs lehetőségek
oktatóval történő megegyezés szerint
15. Jegyzet, tankönyv, felhasználható irodalom
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
28
16.2 Félévközi felkészülés órákra
20
16.3 Felkészülés zárthelyire
12
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
30
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
0
16.7 Egyéb elfoglaltság
0
16.8 Vizsgafelkészülés
0
16.9 Összesen
90
17. Ellenőrző adat Kredit * 30
90
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Dr. Bodon Ferenc
Head of Benchmarking, Head of Hungary at KX
Kx - a division of First Derivatives plc
A tanszékvezető
19. Neve aláírása
Dr. Simon Károly