Big Data infrastrukture i servisiŠifra: MR0019 | 8 ESPB
Opšte informacije
Nivo studija:Master strukovne studije
Godina studija:2
Semestar:3
Uslov:
Cilj:Osposobljavanje studenata za korišćenje tehnologija koje omogućavaju organizovanje i skladištenje podataka koji imaju Big Data
obeležja, primenu algoritama namenjenih za efikasnu obradu velikih skupova podataka, implementaciju metoda Big Data
analitike (identifikovanje odnosa, obrazaca i trendova u podacima).
Ishod:Studenti će biti upoznati sa ključnim tehnologijama koje se primenjuju za skladištenje i obradu velikih skupova podataka,
izabranim softverskim alatima koji se koriste za Big Data analitiku.
Apache Hadoop alati za Big Data: HDFS, Apache Spark, Ambari.
Apache HBase, MongoDB, Neo4j.
Apache Hive skladište podataka.
Prediktivna analiza bazirana na modelima mašinskog učenja (algoritmi klasifikacije, regresije i klasterovanja).
Istraživanje, vizuelizacija i modeliranje velikih podataka.
Uvod i osnove R programskog jezika. RStudio integrisano razvojno okruženje.
Vizualizacija podataka pomoću paketa ggplot.
Transformacija podataka pomoću paketa dplyr.
Pripremanje podataka za analizu. Formiranje skupova podataka pomoću tibble paketa.. Uvoz podataka pomoću readr paketa.
Modelovanje pomoću modelr paketa.
Predstavljanje rezultata. R Markdown.
Praktična nastava:
Vežbe prate izlaganje na predavanjima i uvode studente u projektovanje nerelacionih baza podataka na praktičnim primerima. Na laboratorijskim vežbama studenti rade modelovanje velikih skupova podataka u R programskom jeziku i MongoDB sistemu.
Literatura
Hadley Wickham, Garrett Grolemund, R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, O'Reilly Media, Inc., 2016.
Ivan Marin, Ankit Shukla, et al., Big Data Analysis with Python, Packt, Birmingham – Mumbai, 2019.
K Jain, Big Data and Hadoop, Khanna Publishing. Copyright., 2021.
Ian Witten, Eibe Frank, Mark Hall, Christopher Pal, Data Mining: Practical Machine Learning Tools andTechniques, 4th edition, Morgan Kaufmann, 2016.
G.Dimić, J.Mitić, MongoDB – Priručnik za laboratorijske vežbe.