Big Data инфраструктуре и сервисиШифра: MR0019 | 8 ЕСПБ
Опште информације
Ниво студија:Мастер струковне студије
Година студија:2
Семестар:3
Услов:
Циљ:Оспособљавање студената за коришћење технологија које омогућавају организовање и складиштење података који имају Big Data
обележја, примену алгоритама намењених за ефикасну обраду великих скупова података, имплементацију метода Big Data
аналитике (идентификовање односа, образаца и трендова у подацима).
Исход:Студенти ће бити упознати са кључним технологијама које се примењују за складиштење и обраду великих скупова података,
изабраним софтверским алатима који се користе за Big Data аналитику.
Садржај предмета
Теоријска настава:
Појам Big Data. Big Data и IoT концепт.
NoSQL базе података: кључ-вредност базе података, колонске базе података, базе докумената и графовске базе.
Језера података. Упитни језик.
Методе Big Data интеграције.
Apache Hadoop алати за Big Data: HDFS, Apache Spark, Ambari.
Apache HBase, MongoDB, Neo4j.
Apache Hive складиште података.
Предиктивна анализа базирана на моделима машинског учења (алгоритми класификације, регресије и кластеровања).
Истраживање, визуелизација и моделирање великих података.
Увод и основе R програмског језика. RStudio интегрисано развојно окружење.
Визуализација података помоћу пакета ggplot.
Трансформација података помоћу пакета dplyr.
Припремање података за анализу. Формирање скупова података помоћу tibble пакета.. Увоз података помоћу readr пакета.
Моделовање помоћу modelr пакета.
Представљање резултата. R Markdown.
Практична настава:
Вежбе прате излагање на предавањима и уводе студенте у пројектовање нерелационих база података на практичним примерима. На лабораторијским вежбама студенти раде моделовање великих скупова података у R програмском језику и MongoDB систему.
Литература
Hadley Wickham, Garrett Grolemund, R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, O'Reilly Media, Inc., 2016.
Ivan Marin, Ankit Shukla, еt al., Big Data Analysis with Python, Packt, Birmingham – Mumbai, 2019.
K Jain, Big Data and Hadoop, Khanna Publishing. Copyright., 2021.
Ian Witten, Eibe Frank, Mark Hall, Christopher Pal, Data Mining: Practical Machine Learning Tools andTechniques, 4th edition, Morgan Kaufmann, 2016.
Г.Димић, Ј.Митић, MongoDB – Приручник за лабораторијске вежбе.