Spinner

Документ се учитава

АТУСС

ВИШЕР

Академија техничко-уметничких струковних студија Београд

Одсек Висока школа електротехнике и рачунарства

Big Data инфраструктуре и сервиси Шифра: MR0019 | 8 ЕСПБ

Опште информације
Ниво студија: Мастер струковне студије
Година студија: 2
Семестар: 3
Услов:
Циљ: Оспособљавање студената за коришћење технологија које омогућавају организовање и складиштење података који имају Big Data обележја, примену алгоритама намењених за ефикасну обраду великих скупова података, имплементацију метода Big Data аналитике (идентификовање односа, образаца и трендова у подацима).
Исход: Студенти ће бити упознати са кључним технологијама које се примењују за складиштење и обраду великих скупова података, изабраним софтверским алатима који се користе за Big Data аналитику.
Садржај предмета
Теоријска настава:
  1. Појам Big Data. Big Data и IoT концепт.
  2. NoSQL базе података: кључ-вредност базе података, колонске базе података, базе докумената и графовске базе.
  3. Језера података. Упитни језик.
  4. Методе Big Data интеграције.
  5. Apache Hadoop алати за Big Data: HDFS, Apache Spark, Ambari.
  6. Apache HBase, MongoDB, Neo4j.
  7. Apache Hive складиште података.
  8. Предиктивна анализа базирана на моделима машинског учења (алгоритми класификације, регресије и кластеровања).
  9. Истраживање, визуелизација и моделирање великих података.
  10. Увод и основе R програмског језика. RStudio интегрисано развојно окружење.
  11. Визуализација података помоћу пакета ggplot.
  12. Трансформација података помоћу пакета dplyr.
  13. Припремање података за анализу. Формирање скупова података помоћу tibble пакета.. Увоз података помоћу readr пакета.
  14. Моделовање помоћу modelr пакета.
  15. Представљање резултата. R Markdown.
Практична настава:
  1. Вежбе прате излагање на предавањима и уводе студенте у пројектовање нерелационих база података на практичним примерима. На лабораторијским вежбама студенти раде моделовање великих скупова података у R програмском језику и MongoDB систему.
Литература
  1. Hadley Wickham, Garrett Grolemund, R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, O'Reilly Media, Inc., 2016.
  2. Ivan Marin, Ankit Shukla, еt al., Big Data Analysis with Python, Packt, Birmingham – Mumbai, 2019.
  3. K Jain, Big Data and Hadoop, Khanna Publishing. Copyright., 2021.
  4. Ian Witten, Eibe Frank, Mark Hall, Christopher Pal, Data Mining: Practical Machine Learning Tools andTechniques, 4th edition, Morgan Kaufmann, 2016.
  5. Г.Димић, Ј.Митић, MongoDB – Приручник за лабораторијске вежбе.
Број часова активне наставе (недељно)
Предавања: 4
Вежбе: 0
Други облици наставе: 3
Оцена знања (максималан број поена 100)
Предиспитне обавезе
Поени
активности у току предавања
10
активности на лабораторијским вежбама
10
семинарски рад
20
колоквијум
30
Завршни испит
Поени
Писмени испит
30
Усмени испит
0
Практични испит
0

Наставник

Сарадник

Обавештења
© 2025 Одсек Висока школа електротехнике и рачунарства, Београд
Војводе Степе 283, office@viser.edu.rs, +381 11 2471 099
Радно време: Понедељак - Петак 09:00-17:00