Spinner

Dokument se učitava

ATUSS

VIŠER

Akademija tehničko-umetničkih strukovnih studija Beograd

Odsek Visoka škola elektrotehnike i računarstva

Big Data infrastrukture i servisi Šifra: MR0019 | 8 ESPB

Opšte informacije
Nivo studija: Master strukovne studije
Godina studija: 2
Semestar: 3
Uslov:
Cilj: Osposobljavanje studenata za korišćenje tehnologija koje omogućavaju organizovanje i skladištenje podataka koji imaju Big Data obeležja, primenu algoritama namenjenih za efikasnu obradu velikih skupova podataka, implementaciju metoda Big Data analitike (identifikovanje odnosa, obrazaca i trendova u podacima).
Ishod: Studenti će biti upoznati sa ključnim tehnologijama koje se primenjuju za skladištenje i obradu velikih skupova podataka, izabranim softverskim alatima koji se koriste za Big Data analitiku.
Sadržaj predmeta
Teorijska nastava:
  1. Pojam Big Data. Big Data i IoT koncept.
  2. NoSQL baze podataka: ključ-vrednost baze podataka, kolonske baze podataka, baze dokumenata i grafovske baze.
  3. Jezera podataka. Upitni jezik.
  4. Metode Big Data integracije.
  5. Apache Hadoop alati za Big Data: HDFS, Apache Spark, Ambari.
  6. Apache HBase, MongoDB, Neo4j.
  7. Apache Hive skladište podataka.
  8. Prediktivna analiza bazirana na modelima mašinskog učenja (algoritmi klasifikacije, regresije i klasterovanja).
  9. Istraživanje, vizuelizacija i modeliranje velikih podataka.
  10. Uvod i osnove R programskog jezika. RStudio integrisano razvojno okruženje.
  11. Vizualizacija podataka pomoću paketa ggplot.
  12. Transformacija podataka pomoću paketa dplyr.
  13. Pripremanje podataka za analizu. Formiranje skupova podataka pomoću tibble paketa.. Uvoz podataka pomoću readr paketa.
  14. Modelovanje pomoću modelr paketa.
  15. Predstavljanje rezultata. R Markdown.
Praktična nastava:
  1. Vežbe prate izlaganje na predavanjima i uvode studente u projektovanje nerelacionih baza podataka na praktičnim primerima. Na laboratorijskim vežbama studenti rade modelovanje velikih skupova podataka u R programskom jeziku i MongoDB sistemu.
Literatura
  1. Hadley Wickham, Garrett Grolemund, R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, O'Reilly Media, Inc., 2016.
  2. Ivan Marin, Ankit Shukla, et al., Big Data Analysis with Python, Packt, Birmingham – Mumbai, 2019.
  3. K Jain, Big Data and Hadoop, Khanna Publishing. Copyright., 2021.
  4. Ian Witten, Eibe Frank, Mark Hall, Christopher Pal, Data Mining: Practical Machine Learning Tools andTechniques, 4th edition, Morgan Kaufmann, 2016.
  5. G.Dimić, J.Mitić, MongoDB – Priručnik za laboratorijske vežbe.
Broj časova aktivne nastave (nedeljno)
Predavanja: 4
Vežbe: 0
Drugi oblici nastave: 3
Ocena znanja (maksimalan broj poena 100)
Predispitne obaveze
Poeni
aktivnosti u toku predavanja
10
aktivnosti na laboratorijskim vežbama
10
seminarski rad
20
kolokvijum
30
Završni ispit
Poeni
Pismeni ispit
30
Usmeni ispit
0
Praktični ispit
0

Nastavnik

Saradnik

Obaveštenja