L’obiettivo del corso è fornire allo studente le conoscenze necessarie per analizzare e comprendere la natura dei dati attraverso moderne tecniche statistiche e di intelligenza artificiale, come il Machine Learning e il Deep Learning. Inoltre, ha l’obiettivo di fornire le competenze per l’utilizzo dei più diffusi software per l’analisi dati e di Machine Learning.
Alla fine del corso lo studente sarà in grado di: - conoscere i concetti fondamentali della Data Analytics e delle principali metodologie e tecniche di estrazione, manipolazione ed analisi dei dati basate sull’Intelligenza Artificiale. - valutare costi e benefici delle diverse metodologie e tecniche per l’estrazione, manipolazione e analisi dei dati; - utilizzare strategie e modelli per l’analisi dei dati per ottenere informazioni utili per uno specifico obiettivo di business.
Prerequisiti
Conoscenze di base di informatica e delle reti informatiche.
Metodi Didattici
Lezioni approfondimenti, seminari
Verifica Apprendimento
Prova intermedia – esame finale orale
Testi
- Mining of Massive Datasets [Leskovec, Rajaraman, Ullman] (available online) - Big Data Analysis with Python [Marin, Shukla, VK] - Large Scale Machine Learning with Python [Sjardin, Massaron, Boschetti]
Contenuti
Introduzione ai Big Data: caratteristiche, problemi, opportunità. Tecnologie e soluzioni per la gestione di Big Data: Distributed File Systems (HDFS), Map Reduce e Spark. Data Analytics e Machine Learning: apprendimento non supervisionato, apprendimento supervisionato, sistemi di raccomandazione e analisi di grafi.