ID:
7263
Durata (ore):
48
CFU:
6
Url:
INGEGNERIA GESTIONALE/PERCORSO COMUNE Anno: 2
Anno:
2023
Dati Generali
Periodo di attività
Primo Semestre (25/09/2023 - 15/12/2023)
Syllabus
Obiettivi Formativi
Consentire l’apprendimento delle principali tecniche per l’analisi dei dati mirate alla raccolta, analisi ed interpretazione statistica dei dati ed all’estrapolazione delle informazioni. I contenuti sono presentati allo studente seguendo un approccio orientato al problem solving al fine di sviluppare le conoscenze algoritmiche e le competenze utili per valutare le strategie necessarie alla risoluzione di problemi specifici dell’ingegneria.
Far acquisire adeguate competenze per la comprensione dell’analisi dei dati e per modellare, analizzare e risolvere problemi dell’ingegneria attraverso un’analisi strutturata e sapendo utilizzare le conoscenze informatiche e statistiche acquisite. Verranno trattati gli aspetti dell’apprendimento supervisionato e non supervisionato mediante lo studio delle basi teoriche e la loro applicazione a problemi reali. Il corso intende fornire anche agli studenti le capacità pratiche per l’utilizzo dei principali ambienti di sviluppo di algoritmi di machine learning.
Far acquisire la capacità di individuare autonomamente i principali tools per l’analisi dei dati, individuare appropriati metodi di modellazione e trarre conclusioni anche attraverso l'integrazione delle conoscenze acquisite con appropriate indagini bibliografiche tali da consentire un confronto critico tra le diverse soluzioni possibili.
Far acquisire la capacità di interloquire con linguaggio tecnico appropriato alla disciplina.
Far acquisire la capacità di un adeguato metodo di studio logico-deduttivo, al fine di consentire autonomamente l'approfondimento delle conoscenze e di e affrontare gli studi successivi all'ingegneria.
Prerequisiti
Conoscenze di statistica, algebra lineare.
Metodi didattici
Il corso, al fine di raggiungere gli obiettivi formativi previsti, si svolge prevalentemente attraverso lezioni frontali. Sono inoltre previste esercitazioni in aula ed esercitazioni guidate svolte dagli studenti con lo scopo di stimolare l’approccio ai problemi con autonomia e senso critico. Tutte le attività sono svolte con supporto di lavagna digitale (tablet) e computer per la parte di programmazione.
Verifica Apprendimento
L'esame consiste nella presentazione di un progetto. Il progetto da elaborare viene concordato con il docente e consiste nella scelta di un problema e di un relativo dataset e nella successiva applicazione di alcune delle tecniche apprese durante il corso per la risoluzione del problema. Durante la presentazione del progetto saranno chiesti eventuali approfondimenti sugli argomenti trattati durante il corso (definizioni, esempi rilevanti, applicazioni, collegamenti tra i vari argomenti.) con il duplice scopo di verificare il livello di conoscenza e di comprensione dei contenuti del corso e di valutare l'autonomia di giudizio, la capacità di apprendimento, l'abilità comunicativa e la proprietà di linguaggio scientifico e indi valutare le facoltà logico-deduttive acquisite dallo studente. La valutazione è fatta in trentesimi.
Testi
James, Witten, Hastie, Tibshirani – “Introduzione all’apprendimento statistico con applicazioni in R”, Piccin, ISBN: 978-88-299-3094-4
Contenuti
-INTRODUZIONE ALL’ANALISI DEI DATI: Raccolta ed immagazzinamento dei dati. Il machine learning. Il concetto di data set. Exploratory Data Analysis. Apprendimento supervisionato e non-supervisionato. Interpretazione statistica dei dati. Panoramica dei principali tool per l’analisi dei dati.
-IL LINGUAGGIO R: Introduzione alla programmazione. Costrutti di base. Ambiente RStudio. Librerie per l’analisi dei dati.
-LA REGRESSIONE: La regressione lineare. Regressione univariata. Regressione multivariata. Funzione di costo. Training e testing. Regressione come problema di ottimizzazione. L’algoritmo Gradient Descent. Normal equation. Regressione polinomiale.
-LA CLASSIFICAZIONE: Classificazione binaria e multi-classe. Logistic regression. Funzione di costo. Decision boundary. Esempi di Classificazione. IRIS dataset. Accuratezza. Precision, Recall. Indice F1. Classificazione Softmax.
-ANALISI DEGLI ALGORITMI: Capacità di un modello. Underfitting e Overfitting. Learning curves. Regolarizzazione. Scelta dei parametri di un modello. Cross validation.
-ALGORITMI SUPERVISIONATI: K-nearest neighbors. Alberi decisionali. Random forest.
-ALGORITMI NON-SUPERVISIONATI: Clustering. K-means.
-RIDUZIONE DELLA DIMENSIONALITÀ: Visualizzazione. Compressione. L’algoritmo PCA
-IL LINGUAGGIO R: Introduzione alla programmazione. Costrutti di base. Ambiente RStudio. Librerie per l’analisi dei dati.
-LA REGRESSIONE: La regressione lineare. Regressione univariata. Regressione multivariata. Funzione di costo. Training e testing. Regressione come problema di ottimizzazione. L’algoritmo Gradient Descent. Normal equation. Regressione polinomiale.
-LA CLASSIFICAZIONE: Classificazione binaria e multi-classe. Logistic regression. Funzione di costo. Decision boundary. Esempi di Classificazione. IRIS dataset. Accuratezza. Precision, Recall. Indice F1. Classificazione Softmax.
-ANALISI DEGLI ALGORITMI: Capacità di un modello. Underfitting e Overfitting. Learning curves. Regolarizzazione. Scelta dei parametri di un modello. Cross validation.
-ALGORITMI SUPERVISIONATI: K-nearest neighbors. Alberi decisionali. Random forest.
-ALGORITMI NON-SUPERVISIONATI: Clustering. K-means.
-RIDUZIONE DELLA DIMENSIONALITÀ: Visualizzazione. Compressione. L’algoritmo PCA
Lingua Insegnamento
ITALIANO
Corsi
Corsi
INGEGNERIA GESTIONALE
Laurea
3 anni
No Results Found