ID:
A000862
Durata (ore):
48
CFU:
6
Url:
INFORMATICA/DATA ANALYSIS Anno: 1
Anno:
2023
Dati Generali
Periodo di attività
Secondo Semestre (26/02/2024 - 31/05/2024)
Syllabus
Obiettivi Formativi
Conoscenza di tecniche e metodologie matematiche per l’estrazione di informazione da dati massivi (analisi delle componenti principali, analisi fattoriale, procedure di fitting e interpolazione) e per il processo di apprendimento dai dati.
Prerequisiti
Calcolo differenziale di funzioni reali di variabile reale, numeri complessi.
Metodi didattici
Lezioni frontali ed esercitazioni in presenza. La presentazione di casi di studio sarà svolta mediante l'ausilio di software scientifico.
Verifica Apprendimento
L'esame, orale, è volto a verificare il grado di raggiungimento degli obiettivi formativi: livello di conoscenza degli argomenti teorici e capacità di impostare e risolvere problemi.
Testi
1) Jeff M. Phillips. Mathematical foundations for data analysis, 2019. Disponibile online all'url http://www.cs.utah.edu/~jeffp/M4D/M4D.html
2) Gilbert Strang. Linear algebra and learning from data. Wellesey-Cambridge Press, 2019.
3) T. T. Soong. Fundamentals of probability and statistics for engineers. John Wiley & Sons, 2004.
2) Gilbert Strang. Linear algebra and learning from data. Wellesey-Cambridge Press, 2019.
3) T. T. Soong. Fundamentals of probability and statistics for engineers. John Wiley & Sons, 2004.
Contenuti
Elementi di Algebra Lineare: gruppi, campi, spazi vettoriali, sottospazi vettoriali, vettori e matrici, operazioni tra sottospazi, operazioni tra vettori e matrici, dipendenza e indipendenza lineare, span lineare, sistemi di generatori, determinante, rango, inversa di una matrice, minori principali, minori di testa, minori orlati, teorema dei minori orlati, matrici a gradini, metodo di eliminazione di Gauss, metodo di Gauss-Jordan, base e dimensione di uno spazio vettoriale, teorema di Grassman, cambiamento di base in uno spazio vettoriale, prodotto scalare, spazi Euclidei, diseguaglianza di Cauchy-Schwarz, ortogonalità tra vettori, vettori normalizzati, basi ortogonali e ortornormali, ortogonalizzazione di Gram-Schmidt, norme vettoriali, norme Lp, norme indotte da un prodotto scalare, equivalenza di norme vettoriali, norme matriciali, norme matriciali indotte da norme vettoriali Lp, norme matriciali entry-wise, consistenza di norme matriciali, operatori lineari, nucleo e immagine di un operatore lineare, teorema del rango, rappresentazione di un operatore lineare, operazioni tra operatori lineari, sistemi lineari, compatibilità e insieme delle soluzioni di sistemi lineari, teorema di Rouché-Capelli, metodi di risoluzione di sistemi lineari, metodi di eliminazione delle variabili, metodo di Cramer per sistemi lineari quadrati e rettangolari, metodi di sostituzione in avanti e all’indietro, autovalori e autovettori, autospazio, autosistema, autobase, polinomio caratteristico, equazione caratteristica, molteplicità algebrica, molteplicità geometrica, matrici simili e diagonalizzabili, autodecomposizione di matrici, forme quadratiche, equivalenza tra forme quadratiche, carattere di definizione di una forma quadratica, studio del segno di una forma quadratica mediante il criterio di Sylvester, il metodo di eliminazione di Gauss e il segno degli autovalori.
Distanze: distanze e metriche in uno spazio vettoriale, distanze indotte da norme vettoriali, distanze Lp, distanza di Manhattan, distanza Euclidea, distanza di Chebyshev, distanza di Hamming, distanza di Lee, distanza di Mahalanobis, distanza del coseno, distanza angolare, distanze tra insiemi e stringhe, distanza tra un vettore e un insieme, distanza di Hausdorff, distanza di Jaccard, distanze di modifica tra stringhe, modellistica e analisi di dati testuali tramite distanze, modelli della borsa di parole, k-grammi.
Elementi di Statistica Descrittiva: variabili numeriche e categoriche, frequenze assolute, relative e cumulative, dati raggruppati e classi, distribuzione di frequenze, rappresentazioni grafiche di dati, diagramma a torta, istogramma, poligono di frequenza, diagramma a barre, poligono cumulativo, funzione cumulativa empirica, diagramma a scatola e baffi, minimo, massimo, mediana, primo quartile, terzo quartile, scarto interquartile, p-quantile, metodo di calcolo dei p-quantili, approssimazione lineare di p-quantili, media aritmetica, varianza, formule ricorsive di media e varianza, media e varianza di trasformazioni lineari di dati, media e varianza di una distribuzione di frequenze, approssimazione di media e varianza per dati raggruppati, media pesata, media armonica, media geometrica, media Chisini, stima della varianza, scarto quadratico medio, moda, coefficiente di variazione, standardizazzione di dati, indice di simmetria di una distribuzione, indice di curtosi, covarianza, proprietà e interpretazione geometrica della covarianza, covarianza di combinazioni lineari di dati, stima della covarianza, coefficiente di correlazione, proprietà e interpretazione geometrica del coefficiente di correlazione, matrici di covarianza e di correlazione.
Elementi di Analisi Combinatoria: permutazioni semplici e con ripetizione, disposizioni semplici e con ripetizione, combinazioni semplici, coefficiente binomiale, combinazioni con ripetizione.
Elementi di teoria della Probabilità: eventi, spazio campionario, proprietà e rappresentazione di eventi e di spazi campionari, operazioni tra eventi, eventi incompatibili e compatibili, eventi indipendenti e dipendenti, concezione classica, frequentista e assiomatica della probabilità, assiomi della probabilità e conseguenze, probabilità condizionata, probabilità di eventi indipendenti, teorema della probabilità assoluta, teorema di Bayes, paradossi della probabilità, applicazioni ai test diagnostici.
Fitting: analisi di regressione lineare, metodo dei minimi quadrati, regressione lineare semplice, media e varianza dei residui, fitting di dati con un modello.
Analisi delle Componenti Principali: dati matriciali, rappresentazione delle Componenti Principali in geometria e in data analysis, proiezioni di dati mediante cambiamento di base, decomposizione ai valori singolari di matrici per descrivere la varianza di insiemi di dati, applicazioni a insiemi di dati e implementazione dell’algoritmo per l’Analisi delle Componenti Principali.
Distanze: distanze e metriche in uno spazio vettoriale, distanze indotte da norme vettoriali, distanze Lp, distanza di Manhattan, distanza Euclidea, distanza di Chebyshev, distanza di Hamming, distanza di Lee, distanza di Mahalanobis, distanza del coseno, distanza angolare, distanze tra insiemi e stringhe, distanza tra un vettore e un insieme, distanza di Hausdorff, distanza di Jaccard, distanze di modifica tra stringhe, modellistica e analisi di dati testuali tramite distanze, modelli della borsa di parole, k-grammi.
Elementi di Statistica Descrittiva: variabili numeriche e categoriche, frequenze assolute, relative e cumulative, dati raggruppati e classi, distribuzione di frequenze, rappresentazioni grafiche di dati, diagramma a torta, istogramma, poligono di frequenza, diagramma a barre, poligono cumulativo, funzione cumulativa empirica, diagramma a scatola e baffi, minimo, massimo, mediana, primo quartile, terzo quartile, scarto interquartile, p-quantile, metodo di calcolo dei p-quantili, approssimazione lineare di p-quantili, media aritmetica, varianza, formule ricorsive di media e varianza, media e varianza di trasformazioni lineari di dati, media e varianza di una distribuzione di frequenze, approssimazione di media e varianza per dati raggruppati, media pesata, media armonica, media geometrica, media Chisini, stima della varianza, scarto quadratico medio, moda, coefficiente di variazione, standardizazzione di dati, indice di simmetria di una distribuzione, indice di curtosi, covarianza, proprietà e interpretazione geometrica della covarianza, covarianza di combinazioni lineari di dati, stima della covarianza, coefficiente di correlazione, proprietà e interpretazione geometrica del coefficiente di correlazione, matrici di covarianza e di correlazione.
Elementi di Analisi Combinatoria: permutazioni semplici e con ripetizione, disposizioni semplici e con ripetizione, combinazioni semplici, coefficiente binomiale, combinazioni con ripetizione.
Elementi di teoria della Probabilità: eventi, spazio campionario, proprietà e rappresentazione di eventi e di spazi campionari, operazioni tra eventi, eventi incompatibili e compatibili, eventi indipendenti e dipendenti, concezione classica, frequentista e assiomatica della probabilità, assiomi della probabilità e conseguenze, probabilità condizionata, probabilità di eventi indipendenti, teorema della probabilità assoluta, teorema di Bayes, paradossi della probabilità, applicazioni ai test diagnostici.
Fitting: analisi di regressione lineare, metodo dei minimi quadrati, regressione lineare semplice, media e varianza dei residui, fitting di dati con un modello.
Analisi delle Componenti Principali: dati matriciali, rappresentazione delle Componenti Principali in geometria e in data analysis, proiezioni di dati mediante cambiamento di base, decomposizione ai valori singolari di matrici per descrivere la varianza di insiemi di dati, applicazioni a insiemi di dati e implementazione dell’algoritmo per l’Analisi delle Componenti Principali.
Lingua Insegnamento
INGLESE
Corsi
Corsi
INFORMATICA
Laurea
3 anni
No Results Found
Persone
Persone
No Results Found