8070 - METODI STATISTICI PER L'ECONOMIA APPLICATA [STATISTICAL METHODS FOR ECONOMICS AND BUSINESS (MULTIVARIATE ANALYSIS)]
CLEMIT-LS
Department of Decision Sciences
Course taught in Italian
RAFFAELLA PICCARRETA
Obiettivi formativi del corso
Fornire agli studenti conoscenze di base nelle tecniche di analisi esplorativa di dati multivariati. In particolare, oggetto del corso sono le tecniche di riduzione del patrimonio informativo sia con riferimento al numero di casi che con riferimento al numero di variabili. Le metodologie oggetto di insegnamento vengono presentate e illustrate facendo diretto riferimento a banche dati rilevanti per gli insegnamenti di Economia Internazionale, Economia industriale ed Economia dell'innovazione.
Programma sintetico del corso
Parte I: l'analisi di dati quantitativi
-
Vettori aleatori. Sintesi di vettori aleatori, campioni multivariate. Le matrici Individui/Variabili. Sintesi campionarie di dati multivariati. Interpretazione geometrica delle matrici di dati. Lo spazio delle variabili e lo spazio delle unita'. La metrica Euclidea e la metrica Euclidea ponderata. Varianza totale e varianza generalizzata e loro interpretazione geometrica.
-
Analisi in componenti principali. Trasformazione in componenti principali. Proprieta', interpretazione, valutazioni dell'analisi in componenti principali. Componenti principali campionarie e loro proprieta'.
-
Analisi fattoriale. Il modello fattoriale: definizione e assunzioni. Stima dei parametri del modello fattoriale: metodo delle componenti principali e metodo dei fattori principali. Interpretazione dei fattori: la rotazione. La stima dei fattori.
-
Analisi dei gruppi (cluster analysis). Matrici di distanza. Scelta della misura di distanza. Classificazione gerarchica: i diversi criteri di raggruppamento, la scelta del numero dei gruppi. Classificazione non gerarchica: il metodo delle k medie. La valutazione dei risultati.
Parte II: l'analisi di dati qualitativi
-
Variabili categoriche, tabelle di contingenza. Misure di associazione tra variabili categoriche nominali.
-
Studio dell'associazione tra variabili qualitative. Analisi delle corrispondenze semplici e analisi delle corrispondenze multiple. Profili e metrica del Chi-quadrato. Matrici indicatrici e matrice di Burt. La determinazione dei fattori e loro interpretazione. Rappresentazione grafica. Analisi dei risultati.
-
Analisi dei gruppi per variabili qualitative. Definizione delle matrici di dissimilarita'. Scelta della scale e della misura di dissimilarita'. Applicazione delle tecniche illustrate nel caso quantitativo al caso qualitativo.
Descrizione dettagliata delle modalità d'esame
Prova in laboratorio informatico. Tale prova, della durata di 4 ore, vertera' sull'analisi di un data set reale. Oggetto di valutazione sara' l'output ottenuto e il commento all'output.
È prevista anche una prova orale durante la quale verra' analizzato e discusso l'elaborato.
Testi d'esame
-
J.D. JOBSON, Applied Multivariate Data Analysis, Springer, 1992.
-
L. FABBRIS, Statistica Multivariata, McGraw-Hill, 1997.