Info
Logo Bocconi

Course 2019-2020 a.y.

30001 - STATISTICA / STATISTICS

Department of Decision Sciences

For the instruction language of the course see class group/s below

Go to class group/s: 9 - 10

CLEF (8 credits - I sem. - OBBC  |  SECS-S/01)
Course Director:
PIERO VERONESE

Classi: 9 (I sem.) - 10 (I sem.)
Docenti responsabili delle classi:
Classe 9: PIERO VERONESE, Classe 10: ELENA POLI

Classe/i impartita/e in lingua italiana

Conoscenze pregresse consigliate

Per frequentare con profitto l’insegnamento è fortemente consigliato avere una conoscenza di base degli elementi di teoria delle probabilità e delle variabili aleatorie. Tali argomenti si possono trovare nei capitoli 4, 5 e 6 del libro di testo del corso. In particolare si suggerisce di guardare con attenzione gli argomenti trattati nei paragrafi 5.3 e 5.7 del Capitolo 5.


Mission e Programma sintetico
MISSION

Nell'ultimo decennio si è assistito ad una rivoluzione senza precedenti nella raccolta e nella accessibilità a dati di tutti i tipi: si stima ad esempio che il 90% dei dati presenti oggi sia stato creato negli ultimi due anni. La possibilità di avere così tanti dati non significa però un aumento diretto della conoscenza dei vari fenomeni, anzi è possibile il contrario. Al di là dei molti problemi tecnici dovuti all'elaborazione di dataset di enormi dimensioni, una analisi accurata non può non tener conto della differente natura dei dati, della loro complessità, delle loro inter-relazioni ecc. Il corso si propone quindi di fornire i primi strumenti teorici e applicati per effettuare un’analisi statistica rigorosa di un insieme di dati. In particolare lo studente impara come sia possibile estrarre informazioni utili e al contempo valutarne il loro grado di affidabilità.

PROGRAMMA SINTETICO

Il corso si articola nei seguenti punti:

  • Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
  • Studio delle relazioni fra due caratteri.
  • Inferenza statistica e variabilità campionaria.
  • Teoria della stima puntuale e per intervallo.
  • Verifica di ipotesi.
  • Modello di regressione lineare semplice e cenni a quello multiplo.

Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
Al termine dell'insegnamento, lo studente sarà in grado di...
  • Comprendere la diversa natura dei dati.
  • Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
  • Riconoscere semplici modelli statistici.
CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
Al termine dell'insegnamento, lo studente sarà in grado di...
  • Sintetizzare in modo appropriato un insieme di dati.
  • Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
  • Costruire semplici modelli statistici, quali quelli di regressione, volti a studiare le relazioni fra le diverse variabili di interesse.
  • Utilizzare il software R al fine di determinare le soluzioni dei precedenti problemi.

Modalità didattiche
  • Lezioni frontali
  • Esercitazioni (esercizi, banche dati, software etc.)
  • Analisi casi studio / Incidents guidati (tradizionali, multimediali)
DETTAGLI

L'attività di insegnamento-apprendimento di questo corso, oltre alle tradizionali lezioni frontali, prevede lezioni/esercitazioni/tutoraggi in cui si utilizza il software R per risolvere le diverse problematiche statistiche precedentemente illustrate. In particolare durante le esercitazioni e i tutoraggi gli studenti possono utilizzare il loro pc per risolvere assieme al docente il problema proposto e interpretare i risultati. Un data-set reale è utilizzato durante tutto il corso cosicché alla fine si possa avere un esempio completo (rispetto agli strumenti illustrati) di una concreta analisi statistica.


Metodi di valutazione dell'apprendimento
  Accertamento in itinere Prove parziali Prova generale
  • Prova individuale scritta (tradizionale/online)
  •   x x
    STUDENTI FREQUENTANTI E NON FREQUENTANTI

    La valutazione, identica sia per studenti frequentanti che non frequentanti, avviene attraverso due possibili modalità: 1) tre prove parziali 2) uno scritto generale.

    1. Delle tre prove parziali, due (PP1, PP2) sono svolte in modo tradizionale (carta e penna) e danno un punteggio massimo di 31/30, mentre una (PR) richiede che lo studente usi il software R installato sul suo pc per poter rispondere ad alcune domande che richiedono una piccola analisi di un data-set. Quest’ultima prova vale al massimo 4/30 di punto che sono aggiunti alla media ponderata delle altre due prove parziali. Il voto finale è quindi dato da: [ (PP1+PP2)/2]*(27/31)+PR.
    2. Una prova generale svolta in modo tradizionale (punteggio massimo 31/30). Il testo dell’esame contiene domande esplicite sul codice di R, sul suo funzionamento e sull’interpretazione dei suoi risultati. Tali domande hanno globalmente un peso pari a 4/30 di punto. Un punteggio totale di 31/30 equivale a 30/30 e lode.

    Entrambe le modalità mirano a verificare tramite opportune domande:

    • La capacità di identificare la metodologia corretta per risolvere un dato problema.
    • La comprensione della logica sottostante una determinata procedura.
    • La capacità di calcolare specifici indicatori statistici a mano e con il software.
    • La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo con R.
    • La capacità di interpretare l'output del software.

    Materiali didattici
    STUDENTI FREQUENTANTI E NON FREQUENTANTI
    • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, Pearson/Prentice Hall, 2010, 2° edizione.
    • Nota sulle Distribuzioni di frequenza disponibile sulla piattaforma Bboard del corso.
    • Materiale specifico sull'uso del software R caricato sulla piattaforma Bboard. 
    Modificato il 10/07/2019 11:45