Course 2023-2024 a.y.

30001 - STATISTICA / STATISTICS

Department of Decision Sciences

Student consultation hours
Class timetable
Exam timetable

For the instruction language of the course see class group/s below
Go to class group/s: 9 - 10
CLEF (8 credits - I sem. - OBBC  |  SECS-S/01)
Course Director:
RAFFAELLA PICCARRETA

Classi: 9 (I sem.) - 10 (I sem.)
Docenti responsabili delle classi:
Classe 9: ELENA POLI, Classe 10: ELENA POLI

Classe/i impartita/e in lingua italiana

Synchronous Blended: Lessons in synchronous mode in the classroom (for a maximum of one hour per credit in remote mode)

Conoscenze pregresse consigliate

Per frequentare con profitto l’insegnamento è fortemente consigliato avere una conoscenza di base degli elementi di teoria delle probabilità e delle variabili aleatorie, coperti nel corso Matematica Modulo 2 (Applicata) – cod. 30063. Tali argomenti si possono trovare nei capitoli 4, 5 e 6 del libro di testo del corso. In particolare si suggerisce di guardare con attenzione gli argomenti trattati nei paragrafi 5.3 e 5.7 del Capitolo 5.

Mission e Programma sintetico

MISSION

Nell'ultimo decennio si è assistito ad una rivoluzione senza precedenti nella raccolta e nella accessibilità a dati di tutti i tipi. L’analisi esplorativa dei dati ed il loro utilizzo ai fini inferenziali sta diventando sempre più importante e cruciale in ogni campo. L’affidabilità dell’analisi dei dati e delle estrapolazioni su questa basate dipende dall’adeguatezza delle procedure di sintesi e di inferenza adottate, così come dalla corretta esposizione e comunicazione dei risultati dell’analisi. Il corso si propone di fornire i primi strumenti teorici e applicati per effettuare un’analisi statistica rigorosa di un insieme di dati. Nello specifico, il corso si focalizza sulle tecniche atte alla descrizione e alla sintesi di dati di diversa natura e allo studio delle loro relazioni, sui concetti fondamentali alla base del campionamento e dell’inferenza statistica, e sulla valutazione dei rischi connessi all’estrapolazione e all’inferenza. In particolare, lo studente impara come estrarre informazioni utili dai dati e come valutarne il grado di affidabilità.

PROGRAMMA SINTETICO

Il corso si articola nei seguenti punti:

  • Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
  • Studio delle relazioni fra due caratteri.
  • Inferenza statistica e variabilità campionaria.
  • Teoria della stima puntuale e per intervallo.
  • Verifica di ipotesi.
  • Modello di regressione lineare semplice e multiplo.

 

Tutte le tecniche descrittive e inferenziali descritte nel corso verranno applicate utilizzando il software statistico R– e in particolare l’ambiente di sviluppo integrato (IDE) RStudio. Il corso prevede quindi anche lezioni dedicate all'introduzione e all'utilizzo del software 

 


Risultati di Apprendimento Attesi (RAA)

CONOSCENZA E COMPRENSIONE

Al termine dell'insegnamento, lo studente sarà in grado di...
  • Comprendere la diversa natura dei dati.
  • Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
  • Riconoscere semplici modelli statistici.
  • Utilizzare il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per svolgere analisi dei dati

 

CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE

Al termine dell'insegnamento, lo studente sarà in grado di...
  • Sintetizzare in modo appropriato un insieme di dati.
  • Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
  • Costruire modelli di regressione per studiare le relazioni fra le diverse variabili di interesse.
  • Utilizzare il software R/RStudio per determinare le soluzioni dei precedenti problemi.

 


Modalità didattiche

  • Lezioni frontali
  • Esercitazioni (esercizi, banche dati, software etc.)
  • Analisi casi studio / Incidents guidati (tradizionali, multimediali)

DETTAGLI

L'attività di insegnamento-apprendimento di questo corso prevede, oltre alle tradizionali lezioni frontali, lezioni/esercitazioni in cui si utilizza il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per analizzare le diverse tecniche statistiche illustrate. In particolare, durante le esercitazioni e i tutoraggi gli studenti dovranno utilizzare il loro pc per condurre insieme al docente analisi dei dati volte alla risoluzione di specifici problemi, e interpretare i risultati ottenuti.


Metodi di valutazione dell'apprendimento

  Accertamento in itinere Prove parziali Prova generale
  • Prova individuale scritta (tradizionale/online)
  x x

STUDENTI FREQUENTANTI E NON FREQUENTANTI

La valutazione, identica sia per studenti frequentanti che non frequentanti, avviene attraverso due possibili modalità: 1) due prove parziali 2) una prova generale.

 

Le due prove parziali sono organizzate in modo identico. In entrambe le prove verranno somministrati esercizi da risolvere manualmente (relativi a dati aggregati), domande di teoria, e domande relative all’analisi di un dataset cui rispondere utilizzando il software R/RStudio.

Ognuna delle prove parziali viene valutata con un voto massimo pari a 31/30, e si considera superata con un voto maggiore o uguale a 15. Se la prima e la seconda prova parziale sono entrambe superate, il voto finale nell’esame è dato dalla media dei voti nelle due prove. Il voto massimo è di 31/30, e l’esame si ritiene superato solo se tale voto risulta maggiore o uguale a 18. Un voto pari a 31/30 comporta l’assegnazione della lode.

Importante: gli studenti che superano le prove parziali ma che nella seconda prova parziale conseguono un voto inferiore a 18 potranno chiedere che il loro voto finale non sia registrato. Questo non vale per gli studenti che conseguono un voto inferiore a 18 nella prima prova parziale, in quanto la partecipazione alla seconda prova parziale implica l'accettazione del risultato conseguito nella prima prova.

 

La prova generale è articolata come le prove parziali (esercizi da svolgere manualmente, domande di teoria, domande relativa ad analisi di dati cui rispondere utilizzando il software R/RStudio). Il voto massimo è di 31/30, e l’esame si ritiene superato solo se tale voto risulta maggiore o uguale a 18. Un voto pari a 31/30 comporta l’assegnazione della lode.

 

Entrambe le modalità d'esame mirano a verificare:

  • La capacità di identificare la metodologia corretta per risolvere un dato problema.
  • La comprensione della logica sottostante una determinata procedura.
  • La capacità di calcolare specifici indicatori statistici a mano e con il software.
  • La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo in R/RStudio.
  • La capacità di interpretare l'output del software.

Materiali didattici


STUDENTI FREQUENTANTI E NON FREQUENTANTI

  • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, 9/Ed. Pearson (2021).
  • Materiali integrativi distribuiti sulla piattaforma Bboard
  • Materiale specifico sull'uso del software R disponibile sulla piattaforma Bboard. 
Modificato il 03/06/2023 16:30