Info
Foto sezione
Logo Bocconi

Course 2022-2023 a.y.

30001 - STATISTICA / STATISTICS

All Programs
Department of Decision Sciences

For the instruction language of the course see class group/s below

Go to class group/s: 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10 - 15 - 16 - 17 - 18 - 21 - 22

CLEAM (8 credits - I sem. - OBBC  |  SECS-S/01) - CLEF (8 credits - I sem. - OBBC  |  SECS-S/01)
Course Director:
RAFFAELLA PICCARRETA

Classi: 1 (I sem.) - 2 (I sem.) - 3 (I sem.) - 4 (I sem.) - 5 (I sem.) - 6 (I sem.) - 7 (I sem.) - 8 (I sem.) - 9 (I sem.) - 10 (I sem.)
Docenti responsabili delle classi:
Classe 1: ELENA POLI, Classe 2: LUCA MOLTENI, Classe 3: DANIELE GRECHI, Classe 4: MATTIA VITTORIO ORESTE COZZI, Classe 5: RAFFAELLA PICCARRETA, Classe 6: MATTIA VITTORIO ORESTE COZZI, Classe 7: EMILIANO SIRONI, Classe 8: ALESSANDRO RECLA, Classe 9: PIERO VERONESE, Classe 10: ELENA POLI

Classe/i impartita/e in lingua italiana

Class-group lessons delivered  on campus

Conoscenze pregresse consigliate

Per frequentare con profitto l’insegnamento è fortemente consigliato avere una conoscenza di base degli elementi di teoria delle probabilità e delle variabili aleatorie, coperti nel corso Matematica Modulo 2 (Applicata) – cod. 30063. Tali argomenti si possono trovare nei capitoli 4, 5 e 6 del libro di testo del corso. In particolare si suggerisce di guardare con attenzione gli argomenti trattati nei paragrafi 5.3 e 5.7 del Capitolo 5.


Mission e Programma sintetico
MISSION

Nell'ultimo decennio si è assistito ad una rivoluzione senza precedenti nella raccolta e nella accessibilità a dati di tutti i tipi. L’analisi esplorativa dei dati ed il loro utilizzo ai fini inferenziali sta diventando sempre più importante e cruciale in ogni campo. L’affidabilità dell’analisi dei dati e delle estrapolazioni su questa basate dipende dall’adeguatezza delle procedure di sintesi e di inferenza adottate, così come dalla corretta esposizione e comunicazione dei risultati dell’analisi. Il corso si propone di fornire i primi strumenti teorici e applicati per effettuare un’analisi statistica rigorosa di un insieme di dati. Nello specifico, il corso si focalizza sulle tecniche atte alla descrizione e alla sintesi di dati di diversa natura e allo studio delle loro relazioni, sui concetti fondamentali alla base del campionamento e dell’inferenza statistica, e sulla valutazione dei rischi connessi all’estrapolazione e all’inferenza. In particolare, lo studente impara come estrarre informazioni utili dai dati e come valutarne il grado di affidabilità.

PROGRAMMA SINTETICO

Il corso si articola nei seguenti punti:

  • Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
  • Studio delle relazioni fra due caratteri.
  • Inferenza statistica e variabilità campionaria.
  • Teoria della stima puntuale e per intervallo.
  • Verifica di ipotesi.
  • Modello di regressione lineare semplice e cenni a quello multiplo.

 


Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
Al termine dell'insegnamento, lo studente sarà in grado di...
  • Comprendere la diversa natura dei dati.
  • Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
  • Riconoscere semplici modelli statistici.

 

CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
Al termine dell'insegnamento, lo studente sarà in grado di...
  • Sintetizzare in modo appropriato un insieme di dati.
  • Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
  • Costruire semplici modelli statistici, quali quelli di regressione, volti a studiare le relazioni fra le diverse variabili di interesse.
  • Utilizzare il software R al fine di determinare le soluzioni dei precedenti problemi.

 


Modalità didattiche
  • Lezioni frontali
  • Esercitazioni (esercizi, banche dati, software etc.)
  • Analisi casi studio / Incidents guidati (tradizionali, multimediali)
DETTAGLI

L'attività di insegnamento-apprendimento di questo corso prevede, oltre alle tradizionali lezioni frontali, lezioni/esercitazioni in cui si utilizza il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per analizzare le diverse tecniche statistiche illustrate. In particolare, durante le esercitazioni e i tutoraggi gli studenti possono utilizzare il loro pc per condurre insieme al docente analisi dei dati volte alla risoluzione di specifici problemi, e interpretare i risultati ottenuti.


Metodi di valutazione dell'apprendimento
  Accertamento in itinere Prove parziali Prova generale
  • Prova individuale scritta (tradizionale/online)
  •   x x
    STUDENTI FREQUENTANTI E NON FREQUENTANTI

    La valutazione, identica sia per studenti frequentanti che non frequentanti, avviene attraverso due possibili modalità: 1) due prove parziali 2) una prova generale.

     

    Le due prove parziali sono organizzate in modo identico, e constano ciascuna di due parti. La prima parte consiste in esercizi da risolvere manualmente e da domande di teoria, e viene valutata con un punteggio massimo di 26 punti. La seconda parte – svolta dagli studenti sul proprio laptop – consiste nell’analisi di un dataset utilizzando il software R/RStudio, e viene valutata con un punteggio massimo di 5 punti.

    Ognuna delle prove parziali viene valutata con un voto massimo pari a 31/30, e si considera superata con un voto maggiore o uguale a 15. Se la prima e la seconda prova parziale sono entrambe superate, il voto finale nell’esame è dato dalla media dei voti nelle due prove. Il voto massimo è di 31/30, e l’esame si ritiene superato solo se tale voto risulta maggiore o uguale a 18. Un voto pari a 31/30 comporta l’assegnazione della lode.

     

    La prova generale è anch’essa articolata in una parte svolta in modo tradizionale, valutata con un punteggio massimo di 26 punti, e una parte – svolta dagli studenti sul proprio laptop – consistente nell’analisi di un dataset utilizzando il software R/RStudio, che viene valutata con un punteggio massimo di 5 punti. Il voto massimo è di 31/30, e l’esame si ritiene superato solo se tale voto risulta maggiore o uguale a 18. Un voto pari a 31/30 comporta l’assegnazione della lode.

     

    Entrambe le modalità mirano a verificare:

    • La capacità di identificare la metodologia corretta per risolvere un dato problema.
    • La comprensione della logica sottostante una determinata procedura.
    • La capacità di calcolare specifici indicatori statistici a mano e con il software.
    • La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo in R/RStudio.
    • La capacità di interpretare l'output del software.

    Materiali didattici
    STUDENTI FREQUENTANTI E NON FREQUENTANTI
    • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, 9/Ed. Pearson (2021).
    • Nota sulle Distribuzioni di frequenza disponibile sulla piattaforma Bboard del corso.
    • Materiale specifico sull'uso del software R disponibile sulla piattaforma Bboard. 
    Modificato il 26/04/2023 19:37

    BIEF (8 credits - I sem. - OBBC  |  SECS-S/01) - BIEM (8 credits - I sem. - OBBC  |  SECS-S/01)
    Course Director:
    RAFFAELLA PICCARRETA

    Classes: 15 (I sem.) - 16 (I sem.) - 17 (I sem.) - 18 (I sem.) - 21 (I sem.) - 22 (I sem.)
    Instructors:
    Class 15: PIERALBERTO GUARNIERO, Class 16: MARTA ANGELICI, Class 17: DANIELE TONINI, Class 18: EMILIO GREGORI, Class 21: MAURIZIO POLI, Class 22: RENATA TRINCA COLONEL

    Class group/s taught in English

    Class-group lessons delivered  on campus

    Suggested background knowledge

    For a fruitful attendance, students are strongly advised to have a basic understanding of the concepts of probability theory and random variables. Notes on these arguments (taught in course cod. 30063, Mathematics, Module 2 (Applied)) can be found in chapters 3, 4 and 5 of the course textbook. In particular it is suggested to look carefully at the topics covered in paragraphs 4.3 and 4.7 .

    PREREQUISITES

    For BIEM students the exam code 30001 STATISTICA / STATISTICS is a prerequisite of the exam code 30280 Applications for management For BIEF students the exam code 30001 STATISTICA / STATISTICS is a prerequisite of the exam code 30284 EMPIRICAL METHODS FOR ECONOMICS (INTRODUCTION TO ECONOMETRICS) and of the exam code 30285 EMPIRICAL METHODS FOR FINANCE (INTRODUCTION TO ECONOMETRICS FOR FINANCE)


    Mission & Content Summary
    MISSION

    In the last decade an unprecedented revolution has taken place in the collection of and accessibility to all types of data. Exploratory data analysis, inference and prediction are becoming more and more important in almost every field. The reliability of the conclusions drawn based on the analysis of data relies on the suitability of the applied procedures, as well as on the appropriate communication of results. This course aims at providing the basic theoretical and applied tools for a rigorous statistical analysis. Specifically, the course focuses on techniques to summarize and visualize data of different types and their possible relations, as well as on basic sampling and inferential procedures, and on the assessment of the risk associated to extrapolation and inference. In particular, students will learn how to extract information from data and how to assess the reliability of such information.

    CONTENT SUMMARY

    The course covers the following topics:

    • Collection, management and summary of data using frequency distributions, graphical representations and summaries.
    • Study of the relationship between two variables.
    • Statistical inference and sampling variability.
    • Theory of point estimation and confidence intervals.
    • Hypothesis testing.
    • Simple regression model and brief introduction to the multiple regression model.

     


    Intended Learning Outcomes (ILO)
    KNOWLEDGE AND UNDERSTANDING
    At the end of the course student will be able to...
    • Recognize different types of data.
    • Understand the difference between the tools of descriptive and inferential statistics, and identify the most suitable approach for the problem at hand.
    • Recognize simple statistical models.

     

    APPLYING KNOWLEDGE AND UNDERSTANDING
    At the end of the course student will be able to...
    • Properly summarize a dataset.
    • Estimate, and test hypotheses on, the unknown parameters of a population on the basis of sample data.
    • Build simple statistical models, as regression models, aimed at studying the relationships  between variables of interest.
    • Use the R software to address the aformentioned issues.

    Teaching methods
    • Face-to-face lectures
    • Exercises (exercises, database, software etc.)
    • Case studies /Incidents (traditional, online)
    DETAILS

    Beyond traditional classes, the course features hands-on classes, where the statistical software R - and in particular the integrated development environment (IDE) RStudio - is used to apply basic statistical analyses to data. More specifically, during these sessions students will use their laptop to address specific issues, and to interpret the obtained results.


    Assessment methods
      Continuous assessment Partial exams General exam
  • Written individual exam (traditional/online)
  •   x x
    ATTENDING AND NOT ATTENDING STUDENTS

    The assessment method, both for attending and not-attending students, consists of 1) two midterm exams or 2) a general exam.

     

    The two midterms are articulated into two parts. The first part, consisting in a traditional written exam with theoretical questions and traditional “paper and pencil” derivation exercises, is graded 26 points maximum. The second part consists of the analysis of a dataset using R/Rstudio (installed on each student’s laptop), and is graded 5 points maximum. The maximum grade in each midterm is 31/30.

    To pass the exam, a grade higher than or equal to 15 is required in both midterms, and an average of at least 18 points. A final grade equal to 31 is rewarded cum laude.

     

    The general exam is organized as the midterms, and consists of a first traditional part (theoretical questions and “paper and pencil” exercises) graded 26 points maximum, and of a second part with problems to be solved using R/Rstudio (installed on each student’s laptop), graded 5 points maximum. The maximum grade in the exam is 31/30; The exam is passed with a grade higher than or equal to 18. A final grade equal to 31 is rewarded cum laude.

     

    The exam aims at assessing:

    • The ability to identify the proper methodology to solve a given problem.
    • The understanding of the logic underlying a certain procedure.
    • The ability to compute appropriate statistical measures with both a pocket calculator and a statistical software.
    • The ability of suggesting and implementing with R a statistical model, consistent with both the assumptions stated and the data at hand.
    • The ability to understand the software output.

    Teaching materials
    ATTENDING AND NOT ATTENDING STUDENTS
    • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistics for Business and Economics, Pearson/Prentice Hall, 9th global edition (2019). 
    • Additional teaching note on Frequency Distributions, available on the Bboard platform.

    • A specific manual on the use of R/Studio available on the Bboard platform.

     

    Last change 26/04/2023 19:40