Info
Logo Bocconi

Course 2019-2020 a.y.

30001 - STATISTICA / STATISTICS

Department of Decision Sciences

For the instruction language of the course see class group/s below

Go to class group/s: 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10 - 11 - 12 - 15 - 16 - 17 - 18 - 21 - 22

CLEAM (8 credits - I sem. - OBBC  |  SECS-S/01) - CLEF (8 credits - I sem. - OBBC  |  SECS-S/01)
Course Director:
PIERO VERONESE

Classi: 1 (I sem.) - 2 (I sem.) - 3 (I sem.) - 4 (I sem.) - 5 (I sem.) - 6 (I sem.) - 7 (I sem.) - 8 (I sem.) - 9 (I sem.) - 10 (I sem.)
Docenti responsabili delle classi:
Classe 1: PAOLA PAGANI, Classe 2: LUCA MOLTENI, Classe 3: GIANNA SERAFINA MONTI, Classe 4: CLAUDIO GIOVANNI BORRONI, Classe 5: PAOLA PAGANI, Classe 6: ELENA POLI, Classe 7: EMILIANO SIRONI, Classe 8: ALESSANDRO RECLA, Classe 9: PIERO VERONESE, Classe 10: ELENA POLI

Classe/i impartita/e in lingua italiana

Conoscenze pregresse consigliate

Per frequentare con profitto l’insegnamento è fortemente consigliato avere una conoscenza di base degli elementi di teoria delle probabilità e delle variabili aleatorie. Tali argomenti si possono trovare nei capitoli 4, 5 e 6 del libro di testo del corso. In particolare si suggerisce di guardare con attenzione gli argomenti trattati nei paragrafi 5.3 e 5.7 del Capitolo 5.


Mission e Programma sintetico
MISSION

Nell'ultimo decennio si è assistito ad una rivoluzione senza precedenti nella raccolta e nella accessibilità a dati di tutti i tipi: si stima ad esempio che il 90% dei dati presenti oggi sia stato creato negli ultimi due anni. La possibilità di avere così tanti dati non significa però un aumento diretto della conoscenza dei vari fenomeni, anzi è possibile il contrario. Al di là dei molti problemi tecnici dovuti all'elaborazione di dataset di enormi dimensioni, una analisi accurata non può non tener conto della differente natura dei dati, della loro complessità, delle loro inter-relazioni ecc. Il corso si propone quindi di fornire i primi strumenti teorici e applicati per effettuare un’analisi statistica rigorosa di un insieme di dati. In particolare lo studente impara come sia possibile estrarre informazioni utili e al contempo valutarne il loro grado di affidabilità.

PROGRAMMA SINTETICO

Il corso si articola nei seguenti punti:

  • Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
  • Studio delle relazioni fra due caratteri.
  • Inferenza statistica e variabilità campionaria.
  • Teoria della stima puntuale e per intervallo.
  • Verifica di ipotesi.
  • Modello di regressione lineare semplice e cenni a quello multiplo.

Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
Al termine dell'insegnamento, lo studente sarà in grado di...
  • Comprendere la diversa natura dei dati.
  • Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
  • Riconoscere semplici modelli statistici.
CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
Al termine dell'insegnamento, lo studente sarà in grado di...
  • Sintetizzare in modo appropriato un insieme di dati.
  • Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
  • Costruire semplici modelli statistici, quali quelli di regressione, volti a studiare le relazioni fra le diverse variabili di interesse.
  • Utilizzare il software R al fine di determinare le soluzioni dei precedenti problemi.

Modalità didattiche
  • Lezioni frontali
  • Esercitazioni (esercizi, banche dati, software etc.)
  • Analisi casi studio / Incidents guidati (tradizionali, multimediali)
DETTAGLI

L'attività di insegnamento-apprendimento di questo corso, oltre alle tradizionali lezioni frontali, prevede lezioni/esercitazioni/tutoraggi in cui si utilizza il software R per risolvere le diverse problematiche statistiche precedentemente illustrate. In particolare durante le esercitazioni e i tutoraggi gli studenti possono utilizzare il loro pc per risolvere assieme al docente il problema proposto e interpretare i risultati. Un data-set reale è utilizzato durante tutto il corso cosicché alla fine si possa avere un esempio completo (rispetto agli strumenti illustrati) di una concreta analisi statistica.


Metodi di valutazione dell'apprendimento
  Accertamento in itinere Prove parziali Prova generale
  • Prova individuale scritta (tradizionale/online)
  •   x x
    STUDENTI FREQUENTANTI E NON FREQUENTANTI

    La valutazione, identica sia per studenti frequentanti che non frequentanti, avviene attraverso due possibili modalità: 1) tre prove parziali 2) uno scritto generale.

    1. Delle tre prove parziali, due (PP1, PP2) sono svolte in modo tradizionale (carta e penna) e danno un punteggio massimo di 31/30, mentre una (PR) richiede che lo studente usi il software R installato sul suo pc per poter rispondere ad alcune domande che richiedono una piccola analisi di un data-set. Quest’ultima prova vale al massimo 4/30 di punto che sono aggiunti alla media ponderata delle altre due prove parziali. Il voto finale è quindi dato da: [ (PP1+PP2)/2]*(27/31)+PR.
    2. Una prova generale svolta in modo tradizionale (punteggio massimo 31/30). Il testo dell’esame contiene domande esplicite sul codice di R, sul suo funzionamento e sull’interpretazione dei suoi risultati. Tali domande hanno globalmente un peso pari a 4/30 di punto. Un punteggio totale di 31/30 equivale a 30/30 e lode.

    Entrambe le modalità mirano a verificare tramite opportune domande:

    • La capacità di identificare la metodologia corretta per risolvere un dato problema.
    • La comprensione della logica sottostante una determinata procedura.
    • La capacità di calcolare specifici indicatori statistici a mano e con il software.
    • La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo con R.
    • La capacità di interpretare l'output del software.

    Materiali didattici
    STUDENTI FREQUENTANTI E NON FREQUENTANTI
    • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, Pearson/Prentice Hall, 2010, 2° edizione.
    • Nota sulle Distribuzioni di frequenza disponibile sulla piattaforma Bboard del corso.
    • Materiale specifico sull'uso del software R caricato sulla piattaforma Bboard. 
    Modificato il 10/07/2019 11:45

    BIEF (8 credits - I sem. - OBBC  |  SECS-S/01) - BIEM (8 credits - I sem. - OBBC  |  SECS-S/01)
    Course Director:
    PIERO VERONESE

    Classes: 15 (I sem.) - 16 (I sem.) - 17 (I sem.) - 18 (I sem.) - 21 (I sem.) - 22 (I sem.)
    Instructors:
    Class 15: MATTIA VITTORIO ORESTE COZZI, Class 16: MARTA ANGELICI, Class 17: DANIELE TONINI, Class 18: RENATA TRINCA COLONEL, Class 21: MAURIZIO POLI, Class 22: EMILIO GREGORI

    Class group/s taught in English

    Suggested background knowledge

    For a fruitful attendance students are strongly advised to have a basic understanding of the concepts of probability theory and random variables. These arguments can be found in the chapters 3, 4 and 5 of the course textbook. In particular it is suggested to look carefully at the topics covered in paragraphs 4.3 and 4.7.


    Mission & Content Summary
    MISSION

    In the last decade an unprecedented revolution has taken place in the collection of and accessibility to all types of data: for example, it is estimated that 90% of the data present today was created in the last two years. The possibility of collecting such a huge mass of data does not mean however a direct increase in the knowledge on the various phenomena; indeed the opposite is possible. Besides the relevant technical problems due to huge dataset processing (big-data), an accurate analysis of such data cannot avoid taking into account, for example, their different natures, their complexity, their inter-relationships, etc. Therefore, the course is meant to provide the first essential theoretical and applied instruments to carry out a rigorous statistical analysis. In particular, the student learn not only to extract information from data, but also to assess the reliability of such information.

    CONTENT SUMMARY

    The course covers the following broad areas:

    • Collection, management and summary of data using frequency distributions, graphical representations and indexes.
    • Study of the relationship between two variables.
    • Statistical inference and sampling variability.
    • Theory of point estimation and confidence intervals.
    • Hypothesis testing.
    • Simple regression model and brief introduction to the multiple regression model.

    Intended Learning Outcomes (ILO)
    KNOWLEDGE AND UNDERSTANDING
    At the end of the course student will be able to...
    • Recognize different types of data.
    • Understand the difference between the tools of descriptive and inferential statistics, and identify the most suitable approach for the problem at hand.
    • Recognize simple statistical models.
    APPLYING KNOWLEDGE AND UNDERSTANDING
    At the end of the course student will be able to...
    • Properly summarize a dataset.
    • Estimate, and test hypotheses on, the unknown parameters of a population on the basis of sample data.
    • Build simple statistical models, as regression models, aimed at studying the relationships  between variables of interest.
    • Use the R software to find the solutions to the aforementioned problems.

    Teaching methods
    • Face-to-face lectures
    • Exercises (exercises, database, software etc.)
    • Case studies /Incidents (traditional, online)
    DETAILS

    Beyond the traditional classroom lectures, the teaching method adopts practical sessions using the statistical software R to solve the problems previously illustrated. More specifically, during these sessions students use their pc’s to solve several problems together with the instructor. A real-world dataset is used throughout all the course, thus providing an exhaustive example (with respect to the course contents) of a practical statistical analysis.


    Assessment methods
      Continuous assessment Partial exams General exam
  • Written individual exam (traditional/online)
  •   x x
    ATTENDING AND NOT ATTENDING STUDENTS

    The assessment method, equal for attending and not-attending students, considers two alternative ways: 1) three partial exams, 2) a general exam.

    1. Two Partial Exams (PE1,PE2)  are traditional written exams (at most 31/30), while in the third one  using the R software (PR), the students are asked to conduct a short data analysis session to answer some questions. This last partial exam is worth at most 4 points that are added to the weighted average grade of the remaining two partial exams. Thus the final mark is given by: [ (PE1+PE2)/2]*(27/31) + PR.

    2. A general written exam (at most 31/30). The exam contains explicit questions on the code of the R software, on its working principles and on the interpretation of its output. The R-related questions are worth 4 points. A total grade of 31/30 is equivalent to 30/30 cum laude.

    Both forms of the exam aim at assessing:

    • The ability to identify the proper methodology to solve a given problem.
    • The understanding of the logic underlying a certain procedure.
    • The ability to compute appropriate statistical measures with both a pocket calculator and a statistical software.
    • The ability of suggesting and implementing with R a statistical model, consistent with both the assumptions stated and the data at hand.
    • The ability to understand the output from the software.

    Teaching materials
    ATTENDING AND NOT ATTENDING STUDENTS
    • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistics for Business and Economics, Pearson/Prentice Hall, 8th global edition. 
    • Additional material document on Frequency Distributions, available on the Bboard platform.

    • Specific material on the use of the R software are available on the Bboard platform since the beginning of the course.
    Last change 05/07/2019 16:09

    CLEACC (8 credits - I sem. - OB  |  SECS-S/01)
    Course Director:
    EUGENIO MELILLI

    Classes: 12 (I sem.)
    Instructors:
    Class 12: REBECCA GRAZIANI

    Class group/s taught in English

    Mission & Content Summary
    MISSION

    The course has two main purposes. First, the course aims at introducing the statistical tools assumed as indispensable for an undergraduate student in economics. Second, the course intends to enhance modelling capabilities needed for a better understanding of social and economic phenomena and for dealing with decisions under uncertainty. The different topics are introduced starting from real situations and phenomena in order to stress the applied relevance of the concepts and methodological tools. Students are introduced to the use of the software R for the presentation and the analysis of economic and business data.

    CONTENT SUMMARY

    Elements of descriptive statistics:

    • Statistical variables, population and sample.  Data representation and analysis through tables and charts. Frequency distributions.
    • Measures of position, dispersion, concentration and association.

    Elements of probability theory:

    • Discrete and continuous random variables. Probability distributions. Expected value and variance. Binomial  and Gaussian distributions.
    • Independent random variables, central limit theorem.

    Elements of statistical inference:

    • Point and interval estimation of means and proportions. Interval length and confidence level.
    • Hypothesis testing on means, proportions and difference of means. Level of a test. P-value. Test of independence.

    Regression models:

    • Simple linear regression. Inference on the parameters of the model. Testing the significance of the independent variable. Variability decomposition and R-square. Prediction.
    • Multiple linear regression. Inference on the parameters of the model. Testing the significance of each independent variable, of a group of variables and of the overall model. Variability decomposition and R-square. Prediction.

    Intended Learning Outcomes (ILO)
    KNOWLEDGE AND UNDERSTANDING
    At the end of the course student will be able to...
    • Understand and distinguish the different types of data and the different techniques of analysis, both in a descriptive setting (through indicators and plots) and in an inferential one (using appropriate statistical models).
    APPLYING KNOWLEDGE AND UNDERSTANDING
    At the end of the course student will be able to...
    • Appropriately summarize datasets, estimate unknown population parameters and test hypothesis on them starting from sample data, construct simple statistical models (such as regression models) designed to study the relationships among variables. Give valid answers to research questions and help taking decisions using sample data.
       

    Teaching methods
    • Face-to-face lectures
    • Exercises (exercises, database, software etc.)
    DETAILS

    Exercises  devoted to the analysis of  data are proposed throughout the whole course, with particular enphasis on data coming from fields of primary  interest for this course; to this aim the software R is used on a regular basis. Students are invited  to take an active part in the analysis using their own notebook.


    Assessment methods
      Continuous assessment Partial exams General exam
  • Written individual exam (traditional/online)
  • x   x
    ATTENDING STUDENTS

    The overall exam includes 3 in itinere partial tests (with multiple choice questions) and a final written exam (with exercises and open-ended questions). Both the partial tests and the final exam require the use of the statistical software R on PC / notebook to answer some questions and solve some exercises. All the  parts of the exam aim to ascertain the students' knowledge of the main probabilistic and statistical tools necessary for the analysis of economic and business phenomena and their ability to apply them.

    Each of the 3 partial tests in itinere assigns a  score between 0 and 3;  the final written exam assigns a  score between 0 and 22. The final grade is obtained as the sum of the 4 scores, possibly rounded to the nearest integer number (in excess if the sum has a decimal part equal to 0.5). The exam is passed if the sum (possibly rounded as specified above) is at least 18; there is no minimum score required in the individual parts of the exam.

    NOT ATTENDING STUDENTS

    The exam is written  (with exercises, open-ended questions and multiple-choice questions). It requires, for the answer to some questions and the solution of some exercises, the use of the statistical software R on PC /notebook. The exam aims to ascertain the students' knowledge of the main probabilistic and statistical tools necessary for the analysis of economic and business phenomena and their ability to apply them.

    The written exam assigns a score between 0 and 31; this score represents the final grade.


    Teaching materials
    ATTENDING AND NOT ATTENDING STUDENTS
    • P. NEWBOLD, W.L. CARLSON, B.M. THORNE, Statistics for Business and Economics, Pearson, 2013, 8th edition.
    • Teaching notes available on Bboard.
    • Exercises, datasets and further material available on Bboard.
    Last change 22/07/2019 19:23

    Classi: 11 (I sem.)
    Docenti responsabili delle classi:
    Classe 11: EUGENIO MELILLI

    Classe/i impartita/e in lingua italiana

    Mission e Programma sintetico
    MISSION

    Il corso ha essenzialmente due obiettivi: da una parte si propone di fornire allo studente quegli strumenti statistici ritenuti indispensabili nella preparazione di un laureato in materie economico-aziendali e utili ai fini dello svolgimento della tesi di laurea. Dall'altra parte, il corso mira a favorire nello studente la formazione della capacità di modellizzazione della realtà, necessaria per l'analisi quantitativa di fenomeni economici e sociali e per la conseguente predisposizione di strumenti idonei per l'assunzione di decisioni in condizioni di incertezza. La presentazione degli argomenti è motivata da situazioni e fenomeni reali, in modo da porre in evidenza l'applicabilità dei concetti e delle metodologie introdotte, con particolare attenzione ai settori di primario interesse nel corso di laurea. Nel corso si fa uso del software statistico R per la presentazione e l'analisi di dati e fenomeni di natura economica ed aziendale.

    PROGRAMMA SINTETICO

    Elementi di statistica descrittiva:

    • Unità e carattere statistico. Popolazione e campione. Tipologie di dati.
    • Raccolta, analisi e rappresentazione di dati attraverso tabelle e grafici. 
    • Misure di posizione, di variabilità, di concentrazione, di associazione.

    Elementi di calcolo delle probabilità:

    • Variabili aleatorie discrete e continue. Distribuzioni di probabilità. Valore atteso e varianza. Distribuzione binomiale e distribuzione gaussiana.
    • Variabili aleatorie indipendenti e teorema centrale del limite.

    Elementi di inferenza statistica:

    • Stima puntuale e mediante intervalli di confidenza di medie e proporzioni. Coefficiente di confidenza e lunghezza di un intervallo.
    • Verifica di ipotesi sulla media, sulla proporzione e sulla differenza di medie. Livello di un test. P-value. Test di indipendenza.

    Modelli di regressione:

    • Modello di regressione lineare semplice. Problemi inferenziali sui parametri del modello di regressione. Test per la significatività della variabile esplicativa. Scomposizione della variabilità e coefficiente di determinazione. Previsione.
    • Modello di regressione lineare multipla. Problemi inferenziali sui parametri del modello di regressione. Test per la significatività delle singole variabili esplicative, di gruppi di variabili e del modello nel suo complesso. Uso di variabili esplicative qualitative. Scomposizione della variabilità e coefficiente di determinazione. Previsione.

    Risultati di Apprendimento Attesi (RAA)
    CONOSCENZA E COMPRENSIONE
    Al termine dell'insegnamento, lo studente sarà in grado di...
    • Comprendere e distinguere le diverse tipologie di dati e le relative tecniche di analisi, sia in ambito descrittivo (attraverso indicatori e grafici), sia in ambito inferenziale (mediante l'uso di opportuni modelli statistici).
    CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
    Al termine dell'insegnamento, lo studente sarà in grado di...
    • Sintetizzare e descrivere in modo appropriato un insieme di dati; costruire modelli probabilistico-statistici per rappresentare ed analizzare fenomeni reali; usando tali modelli, inferire, sulla base di dati campionari, su  parametri incogniti della  popolazione di interesse; rispondere, sempre partendo da informazioni campionarie,  a domande di ricerca; usare informazioni provenienti da indagini campionarie per orientare le decisioni in ambito economico-aziendale.

    Modalità didattiche
    • Lezioni frontali
    • Esercitazioni (esercizi, banche dati, software etc.)
    DETTAGLI

    Durante l'intero corso vengono svolti esercizi in cui sono proposte analisi di dati effettuate con il software R. Gli studenti possono partecipare in modo attivo a tali analisi, usando in aula il proprio notebook.


    Metodi di valutazione dell'apprendimento
      Accertamento in itinere Prove parziali Prova generale
  • Prova individuale scritta (tradizionale/online)
  • x   x
    STUDENTI FREQUENTANTI

    L'esame prevede 3 prove parziali in itinere (con domande a risposta multipla) ed una prova scritta finale (con esercizi e domande a risposta aperta). Tanto le prove parziali in itinere quanto la prova finale richiedono, per la risposta ad alcune domande e la risoluzione di alcuni esercizi, l'uso del software statistico R su PC/notebook. Tutte le prove suddette si propongono di accertare la conoscenza e la capacità di applicazione, da parte degli studenti, dei principali strumenti probabilistici e statistici necessari per l'analisi di fenomeni  economico-aziendali.

    Ciascuna delle 3 prove in itinere assegna un punteggio variabile tra 0 e 3; la prova scritta finale assegna un punteggio variabile tra 0 e 22. Il voto finale è ottenuto come somma dei 4 punteggi, eventualmente arrotondata all'intero più vicino (per eccesso nel caso in cui la somma abbia una parte decimale uguale a 0.5). L'esame è superato se la somma (eventualmente arrotondata come precisato sopra)  è almeno 18; non vi è alcun punteggio minimo richiesto nelle singole prove ai fini del superamento dell'esame.

    STUDENTI NON FREQUENTANTI

    L'esame prevede una singola  prova scritta  (con esercizi e domande a risposta aperta e domande a risposta multipla). La prova scritta richiede, per la risposta ad alcune domande e la risoluzione di alcuni esercizi, l'uso del software statistico R su PC/notebook. La prova suddetta si propone di accertare la conoscenza e la capacità di applicazione, da parte degli studenti, dei principali strumenti probabilistici e statistici necessari per l'analisi di fenomeni  economico-aziendali.

    La prova scritta  assegna un punteggio variabile tra 0 e 31; questo punteggio rappresenta il voto finale.


    Materiali didattici
    STUDENTI FREQUENTANTI E NON FREQUENTANTI
    • P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, Pearson/Prentice Hall, 2010, 2° edizione.
    • Note didattiche, esercizi e altro materiale disponibile su Bboard.
    Modificato il 10/07/2019 11:45