30001 - STATISTICA / STATISTICS
Department of Decision Sciences
For the instruction language of the course see class group/s below
RAFFAELLA PICCARRETA
Classe 1: ELENA POLI, Classe 2: EMILIANO SIRONI, Classe 3: GIANNA SERAFINA MONTI, Classe 4: MATTIA VITTORIO ORESTE COZZI, Classe 5: ELENA POLI, Classe 6: MATTIA VITTORIO ORESTE COZZI
Classe/i impartita/e in lingua italiana
Conoscenze pregresse consigliate
Mission e Programma sintetico
MISSION
PROGRAMMA SINTETICO
Il corso si articola nei seguenti punti:
- Raccolta, organizzazione e descrizione dei dati tramite distribuzioni di frequenza, grafici e indici.
- Studio delle relazioni fra due caratteri.
- Inferenza statistica e variabilità campionaria.
- Teoria della stima puntuale e per intervallo.
- Verifica di ipotesi.
- Modello di regressione lineare semplice e multiplo.
Tutte le tecniche descrittive e inferenziali descritte nel corso verranno applicate utilizzando il software statistico R– e in particolare l’ambiente di sviluppo integrato (IDE) RStudio. Il corso prevede quindi anche lezioni dedicate all'introduzione e all'utilizzo del software
Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
- Comprendere la diversa natura dei dati.
- Distinguere le tecniche di analisi descrittiva da quelle inferenziali ed essere in grado di identificare quella più appropriata per il problema oggetto di studio.
- Riconoscere semplici modelli statistici.
- Utilizzare il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per svolgere analisi dei dati
CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
- Sintetizzare in modo appropriato un insieme di dati.
- Stimare e verificare ipotesi su parametri non noti di una popolazione a partire da dati campionari.
- Costruire modelli di regressione per studiare le relazioni fra le diverse variabili di interesse.
- Utilizzare il software R/RStudio per determinare le soluzioni dei precedenti problemi.
Modalità didattiche
- Lezioni
- Esercitazioni pratiche
DETTAGLI
L'attività di insegnamento-apprendimento di questo corso prevede, oltre alle tradizionali lezioni frontali, lezioni/esercitazioni in cui si utilizza il software R – e in particolare l’ambiente di sviluppo integrato (IDE) RStudio – per analizzare le diverse tecniche statistiche illustrate. In particolare, durante le esercitazioni e i tutoraggi gli studenti dovranno utilizzare il loro pc per condurre insieme al docente analisi dei dati volte alla risoluzione di specifici problemi, e interpretare i risultati ottenuti.
Metodi di valutazione dell'apprendimento
Accertamento in itinere | Prove parziali | Prova generale | |
---|---|---|---|
|
x | x |
STUDENTI FREQUENTANTI
I metodi di valutazione dell'apprendimento per studenti frequentanti sono gli stessi indicati per gli studenti non frequentanti, a cui si rimanda.
Tuttavia, al fine di incentivare la partecipazione attiva degli studenti alle lezioni, gli studenti che soddisfano tutte le seguenti condizioni:
- frequentano almeno il 75% delle lezioni (esclusivamente in presenza) nella prima parte del corso (prima della prima prova parziale), e registrano la propria presenza esclusivamente durante la lezione
- frequentano almeno il 75% delle lezioni (esclusivamente in presenza) nella seconda parte del corso (dopo la prima prova parziale), e registrano la propria presenza esclusivamente durante la lezione
- superano l’esame nelle sessioni di gennaio o febbraio,
riceveranno 1 punto aggiuntivo che si sommerà al punteggio finale ottenuto (media delle due prove parziali o voto conseguito nella prova generale). Si noti che tale punto aggiuntivo non contribuisce all’attribuzione della lode.
Gli studenti che registrano impropriamente la propria presenza in aula e che non risultano presenti nel caso di verifica dell'attendance in aula – oltre alle conseguenze chiarite nell’Honor Code – perderanno insindacabile tale punto aggiuntivo. Lo stesso vale per studenti che svolgono altre attività durante le lezioni e/o che disturbano l’attività didattica. Si richiede quindi una partecipazione attenta e attiva alle lezioni.
STUDENTI NON FREQUENTANTI
La valutazione dell’apprendimento degli studenti si basa su un esame scritto in cui gli studenti devono fornire risposte motivate a quesiti teorici, risolvere esercizi tradizionali (carta e penna) a partire da informazioni di sintesi, riportare e commentare i risultati di analisi dei dati svolte utilizzando il software R/Rstudio
L’esame mira a verificare
· La corretta comprensione degli strumenti statistici utilizzati
· La capacità di identificare la metodologia corretta per risolvere un dato problema.
· La comprensione della logica sottostante una determinata procedura.
· La capacità di calcolare specifici indicatori statistici a mano e con il software.
· La capacità di proporre un modello statistico, coerente con le ipotesi e con i dati assegnati, e di implementarlo in R/RStudio.
· La capacità di interpretare l'output del software.
Tutti gli studenti senza eccezioni, quindi sia frequentanti che non frequentanti e sia in corso che in debito d’esame possono sostenere l’esame in due modalità
1. due prove parziali, ognuna valutata con un punteggio massimo pari a 31/30, ciascuna superata se il voto conseguito è maggiore o uguale a 15. Se entrambe le prove sono superate, il voto finale nell’esame è dato dalla media dei voti nelle due prove, e l'esame è superato se il voto finale è almeno 18. Sono ammessi a sostenere la seconda prova parziale solo gli studenti che hanno superato la prima prova parziale.
2. un’unica prova generale valutata con un punteggio massimo pari a 31/30, e l'esame è superato se tale voto risulta maggiore o uguale a 18.
Gli studenti provenienti da altre università che devono integrare l'esame e coloro che hanno diritto a misure compensative sono pregati di consultare il syllabus del corso per ulteriori informazioni e istruzioni riguardanti l'organizzazione della loro prova d'esame
Materiali didattici
STUDENTI FREQUENTANTI E NON FREQUENTANTI
E' in corso la stesura di una dispensa ad uso degli studenti dell'università. I dettagli verranno resi disponibili sul syllabus.
Solo nel caso in cui per cause di forza maggiore non si fosse in grado di completare la stesura di tale dispensa, il libro di testo di riferimento rimane quello utilizzato negli scorsi anni:
P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, 9/Ed. Pearson (2021).
Materiali integrativi e materiale specifico sull'uso del software R saranno resi disponibili sulla piattaforma Bboard.
RAFFAELLA PICCARRETA
Class 14: ALESSANDRO RECLA, Class 15: PIERALBERTO GUARNIERO, Class 16: MARTA ANGELICI, Class 17: DANIELE TONINI, Class 18: VALERIO LANGE', Class 19: LUCA MOLTENI, Class 40: FILIPPO TRENTINI, Class 41: RAFFAELLA PICCARRETA, Class 42: RENATA TRINCA COLONEL, Class 43: FILIPPO TRENTINI
Class group/s taught in English
Suggested background knowledge
PREREQUISITES
Mission & Content Summary
MISSION
CONTENT SUMMARY
The course covers the following topics:
- Collection, management and summary of data using frequency distributions, graphical representations and summaries.
- Study of the relationship between two variables.
- Statistical inference and sampling variability.
- Theory of point estimation and confidence intervals.
- Hypothesis testing.
- Simple and multiple regression models
Note that all the descriptive and inferential tools introduced during the course will be applied to data using the statistical software R - and in particular the integrated development environment (IDE) RStudio. Therefore some lessons will be dedicated to the software.
Intended Learning Outcomes (ILO)
KNOWLEDGE AND UNDERSTANDING
- Recognize different types of data.
- Understand the difference between the tools of descriptive and inferential statistics, and identify the most suitable approach for the problem at hand.
- Recognize simple statistical models.
APPLYING KNOWLEDGE AND UNDERSTANDING
- Properly summarize a dataset.
- Estimate, and test hypotheses on, the unknown parameters of a population on the basis of sample data.
- Build simple and multiple regression models to study the relationships between variables of interest.
- Use the R software to address the aforementioned issues.
Teaching methods
- Lectures
- Practical Exercises
DETAILS
Beyond traditional classes, the course features hands-on classes, where the statistical software R - and in particular the integrated development environment (IDE) RStudio - is used to apply basic statistical analyses to data. More specifically, during these sessions students will use their laptop to address specific issues, and to interpret the obtained results.
Assessment methods
Continuous assessment | Partial exams | General exam | |
---|---|---|---|
|
x | x | |
|
x | x |
ATTENDING STUDENTS
The assessment methods for attending students are the same as those outlined for non-attending students, to which reference is made.
However, in order to encourage active participation in class, students who meet all of the following conditions:
1. Attend at least 75% of the classes (exclusively in person) during the first part of the course (i.e., before the first midterm), and register their attendance only during the lecture;
2. Attend at least 75% of the classes (exclusively in person) during the second part of the course (i.e., after the first midterm), and register their attendance only during the lecture;
3. Pass the exam in the January or February exam sessions;
will be awarded 1 additional point, which will be added to the final score (either the average of the two midterms or the score obtained in the general exam).
Please note that this additional point does not contribute to the awarding of honours (cum laude).
Students who falsely register their presence in class and are found to be absent upon attendance verification – in addition to the consequences outlined in the Honor Code – will automatically forfeit the additional point.
The same applies to students who engage in unrelated activities during class or disrupt the learning environment.
Active, attentive, and respectful participation in lectures is therefore required.
NOT ATTENDING STUDENTS
The assessment method is based on a written exam; students will answer theoretical questions, solve traditional “paper and pencil” derivation exercises (questions based on aggregated data), report and comment the results obtained by analysing data using the software R/Rstudio
The exam aims at assessing:
· The understanding of the statistical tools introduced and used in the course
· The ability to identify the proper methodology to solve a given problem.
· The understanding of the logic underlying a certain procedure.
· The ability to compute appropriate statistical measures with both a pocket calculator and a statistical software.
· The ability of suggesting and implementing with R a statistical model, consistent with both the assumptions stated and the data at hand.
· The ability to understand the software output.
All the students, both those attending and not attending, as well as current and in debt students, can take the exam in two ways.
1) two midterm exams, each graded with maximum 31 points. Each midterm is passed with a grade higher or equal to 15. If both the midterms are passed, the final grade is the average of the points taken in the midterms. Only students who passed the first midterm can take the second midterm.
2) one general exam, graded with 31/30 points maximum. The exam is passed with a grade higher than or equal to 18.
Students from other universities who need to integrate the exam, as well as students entitled to compensatory accommodations, are strongly encouraged to consult the course syllabus for detailed information about the exam structure and requirements
Teaching materials
ATTENDING AND NOT ATTENDING STUDENTS
A textbook tailored for the use of students at this university is currently being drafted. Further details will be made available in the course syllabus.
Only in the event that the preparation of this textbook cannot be completed, the official reference textbook will remain the one adopted in previous years:
P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistics, Milan, 9th Ed., Pearson (2021).
Supplementary materials and resources specifically related to the use of R software will be made available on the Bboard platform.