30595 - STATISTICA / STATISTICS
Department of Decision Sciences
For the instruction language of the course see class group/s below
EUGENIO MELILLI
Classe/i impartita/e in lingua italiana
Mission e Programma sintetico
MISSION
PROGRAMMA SINTETICO
Elementi di statistica descrittiva:
- Unità e carattere statistico. Popolazione e campione. Tipologie di dati.
- Raccolta, analisi e rappresentazione di dati attraverso tabelle e grafici.
- Misure di posizione, di variabilità, di concentrazione, di associazione.
Elementi di calcolo delle probabilità:
- Variabili aleatorie discrete e continue. Distribuzioni di probabilità. Valore atteso e varianza. Distribuzione bernoulliana e distribuzione normale (o gaussiana).
- Variabili aleatorie indipendenti e teorema centrale del limite.
Elementi di inferenza statistica:
- Stima puntuale e mediante intervalli di confidenza di medie e proporzioni. Coefficiente di confidenza e lunghezza di un intervallo.
- Verifica di ipotesi sulla media, sulla proporzione e sulla differenza di medie. Livello di un test. P-value. Test di indipendenza.
Modelli di regressione:
- Modello di regressione lineare semplice. Problemi inferenziali sui parametri del modello di regressione. Test per la significatività della variabile esplicativa. Scomposizione della variabilità e coefficiente di determinazione. Previsione.
- Modello di regressione lineare multipla. Problemi inferenziali sui parametri del modello di regressione. Test per la significatività delle singole variabili esplicative, di gruppi di variabili e del modello nel suo complesso. Uso di variabili esplicative qualitative. Scomposizione della variabilità e coefficiente di determinazione. Previsione.
Risultati di Apprendimento Attesi (RAA)
CONOSCENZA E COMPRENSIONE
Comprendere e distinguere le diverse tipologie di dati e le relative tecniche di analisi, sia in ambito descrittivo (attraverso indicatori e grafici), sia in ambito inferenziale (mediante l'uso di opportuni modelli statistici).
CAPACITA' DI APPLICARE CONOSCENZA E COMPRENSIONE
Sintetizzare e descrivere in modo appropriato un insieme di dati; costruire modelli probabilistico-statistici per rappresentare ed analizzare fenomeni reali; usando tali modelli, inferire, sulla base di dati campionari, su parametri incogniti della popolazione di interesse; rispondere, sempre partendo da informazioni campionarie, a domande di ricerca; usare informazioni provenienti da indagini campionarie per orientare le decisioni in ambito economico-aziendale.
Modalità didattiche
- Lezioni frontali
- Esercitazioni (esercizi, banche dati, software etc.)
DETTAGLI
Durante l'intero corso vengono svolti esercizi in cui sono proposte analisi di dati effettuate con il software R. Gli studenti possono partecipare in modo attivo a tali analisi, usando il proprio notebook.
Metodi di valutazione dell'apprendimento
Accertamento in itinere | Prove parziali | Prova generale | |
---|---|---|---|
|
x | x |
STUDENTI FREQUENTANTI E NON FREQUENTANTI
L'esame può essere sostenuto mediante due prove parziali oppure, in alternativa, mediante un'unica prova generale.
1) Esame con prove parziali.
Prima prova parziale: la prova include domande a risposta chiusa e domande ed esercizi a risposta aperta; alcune domande richiedono l’uso del software R. Le domande vertono sul programma del corso svolto fino all’ultima lezione che precede la pausa prevista per le prove intermedie. Il punteggio massimo della prima prova parziale è 31.
Seconda prova parziale: la prova include domande a risposta chiusa e domande ed esercizi a risposta aperta; alcune domande richiedono l’uso del software R. Le domande vertono sul programma del corso svolto a partire dalla prima lezione che segue la pausa prevista per le prove intermedie. Il punteggio massimo della seconda prova parziale è 31.
Il voto finale è ottenuto come media aritmetica (eventualmente arrotondata alla cifra intera) dei punteggi delle due prove parziali; l’esame è superato se tale voto è maggiore o uguale a 18 (non è richiesto alcun punteggio minimo nelle singole prove).
2) Esame con una prova generale.
La prova include domande a risposta chiusa e domande ed esercizi a risposta aperta; alcune domande richiedono l’uso del software R. Le domande vertono sull’intero programma del corso. Il punteggio massimo della prova generale è 31.
Le domande a risposta chiusa si propongono essenzialmente di verificare la comprensione da parte degli studenti dei concetti e delle metodologie e tecniche presentate. Le domande ed esercizi a risposta aperta si propongono essenzialmente di verificare la capacità degli studenti di distinguere le diverse tipologie di dati e le relative tecniche di analisi e di applicare correttamente queste ultime.
Materiali didattici
STUDENTI FREQUENTANTI E NON FREQUENTANTI
- Note didattiche, esercizi, dataset e altro materiale disponibile su Blackboard.
- Lettura consigliata: P. NEWBOLD, W.L. CARLSON, B. THORNE, Statistica, Milano, Pearson/Prentice Hall, 2020, 9° edizione.
Class group/s taught in English
Mission & Content Summary
MISSION
CONTENT SUMMARY
Elements of descriptive statistics
- Statistical variables, population and sample. Data representation and analysis through tables and charts. Frequency distributions.
- Measures of location, dispersion, concentration and association.
Elements of probability theory
- Discrete and continuous random variables. Probability distributions. Expected value and variance. Bernoulli and Gaussian distributions.
- Independent random variables, central limit theorem.
Elements of statistical inference
- Point and interval estimation of means and proportions. Interval length and confidence level.
- Hypothesis testing on means, proportions and difference of means. Significance level of a test. P-value. Test of independence.
Regression analysis
- Simple linear regression model. Inference on the parameters of the model. Testing the significance of an independent variable. Variability decomposition and R-square. Prediction.
- Multiple linear regression model. Inference on the parameters of the model. Testing the significance of each independent variable, of a group of variables and of the overall model. Variability decomposition and R-square. Prediction.
Intended Learning Outcomes (ILO)
KNOWLEDGE AND UNDERSTANDING
Understand and distinguish the different types of data and the different techniques of analysis, both in a descriptive setting (through indicators and plots) and in an inferential one (using appropriate statistical models).
APPLYING KNOWLEDGE AND UNDERSTANDING
Appropriately summarize datasets, estimate unknown population parameters and test hypothesis on them starting from sample data, construct simple statistical models (such as regression models) designed to study the relationships among variables. Give valid answers to research questions and help taking decisions using sample data.
Teaching methods
- Face-to-face lectures
- Exercises (exercises, database, software etc.)
DETAILS
Exercises devoted to the analysis of data are proposed throughout the whole course, with particular enphasis on data coming from fields of primary interest for this course; to this aim the software R is used on a regular basis. Students are invited to take an active part in the analysis using their own notebook.
Assessment methods
Continuous assessment | Partial exams | General exam | |
---|---|---|---|
|
x | x |
ATTENDING AND NOT ATTENDING STUDENTS
Two partial exams or a general exam
Two partial exams
The partial exams include both open-ended questions and multiple choice (closed-ended) questions. Some questions require the use of sotware R.
The first partial exam tests the students knowledge on all topics up to the last lecture (included) before the break for the exams session.
The second partial exam tests the students knowledge on all topics starting from the first lecture (included) after the break for the exams session, up to the last lecture of the course (included).
Each partial exam is graded out of 31. The final mark is the arithmetic average of the two partial exam marks. Students pass the exam if the final grade is equal or greater than 18.
General exam
The General exam tests the students knowledge on the entire course. The exam includes both open-ended questions and multiple choice (closed-ended) questions. Some questions require the use of software R.
The purpose of the closed-ended questions is mainly to test the knowledge and understanding of the concepts and methodologies presented in the course.
Open-ended questions and exercises aim essentially to test the ability to distinguish among the different types of data and to apply the analysis techniques introduced.
Teaching materials
ATTENDING AND NOT ATTENDING STUDENTS
- Teaching notes
- Slides available on Blackboard Platform for ELearning
- Blackboard tests, datasets and further material available on Blackboard Platform for ELearning
- Additional reading: P. NEWBOLD, W.L. CARLSON, B.M. THORNE, Statistics for Business and Economics, Pearson.