Scienze Geologiche (lauree triennali classe 34; lauree magistrali classe 74)
Info: dipterr@unipr.it      0521 905326
 Corsi di insegnamento: Elementi di Statistica Logout
 

Elementi di Statistica

 

Anno accademico 2014/2015

Docente Prof. Lamberto Soliani (Titolare del corso)
Anno 2° anno
Corso di studi Scienze Geologiche primo livello (34)
Tipologia Affine o integrativo
Crediti/Valenza 6
SSD BIO/07 - ecologia
Erogazione Tradizionale
Lingua Italiano
Frequenza Facoltativa
Valutazione Orale
Periodo didattico Primo semestre
Storico Anni precedenti
 

Obiettivi formativi del corso

Il corso non richiede una formazione approfondita di matematica, ma solamente una cultura di livello liceale. Introduce alla logica dell’inferenza statistica, con illustrazione della teoria e applicazione dei test più diffusi nella ricerca e nella professione delle discipline scientifiche; mostra l'impiego di software statistico, per rendere familiare la gestione e l’elaborazione di dati.

 

Risultati dell'apprendimento

Riconoscere i diversi tipi di scala usati nella rilevazioni dei dati, analizzare le caratteristiche della distribuzione di dati uni variati e bivariati, discutere l’ipotesi da verificare, scegliere il test più adatto, illustrare le affinità e le differenze tra metodi parametrici e non parametrici. Dimostrare di avere acquisito un livello di apprendimento sufficiente per l’uso dei metodi riportati nei testi e nei manuali statistici internazionali.

 

Attività di supporto

Uso di un programma informatico gratuito di riconosciuta validità internazionale. Ad esempio:  PAleontological STatistics: www.nhm.uio.no/norlex/past/download.html

 

 

Note

Ricevimento per spiegazioni.   Tutti i giorni, dopo aver fissato ora, inviando mail: lamberto.soliani@unipr.it  o tel. 0521/905662

Valutazione - Modalità dell’esame: Colloquio orale con discussione di esempi, per verificare l’apprendimento dei concetti e dei metodi della statistica inferenziale, la capacità di illustrare gli output informatici e di interpretarne i risultati. Il voto dipende dalla entità del programma studiato, dalla correttezza dell’ipotesi formulate, della procedura statistica usata, delle conclusioni e del linguaggio scientifico.

 

 

Programma

 

1 - Tipi di scala e di misurazione. Statistica descrittiva per distribuzioni univariate. Costruzione delle tabelle e rappresentazione grafiche per variabili quantitative e variabili qualitative: istogrammi, poligoni, rettangoli distanziati, diagrammi circolari. I pittogrammi e il lie factor. Indici di tendenza centrale, di dispersione, di simmetria e di curtosi. Numero di decimali e di cifre significative.

Esercizi di statistica descrittiva con uso del programma PAST.

 

2 - Calcolo combinatorio, distribuzione binomiale, poissoniana, ipergeometrica. La distribuzione normale e la normale ridotta. Esercizi con uso della normale ridotta e delle tabelle z.

 

3 - Confronti tra tassi e probabilità. La distribuzione chi quadrato. Test per la bontà dell’adattamento; condizioni di validità e correzione di Yates. Tabelle di contingenza 2 x 2 e R x C, per campioni piccoli e grandi: metodo esatto di Fisher e test z in tabelle 2 x 2.

Il metodo G o log-likelihood ratio nei test per la bontà dell’adattamento e in tabelle di contingenza.

Esercizi sul test chi-quadrato per la bontà dell’adattamento e in tabelle di contingenza con PAST

 

4 - Errore alfa e errore beta; potenza a priori e a posteriori. Stima delle dimensioni dei campioni per il confronto tra medie con la distribuzione normale. Numero di dati per una misura con la precisione desiderata

 

5 - La distribuzione t di Student. Test per la media di un campione e intervallo di confidenza della media. Confronto tra le medie di due campioni dipendenti e di due campioni indipendenti. Test per l’omogeneità della varianza; test F, test di Bartlett, test di Levene. Cenni sui metodi per il confronto tra due medie con varianze differenti. Stima delle dimensioni minime dei due campioni, con la distribuzione t e la distribuzione z. Il bilanciamento di 2 campioni.

Esercizi sul test t di Student con il programma PAST, con varianze uguali e diverse.

 

6 - Analisi della varianza (ANOVA) a un criterio (one-way): il confronto tra due o più medie. Distribuzione F di Fisher-Snedecor e relazione con la distribuzione t di Student. Condizioni di validità dell’ANOVA  e test per l’omoschedasticità con k campioni: test di  Hartley, test di Cochran, test di Bartlett, test di Levene e sue varianti. Confronti multipli a priori o pianificati; confronti multipli a posteriori o post-hoc: il rischio alfa e il principio di Bonferroni; i metodi Bonferroni-Dunn, HSD di Tukey, SNK e i metodi sequenziali, il test di Dunnett, il test Duncan. Applicazioni dell’ANOVA e dei confronti multipli con il programma PAST.

Esercizi sull’ANOVA con il programma PAST.

 

7 - Analisi della varianza con due (two way) e con più criteri crossed. Metodi per ridurre il numero di osservazioni: i quadrati latini. Efficienza relativa di un disegno sperimentale. La perdita di dati in tabelle a due o più fattori crossed. Analisi dell’interazione tra due fattori, con misure ripetute. Interpretazione dell’interazione, con rappresentazioni grafiche. Analisi gerarchica o nested a due e a più livelli. Interazione nell’ANOVA a più fattori, crossed, nested e mista.

Assunzioni di validità dell’ANOVA, trasformazioni dei dati; il metodo di Box-Cox per la trasformazione più adeguata.

 

8 - Statistica descrittiva per distribuzioni bivariate. Regressione lineare semplice: stima del coefficiente angolare b e dell’intercetta a; significatività e intervallo di confidenza del coefficiente angolare e dell’intercetta. Scelta del campione per la significatività del coefficiente angolare e dell’intercetta. Il coefficiente di determinazione R-quadro. La regressione per l’origine: vantaggi e svantaggi. La predizione inversa o calibrazione. Confronto tra i coefficienti angolari di due campioni indipendenti. Concetti sull’analisi della covarianza (confronti tra medie di Y con X diversi).

La regressione lineare con Y ripetute. Calcolo dei termini della regressione mediante i coefficienti polinomiali. Test di linearità con Y ripetute, in campioni non bilanciati. Cenni sulla regressione pesata per la varianza e il numero di dati;  sua calibrazione.

La correlazione: stima dell’indice di correlazione r di Pearson e sua significatività. Relazioni tra coefficiente angolare b e indice r di correlazione lineare. Intervallo di confidenza di r. La correlazione parziale o netta.

Applicazioni della regressione lineare e della correlazione con il programma PAST.

 

9 - Test per un campione: test delle successioni; test dei segni; test di Wilcoxon; intervallo di confidenza di una mediana; test di casualizzazione. Il test di Kolmogorv-Sminov.

Test per due campioni dipendenti: test dei segni, test T di Wilcoxon, test di casualizzazione.

Test per due campioni indipendenti: test della mediana, test T di Wilcoxon-Mann-Whitney, test U di Mann-Whitney, test di casualizzazione; il test di Levene non parametrico per differenze nella variabilità.

Test per k campioni: test della mediana; test di Kruskal-Wallis o ANOVA non parametrica a un criterio: test di Friedman o ANOVA non parametrica a due criteri; test di Jonckheere-Terpstra; test di Page.

La correlazione non parametrica; rho di Spearman e tau di Kendall.

La retta non parametrica o retta robusta di Theil.

 

 

 

 

 

 

 

Testi consigliati e bibliografia

 

Dispense consigliate.

A)  Per la statistica parametrica:

Lamberto Soliani (2008) Statistica applicata. UNI.NOVA, Parma. (pagg. X + 694);

  ISBN:978-88-6319-041-0;  www.uninova.net

B)  Per la statistica non parametrica:

Soliani Lamberto (2008) I test non parametrici più citati nelle discipline scientifiche, UNI.NOVA, Parma. (pagg. VII + 828);   ISBN: 978-88-6319-022-9;   www.uninova.net

Edite dalla casa editrice di testi universitari UNINOVA di Parma, gruppo Pegaso Libreria;Via Cavedani, 7

Tel. 0521-290245  -  Fax  0521-291661  -  E-mail:  libreria@gruppopegaso.it

 

Testi internazionali di riferimento:

- Sokal R. R. and F. J. Rohlf (1995). Biometry, 3rd Edition. W. H. Freeman & Co.,New York.

- Zar Jerrold (2010). Biostatistical Analysis, Fifth Edition. Pearson Education International.

 

Testi internazionali gratuiti in rete

- EPA 530/R-09-007, March 2009, Statistical Analysis of Groundwater Monitoring Data at RCRA Facilities. Unified Guidance, EnvironmentalProtection Agency,United States (pp. 888).

- EM 1110-1-4014, 31 Jan 2008, Environmental Quality - ENVIRONMENTAL STATISTICS, Department of the Army, U. S. Army Corps of Engineers (pp. 544).

 

 

 

 

Orario lezioniV

GiorniOreAula
Martedì14:30 - 16:30Aula A Dipartimento di Bioscienze - Cascina Ambolana
Mercoledì14:30 - 16:30Aula A Dipartimento di Bioscienze - Cascina Ambolana
Lezioni: dal 08/10/2013 al 31/01/2014


 

Materiale didattico

Test online

Vai a Moodle

Visita i forum

Registrati al corso

Studenti registrati

Ultimo aggiornamento: 18/07/2014 10:58
HOMEDuplica il recordPrimoPrecedenteSuccessivoUltimoPS