mail unicampaniaunicampania webcerca

    Sandro STRUMIA

    Insegnamento di BIOMETRIA

    Corso di laurea in SCIENZE AGRARIE E FORESTALI

    SSD: BIO/03

    CFU: 6,00

    ORE PER UNITÀ DIDATTICA: 48,00

    Periodo di Erogazione: Secondo Semestre

    Italiano

    Lingua di insegnamento

    ITALIANO

    Contenuti

    Variabili nelle Scienze agrarie e forestali: variabili qualitative e quantitative, scale di misura. Disegno sperimentale: popolazione statistica, campione statistico, unità di campionamento, osservazione. Rappresentazione dei dati: diagrammi a barre, a torta, istogrammi, curve di distribuzione. Statistiche descrittive: indici di centralità dei dati (media, mediana e moda), indici di variabilità (varianza, deviazione standard, errore standard). Statistica inferenziale: T-test, Analisi della Varianza, correlazione e regressione lineare. Analisi multivariate. Matrici di dati. Classificazione gerarchica: indici di similarità e dissimilarità. Criteri agglomerativi. Costruzione di dendrogrammi. Ordinamento. Analisi dei Componenti Principali. Biplot. Uso ed interpretazione dei risultati di statistiche sia semplici che multivariate in campo agronomico e forestale.

    Testi di riferimento

    Whitlock M.C and Schluter, D., 2010. Analisi statistica dei dati biologici. Zanichelli
    Podani J., 2007 - Analisi ed esplorazione dei dati in ecologia e biologia. Liguori Editore, Napoli.
    Dispense e materiale didattico distribuito a lezione

    Obiettivi formativi

    Lo studente acquisirà conoscenze su: metodologie statistiche semplici (descrittive ed inferenziali) necessarie per l’analisi di sistemi agronomici e forestali a diversa complessità e statistiche multivariate (classificazione ed ordinamento). Attraverso un approccio pratico-applicativo si vogliono fornire le nozioni di base della biometria indispensabili sia per affrontare l’analisi di dati provenienti da una ricerca originale su sistemi agronomici e forestali che per leggere in maniera più consapevole i risultati di ricerche pubblicate su riviste scientifiche.
    In particolare lo studente sarà capace di:
    • Riconoscere tipo e caratteristiche di variabili agronomiche e forestali e di diversi tipi di universi campionari, campioni e unità di campionamento .
    • Analizzare e gestire dati raccolti in agroecosistemi ed in foreste usando sia tecniche di statistica semplice (descrittiva ed inferenziale) che multivariata.
    • Interpretare e commentare i risultati di statistiche riportati nella letteratura scientifica con particolare riferimento a quelli provenienti da sistemi agronomici e forestali anche di natura complessa.

    Prerequisiti

    Conoscenze di base della Biologia

    Metodologie didattiche

    Il corso consiste di 30 ore di lezioni frontali con l’ausilio di slides e di 18 ore di esercitazioni numeriche in cui le statistiche illustrate nelle lezioni frontali vengono usate per analizzare dati di ecosistemi agrari e forestali provenienti dalla letteratura scientifica e dai risultati delle analisi di campo condotte durante l’esercitazione del modulo di Ecologia generale
    La presenza non è obbligatoria, ma fortemente raccomandata soprattutto per le esercitazioni numeriche

    Metodi di valutazione

    Durante il corso viene effettuato un test in progress. Esame scritto finale: l’esame consiste di cinque o sei domande contenenti sia esercizi numerici che l’interpretazione dei risultati delle statistiche (semplice e multivariate) applicate a dati agronomici e forestali
    Il tempo a disposizione varia tra 45 e 60minuti in funzione della complessità degli esercizi proposti
    Il voto è dato in 30/30; il valore viene successivamente ponderato in funzione del numero di CFU (6) del modulo di Biometria; pertanto esso contribuisce per 5/10 alla valutazione finale dell’esame
    L’esame si considera superato se le risposte corrette superano il 60%

    Programma del corso

    Introduzione alla biometria. Le variabili biometriche: definizioni ed esempi. Osservazioni individuali. Unità di campionamento. Popolazione statistica e popolazione biologica. Universo campionario discreto e continuo. Campione di osservazioni. Tecniche di campionamento di dati biologici. Il design sperimentale. Bias
    Tabelle di dati biometrici e matrici di dati grezzi. Rappresentazione grafica dei dati. Frequenze. Distribuzioni di frequenza di dati ecologici. Curva di distribuzione normale e sue caratteristiche. Forma della curva di distribuzione normale. Curva gaussiana e nicchia ecologica. Curve asimmetriche: caratteristiche e significato biologico. Normalizzazione e trasformazione dei dati.
    Statistiche descrittive in ambito ambientale. Statistiche di centralità. Statistiche di dispersione. Significato, uso ed interpretazione di statistiche descrittive in ambito biologico. Interpretazione della variabilità in biometria.
    Statistica inferenziale. Concetto di significatività statistica. Ipotesi nulla ed ipotesi di lavoro. Test parametrici e non parametrici. T-test o t di Student. Calcolo del t-test con numero uguale o differente di osservazioni. Errore del I e del II tipo. F-test. Analisi della varianza (ANOVA), filosofia generale del test e campi di applicazione. Calcolo dell’ANOVA ad un fattore. Confronto del risultato con i valori tabulati. Interpretazione di risultati di ANOVA aduna ed a più vie.
    Relazioni tra variabili. Correlazione e regressione lineare: differenze teoriche e significato statistico. Significatività statistica della correlazione. Applicazioni in campo biologico.
    Differenze teoriche tra statistica semplice e multivariata - nicchia ecologica e nicchia di comunità- - matrici di dati come rappresentazione di spazi iperdimensionali - Funzioni e matrici di somiglianza: indici di similarità, dissimilarità e correlazione – indici per dati binari: Jaccard, Sorensen, – indici per dati quantitativi Distanza Euclidea - matrici di somiglianza - procedure per il calcolo delle matrici di similarità.
    Procedure per la graficizzazione dei risultati – classificazione gerarchica – criteri agglomerativi – legame medio, singolo e completo - realizzazione di dendrogrammi – valutazione dei dendrogrammi.
    Analisi diretta ed indiretta dei gradienti – ordinamento – teoria dell’ordinamento e della riduzione delle dimensioni di una matrice – Tecnica di Bray & Curtis – Analisi dei Componenti Principali.
    Interpretazione dei risultati. Uso di tecniche grafiche e di statistiche semplici per l'interpretazione dei risultati.

    English

    Teaching language

    Italian

    Contents

    Variables in agronomy and forestry: qualitative and quantitative variables, Scales of measurement. Experimental design: statistical population, sample, unit sample, observation. Presenting data: bar chart, pie chart, histogram, distribution curve. Descriptive statistics: measuring the average (mean, median, mode) and variability (variance, standard deviation, standard error). Inferential statistics: T-test, Analysis of Variance, Correlation, Linear regression. Multivariate statistics. Raw data matrix. Hierarchical classification: similarity and dissimilarity indexes. Agglomerative methods. Dendrograms procedure. Ordination. Principal Component Analysis. Biplot. Use and interpretation of results of both simple and multivariate statistics performed in agronomy and forestry.

    Textbook and course materials

    Whitlock M.C and Schluter, D., 2010. Analisi statistica dei dati biologici. Zanichelli
    Podani J., 2007 - Analisi ed esplorazione dei dati in ecologia e biologia. Liguori Editore, Napoli.
    Further teaching material provided by the professor

    Course objectives

    Students will gain knowledge about the simple statistics (descriptive and inferential) needed to analyze agronomical and forestry systems, as well as multivariate statistics (classification and ordination). Aim of this course is to convey the basics of biometry to analyze experimental data of original researches on agroecosystems and forests and to better understand results reported in scientific papers.
    In particular the student will be able to:
    • Recognize types and characteristics of different agronomical and forestry variable types as well as sampling universe, sample, sampling units
    • Process and manage dataconcerning both forests and agroecosystems using both simple and multivariate statistics
    • Interpret and comment results of descriptive and inferential statistics reported in scientific literature and applied to environmental data, particularly concerning biological and ecological systems.

    Prerequisites

    Basic knowledges of Biology

    Teaching methods

    The course consists of 30 hours of lectures with slides and 18 hours of numerical exercises. In the numerical exercise the statistics explained in the lectures are practically applied to environmental data derived from both scientific literature and in original field sampling activities.
    Attendance is not mandatory, although it is strongly encouraged with particular reference to the numerical exercises.

    Evaluation methods

    During the course a midterm test is carried out. Final examination: one written test: the test is made up of 4 questions concerning both numerical exercise and interpretation of results of statistics applied to environmental data.
    Time available: between 45 and 60 minutes, depending on the complexity of the exercises
    The grading is in 30/30; the minimum mark (18/30) is gained if at least 60% of the answers are correct. The value is weighted according to the number of the CFU (6) of the Biometry module. Therefore, it contributes for 5/10 of the total grading. The exam is considered passed (18/30) only if correct answers are more than 60%

    Course Syllabus

    Introduction to main topics of Biometry. Biometric variables: types and characteristics. Individual observations, sample unit, observation. Statistical and biological populatione. Sample: definition and dimansion. Sampling methods. Experimental design. Bias.
    Raw data matrix. Graphical representation. Frequency distribution curve of ecological data. Gaussian or "bell-shaped" curve. Ecological niche and data matrices. Asymmetric distribution of ecological data. Management of not normally distributed data: normalization and standardization
    Descriptive statistics in environmental science. Centrality statistics. Mean, median, mode. Dispersion statistics. Standard deviation. Standard error. Coefficient of Variance. Use of descriptive statistics in environmental and ecological context.
    Inferential statistics. Significance in statistic. Null and work hypothesis. Parametric and not parametric tests. T-test applied to both equal and different sample dimension. Type I and type II error in statistic. F-test. One-way and two-way ANOVA. Output of ANOVA. Interpretation of ANOVA outputs.
    Relationships between environmental variables. Correlation and regression of variable. Pearson correlation index. Use of correlation in biology and ecology.
    Theoretical and practical differences between simple and multivariate statistics – Species and community ecological niche – Data matrix as hyperdimensional space –similarity and dissimilarity indexes – indexes for presence/absence data: Jaccard, Sorensen – indexes for quantitative data: Euclidean distance. Resemblance matrix – Calculation of resemblance matrices.
    Plotting the results: hierarchical classification. Agglomerative methods – Average, single and complete linkage – plotting dendrograms – Evaluation of resulting dendrograms.
    Direct and indirect gradient analysis – Ordination as reducing matrix dimension tool – Bray and Curtis method – Principal Component Analysis
    Interpretation of results – Simple and inferential statistics as interpretative tools of multivariate results.

    facebook logoinstagram buttonyoutube logotype