mail unicampaniaunicampania webcerca

    Luigi RUSSO

    Insegnamento di LABORATORIO DI BIO-INFORMATICA

    Corso di laurea in SCIENZE BIOLOGICHE

    SSD: ING-INF/05

    CFU: 6,00

    ORE PER UNITÀ DIDATTICA: 48,00

    Periodo di Erogazione: Secondo Semestre

    Italiano

    Lingua di insegnamento

    ITALIANO

    Contenuti

    Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi. Secondo Modulo: principali tipi di dati in Python con relative operazioni e metodi di conversione; Algoritmi e diagrammi di flusso; Logica booleana e istruzioni di controllo del flusso; Inserimento dati; Struttura dati complessa; Tuple; Manipolazione di set di dati; Gestione degli errori; cicli while e for; Funzioni e parametri; variabili globali e locali; i moduli della Standard Library e quelli accessibili tramite pip; Come creare e utilizzare ambienti virtuali. Terzo Modulo: Proteomi e proteine. Annotazione funzionale di proteine. Interazioni proteiche. Banche dati: sequenze proteiche-Uniprot, motivi funzionali proteici-PROSITE ed ELM, strutture proteiche-PDB e PDBe, interazioni proteiche-IntAct/MINT e STRING. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche. Strutture proteiche: livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura: diffrazione ai raggi X e Spettroscopia di risonanza magnetica nucleare (NMR). Predizione della struttura delle proteine: struttura secondaria e terziaria. Metodi per l’analisi delle strutture proteiche. Software per l’ analisi e la visualizzazione della struttura delle proteine. Dinamica e docking molecolare.

    Testi di riferimento

    Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi-
    Fondamenti di bioinformatica-Zanichelli
    Stefano Pascarella, Alessandro Paiardini-
    Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli
    https://www.python.org/doc/
    https://www.python.it/doc/

    Obiettivi formativi

    Il presente corso fornirà i concetti di base della bioinformatica al fine di consentire un’analisi critica di dati genomici e proteomici. Il corso si articola in tre parti (moduli). Nella prima parte lo studente acquisirà concetti di base di programmazione e conoscenze di metodologie per l’allineamento di sequenze, l’analisi di dati di espressione genica e l’analisi di proteine. Nella seconda parte del corso, lo studente acquisirà le basi della programmazione in Python e sarà in grado di sviluppare programmi che prendono l'input dell'utente e lo elaborano. Inoltre, lo studente imparerà come archiviare e manipolare i dati e creare programmi in base a requisiti specifici. Nella terza parte del corso, lo studente apprenderà conoscenze approfondite relative all’uso di programmi di grafica molecolare e sarà in grado di accedere alle banche dati disponibili in rete per: l’ analisi delle strutture proteiche ottenute mediante X-ray e NMR; l’uso di informazioni strutturali per progettare esperimenti di mutazione sito diretta, la predizione della struttura secondaria e terziaria delle proteine mediante homology modeling, la predizione della struttura tridimensionale di complessi proteici mediante tecniche di molecular docking.

    Prerequisiti

    Conoscenza dei principi di base di biologia molecolare e strutturale, genetica e biochimica.

    Metodologie didattiche

    - Lezioni frontali in aula su tutti gli argomenti del corso. Le lezioni sono svolte mediante l’ausilio della lavagna e mediante la proiezione di diapositive

    Metodi di valutazione

    Esame orale.

    Altre informazioni

    Lo studente potrà avvalersi del materiale didattico (dispense, esercizi, ecc.) messo a disposizione sul sito web del Dipartimento di Scienze e Tecnologie Ambientali Biologiche e Farmaceutiche (https://www.distabif.unicampania.it/dipartimento/docenti/)
    Il docente è disponibile per ricevimento studenti nei giorni indicati sulla scheda insegnamento e su richiesta inoltrata via e-mail.

    Programma del corso

    Primo modulo: Genomi, genomica e avvento della bioinformatica. Informatica di base: algoritmi, linguaggi di programmazione e basi di dati. Inferenza statistica: test d’ipotesi parametrici e non parametrici. Allineamento tra sequenze. Sequenziamento degli acidi nucleici: Tecniche di sequenziamento NGS, formato dei dati genomici. Ricostruzione e annotazione di genomi. Analisi del trascrittoma: annotazioni di geni e trascritti alternativi, approcci sperimentali per l’analisi del trascrittoma, analisi di dati RNA-Seq, analisi dei livelli di espressione genica, funzione dei geni differenzialmente espressi.
    Secondo Modulo: principali tipi di dati in Python con relative operazioni e metodi di conversione; Algoritmi e diagrammi di flusso; Logica booleana e istruzioni di controllo del flusso; Inserimento dati; Struttura dati complessa; Tuple; Manipolazione di set di dati; Gestione degli errori; cicli while e for; Funzioni e parametri; variabili globali e locali; i moduli della Standard Library e quelli accessibili tramite pip; Come creare e utilizzare ambienti virtuali con venv.
    Terzo Modulo: Proteomi e proteine. Annotazione funzionale di proteine. Interazioni proteiche. Banche dati: sequenze proteiche-Uniprot, motivi funzionali proteici-PROSITE ed ELM, strutture proteiche-PDB e PDBe, interazioni proteiche-IntAct/MINT e STRING. Metodi bioinformatici per l’analisi di sequenze proteiche: descrittori di elementi funzionali nelle sequenze proteiche. Strutture proteiche: livelli di descrizione delle strutture proteiche, metodi sperimentali per la determinazione della struttura: diffrazione ai raggi X e Spettroscopia di risonanza magnetica nucleare (NMR). Predizione della struttura delle proteine: struttura secondaria (reti neurali artificiali), struttura terziaria (modeling comparativo o homology modeling, threading). Predizione della struttura terziaria mediante il metodo I-TASSER. Metodi per l’analisi delle strutture proteiche: Ordine e disordine, confronto di strutture, metodi strutturali per l’annotazione funzionale. Software per l’ analisi e la visualizzazione della struttura delle proteine: PyMoL, CHIMERA, PROCHECK. Interazioni proteiche: metodi per l’analisi delle interazioni proteiche (interferenza per omologia, mutazioni correlate, profili filogenetici, similarità di alberi filogenetici, prossimità genomica, espressione correlata, docking). Software per il docking molecolare: Autodock, Dockthor. Interazione tra proteine e ligandi: analisi strutturale delle interazioni.

    English

    Teaching language

    Italian

    Contents

    First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes.
    Second module: The main data types in Python with related operations and conversion methods; Algorithms and flowcharts; Boolean logic and flow control instructions; Data input; Complex data structure; Tuples; Dataset manipulation; Error handling; While and for loops; Functions and parameters; global and local variables; the modules of the Standard Library and those accessible via pip; How to create and use Virtual Environments with venv.
    Third module: Proteomes and proteins. Functional aspects of proteins. Protein interactions. Protein databases: protein sequences (Uniprot), functional structural motifs of proteins (PROSITE and ELM), protein structures (PDB and PDBe), protein interactions (IntAct/MINT and STRING). Bioinformatics methods for protein sequence analysis: descriptors of functional elements in protein sequences. Protein structures: description of the structural organization of protein structures; experimental methods for protein structural determination: X-Ray and Nuclear Magnetic Resonance (NMR) spectroscopy. Prediction of the secondary and tertiary structure. Methods for analyzing protein structures. Molecular Dynamics simulations and Molecular Docking.

    Textbook and course materials

    Manuela Helmer Citterich, Fabrizio Ferrè, Giulio Pavesi , Graziano Pesole, Chiara Romualdi-
    Fondamenti di bioinformatica-Zanichelli
    Stefano Pascarella, Alessandro Paiardini-
    Bioinformatica Dalla sequenza alla struttura delle proteine- Zanichelli
    https://www.python.org/doc/
    https://www.python.it/doc/

    Course objectives

    This course will provide the basic concepts of bioinformatics aiming a critical analysis of genomic and proteomic data. The course is divided in three parts (modules). In the first part of the course, the student will acquire basic programming concepts and knowledge of methodologies for the alignment of sequences, the analysis of gene expression data and the analysis of proteins. During the second module, the student will learn the basics of programming in python, and will be able to develop programs that take user input and process it. In addition, the student will learn how to store and manipulate data, and build programs according to specific requirements. In the last part of the course, the student will learn in-depth knowledge related of the use of molecular graphics software and he will be able to access to the on-line databases for: the structural analysis of protein structures obtained via X-ray and NMR; the use of conformational information to design direct site mutation experiments; the prediction of the secondary and tertiary structure of proteins by homology modeling methodologies; the prediction of the 3D structure of protein-protein and protein-ligand complexes using molecular docking techniques.

    Prerequisites

    Knowledge of the basic principles of molecular and structural biology, genetics and biochemistry.

    Teaching methods

    - Frontal lectures on all course topics. The lectures are performed with the help of the blackboard and by the projection of slides

    Evaluation methods

    Oral examination

    Other information

    The student will be provided with learning material available on the website of Department of Environmental, Biological and Pharmaceutical Sciences and Technologies (https://www.distabif.unicampania.it/dipartimento/docenti/).
    The professor is available to receive the students in the days indicated in their syllabus or after a student request via e-mail.

    Course Syllabus

    First module: Genomes, genomics and the advent of bioinformatics. Basic computer science: algorithms, programming languages and databases. Statistical inference: parametric and non-parametric hypothesis tests. Alignment between sequences. Nucleic acid sequencing: NGS sequencing techniques, genomic data format. Reconstruction and annotation of genomes. Transcriptome analysis: annotations of genes and transcripts, experimental approaches for transcriptome analysis, analysis of RNA-Seq data, analysis of gene expression levels, functions of differentially expressed genes.
    Second module: The main data types in Python with related operations and conversion methods; Algorithms and flowcharts; Boolean logic and flow control instructions; Data input; Complex data structure; Tuples; Dataset manipulation; Error handling; While and for loops; Functions and parameters; global and local variables; the modules of the Standard Library and those accessible via pip; How to create and use Virtual Environments with venv.
    Third module: Proteomes and proteins. Functional aspects of proteins. Protein interactions. Protein databases: protein sequences (Uniprot), functional structural motifs of proteins (PROSITE and ELM), protein structures (PDB and PDBe), protein interactions (IntAct/MINT and STRING). Bioinformatics methods for protein sequence analysis: descriptors of functional elements in protein sequences. Protein structures: description of the structural organization of protein structures; experimental methods for protein structural determination: X-Ray and Nuclear Magnetic Resonance (NMR) spectroscopy. Prediction of the secondary (artificial neural networks) and tertiary (homology modeling, threading) protein structure. 3D structural prediction using the I-TASSER methodology. Methods for analyzing protein structures: Order and disorder, comparison of protein structures, structural methods for functional annotation. Software for the analysis and visualization of the protein structure: PyMol, CHIMERA, PROCHECK. Protein interactions: methods for analyzing protein interactions ( homology interference, related mutations, phylogenetic profiles, similarities of phylogenetic trees, genomic proximity, related expression, docking). Software for molecular docking studies: Autodock, Dockthor. Protein-ligand interactions: structural analysis of protein interaction networks.

    facebook logoinstagram buttonyoutube logotype