IN470 - Metodi Computazionali per la Biologia - AA 2016-2017
Corso
Descrizione, Programma
Programma finale del corso AA 2016-2017
Introduzione e generalità Bioinformatica e algoritmi; La biologia computazionale nella clinica e nell'industria farmaceutica; Farmacocinetica e farmacodinamica
Introduzione alla Systems Biology: cosa è la biologia computazionale; I ruoli della modellistica matematica e della bioinformatica; a cosa mira; quali sono i problemi; strumenti teorici utilizzati della bio-matematica e della bioinformatica.
Introduzione alla biologia molecolare e cellulare: conoscenza di base di genetica, proteomica e processi cellulari; ecologia ed evoluzione; le molecola base; i legami molecolari; i cromosomi; ll DNA e la sua replicazione; genomica; Il dogma centrale della biologia; analisi dei geni; la trascrizione del DNA; i vari tipi di RNA; la maturazione dell'RNA; la traduzione dell'RNA in proteine. il codice genetico; le proteine; sintesi; il folding;
Breve richiamo dei concetti principali della teoria della probabilità eventi, assiomi, variabili casuali, distribuzioni; momenti. Generazione di variabili aleatorie con distribuzione arbitraria; il metodo Acceptance/Rejection; il metodo Random Wheel Selection per la generazione di un evento con distribuzione discreta data; Calcolo della frequenza di un evento aleatorio generato al calcolatore; visualizzazione dell'istogramma di frequenze;
Introduzione alle teoria dell'informazione; Shannon entropy; conditional entropy; mutual information; diversity indexes (Shannon, Renyi entropy, richness, Simpson).
Introduzione ai processi stocastici; definizione base; esempi; modello di code; processo di Bernoulli e di Poisson; Processi Markoviani; i processi stocastici in bioinformatica e bio-matematica; l'autocorrelazione.
Cenni ai Random Walks e all'algoritmo BLAST di sequence alignment come processo stocastico;
Exact matching/string searching: generalità l'agoritmo di Knuth-Morris-Pratt Exact matching/string searching: l'agoritmo di Boyer-Moore.
Confrontare sequenze: similarità e omologia; pairwise alignment; distanza di editing; scoring matrices PAM e BLOSUM Algoritmo di Needleman-Wunsch; allineamento locale; Algoritmo Smith-Waterman; algoritmo BLAST.
Multiple Sequence Alignment; sequenza di consenso; algoritmi star alignment; ClustalW; entropy e circular sum scoring functions; Banche dati biologiche; motivazioni; formato dati; tassonomia; DB primari; DB secondari; NCBI, EMBL, DDBJ; NCBI Entrez.
Hidden Markov Models; Decoding; the Viterbi Algorithm; Evaluation; The Forward Algorithm; The Backward Algorithm; Posterior Decoding; Learning; Baum-Welch Algorithm; Uso di Hidden Markov Models per l'analisi di bio-sequenze; gene finding.
Phylogenetic Analysis; alberi filogenetici; dimensione dello spazio di ricerca di algoritmi filogenetici; Metodi di costruzione di alberi filogenetici; dati usati per l'analisi filogenetica; l'algoritmo Unweighted Pair Group Method with Arithmetic mean (UPGMA); l'algoritmo Neighbor Joining Method;
Machine Learning; generalità supervised e unsupervised learning; model selection; undefitting; overfitting; Polynomial curve fitting; machine learning come stima dei parametri ed il problema dell'overfitting; suddivisione del training set in testing e testing; concetto di bias e variance trade-off; Artificial Neural Networks; definizone; il percettrone di Rosenblatt; l'algoritmo di apprendimento del percettrone; il multi-layer perceptron; l'algoritmo di error-back propagation per l'apprendimento del MLP; tipi di neural networks; convolution networks; reinforcement networks; unsupervised learning e self-organising maps;
Cenni introduttivi alla teoria dei grafi; rappresentazione, terminologia, concetti; cammini; cicli; connettività distanza; componenti connesse; distanza; visita breadth-first search; depth-first search; algoritmo di Dijkstra; six-degree of separation; small world networks; misure di centralità degree centrality; eigenvector centrality; betweennes centrality; closeness centrality;
La network biology; generalità concetti; tipi di dati biologici usati per costruire le reti; network biology e network medicine; problemi e algoritmi usati; misure di centralità random networks; scale-free networks; preferential attachment; scale-free network in biologia;
Automi Cellulari: introduzione e cenni storici; definizione; caso uni-dimensionale; caso bidimensionale; Game of Life von Neumann replicator; cyclic CA; Greenberg-Hasting model e le Belousov-Zhabotinskii reactions; Gerard-Shuster model; HPP model of particle dynamics; software e hardware a Automi Cellulari; Esempio di CA: il modello preda-predatore;