Genom Analyse

Genom Analyse


B-modul, Efterår 2001, 2 point, 10 ECTS

Målsætning
At beskrive problemer, metoder og resultater i analysen af strukturinformation i protein- og DNA-sekvenser.

Baggrund: Den store vækst af kendte DNA (og protein) sekvenser og strukturer, gør analysen af disse data til en vigtig disciplin.

Kurset er metodeorienteret: 60% metoder og modeller og 40% til resultater af disse analyser. Mange af metoderne anvender en del matematik, algoritmer og statistik, dog intet som ikke kan forstås med Mat A, som baggrund.

Kurset har fokus på funktionelle/strukturelle (og ikke evolutionære) aspekter af sekvensanalysen og skulle dermed være af speciel relevans for molekylærbiologer, biostrukturkemikere og biokemikere.

0. Introduktion til feltet.

Hvilke data er til rådighed og hvad er hovedproblemerne i deres analyse.

1. Sekvenssammenligning (Alignment):

Parvis strengsammenligning (alignment). Sammenligning af mange sekvenser (Multiple Alignment). Søgning i database. Statistisk signifikans af sekvensligheder. Afstandsmatricer for aminosyrer.

2. Strukturforudsigelse:

RNA sekundærstruktur forudsigelse - energiminimering (baseparringsmaximering) og koblede substitutioner. Forudsigelsen af proteiners sekundærstruktur. Proteinfoldningsproblemet: Teoretiske modeller og empiriske resultater. Homologimodellering: Givet to (eller flere) homologe sekvenser hvor kun den enes struktur er kendt, hvad kan man så sige om den andens struktur? Hvor tæt beslægtede skal sekvenser være for at homologimodellering kan anvendes? Hvis man har rekonstrueret den molekylære evolution af en mængde homologe sekvenser,hvad kan man så sige om deres struktur? Molekylær Dynamik: Computersimulationer af makromolekylers bevægelser og interaktioner. Vurdering af strukturforudsigelsers kvalitet: CASP - symposierne.

3. Struktursammenligning:

Sammenligning af 3-dimensionelle proteinstrukturer. Sammenligning af RNA-sekundærstrukturer. Kombineret strukturforudsigelse og struktursammenligning. Docking: Passer 2 givne proteinstrukturer ind i hinanden. Passer en sekvens til en given struktur ("Threading")?

4. Microarray data analyse:

Datamining værktøjer, Clustering, Bayesian Networks, Rekonstruktion af Regulatoriske Pathways, Udledning af funktionen af ukendte gener.

5. Genomprojekter. 

Homo sapiens, C. elegans, gær, Whole genome assembly, Sammenligning af genomer. Søgning efter gener i genomiske sekvenser. Søgning efter regulatoriske sekvenser. Rekonstruktion af Metabolske Pathways. Funktionel Klassifikation af gener.

Form og omfang
Ugentlig i 11 uger: 2 timers foredrag + 3 timers diskussion/gennemgang af artikler eller computerøvelser.

Litteratur
Udleverede særtryk.

Lærere
Leif Schauser, Mikkel Schierup fra Center for Bioinformatik (BiRC) og gæsteforelæsere.


Eksamensform
Mundtlig eksamen med ekstern censur.