Forår 2003,
Målsætning
At beskrive problemer, metoder og resultater i analysen af strukturinformation i protein- og DNA-sekvenser.
Baggrund
Den store vækst af kendte DNA (og protein) sekvenser og strukturer, gør analysen af disse data til en vigtig disciplin.
Kurset er metodeorienteret: Vi vil gennemgå problemstillinger med udgangspunkt i biologiske sekvenser og strukturer. Der lægges vægt på opstilling af en model for at kunne løse et problemet. Basale algoritmer vil blive presenteret. Derudover har kurset en praktisk vinkel: Der vil blive presenteret en række computer værktøjer som effektivt kan løse problemerne.
1. Introduktion til feltet.
Hvilke data er til rådighed og hvad er hovedproblemerne i deres analyse.
2. Sekvenssammenligning:
Parvis strengsammenligning (alignment). Sammenligning af mange sekvenser (multiple alignment). Søgning i databaser. Statistisk signifikans af sekvensligheder. Substitutionsmatricer for aminosyrer.
3. Strukturforudsigelse:
RNA sekundærstruktur forudsigelse - energiminimisering (baseparingsmaximering) og koblede substitutioner. Forudsigelsen af proteiners sekundærstruktur. Proteinfoldningsproblemet: Teoretiske modeller og empiriske resultater. Vurdering af strukturforudsigelsers kvalitet: CASP – symposierne.
4. Genfinding: Hvilke biologiske signaler kan bruges til opstilling af statistiske modeller til forudsigelse af genstrukturer. Hvordan validerer man resultaterne?
5. Struktursammenligning:
Sammenligning af 3-dimensionelle proteinstrukturer. Kombineret strukturforudsigelse og struktursammenligning. Passer en sekvens til en given struktur (“Threading”)?
6. Microarray data analyse:
Datamining værktøjer, Clustering, Rekonstruktion af Regulatoriske Pathways Udledning af funktionen af ukendte gener.
7. Genomprojekter:
Whole genome assembly. Sammenligning af genomer. Søgning efter gener i genomiske sekvenser. Søgning efter regulatoriske sekvenser. Rekonstruktion af Metabolske Pathways. Funktionel klassifikation af gener.
Undervisningsform
Ugentlig i 11 uger: 3 timers foredrag + 3 timers computerøvelser.
Lærere
Leif Schauser, Christian Storm og Mikkel Schierup fra Center for Bioinformatik (BiRC).
Litteratur
David Mount: Bioinformatics: Sequence and genome analysis, original litteratur.
Eksamensform
Mundtlig eksamen med karakter efter 13 skala.