Grundlæggende Bioinformatik

Grundlæggende Bioinformatik

Forår 2003,

Målsætning

At beskrive problemer, metoder og resultater i analysen af strukturinformation i protein- og DNA-sekvenser.

 

Baggrund

Den store vækst af kendte DNA (og protein) sekvenser og strukturer, gør analysen af disse data til en vigtig disciplin.

Kurset er metodeorienteret: Vi vil gennemgå problemstillinger med udgangspunkt i biologiske sekvenser og strukturer. Der lægges vægt på opstilling af en model for at kunne løse et problemet. Basale algoritmer vil blive presenteret. Derudover har kurset en praktisk vinkel: Der vil blive presenteret en række computer værktøjer som effektivt kan løse problemerne.

 

1. Introduktion til feltet.

Hvilke data er til rådighed og hvad er hovedproblemerne i deres analyse.

 

2. Sekvenssammenligning:

Parvis strengsammenligning (alignment). Sammenligning af mange sekvenser (multiple alignment). Søgning i databaser. Statistisk signifikans af sekvensligheder.  Substitutionsmatricer for aminosyrer.

 

3. Strukturforudsigelse:

RNA sekundærstruktur forudsigelse - energiminimisering (baseparingsmaximering) og koblede substitutioner. Forudsigelsen af proteiners sekundærstruktur. Proteinfoldningsproblemet: Teoretiske modeller og empiriske resultater. Vurdering af strukturforudsigelsers kvalitet: CASP – symposierne.

 

4. Genfinding: Hvilke biologiske signaler kan bruges til opstilling af statistiske modeller til forudsigelse af genstrukturer. Hvordan validerer man resultaterne?

 

5. Struktursammenligning:

Sammenligning af 3-dimensionelle proteinstrukturer. Kombineret strukturforudsigelse og struktursammenligning. Passer en sekvens til en given struktur (“Threading”)?

 

6. Microarray data analyse:

Datamining værktøjer, Clustering, Rekonstruktion af Regulatoriske Pathways Udledning af funktionen af ukendte gener.

 

7. Genomprojekter:

Whole genome assembly. Sammenligning af genomer. Søgning efter gener i genomiske sekvenser. Søgning efter regulatoriske sekvenser. Rekonstruktion af Metabolske Pathways. Funktionel klassifikation af gener.

 

Undervisningsform

Ugentlig i 11 uger: 3 timers foredrag + 3 timers computerøvelser.

 

Lærere

Leif Schauser, Christian Storm og Mikkel Schierup fra Center for Bioinformatik (BiRC).

 

Litteratur

David Mount: Bioinformatics: Sequence and genome analysis, original litteratur.

 

Eksamensform

Mundtlig eksamen med karakter efter 13 skala.