Bioinformatica

branca della biologia che si occupa di raccogliere, archiviare ed analizzare mediante banche dati informazioni biologiche

La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici.

Essa costituisce un tentativo di descrivere dal punto di vista numerico e statistico i fenomeni biologici: storicamente ed epistemologicamente la biologia ha fatto minor ricorso ad un approccio matematico rispetto ad altre discipline scientifiche (quali fisica e chimica). La bioinformatica quindi tenta di supplire a questa lacuna fornendo ai risultati tipici della biochimica e della biologia molecolare un corredo di strumenti analitici e numerici. Vengono coinvolte, oltre all'informatica, la matematica applicata, la statistica, chimica e biochimica e nozioni di intelligenza artificiale.

La bioinformatica principalmente si occupa di:

  • fornire modelli statistici validi per l'interpretazione dei dati provenienti da esperimenti di biologia molecolare e biochimica al fine di identificare tendenze e leggi numeriche
  • generare nuovi modelli e strumenti matematici per l'analisi di sequenze di DNA, RNA e proteine al fine di creare un corpus di conoscenze relative alla frequenza di sequenze rilevanti, la loro evoluzione ed eventuale funzione.
  • organizzare le conoscenze acquisite a livello globale su genoma e proteoma in basi di dati al fine di rendere tali dati accessibili a tutti, e ottimizzare gli algoritmi di ricerca dei dati stessi per migliorarne l'accessibilità.

L'evoluzione storica della bioinformatica, che inizialmente si occupava principalmente dello studio del DNA e RNA, ha portato ad un così vasto uso dell'informatica in molti settori della biologia che è stato coniato il nuovo termine, ormai universalmente accettato, di Biologia Computazionale che esplicita con maggior chiarezza e precisione i reali e più vasti contenuti scientifici e disciplinari del connubio tra informatica e biologia nel XXI secolo.

Gli attuali ambiti di ricerca includono l'allineamento di sequenze, la predizione genica, l'allineamento di sequenze proteiche, la predizione di struttura proteica, l'espressione genica e l'interazione proteina-proteina.

Aree di ricerca

Analisi di sequenze

  Lo stesso argomento in dettaglio: Sequenziamento e Allineamento di sequenze.

Dopo il sequenziamento del DNA del fago Phi X 174 nel 1977, i genomi di centinaia di organismi sono stati sequenziati e salvati in database. Le informazioni vengono analizzate per determinare il quali geni codificano polipeptidi. Il confronto di geni all'interno di una specie, o tra specie differenti, può mostrare similarità tra la funzione di proteine e relazione tra le specie.

L'analisi di sequenze è stata resa possibile da diversi algoritmi specializzati. Tra i primi furono Needleman e Wunsh nel 1970, e Smith e Watermann nel 1981. L'obiettivo era comparare due o più sequenze di amino acidi ed evidenziare identità, similarità (sostituzioni conservative) e disuguaglianze (sostituzioni, inserimenti e rimozioni). Da questi programmi poi ne sono stati messi a punto altri, che hanno permesso alla bioinformatica di evolversi nel tempo e dare un contributo fondamentale nell'attuazione dei progetti di mappatura dei genomi dei viventi. L'allineamento di sequenze è una variante di questo problema, ed è utilizzato anche nel sequenziamento.

La tecnica di sequenziamento detta shotgun (usata, per esempio, dall'Institute for Genomic Research per il sequenziamento del primo genoma batterico, Haemophilus influenzae) non riporta una lista di nucleotidi, ma una sequenza di migliaia di frammenti di DNA, ognuno lungo da 600 a 800 nucleotidi. Le estremità di questi frammenti possono essere sovrapposte e, una volta allineate nel modo giusto, rappresentano l'intero genoma. Questo tipo di sequenziamento è molto rapido, ma la ricostruzione del genoma a partire dai frammenti diventa presto molto complicata per grandi genomi. Lo shotgun è il metodo di sequenziamento maggiormente usato, e lo sviluppo di algoritmi per l'allineamento dei frammenti è un'area di critica importanza nella ricerca bioinformatica.

Annotazione genica

L'annotazione a livello genetico è il processo che consiste nel mappare geni ed altre caratteristiche biologiche all'interno di una sequenza di DNA. Il primo software per l'annotazione genica fu sviluppato nel 1995 dal Dr. Owen White, membro del team che ha sequenziato ed analizzato per primo genoma del batterio Haemophilus influenzae. White creò un programma per trovare geni, RNA transfer ed altre caratteristiche, e per assegnare loro identificazioni.

Annotazione proteica

L'annotazione a livello proteico è il processo che consiste nel mappare caratteristiche biologiche all'interno di una sequenza proteica.

- Annotazione manuale Swiss-Prot - Annotazione automatica TrEMBL Algoritmi di data mining che estrapolano informazioni da database di proteine annotate manualmente (Swiss-Prot) applicate poi a sequenze di proteine non ancora annotate (TrEMBL). I sistemi di annotazione automatica a loro volta si suddividono in: - completamente automatici - semi-automatici

Biologia evolutiva computazionale

Biodiversità

Analisi dell'espressione genica

L'espressione di molti geni può essere determinata misurando i livelli di mRNA con varie tecniche, tra cui microarray di DNA, expressed sequence tag ed altre. Tutte le tecniche sono soggette ad errori e contaminazioni. Vengono perciò ricercati modi per distinguere i segnali dalle interferenze. Un esempio è la determinazione di geni coinvolti in una determinata patologia: si possono confrontare i dati dei microarray di cellule epiteliali cancerose e di cellule non colpite dal cancro per determinare la regolazione di fattori in una particolare popolazione di cellule cancerose.

Espressione proteica

Analisi di mutazioni cancerogene

Predizione di struttura proteica

Predizione di funzione proteica

Simulazione di sistemi biologici

La simulazione di sistemi biologici è una disciplina nata negli ultimi anni per fornire un approccio più moderno allo studio dei sistemi biologici che ha come scopo di modellarne il comportamento, oltre che esclusivamente la loro struttura come avviene nell'approccio riduttivo tipico della bioinformatica statica.

Servizi sul web

Molte applicazioni nel campo della bioinformatica hanno interfacce basate su SOAP e REST, che consentono l'accesso ad algoritmi, dati e risorse su server in tutto il mondo. I principali servizi sono classificati dall'Istituto Bioinformatico Europeo in software di ricerca, allineamento di multiple sequenze, e analisi.

Collegamenti esterni

Template:Link AdQ

  Portale Biologia: accedi alle voci di Wikipedia che trattano di biologia

Template:Link AdQ