Open reading frame
La Open Reading Frame (sigla ORF) è la parte (o sequenza) di DNA o RNA che codifica per una proteina. In un gene le ORF si trovano comprese fra la sequenza di inizio (codone d'inizio) e la sequenza di stop (codone di terminazione).
Le ORF vengono normalmente individuate spostandosi lungo i frammenti di DNA durante la ricerca della localizzazione di un gene Considerando che vi sono oganismi che presentano delle variazioni nella sequenza del codone d'inizio, la ricerca di una ORF può essere differente, sfruttando ad esempio degli algoritmi basati costruiti su tutti i codici genetici esistenti (inclusi quelli alterati) e su tutte le possibili modalità di lettura.
È risaputo che, l'esistenza di una ORF, particolarmente se lunga, è una buona indicazione della presenza di un gene nella sequenza posta nelle immediate vicinanze. In tal caso, la ORF stessa fa parte della sequenza che verrà tradotta dai ribosomi, comprendendo in tutta la sua lunghezza anche le parti che verranno eliminate prima della sintesi proteica, vale a dire gli introni.
La ricerca delle ORF nei procarioti e negli eucarioti
Una volta stabilita la sequenza del gene è importante determinare la ORF corretta. Per gli organismi con DNA a doppia elica, la sequenza può essere stabilita in sei modalità di lettura, tre in un verso e tre nel verso opposto. Negli organismi procarioti, la sequenza più lunga che risulta priva di un codone di terminazione costiutuisce di fatto una ORF.
Più problematico è il caso degli organismi eucarioti in quanto la maggior parte del DNA contenuto in una ORF (quella costituita dagli introni appunto), non viene tradotta; questa è la ragione per cui, in questo caso, una ORF può essere trovata soltanto andando ad analizzare l' mRNA una volta sottoposto al processo di splicing.