Rosetta@home: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente

Contenuto cancellato Contenuto aggiunto

VisualeWikitesto

Versione delle 15:06, 17 lug 2017 modifica Boboviz (discussione \| contributi) 441 modifiche Aggiunto il progetto Ralph Etichetta: Modifica visuale ← Differenza precedente		Versione attuale delle 04:11, 13 mar 2025 modifica annulla FrescoBot (discussione \| contributi) Bot 3 578 450 modifiche m Bot: numeri di pagina nei template citazione
(12 versioni intermedie di 7 utenti non mostrate)
Riga 12: \|Linguaggio = \|Genere = calcolo distribuito \|Licenza = Freeware per uso accademico e no-profit, licenza commerciale disponibile<ref>{{Cita web \| titolo=Portfolio Highlight: Rosetta++ Software Suite \| editore=UW TechTransfer – Digital Ventures \| url=~~http~~https://depts.washington.edu/ventures/UW_Technology/Express_Licenses/rosetta.php \|accesso=7 settembre 2008}}</ref> \|SoftwareLibero = no \|Lingua = }} '''Rosetta@home''' è un progetto di [[calcolo distribuito]] per la previsione della struttura delle [[proteine]] sulla piattaforma [[BOINC]] (Berkeley Open Infrastructure for Network Computing), svolto al Baker laboratory all'[[Università di Washington]]. Rosetta@home si propone di prevedere le interazioni proteina-proteina e di progettare nuove proteine con l'aiuto di ~~373,024~~1.381.985 volontari, ~~1,190,556~~4.541.729 computer, per una potenza di calcolo totale di 278 [[FLOPS\|TeraFLOPS]] in media (alla data del 2922 ~~dicembre~~novembre ~~2015~~2024)<ref name="BOINCstats_RosettaOverview">{{Cita web \| titolo=Rosetta@home: Credit overview \| autore=de Zutter W \| url=~~http~~https://boinc.bakerlab.org/rosetta/\|accesso=14 dicembre 2011}}</ref>. [[Foldit]], un videogioco di Rosetta@home, mira a raggiungere questi obiettivi con un approccio di "crowdsourcing". Benché il grosso del progetto sia orientato verso la [[ricerca scientifica\|ricerca di base]] per migliorare la precisione e la robustezza dei metodi di [[proteomica]], Rosetta@home fa anche ricerca applicata sulla [[malaria]], la [[malattia di Alzheimer]] e altre patologie.<ref>{{Cita web \| titolo=What is Rosetta@home? \| sito=Rosetta@home forums \| editore=University of Washington \| accesso=7 settembre 2008 \| url=https://boinc.bakerlab.org/rosetta/rah_about.php \| urlmorto=sì \| urlarchivio=https://web.archive.org/web/20080913093155/http://boinc.bakerlab.org/rosetta/rah_about.php \| dataarchivio=13 settembre 2008 }}</ref> Come tutti i progetti BOINC, Rosetta@home utilizza le potenzialità di elaborazione inutilizzate dai computer dei volontari, per eseguire calcoli su unità di lavoro individuali. I risultati ottenuti vengono inviati a un [[server]] centrale del progetto, dove vengono convalidati ed inseriti nelle banche dati del progetto. Il progetto è multi piattaforma, e gira su una vasta gamma di configurazioni [[hardware]]. Gli utenti possono vedere il progresso delle loro previsioni della struttura della proteina sullo screensaver di Rosetta@home. Riga 22: Rosetta@Home possiede anche una versione beta del progetto, [https://ralph.bakerlab.org/ Ralph@Home], in cui vengono testati i nuovi applicativi, le nuove impostazioni e tutto ciò che verrà poi introdotto nella versione definitiva sul progetto. Oltre alla ricerca legata alle malattie, la rete di Rosetta@home funge da quadro di test per nuovi metodi di bioinformatica strutturale. Questi nuovi metodi sono poi utilizzati in altre applicazioni basate su Rosetta, come RosettaDock e il progetto [[Human Proteome Folding]], dopo essere stati sufficientemente sviluppati e giudicati stabili sull'ampio e diversificato gruppo di utenti di Rosetta@home. Due prove particolarmente importanti per i nuovi metodi sviluppati con Rosetta@home sono il Critical Assessment of Techniques for Protein Structure Prediction ([http://predictioncenter.org/ CASP]) e il Critical Assessment of Prediction of Interactions ([https://www.ebi.ac.uk/msd-srv/capri/ CAPRI]), esperimenti biennali che valutano rispettivamente lo stato dell'arte nella previsione della struttura delle proteine e dell'interazione proteina-proteina. Rosetta@home si classifica tra i principali programmi di simulazione delle interazioni tra proteine ed è uno dei migliori metodi di previsione della [[struttura terziaria]] disponibili.<ref name="CAPRI3">{{Cita pubblicazione \|autore=Lensink MF, Méndez R, Wodak SJ \|titolo=Docking and scoring protein complexes: CAPRI 3rd Edition \|rivista=Proteins \|volume=69 \|numero=4 \|pp=~~704–18~~704-18 \|anno=2007 \|mese=dicembre\|pmid=17918726 \|doi=10.1002/prot.21804 }}</ref> ==La piattaforma di calcolo== Sia l'applicazione Rosetta@home che la piattaforma di calcolo distribuito BOINC sono disponibili per Microsoft Windows, Linux e Macintosh (BOINC è disponibile anche per diverse altre piattaforme, come ad esempio FreeBSD). La partecipazione a Rosetta@home richiede un'unità centrale di elaborazione ([[CPU]]) con una velocità di clock di almeno 500 [[MHz]], ~~200~~20 ~~megabyte~~gigabyte di spazio libero sul disco, 512 megabyte di memoria [[RAM]] e una connessione a Internet. Al 1727 ~~luglio~~novembre ~~2017~~2024, la versione dell'applicazione Rosetta ~~Mini~~Beta è la 36.7306 per Windows, Mac e Linux, mentre è la 34.8320 per i dispositivi Android. La versione di BOINC consigliata è la 78.60.332. Lo standard HTTP (porta 80) viene utilizzato per la comunicazione tra il client BOINC dell'utente e i server di Rosetta@home all'Università di Washington; HTTPS (porta 443) è usato durante lo scambio di password. Il controllo remoto e locale del client BOINC usa le porte 31.416 e 1043, che potrebbero aver bisogno di essere specificamente sbloccate se sono sotto un firewall. Le unità di lavoro (Workunits), che contengono dati sulle singole proteine, sono distribuite dai [[server]] situati nel laboratorio Baker all'Università di Washington ai computer dei volontari, i quali calcolano una previsione della struttura per la proteina assegnata. Per evitare previsioni di struttura duplicate su una data proteina, ogni Workunit viene inizializzata con dei numeri casuali. Questo dà ad ogni previsione una traiettoria unica di discesa lungo il panorama energetico della proteina. Le previsioni di struttura su Rosetta@home sono approssimazioni di un minimo globale nel paesaggio energetico di una data proteina. Questo minimo globale rappresenta la conformazione più energicamente favorevole della proteina, cioè il suo stato nativo. Una caratteristica principale dell'interfaccia grafica ([[GUI]]) di Rosetta@home è un [[salvaschermo]] che mostra il progresso della workunit in esecuzione durante il processo di folding simulato. Nell'angolo in alto a sinistra dello screensaver, la proteina bersaglio è mostrata mentre adotta forme diverse (conformazioni) durante la ricerca della sua struttura a più bassa energia. Raffigurata subito a destra c'è la struttura più recente accettata. In alto a destra è mostrata la conformazione a più bassa energia finora trovata, al di sotto c'è la vera, o nativa, struttura della proteina, se è già stato determinata sperimentalmente. Tre grafici sono inclusi nello screensaver. Al centro, un grafico indica l'energia libera accettata, la quale fluttua via via che il modello accettato cambia. Un grafico della ''root mean square deviation'' (RMSD) del modello accettato, che misura quanto il modello accettato sia strutturalmente simile al modello originario, viene visualizzato a destra. Sulla destra del grafico dell'energia e sotto il grafico RMSD, i risultati di queste due funzioni vengono utilizzati per produrre il riquadro energia vs RMSD, mentre il modello viene progressivamente raffinato. Riga 38: Con il completamento del Genoma umano gli scienziati hanno soltanto una visione "piana" della struttura delle proteine (la struttura primaria sono le sequenze di aminoacidi). Per poter conoscere approfonditamente cosa fanno le proteine, gli scienziati hanno bisogno di conoscere la struttura tridimensionale delle proteine (struttura terziaria). Conoscendo le proteine in 3D, gli scienziati potranno intuire il loro ruolo nei processi delle cellule e creare terapie più efficaci nel combattere un gran numero di malattie. La struttura 3D delle proteine attualmente è scoperta in modo sperimentale nei laboratori attraverso la [[cristallografia a raggi X]] oppure attraverso la [[risonanza magnetica nucleare]]. Il processo è però molto lento (possono essere impiegate settimane o addirittura mesi per capire come cristallizzare una proteina per la prima volta) e molto costoso (circa $100'000 USD per proteina).<ref>{{Cita libro \|titolo= Structural Bioinformatics \|curatore= Bourne PE, Helge W\| anno=2003 \|città= Hoboken, NJ \| editore=Wiley-Liss \|isbn=978-0-471-20199-1 \|oclc= 50199108 }}</ref> Una volta che la struttura 3D di una proteina è completata, spesso viene depositata in un database di pubblico dominio come il [http://www.rcsb.org/ Protein Databank] o il [~~http~~https://www.ccdc.cam.ac.uk/ Cambridge Protein Structure Database]. Purtroppo, il tasso a cui nuove sequenze vengono scoperte, supera di gran lunga la determinazione della loro struttura. Di oltre 7.400.000 sequenze proteiche disponibili nel database di proteine non ridondanti in [[NCBI]], meno di ~~120~~140.000 strutture tridimensionali sono state risolte e depositate presso il Protein Data Bank, la banca dati principale per le informazioni sulla struttura delle proteine.<ref>{{Cita web \| titolo= Yearly Growth of Protein Structures \|editore= RCSB Protein Data Bank \|anno= 2008 \|accesso= 30 novembre 2008\| \|url= http://www.pdb.org/pdb/statistics/contentGrowthChart.do?content=molType-protein&seqid=100 \|urlarchivio= https://web.archive.org/web/20080928092000/http://www.pdb.org/pdb/statistics/contentGrowthChart.do?content=molType-protein&seqid=100 \|dataarchivio= 28 settembre 2008 \|urlmorto= sì }}</ref> Uno degli obiettivi principali di Rosetta@home è quello di prevedere le strutture proteiche con la stessa precisione dei metodi esistenti, ma in un modo che richiede molto meno tempo e denaro. Rosetta@home sviluppa anche metodi per determinare la struttura e l'interazione delle proteine di membrana (ad esempio, GPCR),<ref>{{Cita web \| titolo=Rosetta@home: David Baker's Rosetta@home journal (message 55893) \| autore=Baker D \|sito= Rosetta@home forums\| editore=University of Washington \|anno=2008 \|accesso=7 ottobre 2008\|url= ~~http~~https://boinc.bakerlab.org/rosetta/forum_thread.php?id=1177&nowrap=true#55893}}</ref> che sono particolarmente difficili da analizzare con tecniche tradizionali, ma che rappresentano la maggioranza degli obiettivi per i moderni farmaci. [[Image:T0281-bakerprediction overlay.png\|thumb\|left \| Il target T0281 del CASP6, la prima previsione ''ab initio'' di una struttura proteica che si è avvicinata ad una risoluzione a livello atomico. Rosetta ha prodotto un modello per T0281 (sovrapposto in magenta) con un RMSD di 1.5 Å dalla struttura cristallina (blu).]] I progressi nella previsione della struttura delle proteine sono valutati ogni due anni nel Critical Assessment of Techniques for Protein Structure Prediction (CASP), in cui ricercatori di tutto il mondo cercano di ricavare la struttura di una proteina a partire dalla sequenza dei suoi [[amminoacido\|amminoacidi]]. I gruppi di ricerca che ottengono alti punteggi in questo esperimento talvolta competitivo, sono considerati portatori di uno standard per quello che è lo stato dell'arte nella previsione della struttura delle proteine. Rosetta, il programma su cui Rosetta@home si basa, è stato utilizzato fin dal CASP5 nel 2002. Nell'esperimento CASP6 del 2004, Rosetta è passata alla storia per essere il primo programma a produrre, nel suo modello presentato per il CASP target T0281, una previsione di una struttura proteica ''ab initio'' vicina alla risoluzione a livello atomico.<ref name="R@H_ResearchOverview">{{Cita web \|sito= Rosetta@home \|titolo= Rosetta@home: Research Overview \| editore= University of Washington \|anno= 2007 \|accesso= 7 ottobre 2008 \|url= https://boinc.bakerlab.org/rosetta/rah_research.php \|urlmorto= sì \|urlarchivio= https://web.archive.org/web/20080925003459/http://boinc.bakerlab.org/rosetta/rah_research.php \|dataarchivio= 25 settembre 2008 }}</ref> La previsione ''ab initio'' è considerata una categoria di previsione di strutture particolarmente difficile, in quanto non utilizza informazioni provenienti da omologia strutturale e può contare solo su informazioni provenienti da omologia di sequenza e modellazione fisica delle interazioni all'interno della proteina. Rosetta@home è stata utilizzata nel CASP dal 2006, ed è stata tra i migliori gruppi di previsione in ogni categoria di previsione della struttura nel CASP7.<ref>{{Cita pubblicazione \|autore=Kopp J, Bordoli L, Battey JN, Kiefer F, Schwede T \|titolo=Assessment of CASP7 predictions for template-based modeling targets \|rivista=Proteins \|volume=69 Suppl 8 \|pp=~~38–56~~38-56 \|anno=2007 \|pmid=17894352 \|doi=10.1002/prot.21753 }}</ref><ref>{{Cita pubblicazione \|autore=Read RJ, Chavali G \|titolo=Assessment of CASP7 predictions in the high accuracy template-based modeling category \|rivista=Proteins \|volume=69 Suppl 8 \|pp=~~27–37~~27-37 \|anno=2007 \|pmid=17894351 \|doi=10.1002/prot.21662 }}</ref><ref name="CASP7Assessment">{{Cita pubblicazione \|autore=Jauch R, Yeo HC, Kolatkar PR, Clarke ND \|titolo=Assessment of CASP7 structure predictions for template free targets \|rivista=Proteins \|volume=69 Suppl 8 \|pp=~~57–67~~57-67 \|anno=2007 \|pmid=17894330 \|doi=10.1002/prot.21771 }}</ref> Queste previsioni di alta qualità sono state possibili grazie alla potenza di calcolo messa a disposizione dai volontari di Rosetta@home.<ref name="CASP7_baker">{{Cita pubblicazione \|autore=Das R, Qian B, Raman S, ''et al.'' \|titolo=Structure prediction for CASP7 targets using extensive all-atom refinement with Rosetta@home \|rivista=Proteins \|volume=69 Suppl 8 \|pp=~~118–28~~118-28 \|anno=2007 \|pmid=17894356 \|doi=10.1002/prot.21636 }}</ref> Un aumento della potenza di calcolo, consentirà a Rosetta@home di sondare più regioni nello spazio conformazionale (le possibili forme che una proteina può assumere), che, secondo il [[paradosso di Levinthal]], aumentano in modo esponenziale con la lunghezza della proteina. Rosetta@home è utilizzata anche nella previsione di interazioni proteiche, in cui si determina la struttura di complessi multiproteici, o [[struttura quaternaria\|strutture quaternarie]]. Questo tipo di interazioni proteiche è presente in molte funzioni cellulari, tra cui [[antigene]]-[[anticorpo]], legame [[enzima]]-[[inibitore enzimatico\|inibitore]] e import-export cellulare. Determinare queste interazioni è essenziale per lo sviluppo di farmaci. Rosetta è utilizzata nel Critical Assessment of Prediction of Interactions (CAPRI), che valuta lo stato dell'arte nel campo del docking proteico, analogamente a come il CASP misura i progressi nella previsione della struttura delle proteine. La potenza di calcolo messa a disposizione dai volontari del progetto Rosetta@home è stato considerato un fattore importante nelle prestazioni di Rosetta in CAPRI, dove le sue previsioni di docking sono state tra le più accurate e complete.<ref name="CAPRI3_1">{{Cita pubblicazione \|autore=Wang C, Schueler-Furman O, Andre I, ''et al.'' \|titolo=RosettaDock in CAPRI rounds 6-12 \|rivista=Proteins \|volume=69 \|numero=4 \|pp=~~758–63~~758-63 \|anno=2007 \|mese=dicembre\|pmid=17671979 \|doi=10.1002/prot.21684 }}</ref> All'inizio del 2008, Rosetta è stata utilizzata per la progettazione computazionale di una proteina con una funzione mai osservata in natura.<ref name="RetroAldol">{{Cita pubblicazione \|autore=Jiang L, Althoff EA, Clemente FR, ''et al.'' \|titolo=De novo computational design of retro-aldol enzymes \|rivista=Science\|volume=319 \|numero=5868 \|pp=~~1387–91~~1387-91 \|anno=2008 \|mese=marzo\|pmid=18323453 \|doi=10.1126/science.1152692 }}</ref> Questo è stato in parte ispirato da un articolo di alto profilo del 2004, che descrive la progettazione computazionale di una proteina con migliorata attività enzimatica rispetto alla sua forma naturale.<ref>{{Cita pubblicazione \| titolo=Protein prize up for grabs after retraction \| autore=Hayden EC \| rivista=Nature \| data=13 febbraio 2008 \| doi=10.1038/news.2008.569 }}</ref> In un articolo del 2008 dal gruppo David Baker, in cui è citato il progetto Rosetta@home per le risorse computazionali che ha messo a disposizione, viene descritto come la proteina è stata fatta. L'articolo è stato un importante proof of concept per questo metodo di progettazione di proteine. Questo tipo progettazione di proteine potrebbe avere applicazioni future nella scoperta di farmaci, nella [[chimica verde]], e nel biorisanamento. ==Attinenza medica== Rosetta@home è un progetto focalizzato sulla ricerca di base, ma parte del lavoro include vari virus tra cui [[AIDS]], [[malattia di Alzheimer]], [[cancro (malattia)\|cancro]] e [[malaria]]. Non ancora tutti i progetti appena citati sono già sulla piattaforma [[BOINC]] perché il progetto sta lavorando su di un efficiente sistema per le code in grado di permettere ai ricercatori di inviare nuovi progetti in maniera semplice ({{en}} [https://web.archive.org/web/20080923080902/http://boinc.bakerlab.org/rosetta/rah_medical_relevance.php]). Esiste un collegamento in tre punti che porta dalla previsione strutturale al trattamento della malattia: Riga 70: ===HIV=== Come parte di una ricerca sovvenzionata con 19,4 milioni di dollari dalla Bill e Melinda Gates Foundation, Rosetta@home è ~~stato~~stata utilizzata nella progettazione di diversi possibili vaccini per il [[hiv\|virus dell'immunodeficienza umana]] (HIV). ===Malaria=== Riga 100: ===Foldit=== Il 9 maggio 2008, dopo che gli utenti di Rosetta@home avevano suggerito una versione interattiva del programma di [[calcolo distribuito]], il laboratorio di Baker ha pubblicamente reso disponibile [[Foldit]], un gioco online per la previsione della struttura delle proteine basato sulla piattaforma di Rosetta. Al 2520 settembre ~~2008~~2016, Foldit ha oltre 59240.000 utenti registrati. Il gioco offre agli utenti una serie di controlli (ad esempio, "mischiare", "muovere", "ricostruire") per manipolare lo scheletro e le catene laterali di una proteina in conformazioni energicamente favorite. Gli utenti possono lavorare sulle proteine singolarmente come "soloists" o collettivamente come "evolvers", acquisendo punti sotto una delle due categorie man mano che migliorano le loro previsioni di struttura. Gli utenti possono anche competere individualmente con altri utenti attraverso la modalità "duello", in cui vince il giocatore che ottiene la struttura a minore energia dopo 20 mosse. ==Confronto a simili progetti di calcolo distribuito== Riga 106: ===Folding@home=== Di tutti i principali progetti di [[calcolo distribuito]] coinvolti nella ricerca sulle proteine, [[Folding@home]] è l'unico a non utilizzare la piattaforma [[BOINC]]. Sia Rosetta@home che Folding@home fanno ricerca su malattie legate al misfolding delle proteine (ad esempio la malattia di [[Alzheimer]]), ma Folding@home lo fa in modo più esclusivo. Invece di utilizzare metodi basati sulla struttura o il design per prevedere il comportamento, per esempio, dell'[[Amiloidosi\|amiloide]], Folding@home usa la dinamica molecolare per fare dei modelli su come le proteine si ripiegano (o potenzialmente mal-ripiegano e successivamente aggregano). In altre parole, la forza di Folding@home è la modellazione del processo di folding delle proteine, mentre la forza di Rosetta@home è la previsione della struttura delle proteine e delle loro interazioni, oltre che il design di nuove proteine. I due progetti differiscono anche in modo significativo per la loro potenza di calcolo e la diversità di hardware usato. A una media di circa 15,0 [[FLOPS\|PetaFLOPS]] (15000 TeraFLOPS) con una base hardware che comprende [[PlayStation 3]] e [[schede video]], Folding@home ha quasi 55 volte la potenza di calcolo di Rosetta@home, che in media si aggira sui 270 [[FLOPS\|TeraFLOPS]] con una base costituita esclusivamente da [[CPU]]. ===World Community Grid=== Riga 114: Come Rosetta@home, [[Predictor@home]] era specializzato nella previsione della struttura delle proteine. Predictor@home prevedeva di sviluppare nuove aree per la sua piattaforma di calcolo distribuito nella progettazione di proteine e di docking proteico (utilizzando il pacchetto [[CHARMM]] di dinamica molecolare), divenendo così maggiormente paragonabile a Rosetta@home. Mentre Rosetta@home utilizza il programma Rosetta per la sua previsione della struttura, Predictor@home utilizzava la metodologia dTASSER. Altri progetti di calcolo distribuito su BOINC correlati alle proteine sono [[QMC@home]], [[Docking@home]], [[POEM@home]], [[SIMAP]], e Tanpaku~~. Anche RALPH@home, il progetto alfa di Rosetta@home che testa le nuove versioni delle applicazioni, unità di lavoro e gli aggiornamenti prima che passino su Rosetta@home, funziona su BOINC~~. ==Note== Riga 132: == Collegamenti esterni == *{{cita web\|~~http~~https://boinc.bakerlab.org/rosetta/\|Rosetta@home\|lingua=it, en}} {{Portale\|Biologia\|informatica}}