Più di un migliaio di genomi microbici sono stati sequenziati presso i centri di sequenziamento vari negli ultimi 15 anni per capire meglio i loro ruoli in compiti che vanno dalla bioenergia per la salute di pulizia ambientale. stime prudenti, circa 10.000 genomi microbici sarà disponibile al pubblico entro i prossimi due anni, ma le norme genomica non hanno preso con i progressi tecnologici che hanno reso il processo di sequenziamento più veloce e più economico. Come risultato, il torrente delle sequenze di DNA di essere rilasciato ha diversi livelli di qualità, che influiscono capacità dei ricercatori ', per usare queste informazioni.
Per facilitare il controllo della qualità del DNA genomico microbica sequenze generate prima di essere presentati al finanziamento federale archivio pubblico GenBank, l'US Department of Energy (DOE) Joint Genome Institute (JGI), ha introdotto uno strumento di controllo della qualità conosciuta come la previsione del gene Miglioramento Pipeline o GenePRIMP. GenePRIMP è descritto in un articolo pubblicato online 2 maggio in Metodi Natura e ha il potenziale per diventare un riferimento per chiamata gene procariotico, una tecnica con cui vengono identificati l'inizio e la fine del potenziale gene codifica sequenze.
Primo autore Amrita Pati, uno sviluppatore software in DOE JGI Genome Biology Program notato che GenePRIMP doppio controlla il gene confini, le annotazioni dei geni e non annotate le regioni intergeniche in sequenze del genoma dopo il processo di finitura. Ha accreditato collega Natalia Ivanova di fissare le basi biologiche del tool software e contribuendo a perfezionare GenePRIMP. Il programma, ha detto Pati, individua gli errori di chiamata gene-come la partenza gene potenzialmente errate e le posizioni finali, le sovrapposizioni tra i grandi geni, i geni frammentato e mancati geni.
Gene-calling errori, ha osservato Pati, può variare da due a cento fino al 30 per cento dei geni originali indicati nel genoma e dipendono da molti fattori, come il trasferimento orizzontale di geni tra specie. Ad esempio, i geni acquisiti per trasferimento orizzontale di geni potrebbe diventare pseudogeni (simili a geni, ma non codifica per un prodotto del gene) e sono più soggetti a errori. Pati ha detto GenePRIMP riduce significativamente la quantità di tempo gli scienziati passano il controllo l'intero genoma, grazie alle quali evidenziando gli errori che devono essere corretti manualmente.
'Senza una relazione GenePRIMP con cui lavorare,' disse, individuando le novella microbo Starkeya - un batterio del suolo che svolge un ruolo importante nella regolazione della ciclistica di carbonio e zolfo - per esempio, 'uno scienziato DOE JGI avrebbe dovuto esaminare 4.480 gene modelli. Con GenePRIMP devono esaminare meno di un decimo di quel numero di geni. ' Ha detto che la relazione GenePRIMP offre un valore aggiunto in quanto include già le eventuali anomalie individuate attraverso BLAST (Basic Local Alignment Search Tool), che trova le regioni di similarità tra le sequenze di locali, così gli scienziati non si deve eseguire la loro propria ricerca BLAST.
'Con GenePRIMP abbiamo raggiunto un importante passo avanti nel miglioramento della qualità di annotazioni strutturali come le previsioni del gene', ha detto Genome Biology Program testa e autore senior studio Nikos Kyrpides. Egli ha sottolineato che l'utilizzo di GenePRIMP offre ai ricercatori tre vantaggi principali: risultati di alta qualità con gli errori ridotti; un approccio che può essere utilizzato indipendentemente dal software automatizzati originariamente utilizzato per controllare le annotazioni del gene, e infine un metodo per standardizzare chiamata gene.
'Ci sono un sacco di strumenti diversi utilizzati per predire i geni nei procarioti,' Kyrpides detto. 'Il problema principale che abbiamo è che tutti producono risultati molto variabili. Questo ostacola la nostra capacità di confrontare genomi sequenziati e commentato da varie fonti, visto che utilizzano diversi strumenti per la previsione del gene. GenePRIMP non è sostituire uno qualsiasi dei metodi disponibili; un utente può utilizzare qualsiasi metodo automatico disponibile predizione genica, e quindi utilizzare GenePRIMP per correggere l'uscita iniziale. Esso genera una potenza molto più standardizzati, quindi non solo migliorare significativamente la qualità, ma anche facilitare in modo significativo l'analisi comparativa. '
Dawn Field, presidente delle norme Genomics Consortium, un'iniziativa internazionale di genomica ricercatori interessati a stabilire gli standard per la raccolta e l'acquisizione dei dati genomiche per la comunità generale, chiamato GenePRIMP 'una grande soluzione a un problema di lunga data nel settore della bioinformatica di calcolo - come pulire fino gene chiamate in base alla comparativa dati genomici. Idealmente ', ha aggiunto,' i principi alla base aprirà la strada per un nuovo standard nel chiedere gene '.
GenePRIMP è disponibile per l'utilizzo da parte dei ricercatori a http://geneprimp.jgi-psf.org/. ricercatori di genomica supportato da una serie di agenzie federali e gli altri finanziamenti sono previsti per sfruttare questo nuovo strumento di controllo della qualità. L'attuale versione del software di reperti e le relazioni del modello gene anomalie agli scienziati. Pati ha detto che una futura versione di GenePRIMP trova automaticamente e correggere le anomalie detto così come mutazione della relazione (mutazione genetica causata da inserzione o la cancellazione di nucleotidi) e pseudogeni.
'Coerentemente annotazione di alta qualità su genomi microbici è la chiave per la loro utilità', ha detto Owen White, direttore della bioinformatica presso l'Università del Maryland School of Medicine e capo del microbioma progetto umano Analisi dei dati e centro di coordinamento che le tracce, negozi, analisi e distribuisce i dati. 'Software come GenePRIMP è una componente importante nella nostra casella degli strumenti di controllo della qualità.'
Pati ha detto che il software tool automatizzato è la cristallizzazione di procedure operative manuali utilizzati per più di 3 anni per correggere i modelli gene al DOE JGI. 'Come tale, essa è anche secondo i principi della normalizzazione delle norme Genomics Consortium e lo sviluppo ulteriore fattore nelle raccomandazioni del Consorzio,' lei ei suoi colleghi hanno scritto, consentendo nel contempo più veloci, le analisi migliori e più economici.
Fonte: DOE / Joint Genome Institute