Análise de repetições em dados biológicos
Resumen
A descodificação dos genomas veio criar novos desafios na comunidade científica ligada à área da computação e da informática. Diariamente são alimentadas inúmeras bases de dados com biliões de registos provenientes de equipamentos cada vez mais evoluídos, que auxiliam na descodificação dos genomas. Determinar o quão importante e relevante são esses dados, de forma a retirar valor acrescentado – informação, e obviamente transformá-los em conhecimento, é o grande desafio actual para a comunidade de investigadores de bioinformática. A análise de genomas, bem como dos proteomas dos vários organismos permitem-nos observar o comportamento ao nível da evolução das espécies. Neste estudo focamos a atenção num aspecto particular dessa análise: as repetições de determinados codões e dos respectivos aminoácidos nos vários organismos eucariotas, especificamente em genes ortólogos. Pertencente a várias fases da evolução das espécies, o objectivo principal centra-se na obtenção de resultados quanto à evolução dessas repetições ao longo de milhões de anos. Sabemos hoje que essas repetições no ser humano são a causa de diversas doenças neuro-degenerativas, entre outras, pelo que esta análise permitirá verificar o estado de conservação ou repressão, dessas repetições ao longo do processo de especiação, bem como ao nível do relacionamento que poderá existir entre essas repetições e as doenças nos seres superiormente evoluídos. Para este estudo foi desenvolvido um algoritmo de detecção de padrões de repetição, que possibilita uma análise detalhada da localização de uma determinada sequência, bem como das sequências que melhor se ajustam ao padrão de repetição inicial.Descargas
Citas
• AFROUZ Behboudi, M. W., Ludmila GORUNOVA, Joost J. van den OORD, Fredrik MERTENS, Fredrik ENLUND, Göran STENMAN. (2005). Clear cell hidradenoma of the skin - a third tumor type with a t(11;19)-associated TORC1-MAML2 gene fusion. Genes, Chromosomes and Cancer, 43(2), 202-205.
• DEPHOURE, N., ZHOU, C., VILLéN, J., BEAUSOLEIL, S. A., BAKALARSKI, C. E., ELLEDGE, S. J., et al. (2008). A quantitative atlas of mitotic phosphorylation. Proceedings of the National Academy of Sciences, 105(31), 10762-10767.
• FERRO, P., CATALANO, M. G., DELL'EVA, R., FORTUNATI, N., & PFEFFER, U. (2002). The androgen receptor CAG repeat: a modifier of carcinogenesis? Molecular and Cellular Endocrinology, 193(1-2), 109-120.
• FREED, K. A., COOPER, D. W., BRENNECKE, S. P., & MOSES, E. K. (2005). Detection of CAG repeats in pre-eclampsia/eclampsia using the repeat expansion detection method. Mol. Hum. Reprod., 11(7), 48 - 87.
• FU, Z., & JIANG, T. (2008). Clustering of main orthologs for multiple genomes. J Bioinform Comput Biol, 6(3), 573-584.
• Gabriela MOURA, M. P., Raquel SILVA, Isabel MIRANDA, Vera AFREIXO, Gaspar DIAS, Adelaide FREITAS, José L OLIVEIRA, and Manuel AS SANTOS. (2005). Comparative context analysis of codon pairs on an ORFeome scale. Genome Biology, 6(3).
• GORDON, D. B., NEKLUDOVA, L., MCCALLUM, S., & FRAENKEL, E. (2005). TAMO: a flexible, object-oriented framework for analyzing transcriptional regulation using DNA-sequence motifs. Bioinformatics, 21(14), 3164-3165.
• HERISHANU, Y. O., PARVARI, R., POLLACK, Y., SHELEF, I., MAROM, B., MARTINO, T., et al. (2009). Huntington disease in subjects from an Israeli Karaite community carrying alleles of intermediate and expanded CAG repeats in the HTT gene: Huntington disease or phenocopy? Journal of the Neurological Sciences, 277(1-2), 143-146.
• JONES, N. C., & PEVZNER, P. A. (2006). Comparative genomics reveals unusually long motifs in mammalian genomes. Bioinformatics, 22(14), e236-242.
• KEGG: Kyoto Encyclopedia of Genes and Genomes. from http://www.kegg.com
• LEVENSHTEIN, V. I. (1966). Binary codes capable of correcting deletions, insertions, and reversals. Sov. Phys. Dokl, 10(8), 707–710.
• LORENZ-DEPIEREUX, B., BASTEPE, M., BENET-PAGES, A., AMYERE, M., WAGENSTALLER, J., MULLER-BARTH, U., et al. (2006). DMP1 mutations in autosomal recessive hypophosphatemia implicate a bone matrix protein in the regulation of phosphate homeostasis. Nat Genet, 38(11), 1248-1250.
• LOUSADO, J. P., MOURA, G. R., SANTOS, M. A. S., & OLIVEIRA, J. L. (2008). Exploiting Codon-Triplets Association for Genome Primary Structure Analysis, Biocomputation, Bioinformatics, and Biomedical Technologies, 2008. BIOTECHNO '08. International Conference on (pp. 155-158). Bucharest, Romania: IEEE Xplorer.
• MACDOUGALL, M., SIMMONS, D., LUAN, X., NYDEGGER, J., FENG, J., & GU, T. T. (1997). Dentin Phosphoprotein and Dentin Sialoprotein Are Cleavage Products Expressed from a Single Transcript Coded by a Gene on Human Chromosome 4. Dentin phosphoprotein dna sequence determination. J. Biol. Chem., 272(2), 835-842.
• MOURA, G., LOUSADO, J., PINHEIRO, M., CARRETO, L., SILVA, R., OLIVEIRA, J., et al. (2007). Codon-triplet context unveils unique features of the Candida albicans protein coding genome. BMC Genomics, 8, 444.
• PAUL, S. (2007). Polyglutamine-Mediated Neurodegeneration: Use of Chaperones as Prevention Strategy. Biochemistry (Moscow), 72(4), 359-366.
• PEARSON C.E., N. E. K., CLEARY J.D. . (2005). Repeat instability: mechanisms of dynamic mutations. [Review]. Nat Rev Genet., 6(10), 729-742.
• PEARSON, W. R., WOOD, T., ZHANG, Z., & MILLER, W. (1997). Comparison of DNA Sequences with Protein Sequences. Genomics, 46(1), 24-36.
• SHER ALI, S. A., Nasreen Z. EHTESHAM, Md. ASIM AZFER, Uday HOMKAR,, & Rajesh GOPAL, S. E. H. (1998). Analysis of the evolutionarily conserved repeat motifs in the genome of the highly endangered central Indian swamp deer Cervus duvauceli branderi. GENE, 223, 361–367.
• STOYE, J. (1997). Divide-and-Conquer Multiple Sequence Alignment. Universität Bielefeld.
• TATUSOVA, T. A., & MADDEN, T. L. (1999). BLAST 2 S, a new tool for comparing protein and nucleotide sequences. FEMS Microbiology Letters, 174(2), 247-250.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Los autores que sometan propuestas para esta revista estarán de acuerdo con los siguientes términos:
a) Los artículos serán publicados según la licencia Licença Creative Commons (CC BY 4.0), conforme el régimen open-access, sin cualquier coste para el autor o para el lector.
b) Los autores conservan los derechos de autor y conceden a la revista el derecho de la primera publicación, se permite la divulgación libre del trabajo, desde que sea correctamente atribuida la autoría y la publicación inicial en esta revista.
c) Los autores están autorización para firmar contratos adicionales separadamente, para la distribución no exclusiva de la versión del trabajo publicada en esta revista (ej.: publicar en un repositorio institucional o como capítulo de un libro), con reconocimiento de la autoría y publicación inicial e esta revista.
d) Los autores tienen permiso y son alentados a publicar y distribuir su trabajo on-line (ej.: en repositorios instituciones o en su página personal) ya que eso podrá generar alteraciones productivas, así como aumentar el impacto y la citación del trabajo publicado.
Documentos necesarios para la sumisión
Plantilla del artículo (formato editable)