Análise de repetições em dados biológicos

Authors

  • José P. Lousado
  • José L. Oliveira

Abstract

A descodificação dos genomas veio criar novos desafios na comunidade científica ligada à área da computação e da informática. Diariamente são alimentadas inúmeras bases de dados com biliões de registos provenientes de equipamentos cada vez mais evoluídos, que auxiliam na descodificação dos genomas. Determinar o quão importante e relevante são esses dados, de forma a retirar valor acrescentado – informação, e obviamente transformá-los em conhecimento, é o grande desafio actual para a comunidade de investigadores de bioinformática. A análise de genomas, bem como dos proteomas dos vários organismos permitem-nos observar o comportamento ao nível da evolução das espécies. Neste estudo focamos a atenção num aspecto particular dessa análise: as repetições de determinados codões e dos respectivos aminoácidos nos vários organismos eucariotas, especificamente em genes ortólogos. Pertencente a várias fases da evolução das espécies, o objectivo principal centra-se na obtenção de resultados quanto à evolução dessas repetições ao longo de milhões de anos. Sabemos hoje que essas repetições no ser humano são a causa de diversas doenças neuro-degenerativas, entre outras, pelo que esta análise permitirá verificar o estado de conservação ou repressão, dessas repetições ao longo do processo de especiação, bem como ao nível do relacionamento que poderá existir entre essas repetições e as doenças nos seres superiormente evoluídos. Para este estudo foi desenvolvido um algoritmo de detecção de padrões de repetição, que possibilita uma análise detalhada da localização de uma determinada sequência, bem como das sequências que melhor se ajustam ao padrão de repetição inicial.

Downloads

Download data is not yet available.

References

• AFROUZ Behboudi, M. W., Ludmila GORUNOVA, Joost J. van den OORD, Fredrik MERTENS, Fredrik ENLUND, Göran STENMAN. (2005). Clear cell hidradenoma of the skin - a third tumor type with a t(11;19)-associated TORC1-MAML2 gene fusion. Genes, Chromosomes and Cancer, 43(2), 202-205.

• DEPHOURE, N., ZHOU, C., VILLéN, J., BEAUSOLEIL, S. A., BAKALARSKI, C. E., ELLEDGE, S. J., et al. (2008). A quantitative atlas of mitotic phosphorylation. Proceedings of the National Academy of Sciences, 105(31), 10762-10767.

• FERRO, P., CATALANO, M. G., DELL'EVA, R., FORTUNATI, N., & PFEFFER, U. (2002). The androgen receptor CAG repeat: a modifier of carcinogenesis? Molecular and Cellular Endocrinology, 193(1-2), 109-120.

• FREED, K. A., COOPER, D. W., BRENNECKE, S. P., & MOSES, E. K. (2005). Detection of CAG repeats in pre-eclampsia/eclampsia using the repeat expansion detection method. Mol. Hum. Reprod., 11(7), 48 - 87.

• FU, Z., & JIANG, T. (2008). Clustering of main orthologs for multiple genomes. J Bioinform Comput Biol, 6(3), 573-584.

• Gabriela MOURA, M. P., Raquel SILVA, Isabel MIRANDA, Vera AFREIXO, Gaspar DIAS, Adelaide FREITAS, José L OLIVEIRA, and Manuel AS SANTOS. (2005). Comparative context analysis of codon pairs on an ORFeome scale. Genome Biology, 6(3).

• GORDON, D. B., NEKLUDOVA, L., MCCALLUM, S., & FRAENKEL, E. (2005). TAMO: a flexible, object-oriented framework for analyzing transcriptional regulation using DNA-sequence motifs. Bioinformatics, 21(14), 3164-3165.

• HERISHANU, Y. O., PARVARI, R., POLLACK, Y., SHELEF, I., MAROM, B., MARTINO, T., et al. (2009). Huntington disease in subjects from an Israeli Karaite community carrying alleles of intermediate and expanded CAG repeats in the HTT gene: Huntington disease or phenocopy? Journal of the Neurological Sciences, 277(1-2), 143-146.

• JONES, N. C., & PEVZNER, P. A. (2006). Comparative genomics reveals unusually long motifs in mammalian genomes. Bioinformatics, 22(14), e236-242.

• KEGG: Kyoto Encyclopedia of Genes and Genomes. from http://www.kegg.com

• LEVENSHTEIN, V. I. (1966). Binary codes capable of correcting deletions, insertions, and reversals. Sov. Phys. Dokl, 10(8), 707–710.

• LORENZ-DEPIEREUX, B., BASTEPE, M., BENET-PAGES, A., AMYERE, M., WAGENSTALLER, J., MULLER-BARTH, U., et al. (2006). DMP1 mutations in autosomal recessive hypophosphatemia implicate a bone matrix protein in the regulation of phosphate homeostasis. Nat Genet, 38(11), 1248-1250.

• LOUSADO, J. P., MOURA, G. R., SANTOS, M. A. S., & OLIVEIRA, J. L. (2008). Exploiting Codon-Triplets Association for Genome Primary Structure Analysis, Biocomputation, Bioinformatics, and Biomedical Technologies, 2008. BIOTECHNO '08. International Conference on (pp. 155-158). Bucharest, Romania: IEEE Xplorer.

• MACDOUGALL, M., SIMMONS, D., LUAN, X., NYDEGGER, J., FENG, J., & GU, T. T. (1997). Dentin Phosphoprotein and Dentin Sialoprotein Are Cleavage Products Expressed from a Single Transcript Coded by a Gene on Human Chromosome 4. Dentin phosphoprotein dna sequence determination. J. Biol. Chem., 272(2), 835-842.

• MOURA, G., LOUSADO, J., PINHEIRO, M., CARRETO, L., SILVA, R., OLIVEIRA, J., et al. (2007). Codon-triplet context unveils unique features of the Candida albicans protein coding genome. BMC Genomics, 8, 444.

• PAUL, S. (2007). Polyglutamine-Mediated Neurodegeneration: Use of Chaperones as Prevention Strategy. Biochemistry (Moscow), 72(4), 359-366.

• PEARSON C.E., N. E. K., CLEARY J.D. . (2005). Repeat instability: mechanisms of dynamic mutations. [Review]. Nat Rev Genet., 6(10), 729-742.

• PEARSON, W. R., WOOD, T., ZHANG, Z., & MILLER, W. (1997). Comparison of DNA Sequences with Protein Sequences. Genomics, 46(1), 24-36.

• SHER ALI, S. A., Nasreen Z. EHTESHAM, Md. ASIM AZFER, Uday HOMKAR,, & Rajesh GOPAL, S. E. H. (1998). Analysis of the evolutionarily conserved repeat motifs in the genome of the highly endangered central Indian swamp deer Cervus duvauceli branderi. GENE, 223, 361–367.

• STOYE, J. (1997). Divide-and-Conquer Multiple Sequence Alignment. Universität Bielefeld.

• TATUSOVA, T. A., & MADDEN, T. L. (1999). BLAST 2 S, a new tool for comparing protein and nucleotide sequences. FEMS Microbiology Letters, 174(2), 247-250.

Published

2016-02-04

How to Cite

Lousado, J. P., & Oliveira, J. L. (2016). Análise de repetições em dados biológicos. Millenium - Journal of Education, Technologies, and Health, (38), 7–18. Retrieved from https://revistas.rcaap.pt/millenium/article/view/8246

Issue

Section

Articles