Descrição
Analisar dados de transcriptômica requer uma análise estatística intensiva para obter informações e conhecimento biológico úteis. Uma porção significativa destes dados é afetado por ruído aleatório ou até mesmo ruído inerente à modelagem experimental. Sem um tratamento robusto, os dados podem não ser muito bem explorados e até conclusões incorretas podem ser tiradas. Examinar a correlação entre perfis de expressão de genes é uma maneira que bioinformatas extraem informações de elementos de transcrição. No entanto, os métodos de correlação utilizados tradicionalmente possuem limitações preocupantes que precisam ser lidadas. (1) Este trabalho compara as duas medidas mais comuns de correlação, rho de Pearson e rho de Spearman, ao recentemente desenvolvido índice de coincidência, uma medida de similaridade que combina os índices de Jaccard e interioridade e os generaliza para serem aplicados a vetores contendo valores reais.(2) Nós usamos os dados experimentais de experimentos de microarray da arqueia Halobacterium salinarum que avaliam os efeitos sobre este organismo quando exposto a luz em um ambiente anaeróbico. O método utilizado explora as vias metabólicas co-expressas medindo as correlações entre enzimas que compartilham metabólitos e busca máximos locais usando um algoritmo de anelamento simulado. (3) Nós demonstramos que o índice de coincidência extrai vias maiores, mais compreensivas, e mais estatisticamente significativas que as medidas tradicionais de Pearson e Spearman.
Referências
1 IDEKER, T. et al. Discovering regulatory and signalling circuits in molecular interaction networks. Bioinformatics, v. 18, suppl. 1, p. S233-S240, 2002.
2 COSTA, L. F. Coincidence complex networks. Journal of Physics: complexity, v. 3, p. 015012-1-015012-18, 2022.
3 SCHOBER, P.; BOER, C.; SCHWARTE, L. A. Correlation coefficients: appropriate use and interpretation. Anesthesia and Analgesia, v. 126, n. 5, p. 1763-1768, 2018.
Certifico que os nomes citados como autor e coautor estão cientes de suas nomeações. | Sim |
---|---|
Palavras-chave | Bioinformática. Biologia de sistemas. Redes complexas. |
Orientador e coorientador | Odemir Martinez Bruno |
Subárea 1 | Redes Complexas |
Subárea 2 (opcional) | Física Aplicada à Biologia e à Medicina |
Subárea 3 (opcional) | Biofísica |
Agência de Fomento | FAPESP |
Número de Processo | 2022/06218-7 |
Modalidade | MESTRADO |
Concessão de Direitos Autorais | Sim |