21 – 25 de ago. de 2023
IFSC/USP
Fuso horário America/Sao_Paulo

Análise multiparamétrica do problema de fases em cristalografia de proteínas por aprendizado de máquina - caso de estudo: lisozima da clara do ovo de galinha

21 de ago. de 2023 16:00
1h 30m
Salão de Eventos USP

Salão de Eventos USP

Prêmio YPM 16h00 - 17h30

Descrição

O problema de fases é notório na cristalografia de proteínas por difração de raios-X. A perda experimental de informações sobre as fases das ondas espalhadas construtivamente pelos componentes do cristal se devem às limitações tecnológicas intrínsecas aos sistemas de detecção dessa radiação. (1) Assim, é impossibilitado o cálculo direto da função de distribuição de densidade eletrônica na cela unitária através de uma transformada de Fourier. Atualmente, há dois métodos experimentais que podem ser aplicados para contornar esse problema: (i) a quantificação seletiva do componente dispersivo (λ-dependente) do fator de espalhamento atômico ou (ii) a substituição parcial do solvente aquoso ordenado por íons mais elétron-densos (metálicos ou halogênicos). (2) Alternativamente, informações prévias, na forma de estruturas cristalinas conhecidas que são funcionalmente relacionadas ou homólogas a componentes no cristal, podem servir como fonte de um conjunto inicial de fases. Apesar de desafiadoras, quando viáveis, as aplicações desses diferentes métodos já possibilitaram a determinação de mais de uma centena de milhares de modelos atômicos, para as mais diversas proteínas (e seus complexos). Tendo em vista a existência de uma vasta coleção de informações estruturais já disponibilizadas no banco de dados Protein Data Bank, propõe-se aqui uma análise multiparamétrica do problema das fases, com base em aprendizagem de máquina profunda (AMP). (3) Nossa hipótese é a de que o extensivo mapeamento estatístico de observações sobre distribuições de fases conhecidas, como um modelo preditivo, pode permitir conclusões sobre o valor alvo de fases em conjuntos de dados ainda não resolvidos, eliminando assim a necessidade de experimentos adicionais ou de estruturas homólogas previamente conhecidas. Assim, neste Projeto de Mestrado, estão sendo testados modelos para um seleto grupo de estruturas de lisozimas provenientes da clara do ovo de galinhas (da sigla HEWL, do inglês Hen egg-white lysozyme), no sentido de avaliar a aplicabilidade e sua reprodutibilidade para outras estruturas no futuro. Até este momento foi obtido êxito em realizar um ciclo completo, isto significa que foi possível a saída da predição das fases por AMP e a utilização destas para a reconstrução dos mapas de densidade eletrônica (MDE).Foi desenvolvido um modelo de predição que possui uma acurácia média de 15-20 graus. Agora tem-se como objetivo refinar ainda mais o modelo e desenvolver uma avaliação quantitativa da fidelidade dos MDEs.

Referências

1 DRENTH, J. Principles of protein X-ray crystallography. 3rd ed. New York: Springer, 2007. 332 p.

2 RUPP, B. Biomolecular crystallography: principles, practice, and application to structural biology. New York: Garland Science, 2010. 809 p.

3 GÉRON, A. Hands-on machine learning with scikit-learn and tensorflow: concepts, tools, and techniques to build intelligent systems. Sebastopol, CA: O’Reilly Media, 2017. 547 p.

Certifico que os nomes citados como autor e coautor estão cientes de suas nomeações. Sim
Palavras-chave Aprendizado de máquina. Cristalografia. Problema de fases.
Orientador e coorientador Andre Luis Berteli Ambrosio
Subárea 1 Física Computacional
Subárea 2 (opcional) Cristalografia
Agência de Fomento CAPES
Número de Processo 88887.675055/2022-00
Modalidade MESTRADO
Concessão de Direitos Autorais Sim

Autor primário

André Gustavo Jucovski (Instituto de Física de São Carlos - USP)

Co-autor

Andre Luis Berteli Ambrosio (Instituto de Física de São Carlos - USP)

Materiais de apresentação

Ainda não há materiais