Um modelo de aprendizado profundo prevaª rapidamente as formas 3D de moléculas semelhantes a drogas, o que poderia acelerar o processo de descoberta de novos medicamentos.
Os pesquisadores do MIT desenvolveram um modelo de aprendizado profundo que pode prever rapidamente as formas 3D prova¡veis ​​de uma molanãcula, dado um gra¡fico 2D de sua estrutura. Essa técnica pode acelerar a descoberta de medicamentos. Créditos: Imagem: Cortesia dos pesquisadores, editada por MIT News
Em sua busca para descobrir novos medicamentos eficazes, os cientistas procuram moléculas semelhantes a drogas que podem se ligar a proteanas causadoras de doenças e alterar sua funcionalidade. a‰ crucial que eles conhea§am a forma 3D de uma molanãcula para entender como ela se liga asuperfÍcies especaficas da proteana.
Mas uma única molanãcula pode se dobrar de milhares de maneiras diferentes, então resolver esse quebra-cabea§a experimentalmente éum processo caro e demorado, semelhante a procurar uma agulha em um palheiro molecular.
Os pesquisadores do MIT estãousando o aprendizado de ma¡quina para agilizar essa tarefa complexa. Eles criaram um modelo de aprendizado profundo que prevaª as formas 3D de uma molanãcula com base exclusivamente em um gra¡fico em 2D de sua estrutura molecular. As moléculas são normalmente representadas como pequenos gra¡ficos.
Seu sistema, GeoMol, processa moléculas em apenas alguns segundos e tem um desempenho melhor do que outros modelos de aprendizado de ma¡quina, incluindo alguns manãtodos comerciais. GeoMol pode ajudar as empresas farmacaªuticas a acelerar o processo de descoberta de drogas, reduzindo o número de moléculas que precisam testar em experimentos de laboratório, diz Octavian-Eugen Ganea, pa³s-doutorado no Laborata³rio de Ciência da Computação e Inteligaªncia Artificial (CSAIL) e coautor do livro o papel.
“Quando vocêpensa em como essas estruturas se movem no espaço 3D, na verdade existem apenas certas partes da molanãcula que são realmente flexaveis, essas ligações rotativas. Uma das principais inovações de nosso trabalho éque pensamos em modelar a flexibilidade conformacional como um engenheiro quamico faria. Na verdade, trata-se de tentar prever a distribuição potencial de ligações rotativas na estrutura â€, diz Lagnajit Pattanaik, estudante de graduação no Departamento de Engenharia Química e coautor do artigo.
Outros autores incluem Connor W. Coley, o Professor Assistente de Desenvolvimento de Carreira Henri Slezynger de Engenharia Química; Regina Barzilay, Professora Distinta de IA e Saúde da Escola de Engenharia do CSAIL; Klavs F. Jensen, o professor de Engenharia Química Warren K. Lewis; William H. Green, Professor Hoyt C. Hottel em Engenharia Química; e o autor saªnior Tommi S. Jaakkola, o professor Thomas Siebel de Engenharia Elanãtrica em CSAIL e membro do Instituto de Dados, Sistemas e Sociedade. A pesquisa seráapresentada esta semana na Conferência sobre Sistemas de Processamento de Informação Neural.
Mapeando uma molanãcula
Em um gra¡fico molecular, os a¡tomos individuais de uma molanãcula são representados como nose as ligações químicas que os conectam são arestas.Â
O GeoMol utiliza uma ferramenta recente de aprendizado profundo chamada rede neural de passagem de mensagem, que éprojetada especificamente para operar em gra¡ficos. Os pesquisadores adaptaram uma rede neural de passagem de mensagem para prever elementos específicos da geometria molecular.
Dado um gra¡fico molecular, GeoMol inicialmente prevaª os comprimentos das ligações químicas entre os a¡tomos e os a¢ngulos dessas ligações individuais. A maneira como os a¡tomos estãoorganizados e conectados determina quais ligações podem girar.
GeoMol então prevaª a estrutura da vizinhana§a local de cada a¡tomo individualmente e monta pares vizinhos de ligações rotativas calculando os a¢ngulos de torção e, em seguida, alinhando-os. Um a¢ngulo de torção determina o movimento de três segmentos que estãoconectados, neste caso, três ligações químicas que conectam quatro a¡tomos.
“Aqui, as ligações girata³rias podem assumir uma grande variedade de valores possaveis. Portanto, o uso dessas redes neurais de transmissão de mensagens nos permite capturar muitos dos ambientes locais e globais que influenciam essa previsão. A ligação rotativa pode assumir vários valores, e queremos que nossa previsão seja capaz de refletir essa distribuição subjacente â€, diz Pattanaik.
Superando os obsta¡culos existentes
Um grande desafio para prever a estrutura 3D das moléculas émodelar a quiralidade. Uma molanãcula quiral não pode ser sobreposta em sua imagem no espelho, como um par de ma£os (não importa como vocêgire suas ma£os, não hácomo suas caracteristicas se alinharem exatamente). Se uma molanãcula for quiral, sua imagem no espelho não interagira¡ com o ambiente da mesma maneira.
Isso pode fazer com que os medicamentos interajam incorretamente com as proteanas, o que pode resultar em efeitos colaterais perigosos. Os manãtodos de aprendizado de ma¡quina atuais frequentemente envolvem um processo de otimização longo e complexo para garantir que a quiralidade seja identificada corretamente, diz Ganea.
Como o GeoMol determina a estrutura 3D de cada ligação individualmente, ele define explicitamente a quiralidade durante o processo de predição, eliminando a necessidade de otimização após o fato.
Depois de realizar essas previsaµes, GeoMol produz um conjunto de estruturas 3D prova¡veis ​​para a molanãcula.
“O que podemos fazer agora épegar nosso modelo e conecta¡-lo de ponta a ponta a um modelo que prevaª esse apego asuperfÍcies especaficas de proteanas. Nosso modelo não éum pipeline separado. a‰ muito fa¡cil de integrar com outros modelos de aprendizagem profunda â€, diz Ganea.
Um modelo “super-ra¡pidoâ€
Os pesquisadores testaram seu modelo usando um conjunto de dados de moléculas e as prova¡veis ​​formas 3D que poderiam assumir, desenvolvido por Rafael Gomez-Bombarelli, o presidente de desenvolvimento de carreira em engenharia de Jeffrey Cheah, e o aluno de pós-graduação Simon Axelrod.
Eles avaliaram quantas dessas estruturas 3D prova¡veis ​​seu modelo foi capaz de capturar, em comparação com modelos de aprendizado de ma¡quina e outros manãtodos.
Em quase todos os casos, o GeoMol superou os outros modelos em todas as manãtricas testadas.
“Descobrimos que nosso modelo ésuper-ra¡pido, o que foi muito empolgante de ver. E, o que émais importante, a medida que vocêadiciona mais ligações girata³rias, espera que esses algoritmos diminuam significativamente. Mas nosrealmente não vimos isso. A velocidade varia muito com o número de ligações rotativas, o que épromissor para o uso desses tipos de modelos no futuro, especialmente para aplicações onde vocêestãotentando prever rapidamente as estruturas 3D dentro dessas proteanas â€, diz Pattanaik.
No futuro, os pesquisadores esperam aplicar GeoMol a área de triagem virtual de alto rendimento, usando o modelo para determinar pequenas estruturas de moléculas que interagiriam com uma proteana especafica. Eles também querem continuar refinando o GeoMol com dados de treinamento adicionais para que ele possa prever com mais eficácia a estrutura de moléculas longas com muitas ligações flexaveis.
“A análise conformacional éum componente-chave de inaºmeras tarefas no projeto de medicamentos auxiliado por computador e um componente importante no avanço das abordagens de aprendizado de ma¡quina na descoberta de medicamentosâ€, disse Pat Walters, vice-presidente saªnior de computação da Relay Therapeutics, que não esteve envolvido nisso pesquisar. “Estou animado com os avanços contanuos no campo e agradea§o ao MIT por contribuir para um aprendizado mais amplo nesta área.â€
Esta pesquisa foi financiada pelo consãorcio Machine Learning for Pharmaceutical Discovery and Synthesis.