Home Economia A nova IA da DeepMind pode prever doenças genéticas

A nova IA da DeepMind pode prever doenças genéticas

Por Humberto Marchezini


Cerca de 10 anos atrás, Žiga Avsec era um estudante de doutorado em física que se viu fazendo um curso intensivo de genômica por meio de um módulo universitário sobre aprendizado de máquina. Logo ele estava trabalhando em um laboratório que estudava doenças raras, em um projeto que visava identificar a mutação genética exata que causava uma doença mitocondrial incomum.

Este foi, diz Avsec, um problema de “agulha num palheiro”. Havia milhões de possíveis culpados escondidos no código genético – mutações no DNA que poderiam causar estragos na biologia de uma pessoa. De particular interesse foram as chamadas variantes missense: alterações de uma única letra no código genético que resultam na produção de um aminoácido diferente dentro de uma proteína. Os aminoácidos são os blocos de construção das proteínas, e as proteínas são os blocos de construção de todo o resto do corpo, por isso mesmo pequenas mudanças podem ter efeitos grandes e de longo alcance.

Existem 71 milhões de variantes missense possíveis no genoma humano, e uma pessoa média carrega mais de 9.000 delas. A maioria é inofensiva, mas alguns têm sido implicados em doenças genéticas, como anemia falciforme e fibrose cística, bem como em condições mais complexas, como diabetes tipo 2, que podem ser causadas por uma combinação de pequenas alterações genéticas. Avsec começou a perguntar aos seus colegas: “Como sabemos quais são realmente perigosos?” A resposta: “Bem, em grande parte, não sabemos”.

Dos 4 milhões de variantes missense que foram detectadas em humanos, apenas 2% foram categorizadas como patogénicas ou benignas, através de anos de investigação meticulosa e dispendiosa. Pode levar meses para estudar o efeito de uma única variante missense.

Hoje, o Google DeepMind, onde Avsec é agora um cientista pesquisador, lançou uma ferramenta que pode acelerar rapidamente esse processo. AlphaMissense é um modelo de aprendizado de máquina que pode analisar variantes missense e prever a probabilidade de elas causarem uma doença com 90% de precisão – melhor do que as ferramentas existentes.

Está construído AlfaFold, o modelo inovador da DeepMind que previu as estruturas de centenas de milhões de proteínas a partir de sua composição de aminoácidos, mas não funciona da mesma maneira. Em vez de fazer previsões sobre a estrutura de uma proteína, o AlphaMissense opera mais como um grande modelo de linguagem, como o ChatGPT da OpenAI.

Ele foi treinado na linguagem da biologia humana (e dos primatas), por isso sabe como deveriam ser as sequências normais de aminoácidos nas proteínas. Quando é apresentado a uma sequência que deu errado, ele pode tomar nota, como acontece com uma palavra incongruente em uma frase. “É um modelo de linguagem, mas treinado em sequências de proteínas”, diz Jun Cheng, que, com a Avsec, é co-autor principal de um artigo publicado hoje em Ciência que anuncia AlphaMissense para o mundo. “Se substituirmos uma palavra de uma frase em inglês, uma pessoa familiarizada com o inglês poderá ver imediatamente se essas substituições mudarão o significado da frase ou não.”

Pushmeet Kohli, vice-presidente de pesquisa da DeepMind, usa a analogia de um livro de receitas. Se AlphaFold estava preocupado com exatamente como os ingredientes podem se unir, AlphaMissense prevê o que pode acontecer se você usar o ingrediente totalmente errado.



Source link

Related Articles

Deixe um comentário