Os algoritmos matema¡ticos analisam constantemente milhões de itens de dados, identificam padraµes e fazem previsaµes sobre todas as áreas da vida
Crédito: URV
A partir de dados (pontos) dados ao roba´ cientafico, ele écapaz de encontrar
a lei que melhor os descreve (superfacie azul) e sua expressão matemática exata.Â
Agora épossível prever quem éo melhor candidato para receber um transplante de a³rga£o, saber se os clientes de um banco devolvera£o os empréstimos solicitados, escolhera£o os filmes que melhor coincidam com os interesses dos consumidores ou atéselecionar o parceiro ideal de alguém . Os algoritmos matema¡ticos analisam constantemente milhões de itens de dados, identificam padraµes e fazem previsaµes sobre todas as áreas da vida. Mas, na maioria dos casos, os resultados fornecem pouco mais do que uma previsão fechada que não pode ser interpretada e que geralmente éafetada por vieses nos dados originais.
Agora, uma equipe do grupo de pesquisa SEES: laboratório do Departamento de Engenharia Química da Universitat Rovira I Virgili e ICREA fez um avanço com o desenvolvimento de um novo algoritmo que faz previsaµes mais precisas e gera modelos matema¡ticos que também possibilitam para entender essas previsaµes. Os resultados desta pesquisa acabam de ser publicados na revista Science Advances .
"O objetivo do nosso estudo foi criar o que éconhecido como roba´ cientafico, um algoritmo que pode aplicar o conhecimento e a experiência que um pesquisador tem para interpretar dados", explica Marta Sales-Pardo, uma das autoras do artigo. Os resultados fornecidos pelo algoritmo são caracterizados pelo fato de serem interpreta¡veis. "a‰ como se alguém tivesse elaborado uma lei ou uma teoria sobre o sistema que estãosendo estudado. O algoritmo fornece as relações matemáticas entre as varia¡veis ​​analisadas e o faz de maneira totalmente independente", acrescenta Roger Guimera , pesquisador do ICREA. do mesmo grupo.
Quando uma empresa possui uma quantidade enorme de dados que deseja explorar, pode fazaª-lo empregando alguém para experimentar vários modelos , propor fa³rmulas e descobrir qual funciona melhor realizando experimentos para valida¡-las. Isso levara¡ a uma fa³rmula matemática que possibilita modelar o sistema, mas envolve um investimento considera¡vel em tempo e dinheiro.
Outra possibilidade éencontrar um especialista em aprendizado de ma¡quina, uma disciplina cientafica no campo da inteligaªncia artificial que cria sistemas que identificam padraµes complexos em enormes conjuntos de dados, aprendem automaticamente e produzem um modelo de "caixa preta" que pode fazer previsaµes. No entanto, esses sistemas não fornecem outras informações e, se a previsão falhar, éimpossível saber onde estãoo erro e o que precisa ser feito para evita¡-lo.
O algoritmo desenvolvido na URV leva o melhor dos dois casos: processa os dados de forma automa¡tica, rápida e confia¡vel, como o sistema de aprendizado de ma¡quina , e também produz um resultado que éum modelo interpreta¡vel.
O algoritmo pode ser usado para analisar e interpretar dados de qualquer disciplina em um processo que seja muito mais a¡gil e eficiente do que os existentes atéo momento. Mas o verdadeiro valor agregado éa informação que o sistema fornece. "Na medicina, por exemplo, se vocêprecisa tomar uma decisão com base em dados, émuito importante entender por que cada decisão foi tomada e o risco de cometer um erro", explica Guimera . "Embora o algoritmo também tenha mostrado que éaltamente preciso, o mais importante éque vocêpossa entender os resultados porque criou um cientista de ma¡quinas que, sem nenhum conhecimento prévio, pode pegar um conjunto de dados e desenvolver uma teoria que resolve o problema colocado ", acrescenta Ignasi Reichardt, outro pesquisador da equipe.
Neste estudo, o algoritmo foi aplicado a um problema fundamental da física de fluidos com a colaboração do grupo de pesquisa Experimentação, Computação e Modelagem em Meca¢nica dos Fluidos e Turbulaªncia do Departamento de Engenharia Meca¢nica da URV.