A IA capacita o iNaturalist a mapear plantas da Califórnia com precisão sem precedentes
Utilizando inteligência artificial avançada e dados de ciência cidadã do aplicativo iNaturalist, pesquisadores da UCL, Berkeley, desenvolveram alguns dos mapas mais detalhados até agora, mostrando a distribuição de espécies de plantas da Califórnia.
Usando mais de 652.000 observações carregadas no iNaturalist (à esquerda), cientistas da UC Berkeley criaram um modelo de IA para prever a distribuição de 2.221 espécies de plantas ao redor do estado. Para treinar a rede de aprendizado profundo, as observações de espécies foram vinculadas a imagens de sensoriamento remoto de 256 x 256 metros tiradas do National Agricultural Imagery Program de 2012 (à direita) e com variáveis climáticas. Crédito: Moi Exposito-Alonso e Lauren Gillespie, UC Berkeley
Utilizando inteligência artificial avançada e dados de ciência cidadã do aplicativo iNaturalist, pesquisadores da UCL, Berkeley, desenvolveram alguns dos mapas mais detalhados até agora, mostrando a distribuição de espécies de plantas da Califórnia.
iNaturalist é um aplicativo de celular amplamente usado, desenvolvido originalmente por estudantes da UC Berkeley, que permite que as pessoas carreguem fotos e dados de localização de plantas, animais ou qualquer outra vida que encontrem e, então, façam crowdsourcing de sua identidade. O aplicativo atualmente tem mais de 8 milhões de usuários no mundo todo que, coletivamente, carregaram mais de 200 milhões de observações.
Os pesquisadores usaram um tipo de inteligência artificial chamada rede neural convolucional , que é um modelo de aprendizado profundo , para correlacionar os dados da ciência cidadã para plantas na Califórnia com imagens de satélite ou avião de sensoriamento remoto de alta resolução do estado. A rede descobriu correlações que foram então usadas para prever o alcance atual de 2.221 espécies de plantas em toda a Califórnia, até escalas de alguns metros quadrados.
Os botânicos geralmente constroem mapas de espécies de alta qualidade listando meticulosamente todas as espécies de plantas em uma área, mas isso não é viável fora de algumas pequenas áreas naturais ou parques nacionais. Em vez disso, o modelo de IA, chamado Deepbiosphere, aproveita dados gratuitos do iNaturalist e aviões ou satélites de sensoriamento remoto que agora cobrem o globo inteiro. Dadas observações suficientes de cientistas cidadãos, o modelo poderia ser implantado em países sem dados científicos detalhados sobre distribuições de plantas e habitats para monitorar mudanças na vegetação, como desmatamento ou recrescimento após incêndios florestais.
As descobertas foram publicadas em 5 de setembro no periódico Proceedings of the National Academy of Sciences por Moisés "Moi" Expósito-Alonso, professor assistente de biologia integrativa da UC Berkeley, a primeira autora Lauren Gillespie, uma estudante de doutorado em ciência da computação na Universidade de Stanford, e seus colegas. Gillespie atualmente tem uma bolsa do Fulbright US Student Program para usar técnicas semelhantes para detectar padrões de biodiversidade vegetal no Brasil.
"Durante meu ano aqui no Brasil, vimos a pior seca já registrada e uma das piores temporadas de incêndios já registradas", disse Gillespie. "Os dados de sensoriamento remoto até agora foram capazes de nos dizer onde esses incêndios aconteceram ou onde a seca é pior, e com a ajuda de abordagens de aprendizado profundo como a Deepbiosphere, em breve eles nos dirão o que está acontecendo com espécies individuais no solo."
"Essa é uma meta — expandi-la para muitos lugares", disse Expósito-Alonso. "Quase todo mundo no mundo tem smartphones agora, então talvez as pessoas comecem a tirar fotos de habitats naturais e isso possa ser feito globalmente. Em algum momento, isso nos permitirá ter camadas no Google Maps mostrando onde todas as espécies estão, para que possamos protegê-las. Esse é o nosso sonho."
Além de serem gratuitos e cobrirem a maior parte da Terra, os dados de sensoriamento remoto também são mais refinados e atualizados com mais frequência do que outras fontes de informação, como mapas climáticos regionais, que geralmente têm uma resolução de alguns quilômetros. Usar dados de ciência cidadã com imagens de sensoriamento remoto — apenas os mapas infravermelhos básicos que fornecem apenas uma imagem e a temperatura — pode permitir o monitoramento diário de mudanças na paisagem que são difíceis de rastrear.
Um mapa aéreo (1º painel) dos Parques Nacionais e Estaduais Redwoods da Califórnia, que contêm algumas das últimas sequoias antigas do mundo, visíveis como uma linha verde escura margeando o lado direito do Redwood Creek. A Deepbiosphere previu corretamente a presença de sequoias (2º painel) com resolução de 50 metros nos parques, distinguindo bosques maduros de jovens em regeneração (3º painel) e previu duas plantas de sub-bosque, azedinha-vermelha (O. oregana, vermelha) e amora-preta da Califórnia (R. ursinius, azul) que crescem sob florestas de sequoias de diferentes idades (4º painel). Crédito: Moi Exposito-Alonso e Lauren Gillespie, UC Berkeley
Esse monitoramento pode ajudar os conservacionistas a descobrir pontos críticos de mudança ou identificar áreas ricas em espécies que precisam de proteção.
"Com o sensoriamento remoto, quase a cada poucos dias há novas imagens da Terra com resolução de 1 metro", disse Expósito-Alonso. "Agora, elas nos permitem rastrear potencialmente em tempo real mudanças nas distribuições de plantas, mudanças nas distribuições de ecossistemas. Se as pessoas estão desmatando lugares remotos na Amazônia, agora elas não podem escapar — isso é sinalizado por meio dessa rede de previsão."
Expósito-Alonso, que se mudou de Stanford para a UC Berkeley no início deste ano, é um biólogo evolucionista interessado em como as plantas evoluem geneticamente para se adaptar às mudanças climáticas.
"Senti uma necessidade de ter um método escalável para saber onde as plantas estão e como elas estão mudando", disse ele. "Já sabemos que elas estão tentando migrar para áreas mais frias, que estão tentando se adaptar ao ambiente que estão enfrentando agora. A parte central do nosso laboratório é entender essas mudanças e esses impactos e se as plantas evoluirão para se adaptar."
No estudo, os pesquisadores testaram o Deepbiosphere excluindo alguns dados do iNaturalist do conjunto de treinamento de IA e, mais tarde, pedindo ao modelo de IA para prever as plantas na área excluída. O modelo de IA teve uma precisão de 89% na identificação da presença de espécies, em comparação com 27% dos métodos anteriores. Eles também o compararam com outros modelos desenvolvidos para prever onde as plantas estão crescendo na Califórnia e como elas migrarão com o aumento das temperaturas e mudanças nas chuvas. Um desses modelos é o Maxent , desenvolvido no Museu Americano de História Natural, que usa grades climáticas e dados de plantas georreferenciados. O Deepbiosphere teve um desempenho significativamente melhor do que o Maxent.
Eles também testaram o Deepbiosphere em mapas detalhados de plantas criados para alguns dos parques estaduais. Ele previu com 81,4% de precisão a localização das sequoias no Redwood National Park no norte da Califórnia e capturou com precisão (com R 2 = 0,53) a gravidade da queimada causada pelo Rim Fire de 2013 no Yosemite National Park.
"O que foi incrível sobre esse modelo que Lauren criou é que você está apenas treinando-o com dados disponíveis publicamente que as pessoas continuam enviando com seus telefones, mas você pode extrair informações suficientes para ser capaz de criar mapas bem definidos em alta resolução", disse Expósito-Alonso. "A próxima pergunta, uma vez que entendemos os impactos geográficos, é: 'As plantas vão se adaptar?'"
Megan Ruffley, também da Carnegie Institution for Science em Stanford, é coautora do artigo.
Mais informações: Lauren E. Gillespie et al, Modelos de aprendizagem profunda mapeiam mudanças rápidas em espécies de plantas a partir de dados de ciência cidadã e sensoriamento remoto, Proceedings of the National Academy of Sciences (2024). DOI: 10.1073/pnas.2318296121
Informações do periódico: Proceedings of the National Academy of Sciences