Um desequilíbrio global nos genomas de referência: Pesquisa destaca necessidade de recursos de sequenciamento em áreas ricas em biodiversidade
Pesquisadores da Montana State University e da Universidad de los Andes detectaram um desequilíbrio significativo na distribuição de genomas de referência de tetrápodes. Eles encontraram uma concentração desproporcional de estudos...
(A) Espécies tropicais são sub-representadas entre os genomas de referência disponíveis. (B) A riqueza entre espécies com genomas de referência não reflete os padrões globais de biodiversidade. Crédito: Molecular Ecology (2024). DOI: 10.1111/mec.17551
Pesquisadores da Montana State University e da Universidad de los Andes detectaram um desequilíbrio significativo na distribuição de genomas de referência de tetrápodes. Eles encontraram uma concentração desproporcional de estudos em regiões de alta latitude em comparação com onde a biodiversidade global é mais concentrada.
De acordo com o estudo, o desequilíbrio atual no conhecimento genômico global em ecologia e biologia evolutiva pode impactar profundamente os esforços futuros de conservação. Esse desequilíbrio é particularmente preocupante, dado que a maioria da diversidade biológica é encontrada em áreas tropicais de latitudes mais baixas.
O sequenciamento do genoma completo (WGS) é usado para entender a diversidade genética , identificar características adaptativas, inferir parentesco evolutivo e detectar genes com funções ou adaptações específicas. Esses aspectos identificáveis de um genoma completo são colchas de retalhos montadas de milhões de projetos de pesquisa que identificam funções genéticas individuais dentro e entre formas de vida.
Na genética da conservação , o WGS oferece insights críticos sobre a saúde genética das populações. Ao revelar padrões de variação genética e endogamia, esses insights informam decisões de gestão para auxiliar na preservação de espécies ameaçadas.
Em um artigo, "Um gradiente latitudinal de genomas de referência", publicado no periódico Molecular Ecology , os pesquisadores revelam que os genomas de referência e a identificação da biodiversidade global de tetrápodes são fortemente distorcidos em direção a espécies no Norte Global e latitudes médias.
Uma busca bibliográfica na Web of Science para pesquisa em genética da conservação revelou que 87% dos estudos tinham autores do Norte Global. O uso do WGS em pesquisa em genética da conservação dentro do Sul Global foi responsável por apenas 1–2% dos estudos relevantes.
Dois conjuntos de dados, o Global Biodiversity Information Facility (GBIF) e o Genome Browser do National Center for Biotechnology Information (NCBI) do US National Institutes of Health, foram comparados para buscar foco no sequenciamento de espécies.
O NCBI é um banco de dados gratuito de pesquisa genômica que contém a coleção mais abrangente do mundo de genomas sequenciados.
O GBIF é um catálogo online gratuito com dados sobre milhões de espécies, com o objetivo de fornecer a qualquer pessoa, em qualquer lugar, acesso aberto a dados sobre todos os tipos de vida na Terra. Ao restringir uma busca do GBIF a espécimes preservados de coleções de museus de história natural e selecionar apenas os espécimes com coordenadas de geolocalização, eles criaram um conjunto de 30.832 tetrápodes.
Comparando esse pool de tetrápodes com genomas de referência disponíveis pelo NCBI, apenas 2.099 espécies (6,8%) têm genomas de referência montados. A maioria das 2.099 espécies sequenciadas se originam do Norte Global e regiões de latitude média, enquanto áreas tropicais e o Sul Global são nitidamente sub-representados. Mesmo dentro dos já limitados 6,8% de dados de espécies, apenas uma pequena fração vem de regiões com a maior biodiversidade.
Catalogar com precisão a biodiversidade global por localização com o WGS é essencial para garantir que os esforços de conservação sejam baseados em dados precisos. Com mais dados de sequenciamento, cientistas de ecologia, evolução e conservação podem preservar melhor a rica diversidade do planeta e proteger espécies ameaçadas para as gerações futuras.
Há também uma função oculta de sequenciamento de dados que os autores mencionam. Revistas científicas de alto impacto têm cada vez mais diretrizes editoriais que esperam dados de sequenciamento, mesmo que não sejam essenciais para todas as questões de pesquisa.
Se a infraestrutura de sequenciamento de alto rendimento estiver fora do alcance dos cientistas que residem onde vive a maioria das espécies do mundo, podemos não estar perdendo apenas alguns dados, mas todos eles.
Mais informações: Ethan B. Linck et al, A Latitudinal Gradient of Reference Genomes, Molecular Ecology (2024). DOI: 10.1111/mec.17551
Informações do periódico: Molecular Ecology