Pesquisadores recorreram à inteligência artificial para complementar e consolidar uma série de informações até então dispersas sobre os chamados tetrápodes – superclasse de vertebrados terrestres possuidores de quatro membros, como é o caso de mamíferos, aves, répteis e anfíbios.
Reunidos no repositório TetrapodTraits, os dados permitem aos usuários, por exemplo, conhecer os serviços ecossistêmicos prestados em uma determinada área ou estudar um grupo de espécies distribuído pelo mundo. Podem ainda ser úteis para esforços de conservação.
O trabalho teve apoio da FAPESP e foi publicado ontem (11/07) na revista PLOS Biology.
“Até agora, quem quisesse fazer um trabalho sobre múltiplos grupos de espécies precisava consultar diferentes bancos de dados, harmonizar essas informações para garantir que estava tratando das mesmas espécies em cada dataset e ainda lidar com a falta de dados sobre muitas delas. Nosso banco tem dados completos e harmonizados, no contexto espacial, filogenético e ecológico para cada espécie”, explica Mario Moura, pesquisador do Instituto de Biologia da Universidade Estadual de Campinas (IB-Unicamp) apoiado pela FAPESP e líder do estudo.
Mais do que a soma de outros bancos de dados, acrescido de informações contidas na literatura científica, o repositório tem como diferencial o uso de inteligência artificial para completar as informações deixadas em aberto pelos estudos científicos realizados até hoje sobre esse grupo de animais.
Nas espécies em que faltavam informações, nosso algoritmo cruzou as que existiam sobre a própria espécie com as de outras evolutivamente próximas. Após 10 mil simulações, chegou-se a um valor que está agora informado no nosso banco de dados, com a ressalva de que é deduzido por inteligência artificial”, explana.
Foram incluídos valores observados, predições e fontes de informação para as 33.281 espécies de tetrápodes de que se tem notícia. Os dados incluem tamanho corporal (comprimento e peso), período de atividade (noturno ou diurno), micro e macro-hábitat (aquático, terrestre, arborícola, fossorial etc.), ecossistema (floresta, savana, deserto etc.), grau de ameaça de extinção (criticamente ameaçado, não ameaçado, vulnerável etc.), mapa de ocorrência, se vive ou não em ilha, preferências ambientais e dados sofre influência humana na área de distribuição da espécie.
O repositório, com quase 800 mil entradas de dados, envolveu o uso de mais de 3,4 mil referências, sendo que 66% dessas informações foram harmonizadas a partir de bancos já existentes. Os pesquisadores focaram nas cinco informações que mais faltam nessas fontes: tamanho e massa corporal, período de atividade, micro-hábitat e grau de ameaça. Apenas 43% dos tetrápodes tinham todos esses dados disponíveis em repositórios.
Com a adição manual de informações contidas na literatura científica e os valores calculados por inteligência artificial, em 24 atributos desses animais existem agora 98% de informações completas.
Lacunas
O trabalho é parte do VertLife, plataforma criada na Universidade de Yale, nos Estados Unidos, onde Moura realizou pós-doutorado. Desde 2012, a iniciativa vem criando bancos de dados por grupos de espécies. O TetrapodTraits também engloba informações do projeto Map of Life, que consolida mapas de distribuição provenientes de diferentes fontes.
Ao levantar um número tão grande de informações, sobre tantas espécies, os pesquisadores puderam entender os diferentes vieses na coleta de dados de história natural. Em um trabalho anterior, Moura havia apresentado os principais direcionamentos adotados em estudos sobre répteis (leia mais em: agencia.fapesp.br/40631).
“As espécies que mais se conhecia eram as de tamanho e peso maior, mais fáceis de serem detectadas. As que faltavam mais dados eram as de pequeno porte, como animais com menos de um grama, nem sempre possíveis de serem pesados nas balanças mais comuns”, conta Moura.
“Existe muito conhecimento sobre o período de atividade de animais diurnos, enquanto a maioria dos dados faltantes foi predita como sendo referente a espécies noturnas, o que pode indicar maior dificuldade de amostragem desse grupo”, avalia.
O TetrapodTraits terá uma plataforma interativa em que os usuários poderão atualizar os dados existentes, algo fundamental para manter a relevância do repositório. Isso porque novas espécies são descritas o tempo todo, outras reclassificadas. “Esse dinamismo é muito laborioso nos estudos de biodiversidade”, comenta Moura.
O estudo também tem apoio da FAPESP por meio de outros três projetos (20/12558-0, 22/15247-0 e 16/25358-3).
O artigo A phylogeny-informed characterisation of global tetrapod traits addresses data gaps and biases pode ser lido gratuitamente em: https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3002658.
Informações da Agência FAPESP