Prevê a criação de uma plataforma digital que integra, organiza e disponibiliza os dados gerados pelos diversos grupos de pesquisa da instituição para superar os desafios atuais de acesso, interoperabilidade e reutilização das informações científicas, promovendo uma infraestrutura moderna e dinâmica para armazenamento, catalogação e análise de dados em larga escala.
Atualmente, os dados produzidos pelo ITV DS estão pulverizados em diferentes formatos e repositórios, como planilhas, relatórios, artigos científicos e bancos de dados locais. Essa fragmentação compromete o potencial de descoberta científica e a geração de conhecimento estratégico. Inspirado nos princípios FAIR (Findable, Accessible, Interoperable, Reusable), o projeto propõe o desenvolvimento de um data lake institucional que permita a ingestão de dados brutos em seus formatos nativos, com estruturação posterior conforme as necessidades analíticas.
A plataforma poderá integrar dados heterogêneos, como informações sobre uso e cobertura do solo, clima, biodiversidade, genética, geologia, hidrologia e socioeconomia, tendo a geolocalização como eixo comum. Além disso, permitirá a anotação com metadados, atualização dinâmica e acesso controlado, viabilizando análises avançadas com o uso de inteligência artificial, modelagem preditiva e visualização interativa. A arquitetura do DataLakeDS será baseada em uma estrutura de zoneamento de dados, com etapas específicas para avaliação de qualidade, transformação, governança, utilidade e exploração, conforme modelos de referência consolidados na literatura científica.








