O projeto Artificial Intelligence for Aviation Data Analysis (AirData) envolve o desenvolvimento de um sistema de armazenamento e análise de dados para o setor de aviação brasileiro, focado na aviação civil, fundamentado em técnicas de Inteligência Artificial (IA). Esse sistema integrará e aprimorará dados provenientes de múltiplas bases do setor aeronáutico, incluindo dados oriundos da ANAC, SAC e DECEA, complementados por dados de trajetória do OpenSky. A plataforma utilizará algoritmos de IA para melhorar a qualidade das informações, reduzindo erros e inconsistências nos dados, o que permitirá automatizar e aprimorar o cálculo dos indicadores estabelecidos pelo GANP, GASP e PAN, por exemplo.
O AirData implementará técnicas de análise preditiva e prescritiva baseadas em Machine Learning (ML), visando a identificação de tendências e padrões anômalos no sistema de aviação civil. O sistema deverá ser capaz de identificar desvios significativos de trajetórias em relação às rotas padrão estabelecidas, correlacionando possíveis fatores causais, como condições meteorológicas, restrições operacionais ou outros eventos relevantes. Além disso, a plataforma permitirá analisar o impacto em cascata de atrasos na rede de transporte aéreo, identificando como perturbações em determinados aeroportos podem afetar sistemicamente a malha aérea nacional.
A arquitetura do sistema será projetada para ser flexível e escalável, possibilitando a incorporação de novas bases de dados e a contínua evolução dos indicadores. Isso garantirá que o setor de aviação brasileiro permaneça alinhado com as mais recentes práticas de análise de dados, promovendo uma tomada de decisão mais informada e eficiente em todos os níveis. Como produtos finais, o projeto disponibilizará uma ferramenta web para consulta de eventos aeronáuticos, permitindo também o download de dados em XLS ou CSV, e uma plataforma experimental com chatbot baseado em IA generativa para análises complexas do setor.
Por fim, é importante destacar que o projeto enfrenta desafios técnicos importantes. O primeiro refere-se à harmonização temporal das diferentes bases de dados, garantindo a correta correlação entre eventos aeronáuticos registrados em diferentes sistemas. Além disso, existem complexidades inerentes à estimativa precisa dos indicadores, como por exemplo os do GANP e GASP, que demandarão o desenvolvimento de metodologias de processamento e análise de dados para assegurar resultados confiáveis e aderentes aos padrões internacionais. No contexto da implementação dos chatbots, a utilização de modelos de IA generativa open source apresenta desafios próprios, como possíveis limitações na precisão e contextualização das respostas durante as fases iniciais do projeto, demandando um processo iterativo de refinamento e ajuste dos modelos. Outros desafios incluem a necessidade de lidar com bases de dados que podem apresentar informações ausentes ou divergentes entre si, garantir que os diferentes sistemas existentes consigam efetivamente trocar informações entre si, e desenvolver métodos para verificar se as previsões e análises geradas pelo sistema estão realmente adequadas e confiáveis.