SBPO 2025 · Pesquisa Operacional · Gramado/RS

Inteligência Artificial Generativa: construção e avaliação de um modelo em apoio à Autoridade Marítima Brasileira

Márcio Selemen Coelho — Capitão de Corveta (IM), Diretoria de Abastecimento da Marinha (DAbM)

Ketia Kellen Araújo da Silva — Capitão de Corveta (RM3-T), Escola de Guerra Naval (EGN)

Apresentado no 57º Simpósio Brasileiro de Pesquisa Operacional (SBPO 2025), Gramado/RS, outubro de 2025.

Resumo

Este artigo apresenta o desenvolvimento de um modelo de inteligência artificial generativa com arquitetura de recuperação, ampliação e geração (RAG) para aplicação de normas da Autoridade Marítima Brasileira. O estudo abordou a construção de uma base vetorial, a partir de normativos selecionados, e a implementação de uma ferramenta usando um grande modelo de linguagem (LLM). A avaliação de desempenho do modelo utilizou questões de concurso público da Marinha do Brasil para ingresso no quadro técnico de segurança do tráfego aquaviário, alcançando 75% de acurácia. Métricas complementares mostraram fidelidade entre 50–100%, relevância da resposta entre 80–89% e relevância do contexto entre 5–25%. Os resultados indicam desempenho robusto da ferramenta, comparável a benchmarks de modelos avançados do mercado. O trabalho discute, ainda, limitações como alucinações, vieses e questões de interpretabilidade. Por fim, conclui-se que o modelo representa um avanço significativo, com potencial para automatizar consultas, agilizar interpretações e aprimorar o treinamento de pessoal.

Destaques

Palavras-chave

IA Generativa Grandes Modelos de Linguagem Avaliação de Desempenho RAG Pesquisa Operacional

Abstract (EN)

This article presents the development of a generative artificial intelligence model with retrieval-augmented generation architecture for applying Brazilian Maritime Authority regulations. The model's performance evaluation utilized Brazilian Navy public examination questions for the waterway traffic safety technical corps, achieving 75% accuracy, with results comparable to benchmarks of advanced market models. The work also discusses limitations such as hallucinations, biases, and interpretability, concluding that the model represents a significant advancement with potential to automate queries, streamline regulatory interpretations, and enhance personnel training.

Ler o artigo completo (PDF) Falar sobre o projeto