ATA - 06/05

ATA DE REUNIÃO

Projeto: C26002-ATVX – Implantação de IA no Comercial

Campo Informação
Data 06 de maio de 2026
Horário 17h01
Duração 2h08min28s
Formato Reunião remota com compartilhamento de tela
Participantes identificados Lucas C. Arruda – Autvix Group; Gustavo L. Schwartz – Autvix Group
Fonte Transcrição da gravação da reunião

1. Objetivo da reunião

Revisar o estado atual do sistema de implantação de IA no Comercial, incluindo arquitetura, requisitos funcionais e não funcionais, modelo de dados, fluxo de ingestão de e-mails, observabilidade, dashboards e evolução dos filtros de classificação. A reunião também teve como objetivo definir ajustes técnicos, prioridades de implementação e próximos prazos do projeto.

2. Pauta tratada

3. Principais discussões

3.1 Arquitetura e fluxo atual

Foi revisado que o fluxo atual envolve captura de e-mails, geração de pastas, sincronização via OneDrive, detecção por mecanismo baseado em Inotify/Fuse Poller, validação dos dados e inserção em banco MySQL. Também foram citados Metabase e Grafana para visualização e observabilidade. Foi destacado que o fluxo atual funciona, mas possui uma cadeia de serviços extensa e complexa.

3.2 Complexidade técnica e necessidade de simplificação

Lucas destacou que o projeto apresenta profundidade técnica em pontos como logs, migrations e observabilidade, mas ainda possui pendências em elementos essenciais do entregável, como estruturação definitiva da base e do filtro principal. Foi defendida a priorização do esqueleto funcional e entregável ao cliente antes de novas camadas de refinamento técnico.

3.3 Migração para Microsoft Graph API / Power Automate

A equipe convergiu que a migração do fluxo atual para uma abordagem baseada em Microsoft Graph API, possivelmente via Power Automate, deve reduzir a complexidade lógica e operacional. A substituição reduziria dependências de OneDrive, Fuse Poller e Watch/Inotify, além de facilitar rastreabilidade e confiabilidade do processamento.

3.4 Revisão do banco de dados

A tabela de e-mails foi tratada como principal por valor agregado, pois concentra as informações recebidas e serve como base para auditoria, dashboards e relacionamento com classificações. Foi reforçado que o banco não deve ser o mecanismo principal de processamento do modelo, mas sim um repositório histórico, de auditoria e análise futura.

3.5 Campos da tabela de e-mails

Foi discutida a manutenção de campos como ID, contato_idclassificacao_id, destinatário, subject, data de recebimento, data de processamento, folder_path, quantidade de anexos, nomes dos anexos e ID da mensagem. Foi sugerida a remoção de body_html e body_text, pois os arquivos correspondentes já ficam salvos na pasta, evitando duplicidade e ambiguidade.

3.6 Contatos, clientes e domínios

Foi diferenciada a entidade contato da entidade cliente: contato representa quem envia e-mails, enquanto cliente representa a base de clientes cadastrados. Ficou indicado que os domínios de remetentes devem ser relacionados posteriormente a clientes, com apoio de pessoas da área comercial, já que a equipe técnica não possui domínio completo para essa vinculação.

3.7 Classificação e filtros de IA

Lucas apresentou testes com regressão logística, banco vetorial, LLM e combinação dos modelos. Foi mencionada acurácia combinada em torno de 91% em amostra de teste e acurácia de 96% na regressão logística sobre 1.097 dados. Também foi reforçada a necessidade de testar com dados não usados no treinamento para validar a real capacidade de generalização.

3.8 Métricas, dashboards e observabilidade

A dashboard é considerada requisito do sistema para visualização dos e-mails e indicadores. Foram discutidas métricas como quantidade de anexos, nomes/extensões de arquivos, status de processamento e saúde dos serviços. A observabilidade atual usa Grafana e registros em tabela de status dos serviços.

3.9 Integrações externas e limitações

Foi comentada a limitação relacionada a APIs de portais externos, especialmente Petrobras/Petronet. A equipe reconheceu que parte desses problemas depende de terceiros, mas que será necessário acompanhar e cobrar resolução para viabilizar etapas futuras.

4. Decisões e alinhamentos

  1. Priorizar a entrega funcional do projeto antes de aprofundar novas camadas de refinamento técnico.
  2. Migrar o fluxo atual para Microsoft Graph API/Power Automate, substituindo dependências excessivas de OneDrive, Fuse Poller e Watch/Inotify sempre que possível.
  3. Tratar a tabela de e-mails como a tabela principal para histórico, auditoria, dashboards e relacionamento com classificações.
  4. Manter o folder_path como referência para localização dos arquivos do e-mail e para consultas futuras, especialmente após classificação.
  5. Revisar a base de dados para eliminar inconsistências, especialmente duplicidade de message_id, reconstruindo a base se necessário a partir dos dados salvos.
  6. Remover ou deixar de utilizar campos redundantes como body_html e body_text enquanto não houver necessidade clara de uso no banco.
  7. Distinguir contato de cliente no modelo de dados, mantendo contato como remetente/domínio e cliente como entidade de cadastro comercial.
  8. Delegar a vinculação de domínios a clientes para pessoas com conhecimento comercial, como Juliana e/ou Vidal, por meio de planilha de validação.
  9. Focar inicialmente na classificação “solicitação” versus “não solicitação”, antes de aprofundar o filtro de dentro/fora do escopo.
  10. Reexecutar testes da pipeline de classificação com dados não utilizados no treinamento, para medir acurácia de forma mais confiável.

5. Encaminhamentos e responsáveis

# Ação Responsável Prazo
1 Implementar a migração do fluxo atual para Graph API/Power Automate, reduzindo dependências de OneDrive/Fuse/Watch. Gustavo Até 07/05/2026, 17h
2 Recarregar ou reconstruir a base de e-mails, validando duplicidades e consistência do message_id e do folder_path. Gustavo Após migração para Graph API
3 Revisar o modelo de dados da tabela de e-mails, removendo campos redundantes e mantendo os campos essenciais para auditoria e dashboard. Lucas e Gustavo Curto prazo
4 Exportar lista de domínios/contatos e solicitar validação de associação com clientes à área comercial. Gustavo, com apoio de Juliana/Vidal A definir
5 Revisar prompt/system prompt e repetir testes da pipeline de classificação. Lucas Antes da próxima validação técnica
6 Separar dados não utilizados no treinamento para nova rodada de testes de acurácia. Lucas, com apoio operacional a definir Curto prazo
7 Iniciar desenvolvimento de novo filtro após estabilização da ingestão e validação inicial da classificação. Lucas Após testes e base ajustada
8 Buscar bios/dados da Davis/Multimix ou focar inicialmente em uma única empresa para simplificar o recorte do teste. Lucas/Romeu Até 11/05/2026, se possível
9 Acompanhar pendências com APIs externas, especialmente Petronet/Petrobras. Lucas Contínuo
10 Preparar dashboard robusta para apresentação, com base nos dados disponíveis. Gustavo Até 11/05/2026

6. Prazos combinados

Data Entrega/Marco
07/05/2026, até 17h Conclusão estimada da migração inicial para Graph API/Power Automate e ajustes de base.
11/05/2026, até 17h Meta de ter pré-classificador em conjunto com a base ajustada; possibilidade de dashboard robusta.
29/05/2026 Meta indicativa para ter algo rodando no Comercial. O prazo foi reconhecido como desafiador, especialmente para a parte de IA.

7. Pontos em aberto

8. Encerramento

A reunião foi encerrada após a definição dos próximos passos técnicos, com foco na simplificação da arquitetura, revisão do modelo de dados, melhoria da confiabilidade da ingestão de e-mails e continuidade dos testes de classificação. A próxima etapa prática é a migração para Graph API/Power Automate, seguida da validação da base e avanço do pré-classificador.


Ata elaborada a partir da transcrição da reunião.


Revision #4
Created 18 May 2026 14:13:43 by Lucas Arruda
Updated 18 May 2026 14:18:17 by Lucas Arruda