Skip to main content

ATA - 06/05

# ATA DE REUNIÃO

**Projeto:** C26002-ATVX – Implantação de IA no Comercial

| Campo | Informação |

|---|---|

| Data | 06 de maio de 2026 |

| Horário | 17h01 |

| Duração | 2h08min28s |

| Formato | Reunião remota com compartilhamento de tela |

| Participantes identificados | Lucas C. Arruda – Autvix Group; Gustavo L. Schwartz – Autvix Group |

| Fonte | Transcrição da gravação da reunião |

## 1. Objetivo da reunião

Revisar o estado atual do sistema de implantação de IA no Comercial, incluindo arquitetura, requisitos funcionais e não funcionais, modelo de dados, fluxo de ingestão de e-mails, observabilidade, dashboards e evolução dos filtros de classificação. A reunião também teve como objetivo definir ajustes técnicos, prioridades de implementação e próximos prazos do projeto.

## 2. Pauta tratada

- Apresentação do fluxo atual de captura, sincronização, validação e armazenamento de e-mails.

- Revisão dos requisitos funcionais e não funcionais já documentados ou implementados.

- Discussão sobre a complexidade atual envolvendo OneDrive, Fuse Poller, Watch/Inotify, Power Automate, MySQL, Metabase e Grafana.

- Análise de inconsistências na base, especialmente duplicidade de IDs de mensagens e definição do folder\_path como referência única.

- Revisão do modelo de dados, com foco na tabela principal de e-mails, contatos, clientes e classificação.

- Avaliação dos testes de classificação de IA, métricas de acurácia e matriz de confusão.

- Definição dos próximos passos, responsáveis e prazos para migração, testes e entregáveis.

## 3. Principais discussões

### 3.1 Arquitetura e fluxo atual

Foi revisado que o fluxo atual envolve captura de e-mails, geração de pastas, sincronização via OneDrive, detecção por mecanismo baseado em Inotify/Fuse Poller, validação dos dados e inserção em banco MySQL. Também foram citados Metabase e Grafana para visualização e observabilidade. Foi destacado que o fluxo atual funciona, mas possui uma cadeia de serviços extensa e complexa.

### 3.2 Complexidade técnica e necessidade de simplificação

Lucas destacou que o projeto apresenta profundidade técnica em pontos como logs, migrations e observabilidade, mas ainda possui pendências em elementos essenciais do entregável, como estruturação definitiva da base e do filtro principal. Foi defendida a priorização do esqueleto funcional e entregável ao cliente antes de novas camadas de refinamento técnico.

### 3.3 Migração para Microsoft Graph API / Power Automate

A equipe convergiu que a migração do fluxo atual para uma abordagem baseada em Microsoft Graph API, possivelmente via Power Automate, deve reduzir a complexidade lógica e operacional. A substituição reduziria dependências de OneDrive, Fuse Poller e Watch/Inotify, além de facilitar rastreabilidade e confiabilidade do processamento.

### 3.4 Revisão do banco de dados

A tabela de e-mails foi tratada como principal por valor agregado, pois concentra as informações recebidas e serve como base para auditoria, dashboards e relacionamento com classificações. Foi reforçado que o banco não deve ser o mecanismo principal de processamento do modelo, mas sim um repositório histórico, de auditoria e análise futura.

### 3.5 Campos da tabela de e-mails

Foi discutida a manutenção de campos como ID, contato\_id, classificacao\_id, destinatário, subject, data de recebimento, data de processamento, folder\_path, quantidade de anexos, nomes dos anexos e ID da mensagem. Foi sugerida a remoção de body\_html e body\_text, pois os arquivos correspondentes já ficam salvos na pasta, evitando duplicidade e ambiguidade.

### 3.6 Contatos, clientes e domínios

Foi diferenciada a entidade contato da entidade cliente: contato representa quem envia e-mails, enquanto cliente representa a base de clientes cadastrados. Ficou indicado que os domínios de remetentes devem ser relacionados posteriormente a clientes, com apoio de pessoas da área comercial, já que a equipe técnica não possui domínio completo para essa vinculação.

### 3.7 Classificação e filtros de IA

Lucas apresentou testes com regressão logística, banco vetorial, LLM e combinação dos modelos. Foi mencionada acurácia combinada em torno de 91% em amostra de teste e acurácia de 96% na regressão logística sobre 1.097 dados. Também foi reforçada a necessidade de testar com dados não usados no treinamento para validar a real capacidade de generalização.

### 3.8 Métricas, dashboards e observabilidade

A dashboard é considerada requisito do sistema para visualização dos e-mails e indicadores. Foram discutidas métricas como quantidade de anexos, nomes/extensões de arquivos, status de processamento e saúde dos serviços. A observabilidade atual usa Grafana e registros em tabela de status dos serviços.

### 3.9 Integrações externas e limitações

Foi comentada a limitação relacionada a APIs de portais externos, especialmente Petrobras/Petronet. A equipe reconheceu que parte desses problemas depende de terceiros, mas que será necessário acompanhar e cobrar resolução para viabilizar etapas futuras.

## 4. Decisões e alinhamentos

1. Priorizar a entrega funcional do projeto antes de aprofundar novas camadas de refinamento técnico.

2. Migrar o fluxo atual para Microsoft Graph API/Power Automate, substituindo dependências excessivas de OneDrive, Fuse Poller e Watch/Inotify sempre que possível.

3. Tratar a tabela de e-mails como a tabela principal para histórico, auditoria, dashboards e relacionamento com classificações.

4. Manter o folder\_path como referência para localização dos arquivos do e-mail e para consultas futuras, especialmente após classificação.

5. Revisar a base de dados para eliminar inconsistências, especialmente duplicidade de message\_id, reconstruindo a base se necessário a partir dos dados salvos.

6. Remover ou deixar de utilizar campos redundantes como body\_html e body\_text enquanto não houver necessidade clara de uso no banco.

7. Distinguir contato de cliente no modelo de dados, mantendo contato como remetente/domínio e cliente como entidade de cadastro comercial.

8. Delegar a vinculação de domínios a clientes para pessoas com conhecimento comercial, como Juliana e/ou Vidal, por meio de planilha de validação.

9. Focar inicialmente na classificação “solicitação” versus “não solicitação”, antes de aprofundar o filtro de dentro/fora do escopo.

10. Reexecutar testes da pipeline de classificação com dados não utilizados no treinamento, para medir acurácia de forma mais confiável.

## 5. Encaminhamentos e responsáveis

| # | Ação | Responsável | Prazo |

|---:|---|---|---|

| 1 | Implementar a migração do fluxo atual para Graph API/Power Automate, reduzindo dependências de OneDrive/Fuse/Watch. | Gustavo | Até 07/05/2026, 17h |

| 2 | Recarregar ou reconstruir a base de e-mails, validando duplicidades e consistência do message\_id e do folder\_path. | Gustavo | Após migração para Graph API |

| 3 | Revisar o modelo de dados da tabela de e-mails, removendo campos redundantes e mantendo os campos essenciais para auditoria e dashboard. | Lucas e Gustavo | Curto prazo |

| 4 | Exportar lista de domínios/contatos e solicitar validação de associação com clientes à área comercial. | Gustavo, com apoio de Juliana/Vidal | A definir |

| 5 | Revisar prompt/system prompt e repetir testes da pipeline de classificação. | Lucas | Antes da próxima validação técnica |

| 6 | Separar dados não utilizados no treinamento para nova rodada de testes de acurácia. | Lucas, com apoio operacional a definir | Curto prazo |

| 7 | Iniciar desenvolvimento de novo filtro após estabilização da ingestão e validação inicial da classificação. | Lucas | Após testes e base ajustada |

| 8 | Buscar bios/dados da Davis/Multimix ou focar inicialmente em uma única empresa para simplificar o recorte do teste. | Lucas/Romeu | Até 11/05/2026, se possível |

| 9 | Acompanhar pendências com APIs externas, especialmente Petronet/Petrobras. | Lucas | Contínuo |

| 10 | Preparar dashboard robusta para apresentação, com base nos dados disponíveis. | Gustavo | Até 11/05/2026 |

## 6. Prazos combinados

| Data | Entrega/Marco |

|---|---|

| 07/05/2026, até 17h | Conclusão estimada da migração inicial para Graph API/Power Automate e ajustes de base. |

| 11/05/2026, até 17h | Meta de ter pré-classificador em conjunto com a base ajustada; possibilidade de dashboard robusta. |

| 29/05/2026 | Meta indicativa para ter algo rodando no Comercial. O prazo foi reconhecido como desafiador, especialmente para a parte de IA. |

## 7. Pontos em aberto

- Confirmar o desenho final da arquitetura após a migração para Graph API/Power Automate.

- Validar se o ID da mensagem será único em todos os cenários e como será tratado quando houver múltiplos destinatários.

- Definir com precisão quais campos permanecerão nas tabelas de e-mails, contatos, clientes e classificação.

- Confirmar o mecanismo final de entrega dos resultados classificados ao cliente: CRM, plataforma futura, dashboard ou outro canal.

- Avaliar a viabilidade de integração com portais externos e contornar limitações de APIs de terceiros.

- Definir quem fará a rotulagem/validação de dados não treinados para os próximos testes.

## 8. Encerramento

A reunião foi encerrada após a definição dos próximos passos técnicos, com foco na simplificação da arquitetura, revisão do modelo de dados, melhoria da confiabilidade da ingestão de e-mails e continuidade dos testes de classificação. A próxima etapa prática é a migração para Graph API/Power Automate, seguida da validação da base e avanço do pré-classificador.

---

Ata elaborada a partir da transcrição da reunião.