# perk/mm-loyalty

## Hero

### De endpoints de 500ms pra enterprise-grade a tempo de um lançamento global.

A M&M's precisava de uma plataforma de fidelidade pronta pra milhares de usuários simultâneos. A infra existente não chegava perto. A Bleu reconstruiu a camada de performance, monitoramento e resposta a incidentes antes da data de lançamento.

## Contexto

No início de 2025, a Perk conquistou a maior oportunidade até então: a M&M's queria lançar o "M&M's Fun Club" — uma plataforma de engajamento que iria ao ar em fevereiro de 2025. O problema: a infra existente não tava pronta pra esse nível.

Endpoints respondendo em 500ms+. Código cheio de queries n+1 e problemas de memória. Sem monitoramento de verdade, sem sistema de resposta a incidentes, e sem confiança de que a plataforma aguentaria o tráfego de uma marca global.

Com milhares de usuários concorrentes esperados e data de lançamento fixa, a Perk precisava de mais que melhorias incrementais — precisava de uma transformação técnica completa.

- Endpoints em 500ms+ com queries n+1 e problemas de memória
- Sem monitoramento de verdade nem resposta a incidentes
- Infra não preparada pra tráfego de marca global
- Data de lançamento fixa em fevereiro de 2025

## Nosso papel

Assumimos a base técnica. Não só corrigindo problemas — reconstruindo infra do zero enquanto entregávamos o que a M&M's precisava pro lançamento.

O que tava em jogo era claro: se a plataforma falhasse no lançamento, não era só o relacionamento com a M&M's que seria afetado — a confiança de que a Perk conseguia operar nesse nível ficaria comprometida.

### Quote

> "Não são clientes pequenos. Temos repercussões reais como empresa se algo der errado, até penalidades financeiras por downtime. É bom que eu não fico acordado à noite preocupado que vai quebrar."

## O que mudou

A plataforma saiu de frágil sob carga pra estável em produção. Tempos de resposta caíram de 500ms+ pra menos de 50ms. Testes de carga validaram 10.000 usuários concorrentes e, desde o lançamento, a plataforma mantém 99.984% de uptime.

- M&M's lançou no prazo em fevereiro de 2025 com zero downtime no período crítico
- Tempos de resposta de 500ms+ pra menos de 50ms
- 10.000 usuários concorrentes validados em testes de carga
- 99.984% de uptime desde o lançamento

## Áreas que assumimos

#### Reconstrução de Infra

Deploy manual substituído por Infrastructure as Code com AWS CDK.

- **Infrastructure as Code**: Substituímos deploys manuais por IaC com AWS CDK. Padrões de segurança enterprise desde o dia 1 e arquitetura pensada pra escalar horizontalmente em picos imprevisíveis.

#### Otimização de Performance

90% de redução em latência com otimização sistemática.

- **Otimização Sistemática**: Redução de 90% em latência — eliminando queries n+1, adicionando índices estratégicos e resolvendo problemas de memória em toda a base. Validado com testes de carga até a aplicação aguentar 10.000 usuários concorrentes tranquilamente.

#### Sistema de Escaneamento de Recibos

A mecânica central de engajamento da plataforma.

- **Escaneamento de Recibos**: Mecânica central: clientes submetem recibos com produtos M&M's, o sistema processa e valida automaticamente, e usuários resgatam recompensas por merchandise M&M's.

#### Desafios e Mini-Games

Mini-games interativos integrados à plataforma.

- **Desafios e Mini-Games**: Mini-games interativos integrados à plataforma com sistema de recompensas por pontos e desafios exclusivos com tema M&M's.

#### Sistema de Notificações

Notificações de plataforma e mensagens direcionadas.

- **Notificações**: Sistema de notificações pra mensagens de plataforma e comunicações direcionadas, dando à M&M's mais uma forma de reagir à atividade durante o lançamento.

#### Frontend Customizado

Frontend dedicado pra experiência M&M's.

- **Frontend M&M's**: Frontend dedicado construído sobre a plataforma reestruturada, dando à marca uma experiência própria sem bifurcar a base.

#### API GraphQL

Nova API projetada pro frontend M&M's.

- **Nova API GraphQL**: API GraphQL projetada pro frontend M&M's com queries otimizadas que eliminaram os problemas n+1 dos endpoints REST legados.

#### Dados & Analytics

Motor de processamento CSV e dashboards admin.

- **Processamento de Dados**: Motor de processamento CSV que exporta milhões de linhas em segundos, mais dashboards admin com padrões de acesso, retenção e informações de estoque.

#### APM & Monitoramento

Rotinas de health check e detecção proativa.

- **Health Check**: Rotinas semanais monitorando infra, entrega de email e tempos de resposta — detectando problemas antes dos usuários perceberem.

#### Hardening de Segurança

Sistema OTP com proteção contra ataques.

- **Sistema OTP**: Sistema de one-time password com proteção contra força bruta, rainbow table e vulnerabilidades de birthday problem.

#### On-Call & Resposta a Incidentes

Cobertura 24/7 com engenheiros seniores.

- **Rotação On-Call**: Cobertura 24/7 com engenheiros seniores em rotação — 100% de cobertura de resposta a incidentes com protocolos de resolução rápida.

#### Sistema de Webhooks

Webhooks configuráveis pra eventos em tempo real.

- **Webhooks**: Webhooks configuráveis pra emissão de eventos em tempo real, sincronizando infra M&M's e Perk.

## Por que essa parceria funciona

O lançamento M&M's exigia velocidade e precisão — sem espaço pra plataforma ceder sob pressão e sem tempo pra construir devagar. A Bleu operou como extensão do time da Perk, assumindo decisões técnicas enquanto a Perk focava no relacionamento com o cliente e coordenação do lançamento.

## Resultado

O lançamento do M&M's Fun Club comprovou que a Perk conseguia sustentar uma marca global em condições reais. Infra reconstruída, performance otimizada e práticas de confiabilidade implementadas antes do go-live — o time entregou em fevereiro de 2025 sem downtime e deixou uma base reutilizável pros próximos projetos desse porte.