Neste episódio nós destrinchamos o grande outage recente da AWS sob a ótica de DevOps/SRE: da hipótese inicial (DNS/DynamoDB e dependências trans-regionais) até os desdobramentos práticos em arquitetura resiliente. Conversamos com o Lucas Azevedo sobre como diagnosticar incidentes que parecem “só mais uma intermitência” e viram uma queda global. Falamos de guerra de versões em automações de DNS, caminhos de controle que ainda dependem de us-east-1 e por que “é sempre DNS… até quando não é”.

Também exploramos estratégias de resiliência multi-região e os compromissos reais entre custo, complexidade e RTO/RPO. Discutimos como mapear blast radius, priorizar runbooks acionáveis e criar exercícios de resiliência que vão além do chaos monkey. Trazemos casos de falhas cascata, impactos em serviços gerenciados (KMS, EKS, IAM, Support), além de práticas de observabilidade viva para encurtar MTTR quando o provedor está fora do ar.



Por fim, damos um giro de lições aprendidas para equipes de produto e plataforma: feature flags para fallback de integrações, rotas alternativas para planos de controle, circuit breakers em clientes, e playbooks para comunicação com stakeholders. Dois tópicos que merecem atenção especial neste papo: resiliência multi-região na prática e como preparar sua organização para incidentes “quase improváveis”.

Links Importantes:

  • Lucas Azevedo - https://www.linkedin.com/in/lazevedo-devops/

  • Comunidade DevOps no Discord - https://discord.com/invite/k6wPagw4tV

  • João Brito - https://www.linkedin.com/in/juniorjbn/



    🎧 Ouça também o Kubicast no Spotify, e compartilhe com toda a turma que está trabalhando no novo plano de DR!

Social

Fale conosco

Almeda Campinas 802, CJ 12, Jardim Paulista,

São Paulo - SP, 01404-001

Faça parte do time

Nossos conteúdos

Social

Fale conosco

Almeda Campinas 802, CJ 12, Jardim Paulista,

São Paulo - SP, 01404-001

Faça parte do time

Nossos conteúdos

Social

Fale conosco

Almeda Campinas 802, CJ 12, Jardim Paulista,

São Paulo - SP, 01404-001

Faça parte do time

Nossos conteúdos