No episódio #168 do Kubicast, recebemos Natália Granato, especialista em engenharia de plataformas, para uma conversa afiada sobre DevOps real, com foco em troubleshooting, incidentes em produção e boas práticas que nascem do caos — e não de um whitepaper.
A Natália compartilhou histórias que todo time de infraestrutura vai reconhecer: aquele bug fantasma que só aparece em produção, a enxurrada de alertas inúteis que escondem o problema real, e os aprendizados que só surgem depois de passar pelo fogo. Literalmente, às vezes.
Mais do que falar de ferramentas, o papo mergulha na cultura por trás de um bom processo de resolução de incidentes, onde a comunicação e a confiança do time são tão importantes quanto qualquer script ou dashboard.
Entre uma piada e outra, discutimos:
Como construir uma cultura de pós-mortem honesta e sem caça às bruxas
O impacto de uma stack de observabilidade mal calibrada (spoiler: ruído é inimigo)
Quando não é problema de DNS — mas você ainda acha que é
Ferramentas que ajudam (e as que atrapalham)
A pressão de manter ambientes críticos funcionando sem perder a sanidade
Se você já passou por um incidente em produção e pensou “não é possível que só comigo isso acontece”, esse episódio é pra você. E se ainda não passou, ouça para estar melhor preparado — porque vai acontecer.
🎧 Ouça também o Kubicast no Spotify, e compartilhe com aquele colega que vive dizendo “sobe em produção e a gente vê” — talvez ele veja mesmo.