🎯 Missão do Cargo
Garantir que a missão da área — entregar o produto em plataforma de altíssima disponibilidade e segurança com eficiência financeira — seja executada com consistência e evolução contínua. Isso significa liderar as equipes de infraestrutura, DevOps e banco de dados, garantindo que a estratégia técnica esteja alinhada ao crescimento da base de clientes, ao roadmap de produto e às demandas do time de backend. Você conecta o nível técnico ao nível estratégico, tomando decisões que equilibram qualidade, velocidade e custo.
📋 Responsabilidades e Entregáveis
-
Liderança das Equipes de Infraestrutura
Gerir e desenvolver as equipes de infraestrutura, DevOps e banco de dados, garantindo capacidade técnica, engajamento e entrega consistente.
Equipes operando dentro dos SLAs, 1:1s realizados semanalmente, PDIs ativos e turnover abaixo da meta da empresa.
-
Planejamento de Escalabilidade Técnica
Planejar a evolução da infraestrutura alinhada ao crescimento da base de usuários, lançamentos de produto e mudanças de arquitetura de backend.
Roadmap de infraestrutura atualizado trimestralmente, com capacidade projetada para 12 meses e decisões de investimento documentadas.
-
Gestão de Custos de Cloud
Monitorar e otimizar os gastos com computação em nuvem, mantendo o custo dentro da meta de 13% do MRR de produto.
Relatório mensal de custos com análise de desvios e plano de otimização; custo dentro da meta no acumulado trimestral.
-
Decisões de Arquitetura de Infraestrutura
Liderar as decisões técnicas de maior impacto — escolha de provedores, mudanças de arquitetura, adoção de novas tecnologias.
Decisões documentadas em ADRs com análise de trade-offs, custo e risco; alinhamento com a liderança de engenharia antes da implementação.
-
Aproximação com o Time de Backend
Garantir que a área de infraestrutura seja um parceiro ativo do time de backend, antecipando necessidades e reduzindo fricção operacional.
Participação em cerimônias de engenharia, com demandas de infraestrutura identificadas e priorizadas antes de virarem bloqueios.
-
Gestão de Disponibilidade e Incidentes
Garantir processos maduros de resposta a incidentes, com metas de disponibilidade cumpridas e evolução contínua dos processos.
Meta de 99,9% cumprida; post-mortem de todo incidente crítico em até 5 dias úteis; incidentes repetidos reduzindo trimestre a trimestre.
-
🤖 Uso Estratégico de IA
Analisar tendências de custo de cloud e simular cenários de otimização; elaborar roadmap técnico e ADRs; analisar métricas de disponibilidade e identificar padrões de incidentes; gerar relatórios executivos; pesquisar e avaliar novas tecnologias; apoiar a gestão com templates de 1:1 e planos de desenvolvimento.
🔧 Conhecimento Técnico
-
Cloud e FinOps
Domínio dos principais provedores (Azure, AWS ou GCP) com foco em otimização de custos — análise de usage, reservas, rightsizing e relatórios de FinOps.
-
Arquitetura e Decisões Técnicas
Capacidade de conduzir ADRs com análise de trade-offs; visão sistêmica de infraestrutura, DevOps e dados como plataforma integrada.
-
Gestão de SRE e Disponibilidade
Processos maduros de incident response, post-mortem, SLO/SLA e evolução contínua de confiabilidade da plataforma.
-
Liderança Técnica e Desenvolvimento de Times
Condução de 1:1s, PDIs e ciclos de feedback; capacidade de desenvolver engenheiros sênior e construir times de alta performance.
-
Estratégia e Roadmap de Infraestrutura
Planejamento de capacidade para 12 meses; alinhamento de investimentos técnicos com crescimento de MRR e roadmap de produto.
💡 Comportamentos na Prática