🎯 Missão do Cargo
Manter os alicerces técnicos que sustentam a plataforma Ploomes operando com estabilidade, segurança e desempenho — garantindo que os sistemas operacionais, os clusters Kubernetes e a infraestrutura de rede estejam configurados corretamente, atualizados e prontos para absorver o crescimento da base de clientes. Você é a referência técnica do time de engenharia em tudo que envolve servidores, redes e orquestração de contêineres.
📋 Responsabilidades e Entregáveis
-
Gestão de Sistemas Operacionais
Administrar e manter os servidores (Windows e Linux) da plataforma, aplicando atualizações e patches de segurança periodicamente.
100% dos servidores com patches críticos aplicados dentro do prazo, sem sistemas desatualizados há mais de 30 dias.
-
Gestão de Clusters Kubernetes
Operar, monitorar e evoluir os clusters Kubernetes da plataforma, garantindo disponibilidade e otimização de recursos.
Clusters com uptime alinhado à meta de 99,9%, com relatório mensal de utilização e ações de otimização.
-
Configuração de Rede e Segurança de Perímetro
Gerenciar configurações de rede, VPN e firewalls para garantir conectividade segura entre serviços e usuários.
Topologia de rede documentada e atualizada, regras de firewall revisadas trimestralmente, sem exposições indevidas em auditorias.
-
Automação de Provisionamento
Utilizar Ansible e/ou Terraform para automatizar configuração e provisionamento de infraestrutura, reduzindo configuração manual.
Ao menos 80% dos provisionamentos recorrentes automatizados, com documentação dos scripts.
-
Suporte ao Time de Engenharia
Ser o ponto de referência para resolução de problemas de infraestrutura que impactem o desenvolvimento ou a operação.
SLA de resposta a chamados cumprido, com causa raiz documentada para incidentes.
-
Monitoramento Proativo
Acompanhar métricas de saúde da infraestrutura e agir antes que problemas afetem o usuário final.
Alertas configurados para CPU, memória, disco e rede nos servidores críticos, com playbooks de resposta documentados.
-
🤖 Uso Estratégico de IA
Gerar scripts de automação (Ansible, Bash); analisar logs e identificar padrões de falha; redigir runbooks; verificar configurações contra boas práticas de segurança; triagem de alertas; gerar configurações Kubernetes a partir de requisitos.
🔧 Conhecimento Técnico
-
Sistemas Operacionais (Linux / Windows Server)
Conhecimento avançado em administração — tuning, troubleshooting e hardening de servidores em ambiente de produção.
-
Kubernetes
Experiência operacional sólida — deploys, namespaces, RBAC, HPA, PVC e troubleshooting de pods em clusters de produção.
-
Redes e Segurança
Domínio de TCP/IP, DNS, VPN e firewall aplicado a infraestrutura em nuvem e on-premises.
-
IaC e Automação (Ansible / Terraform)
Experiência com automação de provisionamento e gestão de configuração; scripts versionados e documentados.
-
Cloud IaaS (Azure / AWS / GCP)
Conhecimento nos provedores em uso — VMs, storage, load balancers e networking em ambiente de nuvem.
💡 Comportamentos na Prática