Sobre a Suflex
A Suflex é uma empresa de tecnologia SaaS focada em soluções para restaurantes e cozinhas profissionais. Nosso propósito é simplificar processos, aumentar a eficiência operacional e transformar a jornada de clientes com produtos inovadores e de alto impacto.
Buscamos SRE Pleno (foco em confiabilidade, observabilidade e automação) para fortalecer nossas plataformas.
Responsabilidades e Atribuições :
- Monitorar e garantir a disponibilidade, performance e resiliência dos serviços
- Configurar e evoluir métricas, logs e alertas acionáveis
- Investigar incidentes e propor soluções permanentes (post-mortem e RCA)
- Criar rotinas e automações para prevenção de falhas
- Apoiar os times de backend e frontend na instrumentação das aplicações
- Mapear gargalos de consumo, escalabilidade e tempo de resposta
- Melhorar continuamente SLIs, SLOs e acordos de confiabilidade internos
- Documentar padrões de monitoramento, resposta e contingência
- Participar de discussões técnicas para antecipar riscos de produção
- Confortável em atuar em times multidisciplinares e ambiente 100% remoto
Requisitos e qualificações :
Experiência com observabilidade (Grafana, Prometheus, Loki, ELK, Sentry, Datadog ou similares)Vivência com incidentes em produção e troubleshootingConhecimento em AWS ou outra cloud (CloudWatch, RDS, ECS / EKS, Load Balancer)Familiaridade com logs estruturados, tracing e métricas de aplicaçãoExperiência com containers (Docker) e pipelines de deployHabilidades com versionamento (Git) e colaboração com devsNoções de automação e infraestrutura (IaC, CI / CD ou scripts)Conhecimento básico de redes, segurança e escalabilidadeDesejável familiaridade com metodologias ágeis (Scrum / Kanban)