Site Reliability Engineer

Review ALLTimbó, Santa Catarina, Brazil

Há 2 dias

Descrição da vaga

About the Company This company operates a global computing platform that enables businesses to programmatically deploy single-tenant Bare Metal instances across multiple regions worldwide.

They are a team of passionate engineers working at the intersection of hardware, software, and network infrastructure, building the fastest, most developer-centric single-tenant cloud infrastructure on the market. If you share this passion, this role offers the opportunity to help shape the future of internet-scale infrastructure.

This position is being managed in partnership with an external recruitment consultancy supporting the company throughout the hiring process.

Summary

The Reliability team is responsible for the health and resilience of the infrastructure powering a global bare metal cloud platform. As a Senior Site Reliability Engineer (SRE) , you'll focus on building reliable, observable, and self-healing systems at scale.

SREs here operate at the intersection of software engineering and infrastructure — designing tools that automate operations, improve incident response, and enhance observability, ensuring the platform delivers high performance and reliability to customers worldwide.

This role is ideal for engineers passionate about reliability, automation, distributed systems, and bringing cloud-like experiences to bare metal environments.

Key Responsibilities

Continuously improve platform reliability and performance.

Design, build, and maintain tools to automate operational workflows and incident response.

Implement and enhance observability systems (monitoring, alerting, tracing).

Collaborate with engineering and platform teams to design scalable and resilient systems.

Participate in on-call rotations and lead post-incident reviews with a learning-focused approach.

Develop and document operational playbooks and processes.

Contribute to defining SLOs / SLIs and driving reliability metrics across teams.

Skills & Qualifications

Required :

Fluent verbal and written English communication skills

Advanced experience with Linux / Unix in production environments

Hands-on experience with Kubernetes and container orchestration

Proficiency with IaC tools (e.g., Terraform, Ansible)

Experience with observability stacks (Prometheus, Grafana, Loki, ELK, etc.)

Proficiency with scripting / programming languages such as Bash, Python, Go, or Ruby

Working knowledge of Git and CI / CD pipelines

Experience with incident response and root cause analysis

Knowledge of cloud-native reliability and security best practices

What’s Offered

Contractor engagement (PJ)

Paid Time Off

Competitive compensation package

Wellness benefit (Wellhub / Gympass equivalent)

Annual performance-based bonus

Flexible working hours

Opportunities for technical and career growth

Criar um alerta de emprego para esta pesquisa

Site Reliability Engineer • Timbó, Santa Catarina, Brazil

Vagas relacionadas

Promovida

Site Reliability Engineer (Relocation To Portugal)

AffinityBlumenau, Santa Catarina, Brasil

Please note that we're aiming at an expatriation to Portugal • •We are aPortuguese technology consulting companywith a strong outward look to the rest of Europe. We have 12 years of experience in the ...Mostre maisÚltima atualização: 24 dias atrás

Promovida

Engineer Manager

GRUPO SBFJoinville, Santa Catarina, Brazil

Remoto | Grupo SBF | Ecossistema do Esporte Estamos em busca de um(a) Engineering Manager para liderar nossas equipes de engenharia com foco em excelência técnica, impacto nos negócios e desenvo...Mostre maisÚltima atualização: há mais de 30 dias

Promovida

Full Stack Engineer (Remote, $110K USD)

AscenBlumenau, Santa Catarina, Brazil

Senior Full-Stack Software Engineer 100% Remote | Must have at least 4 hours of overlap with US Eastern Time (EST) About Ascen Ascen (ascen. We empower staffing firms to focus on their clients and ...Mostre maisÚltima atualização: há mais de 30 dias

Promovida

System Engineer

InComm Paymentsgaspar, Brasil

In this role, you will be critical to the daily operations, maintenance, and optimization of our observability platforms—. Splunk, DynaTrace, and NewRelic.The ideal candidate will be a proactive pro...Mostre maisÚltima atualização: 2 dias atrás

Promovida

Site Reliability Engineer PL

TurbiGuaramirim, Santa Catarina, Brazil

E aí, tudo azul por aí? A Turbi é a locadora do futuro : 100% digital, movida a tecnologia, gente boa e paixão por transformar a forma como as pessoas se locomovem. A gente abre o carro pelo app (si...Mostre maisÚltima atualização: 1 dia atrás

Promovida
Nova!

Site Reliability Engineer (Sre)

MetactoBlumenau, Santa Catarina, Brasil

At MetaCTO, we specialize in helping startups and growing companies turn visionary ideas into successful digital products through expert app development and fractional CTO services.As aSite Reliabi...Mostre maisÚltima atualização: 21 horas atrás

Promovida

Analista de sistemas

LunelliCorupá, Santa Catarina, Brazil

Buscamos um(a) profissional analítico(a), organizado(a) e com boa capacidade de relacionamento para atuar na análise, suporte e melhoria contínua dos processos relacionados ao ERP da empresa.Essa p...Mostre maisÚltima atualização: 3 dias atrás

Promovida

Agile RTE - SAFe Agile Certified

BirlasoftTimbó, Santa Catarina, Brazil

Specialist Agile RTE Consultant [SAFe Agile Certified] We are seeking a highly skilled Agile Release Train Engineer (RTE) to lead and coordinate cross-team efforts within a scaled Agile environm...Mostre maisÚltima atualização: 18 dias atrás

Promovida

Database Reliability Engineer - DBRE

Vortigo DigitalBrusque, Santa Catarina, Brazil

Somos a Vortigo - nascemos com o propósito de criar aplicativos mobile para um mundo em constante movimento, mas não paramos por aí. Ampliamos nossa atuação e hoje desenvolvemos softwares para aju...Mostre maisÚltima atualização: há mais de 30 dias

Promovida

Senior React Engineer (LATAM | English C1 / C2)

Yisrael Technology LLCTimbó, Santa Catarina, Brazil

We’re looking for a Senior React Engineer to join one of our U.You will work on complex, high-impact applications—often within industries such as finance, insurance, or other data-heavy domains—co...Mostre maisÚltima atualização: 6 dias atrás

Promovida

Software Engineer Site Reliability Engineer

ScubytBrusque, Santa Catarina, Brazil

Software Engineer Site Reliability Engineer Location : Brazil REMOTE Duration : Fulltime CLT / REMOTE About the role The Application SRE Team supports several critical components of our foundational...Mostre maisÚltima atualização: 2 dias atrás

Promovida

Deployment Reliability Engineer

HCLTechJoinville, Santa Catarina, Brazil

Your role and responsabilities : Manage continuous delivery and configuration of SAP Ariba Cloud products using modern deployment tools. Respond quickly to deployment requests and provide technical ...Mostre maisÚltima atualização: 15 dias atrás

Promovida

Site Reliability Engineer

HCLTechBlumenau, Santa Catarina, Brazil

Your role and responsabilities : Handling major incidents via CIRS (Critical Issue Response System) and providing frequent updates until resolution. Performing deep-dive application troubleshootin...Mostre maisÚltima atualização: 9 dias atrás

Promovida

Full Stack Engineer

Astra AITimbó, Santa Catarina, Brazil

Location : San Francisco, CA - Remote (LATAM preferred) Work Type : Full-Time We’re partnering with a confidential, high-growth technology company in Silicon Valley that’s building AI-powered platf...Mostre maisÚltima atualização: há mais de 30 dias

Promovida

Site Reliability Engineer (SRE)

MetaCTOBlumenau, Santa Catarina, Brazil

About Us At MetaCTO, we specialize in helping startups and growing companies turn visionary ideas into successful digital products through expert app development and fractional CTO services.As a S...Mostre maisÚltima atualização: 2 dias atrás

Promovida

Site Reliability Engineer Sr

Mercado EletrônicoGaspar, Santa Catarina, Brazil

O Mercado Eletrônico é líder na América Latina em soluções de gestão de compras B2B.Suas tecnologias e serviços para as áreas de compras ajudam empresas a conquistarem mais economia, agilidade, gov...Mostre maisÚltima atualização: 18 dias atrás

Promovida

Site Reliability Engineer (Relocation to Portugal)

AffinityJaraguá do Sul, Santa Catarina, Brazil

A Job? Or a Lifetime Experience? Start Yours Here! • •Please note that we're aiming at an expatriation to Portugal • • We are a Portuguese technology consulting company with a strong outward look ...Mostre maisÚltima atualização: 27 dias atrás

Promovida

Site Reliability Engineer

Review ALLIndaial, Brasil

About the Company This company operates a global computing platform that enables businesses to programmatically deploy single-tenant Bare Metal instances across multiple regions worldwide.They are ...Mostre maisÚltima atualização: 1 dia atrás