Site Reliability Engineer – SRE

Posted 102ds ago

Employment Information

Education
Salary
Experience
Job Type

Report this job

Job expired or something wrong with this job?

Job Description

Site Reliability Engineer maintaining and enhancing highly available, secure cloud platforms at MedTrainer. Focusing on Kubernetes workloads and reliability engineering practices.

Responsibilities:

  • Diseñar, construir y operar clústeres de Kubernetes (AKS) y servicios de soporte de calidad de producción con alta disponibilidad, seguridad y optimización de costos
  • Arquitectar, implementar y mantener CI/CD usando GitHub Actions (avanzado)
  • Definir, codificar y evolucionar Infraestructura como Código con Pulumi (Python)
  • Desarrollar y mantener gestión de configuración con Ansible
  • Implementar estrategias de entrega y despliegue progresivas
  • Establecer una observabilidad integral con alertas vinculadas a SLOs
  • Liderar la gestión de incidentes y respuesta en guardia
  • Asociarse con productos e ingeniería para diseñar para la confiabilidad
  • Implementar mejores prácticas de seguridad y garantizar el cumplimiento
  • Revisar continuamente los sistemas existentes, eliminar tareas tediosas mediante la automatización

Requirements:

  • Título en Ciencias de la Computación, título equivalente o experiencia profesional equivalente
  • Más de 3 años trabajando en sistemas distribuidos y operaciones en la nube
  • Experiencia práctica sólida con al menos dos proveedores de nube importantes (Azure, AWS, GCP) y sus servicios gestionados de Kubernetes
  • Experiencia profunda en la arquitectura y/o operación de grandes clústeres de Kubernetes: identidad de carga de trabajo, redes, almacenamiento, escalado automático, actualizaciones, seguridad y multi-tenencia
  • Experiencia con contenedores (Docker/OCI)
  • Conocimientos avanzados en GitHub Actions
  • Fuertes habilidades en Python (requeridas) para IaC con Pulumi, herramientas y automatización; conocimientos en Golang son un plus
  • Familiaridad con CI/CD, gestión de cambios y experiencia en entrega progresiva
  • Experiencia en la configuración de redes nativas en la nube, almacenamiento, Linux, controles de seguridad y gobernanza de costos
  • Experiencia en la migración y escalado de infraestructura entre nubes.
  • Certificaciones relevantes (por ejemplo, CKA) son un plus
  • Inglés avanzado (opcional)

Benefits:

  • Seguro médico mayor y cobertura sanitaria
  • Soporte para home office y ergonomía (internet, electricidad, silla de oficina)
  • Oportunidades de desarrollo profesional, incluyendo clases de inglés
  • Beneficios de bienestar como descuentos en gimnasios TotalPass
  • Plan de ahorros
  • Vacaciones pagadas, incluyendo días personales
  • Un entorno colaborativo, internacional y orientado al crecimiento