Como Sr. Site Reliability Engineer (SRE), serás responsable de garantizar la confiabilidad, disponibilidad y rendimiento de nuestros sistemas y aplicaciones. Trabajarás estrechamente con los equipos de desarrollo y operaciones para implementar prácticas de confiabilidad y resiliencia, automatizar procesos y resolver incidentes críticos. Tu experiencia y conocimientos serán fundamentales para mejorar la infraestructura y los servicios de la empresa.
Responsabilidades:Diseñar, implementar y mantener infraestructuras de alta disponibilidad y escalabilidad en entornos de producción.Desarrollar y gestionar herramientas de monitoreo y alerta para asegurar la salud y el rendimiento de los sistemas.Implementar y optimizar pipelines de CI/CD para automatizar despliegues y pruebas.Colaborar con los equipos de desarrollo para diseñar aplicaciones resilientes y escalables.Resolver incidentes críticos y realizar análisis postmortem para prevenir problemas futuros.Gestionar la capacidad y el rendimiento del sistema para asegurar que cumplan con los SLAs establecidos.Desarrollar y mantener documentación técnica y procedimientos operativos.Aplicar principios de SRE, incluyendo la gestión de SLIs, SLOs y SLAs.Habilidades y Tecnologías:Experiencia con plataformas de nube pública como AWS, Azure o Google Cloud Platform.Conocimiento avanzado de herramientas de monitoreo y alerta como Datadog, Prometheus, Grafana, ELK Stack.Habilidades en lenguajes de scripting y programación como Js, Python, Go o Bash.Experiencia en la implementación y gestión de contenedores y orquestadores de contenedores como Docker y Kubernetes.Conocimiento de prácticas de CI/CD y herramientas como Github actions, AWS Code Pipeline, Jenkins, GitLab CI.Experiencia en la implementación de soluciones de alta disponibilidad y recuperación ante desastres.Comprensión profunda de los principios de SRE, incluyendo gestión de la capacidad, SLIs, SLOs y SLAs.Experiencia en la automatización de tareas operativas y de infraestructura utilizando herramientas de infraestructura como Código (IaC) como Terraform, CloudFormation o Ansible.Conocimiento en bases de datos SQL y NoSQL, y experiencia en su gestión en entornos de nube.Familiaridad con sistemas de archivos distribuidos y almacenamiento de objetos como Amazon S3 o Google Cloud Storage.Experiencia en la implementación de políticas de seguridad y cumplimiento en entornos de nube.Conocimiento de arquitecturas de microservicios y su gestión en la nube.Beneficios:15 días de vacaciones desde el primer año.Equipo de trabajo.Aguinaldo de 15 días.Seguro de Gastos Médicos Mayores.5 días de salud mental al año.5 días personales al año.90 días de maternidad y paternidad.La equidad y diversidad importan Orbi es un empleador igualitario. Es política de Orbi brindar igualdad de oportunidades en la carrera y el desarrollo. Creemos en la igualdad real para todos, por lo que, a través de nuestra política de inclusión, buscamos proporcionar un ambiente de trabajo diverso y equitativo para todos nuestros colaboradores.
#J-18808-Ljbffr