Volver

Ingeniero Sre (Site Reliability Engineer)

Transfer Directo México

México

Jornada Completa

1 vacante

Hace 1 mes

Postular

Descripción

El Ingeniero SRE (Site Reliability Engineer) es responsable de operar, mantener y optimizar la infraestructura tecnológica que soporta los servicios SPEI de TDM, garantizando altos niveles de disponibilidad, confiabilidad, seguridad y cumplimiento regulatorio en entornos híbridos (AWS y On-Premise).

Su misión es asegurar la continuidad operativa de los servicios críticos de la organización mediante la implementación de prácticas de confiabilidad, automatización, monitoreo y gestión de incidentes, contribuyendo a la estabilidad de la conexión con Banco de México y al cumplimiento de las disposiciones regulatorias aplicables.

Tiene como objetivo mantener la estabilidad y disponibilidad de la infraestructura tecnológica, reducir riesgos operativos, fortalecer la observabilidad de los servicios, optimizar los procesos mediante automatización y apoyar la implementación de proyectos de infraestructura y plataforma alineados con las necesidades del negocio.

Dentro de sus principales responsabilidades se encuentran la administración y soporte de infraestructura en AWS y ambientes On-Premise; la atención, diagnóstico y resolución de incidentes escalados; la implementación y mantenimiento de infraestructura como código (IaC); la operación de herramientas de monitoreo, observabilidad y alertamiento; la ejecución de respaldos, planes de continuidad y recuperación ante desastres; la gestión de configuraciones de red, seguridad y conectividad; así como la documentación de procedimientos operativos y evidencias requeridas para auditorías y cumplimiento normativo.

Asimismo, participa en proyectos de infraestructura y plataforma, colaborando con equipos de Desarrollo, Operaciones, Seguridad, Arquitectura y NOC para implementar soluciones resilientes, automatizar procesos, fortalecer prácticas DevOps y SRE, mejorar indicadores de disponibilidad y garantizar la operación eficiente de los servicios críticos de la organización.

Requerimientos

Escolaridad

Ingeniería en Sistemas, Computación, Telecomunicaciones, Redes o carrera afín.

Experiencia

Mínimo 3 años en posiciones de Infraestructura, Site Reliability Engineering (SRE) o DevOps.
Experiencia operando infraestructura AWS en ambientes productivos.
Experiencia en entornos híbridos (Cloud y On-Premise).
Experiencia en gestión y resolución de incidentes críticos.
Participación en proyectos de infraestructura, migraciones o integraciones tecnológicas.
Deseable experiencia en instituciones financieras o fintech.
Inglés: Nivel B1 - B2

Conocimientos técnicos

AWS: EC2, VPC, RDS, IAM, EKS, Fargate, Lambda, CloudWatch, S3, API Gateway y Load Balancers.
Kubernetes y Docker.
Infraestructura como código (Terraform, CloudFormation o similares).
Herramientas CI/CD (GitHub Actions, GitLab CI, Jenkins o equivalentes).
Observabilidad y monitoreo (Datadog, Prometheus, Grafana, CloudWatch).
Linux, Windows Server y virtualización.
Redes y seguridad (TCP/IP, VPN, DNS, Firewalls, BGP).
Automatización y scripting (Bash y Python).
Bases de datos MySQL y PostgreSQL.
Continuidad operativa, respaldos y recuperación ante desastres (DRP/BCP).
Deseable conocimiento de regulación Banxico SPEI y CNBV.