Objetivo del cargo:
Diseñar, construir y mantener la infraestructura de datos que soporta los procesos de Inteligencia de Negocios, ciencia de datos y analítica avanzada de Solati, garantizando la disponibilidad, calidad, trazabilidad y seguridad de los datos para la toma de decisiones y el desarrollo de productos de valor para los clientes.
Formación Profesional:
Ingeniería de Sistemas, Ingeniería Informática, Ingeniería en Ciencias de la Computación o carreras afines.
Conocimientos y/o Formación básica:
*Arquitectura y Ecosistema de Datos: Conocimientos en creación de Data Warehouses, Data Lakes y Dominio de motores relacionales (PostgreSQL) y no relacionales.
*Ingeniería y Procesamiento (Motor Analítico): Dominio de SQL y programación en Python o Scala
*Conocimiento de la Nube AWS
*Magia Avanzada: IA Generativa y RAG: Conocimiento en arquitecturas RAG y servicios de IA en AWS.
*Visualización y Gobierno de Datos: Conocimientos en Dashboards.
Volver
Ingeniero De Datos
Solati SAS
Jornada Completa
Data Lab
1 vacante
Bogotá, Colombia
Publicado hace menos de 24 horas
Descripción
Requerimientos
Funciones básicas del cargo:
*Diseñar, implementar y mantener pipelines de datos (ETL/ELT) que alimenten los productos de Inteligencia de Negocios y ciencia de datos del área.
*Construir y administrar la arquitectura de datos de Solati (Data Warehouse, Data Lake, Datamarts) garantizando escalabilidad y rendimiento.
*Garantizar la calidad, consistencia e integridad de los datos a lo largo de todo el ciclo de vida del dato.
*Modelar bodegas de datos a nivel relacional y multidimensional, adaptadas a las necesidades de los clientes internos y externos.
*Optimizar consultas SQL y procesos de ingesta de datos para garantizar la eficiencia operativa.
*Colaborar estrechamente con los equipos de Data Science y Analistas DataLab para asegurar la disponibilidad y estructura correcta de los datos requeridos en los proyectos.
*Diseñar e implementar pipelines de ingesta, preprocesamiento, chunking y generación de embeddings para soluciones de IA Generativa basadas en arquitecturas RAG.
*Configurar y administrar bases de datos vectoriales (Amazon OpenSearch con k-NN, pgvector u otras) integradas con Amazon Bedrock Knowledge Bases para soportar agentes de cobranza y otros productos GenAI del área.
*Construir y mantener los flujos de datos que alimentan los agentes de IA desarrollados sobre Amazon Bedrock y AWS Lambda, garantizando la frescura, calidad y trazabilidad de la información consumida.
*Implementar estrategias de versionado y linaje de datos para los datasets utilizados en el entrenamiento, fine-tuning y evaluación de modelos de lenguaje.
*Monitorear el rendimiento de los pipelines de datos en contextos de LLMOps, identificando degradaciones en la calidad del contexto entregado a los modelos.
*Colaborar en la definición de políticas de retención, acceso y privacidad de datos sensibles utilizados por soluciones de IA Generativa, en cumplimiento con las políticas de seguridad de la información de Solati.
*Implementar y mantener mecanismos de monitoreo y alertas sobre la calidad y disponibilidad de los datos.
*Documentar los procesos, arquitecturas y flujos de datos para garantizar trazabilidad y control de cambios.
*Identificar, investigar y resolver incidentes relacionados con la integridad o disponibilidad de los datos.
*Proponer e implementar mejoras continuas en la infraestructura de datos del área.
*Cumplir con la política de seguridad de la información y velar por la confidencialidad, disponibilidad e integridad de la información de los clientes y de la organización.
*Todas las demás funciones que le sean asignadas según la naturaleza de su cargo.
Cargando ofertas similares...