Administración y monitoreo de ecosistema big data (indispensable cloudera, azure o gcp). Conocimiento de almacenamiento y procesamiento distribuido procesamiento de grandes volumenes de información. Diseño e implementación de flujos de datos sobre datos estructurados y no estructurados. Ingesta, limpieza, homogeneización e integración de diferentes fuentes de datos. Diseño y desarrollo de modelos de datos para el manejo de la información. Interacción en el diseño de arquitecturas big data. Generar mecanismos de control y validación del flujo de datos. Implementación de scripts con python, pyspark, t-sql, shell scripting. Conocimiento de gestores de motores de bases de datos estructurados y no estructurados. Interacción e implementación en la creación de estandares de modelado y control de flujo de datos automatización de flujos de datos. Análisis del comportamiento de flujos de datos. Implementación de soluciones de big data para la gestion de datos: hbase, hive, spark
a lo largo de más de 27 años hemos incursionado y evolucionado en distintas áreas atendiendo en el continente americano a clientes privados, corporativos y sector gobierno. Contribuimos en la consecución de proyectos de seguridad nacional. Esto ha implicado grandes retos tecnológicos, humanos, de infraestructura y de organización, a los cuales respondemos hoy con grandes áreas de especialización. Tenemos un estricto proceso de desarrollo de ingeniería y control de calidad, por lo que contamos con procesos y personal certificados por importantes organismos internacionales y nacionales como la norma iso 9001:2015, iso 27001:2013, iso/iec 20000-1, itil, scrum, pmi y las otorgadas por los fabricantes más importantes del mundo en tecnología de seguridad electrónica.
*requisitos*:
sql. 2 años como minimo python o scala. 3 años como minimo. Diseño de pipelines y streaming: flume, sqoop, kafka, spark-streaming diseño de servicios publisher subscriber. 2 años como minimo transformación de datos en ecosistemas big data: python, spark o manejo de datos tradicionales (etls, ingestas o modelado) 4 años como minimo. Manejo de datos no estructurados. 2 años como minimo conocimiento de dashboard: kibana,tableau, grafana. 1 años como minimo (opcional) mantenimiento de ecosistema big data, cloudera. 2 años como minimo.