Data QA Engineer Mid — Remoto - LATAM — Consultoría Tech - SQL, Snowflake, DBT,
Sobre la vacante
ParallelStaff busca un Data QA Engineer Mid con enfoque en automatización y pruebas manuales para unirse a su equipo de consultoría tech. Requisitos clave:
- Experiencia: Mínimo 4 años en Data QA.
- Tecnologías principales: SQL (2+ años), Snowflake, DBT, almacenamiento en la nube (S3/GCS) y herramientas de BI (Tableau/Metabase).
- Funciones: Testing de ETL/Data Warehouse, automatización de pruebas y experiencia con orquestadores como Dagster y Airflow.
- Requisitos obligatorios: Nivel de inglés avanzado y residencia en Latinoamérica.
- Modalidad: Remota.
¿Por qué deberías aplicar?
Esta posición te permite profundizar en el testing de calidad de datos dentro de arquitecturas modernas en la nube. Trabajarás con tecnologías líderes como Snowflake y DBT, cruciales para el futuro del data engineering y analytics. Es una oportunidad ideal para evolucionar de un rol de QA tradicional a un especialista en calidad de datos, un perfil cada vez más demandado y bien remunerado en el mercado tech.
Tips y consejos de VacantesDigitales.com
Skills indispensables
- Técnicas: SQL avanzado, comprensión de pipelines de datos (ETL/ELT), experiencia con al menos una plataforma de data cloud (Snowflake, BigQuery, Redshift).
- Soft Skills: Atención al detalle, pensamiento analítico para diseñar casos de prueba y comunicación clara para reportar hallazgos.
Tips prácticos para este puesto
- Enfoca tu CV en proyectos donde hayas automatizado pruebas de procesos ETL o de calidad de datos, no solo pruebas funcionales de UI.
- Prepárate para explicar con ejemplos concretos cómo validaste la integridad, consistencia y precisión de los datos en un pipeline.
- Familiarízate con conceptos de Data Observability, ya que muchas empresas están migrando hacia este enfoque.
Recursos recomendados
- Herramientas: Practica con Great Expectations (framework de testing de datos en Python) y dbt test.
- Documentación: La documentación oficial de Snowflake sobre data sharing y time travel es invaluable.
- Cursos: "Data Engineering Zoomcamp" (gratuito) o el curso "Testing Data Pipelines" en Udemy.
- Influencers: Sigue a Barr Moses (CEO de Monte Carlo Data, líder en Data Observability) y Tristan Handy (CEO de dbt Labs).
Preguntas frecuentes en entrevistas para este rol
- "Describe cómo diseñarías un framework de pruebas automatizado para un pipeline de datos que carga información diaria a un data warehouse."
- Tip: Estructura tu respuesta mencionando etapas: validación de datos fuente (conteos, nulos), pruebas de transformación (lógica de negocio en SQL o dbt), y validación del destino (consistencia de agregados). Menciona herramientas como dbt tests o Python scripts.
- "¿Cómo manejarías un escenario donde los reportes de Tableau muestran discrepancias con los datos en el warehouse?"
- Tip: Demuestra un enfoque sistemático: 1) Verificar la consulta SQL del reporte, 2) Revisar los datos en la capa de transformación (dbt/models), 3) Auditar el proceso de ingesta (ELT/ETL) para descartar fallas de carga o calidad en el origen.
- "¿Qué métricas o KPIs considerarías para medir la calidad de los datos en un proyecto?"
- Tip: Ve más allá de "datos correctos". Menciona métricas como completitud (% de campos no nulos), consistencia (valores que siguen reglas de negocio), actualidad (frecuencia de actualización vs. requerida) y validez (formato y tipo de datos correctos).
Rango salarial estimado (LATAM)
Basado en datos de Glassdoor, Computrabajo, GetOnBoard y el mercado actual:
| Nivel | Rango mensual USD |
|---|---|
| Junior | $1,800 - $2,800 |
| Mid | $2,800 - $4,200 |
| Senior | $4,200 - $6,500 |
Nota: Varía según país, empresa, modalidad (remoto internacional paga más) y tecnologías específicas. Empresas de USA/EU pagando en LATAM suelen ofrecer 30-50% más. Un Data QA con dominio de Snowflake y DBT puede ubicarse en el rango alto de Mid.
Red flags a considerar
- Bandera roja 1: Procesos de testing completamente manuales y repetitivos.
- Qué preguntar: "¿Qué porcentaje de las pruebas de calidad de datos está actualmente automatizado? ¿Existe un roadmap para aumentar la automatización?"
- Bandera roja 2: Falta de acceso a entornos de desarrollo o datos sintéticos para pruebas.
- Qué investigar: Pregunta sobre el proceso para obtener datos de prueba y si existen sandboxes o clones de bases de datos para trabajar sin riesgos.
- Bandera roja 3: El equipo de QA está completamente aislado del equipo de Data Engineering.
- Señal de advertencia: Si las tareas de QA llegan como "órdenes" sin contexto del pipeline o la lógica de negocio. Indica poca integración y posiblemente un enfoque reactivo en lugar de preventivo en la calidad de los datos.
Sobre empleos de Data Science y Analytics
La ciencia de datos y el análisis son campos en rápido crecimiento que combinan estadística, programación y conocimiento de negocios. Las empresas latinoamericanas e internacionales buscan profesionales capaces de transformar datos en decisiones estratégicas. Las tecnologías más demandadas incluyen Python, SQL, herramientas de visualización como Tableau y Power BI, y plataformas cloud como AWS y Google Cloud. La capacidad de contar historias con datos y comunicar insights de forma clara es tan importante como las habilidades técnicas.