Mes: febrero 2018

Configuración de Talend y de Spark submit ¿qué diferencia hay?

En mi artículo anterior, «Talend y Apache Spark: un manual técnico», presenté las equivalencias entre las tareas de Talend Spark y Spark Submit. En este texto me gustaría seguir evaluando las configuraciones de Talend Spark con Apache Spark submit. En primer lugar, veremos cómo establecer correspondencias entre las opciones de la pestaña de configuración de […]


Procesamiento por lotes o en flujo: ¿Cuál escoger y en qué momento?

Es de todos conocido que los datos de empresa requieren cambios constantemente y últimamente esos cambios están acelerándose. De repente, las empresas que en su día procesaban todos sus big data localmente se han pasado a cloud. Los frameworks que conocíamos y tanto nos gustaban se han vuelto obsoletos de la noche a la mañana. […]