José Miguel Moya Curbelo

José Miguel Moya Curbelo

Senior Data Engineer & Instructor

Big Data · Cloud · Spark · Snowflake · IA

Últimos Artículos

Particionado en Apache Spark Apache Spark
8 min lectura

Particionado en Apache Spark

Los RDD operan con datos no como una sola masa de datos, sino que administran y operan los datos en particiones repartidas por todo el…

Perfiles en Apache Maven Apache Maven
9 min lectura

Perfiles en Apache Maven

Apache Maven está diseñado para crear compilaciones portátiles que se espera que funcionen en diferentes plataformas y en varios entornos de tiempo de ejecución. Puede…

Acumuladores en Spark-Scala Apache Spark
6 min lectura

Acumuladores en Spark-Scala

Los acumuladores son variables compartidas entre ejecutores que normalmente se utilizan para agregar contadores a su programa Spark. En un entorno distribuido como Apache Spark,…

AR con dependencias Apache Maven
8 min lectura

Crear un JAR con dependencias con Apache Maven

¿Qué es un JAR con dependencias? Un requisito típico de los proyectos es agregar la salida junto con sus dependencias, módulos y otros archivos en…

Instalar Apache Spark en Google Colaboratory Apache Spark
7 min lectura

Instalar Apache Spark en Google Colaboratory

Apache Spark es uno de los frameworks de procesamiento de datos más utilizados en el mundo del Big Data. Sin embargo, configurar un entorno local…

Cursos Online

Aprende Data Engineering con cursos prácticos en Udemy. Más de 10,800+ estudiantes ya están aprendiendo.