Josemtech

Apache Spark

noviembre 17, 2022 8 min lectura

Particionado en Apache Spark

Los RDD operan con datos no como una sola masa de datos, sino que administran y operan los datos en particiones repartidas por todo el…

Apache Maven

noviembre 10, 2022 9 min lectura

Perfiles en Apache Maven

Apache Maven está diseñado para crear compilaciones portátiles que se espera que funcionen en diferentes plataformas y en varios entornos de tiempo de ejecución. Puede…

Apache Spark

noviembre 8, 2022 6 min lectura

Acumuladores en Spark-Scala

Los acumuladores son variables compartidas entre ejecutores que normalmente se utilizan para agregar contadores a su programa Spark. En un entorno distribuido como Apache Spark,…

Apache Maven

noviembre 5, 2022 8 min lectura

Crear un JAR con dependencias con Apache Maven

¿Qué es un JAR con dependencias? Un requisito típico de los proyectos es agregar la salida junto con sus dependencias, módulos y otros archivos en…

Apache Spark

noviembre 2, 2022 7 min lectura

Instalar Apache Spark en Google Colaboratory

Apache Spark es uno de los frameworks de procesamiento de datos más utilizados en el mundo del Big Data. Sin embargo, configurar un entorno local…

José Miguel Moya Curbelo

Últimos Artículos

Particionado en Apache Spark

Perfiles en Apache Maven

Acumuladores en Spark-Scala

Crear un JAR con dependencias con Apache Maven

Instalar Apache Spark en Google Colaboratory

Cursos Online

Big Data y Spark: ingeniería de datos con Python y pyspark

Snowflake Data Warehouse: Desde lo Básico a lo Avanzado

Apache Maven: Construcción de proyectos de cero a avanzado

Spark y Scala en Databricks: Big Data e ingeniería de datos

AWS Glue: Procesamiento de Datos en la Nube

Aprende a manipular datos con Polars y Python

Inteligencia Artificial Generativa en Snowflake