Python

almacenamiento en caché Apache Spark
8 min lectura

Almacenamiento en caché

El almacenamiento en caché permite que Spark conserve los datos en todos los cálculos y operaciones. De hecho, esta es una de las técnicas más…

Particionado en Apache Spark Apache Spark
8 min lectura

Particionado en Apache Spark

Los RDD operan con datos no como una sola masa de datos, sino que administran y operan los datos en particiones repartidas por todo el…

Instalar Apache Spark en Google Colaboratory Apache Spark
7 min lectura

Instalar Apache Spark en Google Colaboratory

Apache Spark es uno de los frameworks de procesamiento de datos más utilizados en el mundo del Big Data. Sin embargo, configurar un entorno local…