noviembre 17, 2022

Particionado en Apache Spark

Apache Spark, Python, Scalanoviembre 17, 2022

Los RDD operan con datos no como una sola masa de datos, sino que administran y operan los datos en particiones repartidas por todo el clúster. Por lo tanto, el concepto de partición de datos es fundamental para el correcto funcionamiento de los Jobs de Apache Spark y puede tener un gran efecto en el rendimiento […]

Volver arriba