RDDs y DataFrames en Spark SQL

En Spark SQL, existen dos formas principales de trabajar con datos estructurados: RDDs y DataFrames. Mientras que los RDDs representan el enfoque tradicional, los DataFrames son la abstracción de datos preferida en versiones más recientes de Spark. RDDs (Resilient Distributed Datasets) Los RDDs son colecciones de elementos distribuidos en los nodos de un clúster, sobre […]

Aprende a manipular datos con Polars y Python

Anuncio con gran entusiasmo la publicación del repositorio de GitHub de mi curso «Aprende a manipular datos con Polars y Python», el cual próximamente estará disponible en la plataforma de Udemy. ¿Qué es «Aprende a manipular datos con Polars y Python»? Este curso te brindará las herramientas y conocimientos necesarios para dominar Polars, una biblioteca de Python […]

AWS Glue triggers

En este artículo analizaremos los aspectos fundamentales que debemos conocer sobre los triggers en AWS Glue. En AWS Glue, podemos crear objetos en el Data Catalog llamados triggers, que podemos usar para iniciar manual o automáticamente uno o más crawlers o ETL. Con los triggers, podemos diseñar una cadena de jobs y crawlers dependientes. Cuando […]

Scastie: tu entorno de programación Scala en el navegador

¿Alguna vez has deseado tener un entorno de programación Scala que sea accesible desde cualquier lugar y en cualquier momento? Scastie es la respuesta a tus necesidades. En este artículo, te presentaré las características principales de Scastie, una herramienta en línea que te permite escribir y ejecutar código Scala de manera rápida y sencilla directamente […]

Comienza escribiendo tu búsqueda y pulsa enter para buscar. Presiona ESC para cancelar.

Volver arriba