Josemtech

Apache Maven

diciembre 13, 2024 14 min lectura

pom.xml y settings.xml en Maven: guía completa con ejemplos

En este artículo, examinaremos a fondo los archivos pom.xml y settings.xml en Apache Maven, incluyendo ejemplos prácticos y explicaciones detalladas de sus componentes. Si trabajas…

Apache Maven

diciembre 3, 2024 11 min lectura

Maven en tu flujo de trabajo de CI/CD: guía para mejorar tus procesos de desarrollo

Maven en tu flujo de trabajo de CI/CD: guía para mejorar tus procesos de desarrollo En el mundo actual del desarrollo de software, la integración…

Apache Spark

diciembre 1, 2024 11 min lectura

Desmitificando el Optimizador Catalyst de Apache Spark

Desmitificando el Optimizador Catalyst de Apache Spark El procesamiento de grandes volúmenes de datos es una tarea crítica en el campo de la ingeniería de…

Apache Spark

noviembre 28, 2024 11 min lectura

Optimización de PySpark para el procesamiento de datos masivos

Optimización de PySpark para el procesamiento de datos masivos En la era del big data, manejar volúmenes masivos de información es crucial para las empresas…

Apache Spark

noviembre 20, 2024 10 min lectura

RDDs y DataFrames en Spark SQL

RDDs y DataFrames en Spark SQL En Spark SQL, existen dos formas principales de trabajar con datos estructurados: RDDs y DataFrames. Mientras que los RDDs…

Diferentes formas de crear un RDD en PySpark

Apache Spark

marzo 19, 2024 10 min lectura

Diferentes formas de crear un RDD en PySpark

Diferentes formas de crear un RDD en PySpark Los RDD (Resilient Distributed Datasets) son la estructura de datos fundamental de Apache Spark. Aunque hoy en…

Leer y Escribir DataFrames de pyspark en AWS S3 Guía Completa

Apache Spark

febrero 27, 2024 10 min lectura

Leer y Escribir DataFrames de pyspark en AWS S3: Guía Completa

Trabajar con grandes volúmenes de datos requiere soluciones de almacenamiento robustas y escalables. AWS S3 (Simple Storage Service) es una de las opciones más utilizadas…

AWS Glue

noviembre 15, 2023 7 min lectura

AWS Glue triggers

En este artículo analizaremos los aspectos fundamentales que debemos conocer sobre los triggers en AWS Glue. ¿Qué son los triggers en AWS Glue? En AWS…

AWS Glue

octubre 25, 2023 8 min lectura

Introducción a Data Catalog y crawlers en AWS Glue

Introducción a Data Catalog y crawlers en AWS Glue En este artículo estaremos dando una introducción al Data Catalog de AWS Glue y a los…

José Miguel Moya Curbelo

Últimos Artículos

pom.xml y settings.xml en Maven: guía completa con ejemplos

Maven en tu flujo de trabajo de CI/CD: guía para mejorar tus procesos de desarrollo

Desmitificando el Optimizador Catalyst de Apache Spark

Optimización de PySpark para el procesamiento de datos masivos

RDDs y DataFrames en Spark SQL

Diferentes formas de crear un RDD en PySpark

Leer y Escribir DataFrames de pyspark en AWS S3: Guía Completa

AWS Glue triggers

Introducción a Data Catalog y crawlers en AWS Glue

Cursos Online

Big Data y Spark: ingeniería de datos con Python y pyspark

Snowflake Data Warehouse: Desde lo Básico a lo Avanzado

Apache Maven: Construcción de proyectos de cero a avanzado

Spark y Scala en Databricks: Big Data e ingeniería de datos

AWS Glue: Procesamiento de Datos en la Nube

Aprende a manipular datos con Polars y Python

Inteligencia Artificial Generativa en Snowflake