Apache Spark - Capítulo 1. ¿Qué es Apache Spark?

Data Engineering Latam
Data Engineering Latam
11 هزار بار بازدید - 3 سال پیش - Ponente: Daniel Portugal RevillaLinkedIn:
Ponente: Daniel Portugal Revilla
LinkedIn: LinkedIn: daniel-portugal

Capítulo 1. ¿Qué es Apache Spark?

Apache Spark es un motor informático unificado y un conjunto de librerías para el procesamiento de datos en paralelo en clústeres de computadoras. En el momento de escribir este artículo, Spark es el motor de código abierto más desarrollado para esta tarea, lo que lo convierte en una herramienta estándar para cualquier desarrollador o científico de datos interesado en big data. Spark admite múltiples lenguajes de programación ampliamente utilizados (Python, Java, Scala y R), incluye bibliotecas para diversas tareas que van desde SQL hasta streaming y machine learningo, y se ejecuta en cualquier lugar, desde una computadora portátil hasta un clúster de miles de servidores.




Acerca del libro
Título: Spark: The Definitive Guide

Apache Spark es actualmente uno de los sistemas más populares para el procesamiento de datos a gran escala, con API en múltiples lenguajes de programación y una gran cantidad de bibliotecas integradas y de terceros. Aunque el proyecto ha existido durante varios años, primero como un proyecto de investigación que comenzó en UC Berkeley en 2009, luego en la Apache Software Foundation desde 2013, la comunidad de código abierto continúa creando API más potentes y bibliotecas de alto nivel sobre Spark, por lo que todavía hay mucho que escribir sobre el proyecto.


---------------------------------------------------------------------------------------------------------------------
¿Te gustaría compartir y aprender sobre SQL, Bases de datos, Big Data, Cloud, R, Oracle, SQL Server, Hadoop, Hive, Spark, Databricks, Delta Lake, git, Airflow, Apache Hudi, Apache Beam, DVC, lakeFS, Flink, AWS, GCP, Azure, Presto/Trino, Snowflake, Ingeniería de Datos, Machine Learning, MLOps, Data Management, etc con más entusiastas por los datos así como tú?

📣Únete a la comunidad Data Engineering LATAM en las distintas redes que tenemos
https://bit.ly/DataEngineeringLATAM

📺 YouTube: https://www.seevid.ir/c/dataenginee...
📈 Linkedin: LinkedIn: data-engineering-latam
📸 Instagram: Instagram: dataengineeringlatam
👍 Facebook: Facebook: dataengineeringlatam
🐦 Twitter: Twitter: DataEngiLATAM
✉ Telegram: https://t.me/dataengineeringlatam
📚 Slack: https://lnkd.in/eV7hgF3

Grupos de Estudios:

🎤 English Speaking and stuff
🎤 DAMA's Study Group (Data Management)
🎤 Databricks Certified Associate
🎤 Apache Airflow Study Club
🎤 Power BI como debe ser
🎤 Club de Lectura / Designing data-intensive Applications 🐗

🎤¿Quieres dar charla en la comunidad?
https://docs.google.com/forms/d/e/1FA...

💌Suscríbete a este canal con el botón rojo que está debajo de los videos y pulsa la campana para que te notifique de las novedades.

📢 ¡Pasa la voz y ayúdanos a ser la comunidad más grande y chévere de todas!
3 سال پیش در تاریخ 1400/08/12 منتشر شده است.
11,049 بـار بازدید شده
... بیشتر