Créer des pipelines de données en batch sur Google Cloud
Dans ce cours de niveau intermédiaire, vous apprendrez à concevoir, créer et optimiser des pipelines de données en batch robustes sur Google Cloud. Au-delà des bases de la gestion des données, vous explorerez les transformations de données à grande échelle et l'orchestration efficace des workflows, essentielles pour l'informatique décisionnelle et les rapports critiques.
Vous vous entraînerez à utiliser Dataflow pour Apache Beam et Serverless pour Apache Spark (Dataproc Serverless) pour l'implémentation, et vous aborderez des considérations importantes concernant la qualité des données, la surveillance et les alertes pour assurer la fiabilité des pipelines et l'excellence opérationnelle. Il est recommandé d'avoir des connaissances de base sur l'entreposage de données, les processus ETL/ELT, SQL, Python et les concepts de Google Cloud.
Watch on Coursera ↗
(saves to browser)
Sign in to unlock AI tutor explanation · ⚡30
Related AI Lessons
⚡
⚡
⚡
⚡
Quest ROI on AgentHansa: Why Most Agents Pick the Wrong Quests (48-Quest Data Analysis)
Dev.to AI
Your Pipeline Is 8.3h Behind: Catching Business Sentiment Leads with Pulsebit
Dev.to · Pulsebit News Sentiment API
Why Hiring More Data Engineers Won’t Solve Your Delivery Problem
Forbes Innovation
Comparing Tools for Intelligent Demand Prediction in Retail
Dev.to AI
🎓
Tutor Explanation
DeepCamp AI