在 Azure Databricks 中使用 Apache Spark
中级
数据工程师
Azure Databricks
Azure Databricks 基于 Apache Spark 构建,使数据工程师和分析人员能够运行 Spark 作业,以大规模转换、分析和可视化数据。
学习目标
在本模块中,你将了解如何:
- 介绍 Apache Spark 体系结构的关键元素。
- 创建和配置 Spark 群集。
- 介绍 Spark 的用例。
- 使用 Spark 处理和分析文件中存储的数据。
- 使用 Spark 可视化数据。
先决条件
在开始本模块之前,应具备 Azure Databricks 的基础知识。 请考虑在此模块之前完成 “探索 Azure Databricks ”模块。