了解 Azure Synapse 无服务器 SQL 池功能和用例

已完成

Azure Synapse Analytics 是一种集成的分析服务,它汇集了各种常用技术,用于大规模处理和分析数据。 数据解决方案中使用的最普遍技术之一是 SQL-一种用于查询和作数据的行业标准语言。

Azure Synapse Analytics 中的无服务器 SQL 池

Azure Synapse SQL 是 Azure Synapse Analytics 中的分布式查询系统,提供两种类型的运行时环境:

  • 无服务器 SQL 池:按需 SQL 查询处理,主要用于处理数据湖中的数据。
  • 专用 SQL 池:用于托管数据存储在关系表中的数据仓库的企业规模关系数据库实例。

在本模块中,我们将重点介绍无服务器 SQL 池,该池提供按查询付费的终结点来查询数据湖中的数据。 使用无服务器 SQL 池的好处包括:

  • 熟悉的 Transact-SQL 语法,无需将数据复制或加载到专用存储中即可就地查询数据。
  • 来自各种商业智能和即席查询工具(包括最受欢迎的驱动程序)的集成连接。
  • 为大规模数据和计算函数构建的分布式查询处理 - 导致查询性能快速。
  • 内置的查询执行容错机制,确保即使对于涉及大型数据集的长期运行查询,也具有高可靠性和成功率。
  • 不需要设置基础设施,也不需要维护群集。 此服务的内置终结点在每个 Azure Synapse 工作区中提供,因此可以在创建工作区后立即开始查询数据。
  • 保留的资源不会产生费用,你只需为运行的查询所处理的数据付费。

何时使用无服务器 SQL 池

无服务器 SQL 池专为查询驻留在 Data Lake 中的数据而定制,因此除了消除管理负担外,还无需担心将数据引入系统。 只需将查询指向已存在于湖中的数据并运行它。

Synapse SQL 无服务器资源模型非常适合计划外或“突发”工作负载,这些工作负载可以通过 Azure Synapse Analytics 工作区中的始终可用无服务器 SQL 终结点进行处理。 如果需要了解执行的每个查询的确切成本以监视成本和查明成本来源,使用无服务器池会有所帮助。

注释

无服务器 SQL 池是一个分析系统,不建议用于 OLTP 工作负荷,例如应用程序用于存储事务数据的数据库。 需要毫秒响应时间并查找数据集中单个行的工作负荷不适合无服务器 SQL 池。

无服务器 SQL 池的常见用例包括:

  • 数据浏览:数据浏览涉及浏览数据湖以获取有关数据的初始见解,并且可以轻松地通过 Azure Synapse Studio 实现。 可以浏览链接 Data Lake 存储中的文件,并使用内置的无服务器 SQL 池自动生成 SQL 脚本,以便从文件或文件夹中选择前 100 行,就像在 SQL Server 中使用表一样。 从那里,你可以对数据应用投影、筛选、分组和大多数操作,就像数据位于常规 SQL Server 表中一样。
  • 数据转换:虽然 Azure Synapse Analytics 通过 Synapse Spark 提供出色的数据转换功能,但某些数据工程师可能会发现数据转换更易于使用 SQL 实现。 使用无服务器 SQL 池可以执行基于 SQL 的数据转换;以交互方式或作为自动化数据管道的一部分。
  • 逻辑数据仓库:在对 Data Lake 中的数据进行初始浏览后,可以在无服务器 SQL 数据库中定义表和视图等外部对象。 数据仍存储在 Data Lake 文件中,但由关系架构抽象化,客户端应用程序和分析工具可以使用该架构查询数据,就像在 SQL Server 中托管的关系数据库中一样。