Fabric 中的镜像功能提供了一种简单的体验,可避免复杂的 ETL(提取转换加载),并可将现有的 Azure SQL 托管实例资产与 Microsoft Fabric 中的其他数据集成在一起。 可以直接将现有 SQL 托管实例持续复制到 Fabric 的 OneLake 中。 在 Fabric 中,可以解锁强大的商业智能、人工智能、数据工程、数据科学和数据共享应用场景。
有关为 Fabric 中的镜像配置 Azure SQL 托管实例的教程,请参阅教程:配置来自 Azure SQL 托管实例的 Microsoft Fabric 镜像数据库(预览版)。
为什么要使用 Fabric 中的镜像功能?
使用 Fabric 镜像功能时,无需将来自多个供应商的不同服务拼凑在一起。 相反,你可以享受高度集成且易于使用的端到端产品,该产品旨在简化你的分析需求,并为在 Microsoft、Azure SQL 托管实例和可读取开源 Delta Lake 表格式的上千种技术解决方案之间建立开放性和协作而构建。
内置了哪些分析体验?
镜像数据库是“Fabric 数据仓库”中的一个项,有别于“仓库”和“SQL 分析终结点”。
镜像在 Fabric 工作区中创建三个项:
每个镜像 Azure SQL 托管实例都有一个自动生成的 SQL 分析终结点,可基于镜像过程创建的增量表,提供丰富的分析体验。 用户可以使用熟悉的 T-SQL 命令来定义和查询数据对象,但不能操作 SQL 分析终结点的数据,因为它是只读副本。 可在 SQL 分析终结点中执行以下操作:
- 浏览从 Azure SQL 托管实例引用 Delta Lake 表中数据的表。
- 创建无代码查询和视图,无需编写任何代码行即可直观地浏览数据。
- 开发 SQL 视图、内联 TVF(表值函数)和存储过程,以 T-SQL 封装语义和业务逻辑。
- 管理对象的权限。
- 在同一工作区中查询其他仓库和湖屋中的数据。
除了 SQL 查询编辑器,还有一个广泛的、可以查询 SQL 分析终结点的工具生态系统,其中包括 SQL Server Management Studio (SSMS)、Azure Data Studio 甚至 GitHub Copilot。
镜像防火墙后面的 Azure SQL 托管实例
如果 Azure SQL 托管实例不可公开访问, 请创建虚拟网络数据网关 或 本地数据网关 来镜像数据。 确保 Azure 虚拟网络或网关服务器的网络可以通过 专用终结点连接到 Azure SQL 托管实例。
活动事务、工作负载以及复制程序引擎行为
- 活动事务将继续保留事务日志截断,直到事务提交并且镜像 Azure SQL 托管实例跟上进度,或事务中止。 长时间运行的事务可能会导致填充超过通常情况的事务日志量。 应监视源数据库事务日志,以避免填充大量事务日志。 有关详细信息,请参阅长时间运行的事务和 CDC 导致事务日志增长。
- 用户工作负载各不相同。 在初始快照期间,源数据库的 CPU 和 IOPS(读取页面的每秒输入/输出操作)资源使用量可能会增加。 表更新/删除操作可能会导致生成的日志增加。 详细了解如何监视 Azure SQL 托管实例的资源。
层级和购买模型支持
源 Azure SQL 托管实例可以是单个 SQL 托管实例,也可以是属于实例池的 SQL 托管实例。
- vCore 购买模型中的所有服务层级均受支持。
定价
用于将数据复制到 Fabric OneLake 的 Fabric 计算免费提供。 OneLake 中的存储是免费的,具体取决于容量大小。 有关详细信息,请参阅 镜像成本和OneLake 镜像定价。 通过 SQL、Power BI 或 Spark 查询数据的计算使用情况仍基于构造容量收费。