数字孪生生成器(预览版)是 Microsoft Fabric 中 Real-Time 智能工作负载中的新项。 它创建实际环境的数字表示形式,以使用数据优化物理作。
重要
此功能目前为预览版。
在本教程中,你将学习如何设置数字孪生构建器,并使用它来构建一个本体论,为从事件流中传输的示例数据提供上下文。 在数字孪生生成器中构建本体后,可以使用快捷方式在事件屋中公开数据,并使用 KQL(Kusto 查询语言)查询对其进行查询。 然后,在 Real-Time 仪表板中可视化这些查询结果。
先决条件
- 具有支持 Microsoft Fabric 的容量的工作区。
- 在租户上已激活数字孪生生成器访问。
Fabric 管理员可以 在 管理门户中授予对数字孪生生成器的访问权限。 在 租户设置中,启用 数字孪生生成器(预览版)。
租户无法启用 Spark 的自动缩放计费,因为数字孪生建模器与它不兼容。 此设置也在 管理门户中进行管理。
情景
本教程中使用的示例场景是一组公交车数据,其中包含有关公交车运行和位置的信息。 通过使用数字孪生生成器(预览版)对数据进行场景化分析和建模,可以分析和估算公交车的行为。
此分析包括估计巴士在下一站是否会迟到,同时利用区级位置数据分析延迟模式。 该分析可用于估计各个站点的延迟,并确定地理趋势,例如哪些站点和城区经历更频繁的延迟。
数据摘要
在本教程中,你将合并来自两个数据源的数据:实时公交车运行和计时详细信息(事实数据),以及精确的地理和上下文公交车站数据(维度数据)。 将数字孪生构建器(预览版)中的公交车数据进行情境化处理,可实现动态分析和运行见解。 整合公交车站的静态数据为进行本地化分析和识别延迟模式奠定了基础。 此外,站点数据中的区县所有权和地方性数据使用户能够了解更广泛的地理趋势和总体交通效率。
下表汇总了每个数据源中包含的数据。
总线数据
此数据集是实时数据,提供有关公交车移动的信息。 由 Real-Time 智能进行流式传输。
领域 | DESCRIPTION |
---|---|
Timestamp |
创建数据快照的时间(实时系统时间)。 |
TripId |
每个行程实例的唯一标识符,例如在线路上运行的特定巴士。 可用于跟踪单个巴士旅程。 |
BusLine |
路由编号,如 110 或 99。 适用于对特定线路的行程和停车进行模式检测的分组。 |
StationNumber |
行程中的停止序列(1 是第一站)。 用于跟踪公交沿路线的进度。 |
ScheduleTime |
公共汽车应该到达其路线上的下一站的预定时间。 可用于计算延迟。 |
Properties |
一个 JSON 字段,其中包含两个值: BusState 可以是 InMotion 或 Arrived (指示移动状态), TimeToNextStation 也是到达下一站的估计时间。 此 JSON 字段列需要分隔,以便在数字孪生生成器中使用(预览版)。 |
公交车站数据
此数据集是有关公交站的维度数据。 它提供了有关停止位置的(模拟)上下文信息。 此数据作为静态文件上传到 tutorial Lakehouse。
领域 | DESCRIPTION |
---|---|
Stop_Code |
公交车站的唯一标识符。 |
Stop_Name |
公共汽车站的名称,如 修道院伍德路。 |
Latitude |
公共汽车站的纬度。 可用于地图可视化以及计算站点之间的距离。 |
Longitude |
公共汽车站的经度。 可用于地图展示或计算站点之间的距离。 |
Road_Name |
车站所在的道路。 用于识别道路特定趋势。 |
Borough |
车站所在的区,如 格林威治。 可用于聚合和地理分析。 |
Borough_ID |
自治市的数字 ID。 可能用于与区级数据集联接。 |
Suggested_Locality |
该站所在的社区或地区,如 Abbey Wood。 比区更精细,更有助于本地分析。 |
Locality_ID |
一个地区的数字标识符。 |
教程步骤
在本教程中,完成以下步骤来构建总线数据方案:
- 设置环境并将静态上下文示例数据上传到 Lakehouse
- 处理流数据并将其存入湖仓系统
- 在数字孪生构建器中构建本体(预览版)
- 使用 Fabric 笔记本将本体数据投影到 Eventhouse
- 创建 KQL 查询和 Real-Time 仪表板以浏览和可视化数据