站长之家- 传媒 2019-05-23T09:48:05 +08:00

Smartbi V8.5提供可重用的自助数据准备能力

基于可视化的数据发现是现代分析和商业智能(BI)平台的一个重要特征.。这股新的潮流始于2004年左右,此后,市场和新的购买趋势从以IT为中心的记录系统(SOR)转向以业务为中心的、带有自助服务的敏捷分析。现代分析和BI平台的特点是易于使用的工具,支持全面的分析工作流功能。它们不需要信息技术的大量参与就可以预先定义数据模型作为分析的先决条件,而且在某些情况下,将自动生成可重用的数据模型(见“现代分析和商业智能平台的技术洞察力”)。一个独立的内存柱状引擎可以促进探索,但也可以快速成型.。现代分析和BI平台可以有选择性地从传统IT建模的数据结构中获取资源,以促进整个组织的治理和可重用性。许多组织可以通过以敏捷的方式扩展IT建模结构并将其与新的多结构数据源相结合来开展他们的现代化工作。

这是Gartner2018年报告中对市场的开篇描述,从中我们可以看到传统BI的数据模型是“预定义“,而现代分析和BI平台的数据模型是”自定义“。其实这符合以业务为中心的Self-BI总体背景,预定义意味着”求人”,自定义意味着“效率”。而追求高效率的运行方式不正是企业运营的本质么!

Smartbi V8.5是如何践行自助式的数据准备呢,我们一起来看看自助数据集的功能和原理。简单来说,自助数据集的功能是:跨库查询、模型设计、抽取控制。其实对于熟悉数据仓库和ETL的技术人员来说,这就对应目标建模、Mapping和ETL作业,但由于使用者从开发阶段的技术人员变成运行阶段的业务人员,因此很多功能细节是差异很大的。

功能一:跨库查询

凡是提到数据准备,异构数据源、信息孤岛是最经常被提及的,如果只能读取一个固定数据源,那肯定不能称之为“平台”,Smartbi V8.5提供跨库查询的引擎,只要新建一个数据源,就会同步体现在这个跨库查询引擎中。

无论是跨库还是单个数据库,查询对于使用者都会需要做表关联,甚至还需要嵌套查询(将可视化查询、SQL查询、原生SQL查询、存储过程查询、JAVA查询、组合分析和透视分析做为数据源),以及设置筛选条件、计算新字段等等。这些常用功能在自助数据集里都是可以支持的,而且操作方式都采用拖拽点选,无须任何专业计算机语言。

功能二:模型设计

自服务数据准备,其结果必定也是一个数据模型,便于后续的可视化、表格化、报告化的展现和分析。自助数据集允许用户轻松分组归类、改别名、改类型、隐藏字段,也可以一键定义日期维和地理维字段,便于支持后续的钻取分析。当然所有的数据分析都会区分两大类:维度和度量,这是最基本的概念。最后,你可以随时预览数据,,以确认自己的模型设计是否满足预期的想法。

功能三:抽取控制(可选)

首先抽取不是必须的,如果你的数据源性能足够好,自助数据集就相当于一个实时SQL,查询到的始终是最新的。但往往我们的数据源性能不特别好,尤其是跨库查询产生了一个有意义的数据分析模型,用户更希望能增量更新数据,以确保其可用性,这时抽取就变得非常必要了。在Smartbi V8.5的自助数据集界面,随时可以定义抽取规则,甚至立刻启动数据抽取。

抽取的规则包括定时抽取、立刻抽取,全量抽取、增量收取等等,甚至还可以设置覆盖最后抽取的N天数据(Vertica),以及出现异常时回滚还是继续。这些与数据仓库的ETL作业是一样的。

那我为什么强调可重用呢,首先还是其使用的时间成本很低,可以反复修改和试错,其次是同一个自助数据集可以通过数据权限跨部门使用,不同的用户看到不同的数据结果。

有了自助数据准备的能力,企业构建面向业务的自助分析平台时就有了更多的选择,最重要的价值是数据分析工作的需求不仅仅是报表和可视化,对数据的前期筛选、关联、计算是必须的,这也是自助分析平台可以真正从Office Excel把业务人员“抢过来”的关键(虽然个人力挺使用Excel)。

推荐关键词

24小时热搜

查看更多内容

大家正在看

Beats Studio3 ACW版本发布