创建合表

来自海致BDP帮助中心、帮助文档
跳转至: 导航搜索

为了提升存储数据的利用率,不去存储过多的重复数据,数据库中的表一般都是采用主从分表的形式进行存储。企业内部有多个业务部门,每个业务部门都有自己的数据存储,如果要分析整个企业的一个经营状况,则需要将各个业务部门的数据汇总起来进行分析。这些整合的过程就是合表,BDP中提供了以下四种合表方式:

  • 多表关联
  • 数据聚合
  • 追加合并
  • SQL合表

在BDP的工作表菜单页,右上方点击创建合表即可看到这四种合表方式,下面将分别介绍这四种合表在BDP中的操作。

多表关联

订单数据中一般只存取了用户的ID,并没有用户的基本信息,如果想要分析商品的用户画像,则需要将订单表和用户基本信息表借助两表共有的用户id可汇总成一张新表,对这张新表进行分析即可得到商品的用户画像。这个操作就是关联,BDP中的关联支持一表对一表的关联合表,也支持一表对多表的关联合表。关联支持三种形式:

  • Left join:左关联,表示以左表为主表进行关联操作。显示左表中的所有记录,不管是否与关联条件相匹配,而右表中的数据只显示与关联条件相匹配的记录
  • Inner join:等值关联,表示对两表取交集,只返回两个表中联结字段相等的行
  • Full join:全关联,表示对两表取并集。返回两表中所有数据,不管是否匹配

完成关联合表需要以下三个操作步骤:

进入多表关联合表操作页面

在BDP的工作表列表页,点击页面右上角的创建合表,选择多表关联,进入多表关联操作页面。

多表关联-1.gif

选择关联的表,关联方式以及要关联的字段

在左侧列表框可以选择要关联的表,将需要关联的表拖拽到右侧编辑区域,即可进行关联操作。

多表关联-2.gif

对新生成的合表进行命名以及保存到相应的工作表文件夹

选择完关联字段以及设置完关联条件后,输入工作表名称,点击保存即可完成多表关联操作。

多表关联-3.gif

另外支持一表对多表的关联以及已经关联的表支持替换和删除操作。

多表关联-4.gif

在页面下方支持设置数据过滤条件,对字段的设置以及查看异常报告。设置过滤条件可以过滤掉不需要的数据或是关联后为空的数据,关联为空的数据可以在异常报告中查看到。

多表关联-5.gif

数据聚合

APP通过埋点会记录用户每天的登陆信息,原始数据只有每天的用户登陆信息,如果需要统计每日登陆人数,通过去重即可得到。如果要统计每月的登陆人数,则需要对一月内的登陆的用户去重才能得到。通过每日登陆的用户得到一月登陆的用户,这个操作可以通过聚合完成。

数据聚合包含以下三个操作:

选择需要进行聚合操作的表

在工作表页面,点击右上角的创建合表,选择数据聚合进入数据聚合页面。在弹出的对话框中借助于搜索框选择要进行聚合操作的工作表。

数据聚合-1.gif

选择聚合的维度和数值

这里我们是要借助于订单数据聚合得到每天的销售额,维度对应到表中的字段是拍下日期,数值就是商品价格,因为我们求的是每天的销售额,就是每天销售的商品价格之和,因此数值计算方式这里选择的是求和。数据聚合数值支持的计算有求和,平均值,计数,去重计数,最大值,最小值。如果我们要聚合得到每天的订单量,则需要将订单号字段拖拽到数值,计算方式选择去重计数,即可聚合得到每天的订单量。聚合结果预览界面,数据量过多的情况,只是随机选取了50条数据进行展示。如果要预览全部数据,可在工作表页面筛选进行查看。

数据聚合-2.gif

保存新生成的表

聚合操作结束后,可编辑聚合后的工作表名称,以及所属文件夹,点击右上角保存按钮,即可创建一张新的聚合表。

数据聚合-3.gif

如果聚合后想过滤一些不需要分析的数据,在数据聚合合表页面的下方还支持数据筛选功能。另外聚合表也支持添加计算字段,计算字段的添加方式和在工作表处添加字段的操作相同。

数据聚合-4.gif

追加合并

应用案例

企业里面不同部门都有各自的数据,但是数据的格式相同的。如果想要分析整个企业的数据,需要将各个部门的数据表汇总成一张表,这个汇总的过程就是追加合并。

追加合并包含以下三个操作:

拖拽选择需要追加的表,选择追加合并的字段

在工作表页面,点击右上角的创建合表,选择追加合并进入追加合并页面,将需要进行追加合并操作的表拖拽到右侧的操作区。

追加合并-1.gif

拖拽一个表后支持批量添加的操作,这主要是考虑到合并表数量较多的情况。

追加合并-2.gif

编辑字段追加的字段以及新生表表的字段名

如果出现匹配不上的情况下,追加合并的字段支持拖拽新建和合并,支持对已有和新建的字段进行重命名。

追加合并-3.gif

对新生成的合表进行命名以及保存到相应的工作表文件夹

追加合并操作完成后,可编辑合并后的工作表名称,以及所属文件夹,点击右上角保存按钮,即可创建一张新的追加合并表。

追加合并-4.gif

SQL合表

对于一些比较复杂的数据处理,或是对SQL比较熟悉的用户,可以选用SQL合表,灵活高效的可以完成数据处理操作。SQL合表建议首先阅读语法帮助说明,在进行SQL语句的编写。

SQL合表.png