查看“创建合表”的源代码
←
创建合表
跳转至:
导航
、
搜索
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
为了提升存储数据的利用率,不去存储过多的重复数据,数据库中的表一般都是采用主从分表的形式进行存储。企业内部有多个业务部门,每个业务部门都有自己的数据存储,如果要分析整个企业的一个经营状况,则需要将各个业务部门的数据汇总起来进行分析。这些整合的过程就是合表,BDP中提供了以下四种合表方式: *多表关联 *数据聚合 *追加合并 *SQL合表 在BDP的工作表菜单页,右上方点击创建合表即可看到这四种合表方式,下面将分别介绍这四种合表在BDP中的操作。 ===多表关联=== 订单数据中一般只存取了用户的ID,并没有用户的基本信息,如果想要分析商品的用户画像,则需要将订单表和用户基本信息表借助两表共有的用户id可汇总成一张新表,对这张新表进行分析即可得到商品的用户画像。这个操作就是关联,BDP中的关联支持一表对一表的关联合表,也支持一表对多表的关联合表。关联支持三种形式: *Left join:左关联,表示以左表为主表进行关联操作。显示左表中的所有记录,不管是否与关联条件相匹配,而右表中的数据只显示与关联条件相匹配的记录 *Inner join:等值关联,表示对两表取交集,只返回两个表中联结字段相等的行 *Full join:全关联,表示对两表取并集。返回两表中所有数据,不管是否匹配 完成关联合表需要以下三个操作步骤: ====进入多表关联合表操作页面==== 在BDP的工作表列表页,点击页面右上角的创建合表,选择多表关联,进入多表关联操作页面。 [[文件:多表关联-1.gif]] ====选择关联的表,关联方式以及要关联的字段==== 在左侧列表框可以选择要关联的表,将需要关联的表拖拽到右侧编辑区域,即可进行关联操作。 [[文件:多表关联-2.gif]] ====对新生成的合表进行命名以及保存到相应的工作表文件夹==== 选择完关联字段以及设置完关联条件后,输入工作表名称,点击保存即可完成多表关联操作。 [[文件:多表关联-3.gif]] 另外支持一表对多表的关联以及已经关联的表支持替换和删除操作。 [[文件:多表关联-4.gif]] 在页面下方支持设置数据过滤条件,对字段的设置以及查看异常报告。设置过滤条件可以过滤掉不需要的数据或是关联后为空的数据,关联为空的数据可以在异常报告中查看到。 [[文件:多表关联-5.gif]] ===数据聚合=== APP通过埋点会记录用户每天的登陆信息,原始数据只有每天的用户登陆信息,如果需要统计每日登陆人数,通过去重即可得到。如果要统计每月的登陆人数,则需要对一月内的登陆的用户去重才能得到。通过每日登陆的用户得到一月登陆的用户,这个操作可以通过聚合完成。 数据聚合包含以下三个操作: ====选择需要进行聚合操作的表==== 在工作表页面,点击右上角的创建合表,选择数据聚合进入数据聚合页面。在弹出的对话框中借助于搜索框选择要进行聚合操作的工作表。 [[文件:数据聚合-1.gif]] ====选择聚合的维度和数值==== 这里我们是要借助于订单数据聚合得到每天的销售额,维度对应到表中的字段是拍下日期,数值就是商品价格,因为我们求的是每天的销售额,就是每天销售的商品价格之和,因此数值计算方式这里选择的是求和。数据聚合数值支持的计算有求和,平均值,计数,去重计数,最大值,最小值。如果我们要聚合得到每天的订单量,则需要将订单号字段拖拽到数值,计算方式选择去重计数,即可聚合得到每天的订单量。聚合结果预览界面,数据量过多的情况,只是随机选取了50条数据进行展示。如果要预览全部数据,可在工作表页面筛选进行查看。 [[文件:数据聚合-2.gif]] ====保存新生成的表==== 聚合操作结束后,可编辑聚合后的工作表名称,以及所属文件夹,点击右上角保存按钮,即可创建一张新的聚合表。 [[文件:数据聚合-3.gif]] 如果聚合后想过滤一些不需要分析的数据,在数据聚合合表页面的下方还支持数据筛选功能。另外聚合表也支持添加计算字段,计算字段的添加方式和在工作表处添加字段的操作相同。 [[文件:数据聚合-4.gif]] ===追加合并=== [http://mp.weixin.qq.com/s?__biz=MzIxMDU0MjAwOQ==&mid=2247483843&idx=1&sn=8a2add0523d8e48aa9981a95352ac53b&chksm=97624d15a015c403b579ab4dd896f7c5a747793aa3d52d5bffc56eed64c53c837bfd8b1d35ec#rd 应用案例] 企业里面不同部门都有各自的数据,但是数据的格式相同的。如果想要分析整个企业的数据,需要将各个部门的数据表汇总成一张表,这个汇总的过程就是追加合并。 追加合并包含以下三个操作: ====拖拽选择需要追加的表,选择追加合并的字段==== 在工作表页面,点击右上角的创建合表,选择追加合并进入追加合并页面,将需要进行追加合并操作的表拖拽到右侧的操作区。 [[文件:追加合并-1.gif]] 拖拽一个表后支持批量添加的操作,这主要是考虑到合并表数量较多的情况。 [[文件:追加合并-2.gif]] ====编辑字段追加的字段以及新生表表的字段名==== 如果出现匹配不上的情况下,追加合并的字段支持拖拽新建和合并,支持对已有和新建的字段进行重命名。 [[文件:追加合并-3.gif]] ====对新生成的合表进行命名以及保存到相应的工作表文件夹==== 追加合并操作完成后,可编辑合并后的工作表名称,以及所属文件夹,点击右上角保存按钮,即可创建一张新的追加合并表。 [[文件:追加合并-4.gif]] ===SQL合表=== 对于一些比较复杂的数据处理,或是对SQL比较熟悉的用户,可以选用SQL合表,灵活高效的可以完成数据处理操作。SQL合表建议首先阅读语法帮助说明,在进行SQL语句的编写。 [[文件:SQL合表.png|1000px]]
返回至
创建合表
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
数据接入
对接概况
数据源列表
文件上传
同步客户端
文件同步宝
BDP Excel 插件
BDP PPT 插件
日志解析同步工具
数据处理
字段类型
创建合表
工作表管理
地址转经纬度
可视化分析
拖拽分析
维度、对比和数值
图表类型
筛选器
字段设置
计算字段函数说明
参数
多层钻取
高级计算
颜色与条件格式
预警与辅助线
对比拆分
其他图表设置
GIS地图
基本操作
气泡图
热力图
海量点图
统计图
轨迹热力图
动态轨迹图
仪表盘
仪表盘管理
仪表盘布局
仪表盘设计
全局筛选器
图表联动
大屏模式及导出
仪表盘协同
账号权限
分组结构
用户管理
安全配置
模板分发
模板分发
开发者手册
Readme
工具
链入页面
相关更改
特殊页面
页面信息