数仓--DW--Hadoop天辰手机app数仓实践Case-11-分段维度


天辰手机app


分段维度概述

在客户维度中, 天辰手机app最具有分析价值的属性就是各种分类, 这些属性的变化范围比较大。 对某个个体客户来说, 可能的分类属性包括: 性别、 年龄、 民族、 职业、 收入和状态, 例如, 新客户、 活跃客户、 不活跃客户、 已流失客户等。 在这些分类属性中, 有一些能够定义成包含连续值的分段, 例如年龄和收入这种数值型的属性, 就可以分成连续的数值区间, 而像状态这种描述性的属性, 可能需要用户根据自己的实际业务仔细定义, 通常定义的根据是某种可度量的数值。

组织还可能使用为其客户打分的方法刻画客户行为。 分段维度模型通常以不同方式按照积分将客户分类, 例如, 基于他们的购买行为、 支付行为、 流失走向等。 每个客户用所得的分数标记。

下面以销售订单为例, 说明分段维度的实现技术。 分段维度包含连续的分段度量值。 例如, 年度销售订单分段维度可能包含有叫做“低”“中”“高”的三个档次, 各档定义分别为消费额在0.01到3000、 3000.01到6000.00、 6000.01到99999999.99区间。 如果一个客户的年度销售订单金额累计为1000, 则被归为“低”档。 分段维度可以存储多个分段集合。 例如, 可能有一个用于促销分析的分段集合, 另一个用于市场细分, 可能还有一个用于销售区域计划。 分段一般由用户定义, 天辰手机版下载而且很少能从源事务数据直接获得。

第一个星型模型是annual_sale_order_fact事实表、source_consumer_dim维度表、source_year_dim维度表构成;年维度是新建的维度,是日期维度的子维度。年度销售额事实表存储客户一年的消费总额,数据由现有的订单事实表中汇总而来。

第二个星型模型是由annual_customer_segment_fact事实表、source_order_segment_dim维度表、source_consumer_dim维度表、source_year_dim维度表构成。客户年度分段事实表中没有度量,只有来自三个相关维度表的代理键,因此它是一个无事实的事实表,存储的数据实际上就是前文所说的行为标记时间序列。年度订单分段维度用于存储分段的定义,在本案例中,它只与年度分段事实表有关系。

如果多个分段的属性相同, 可以将它们存储到单一维度表中, 因为分段通常都有很小的基数。 本例中source_order_segment_dim表存储了“project”和“grid”两种分段集合,它们都是按照客户的年度销售订单金额将其分类。 分段维度按消费金额的定义如下表所示, project分六段, grid分三段。

上一篇:你未来的身价,天辰手机版下载取决于维度竞争
下一篇:天辰手机版下载稳定婚姻的4个价值维度,你符合

网友回应

欢迎扫描关注我们的微信公众平台!

欢迎扫描关注我们的微信公众平台!