属性筛选条件说明
最后更新于:2018-08-08 14:43:57
1. 什么是筛选条件
筛选条件是为了在我们取到的数据集中,通过设置一个条件进行过滤,获取我们最终想得到的子数据集进行分析。神策所有的分析功能中都有筛选条件的选项,均可以实现根据事件的属性进行筛选或根据用户的属性进行筛选。
筛选条件可类比于 SQL 中的 where 条件语句
当使用用户筛选条件时, where 条件作用于 users 表;当使用事件筛选条件时, where 条件作用于 events 表
2. 使用流程
在神策所有的分析功能中,我们可以看到筛选条件
、触发限制条件
等按钮时,代表此处可以对用户或事件进行筛选,参考上图中的标识,具体配置流程如下:
- 点击弹出筛选条件输入框,可以同时添加一个或多个筛选条件
- 在 B 中选择筛选事件或用户的属性
- 在 C 中选择属性的判断类型,不同的属性类型拥有不同的判断类型,不同判断类型的使用方法可参考第 3 部分
- 在 D 选项中输入判断值后,分析结果即会根据输入条件进行筛选
3. 筛选条件分类
3.1 按目标
筛选用户:筛选条件作用于用户表,只看符合筛选条件的那些用户;一般在用户属性上进行条件设置,或者选择用户分群获取符合分析条件的用户。
筛选事件:筛选条件作用于事件,只看符合筛选条件的事件;一般在事件属性上进行条件设置。
3.2 按数据类型
不管是为了筛选出不同用户或筛选不同事件,具体的每一个筛选条件的设置,都可以按其数据类型来了解。
3.2.1 字符串类型属性筛选
当筛选的属性为字符串类型时,可以看到如上图中标识的判断类型,具体每个判断类型的使用可参考下表:
判断类型 | 类比 SQL | 描述说明 |
---|---|---|
等于 | = | 精确判断,只有选择的事件属性等于输入的判断值时,该事件才会才会进入分析过程;当判断值存在多个时,事件属性值等于任意一个,该事件都会进入分析的数据集 |
不等于 | != | 精确判断,只有选择的事件属性不等于输入的判断值时,该事件才会才会进入分析过程;当判断值存在多个时,事件属性值等于任意一个,该事件就不会进入分析过程 |
包含 | LIKE "%$判断值 %" |
匹配判断,当属性字段中包含判断值,该事件或用户就会进入分析过程 |
不包含 | NOT LIKE "%$判断值 %" |
匹配判断,与“包含”相反,当属性字段中包含判断值,该事件不会进入分析过程 |
不为空 | Length($属性 )>0 |
当属性字段中有值(字符串长度大于 0 )时,事件或用户才会进入分析过程 |
为空 | ="" | 当属性字段中值为空字符串时,事件或用户才会进入分析过程 |
没值 | IS NULL | 只有属性字段中值为 NULL 时,事件或用户才会进入分析过程 |
有值 | IS NOT NULL | 只有属性字段中值不为 NULL 时,事件或用户才会进入分析过程 |
正则匹配 | 匹配判断,符合条件的数据进入分析过程,具体请参考:正则表达式 | |
正则不匹配 | 匹配判断,只有不符合正则条件的数据进入分析过程,具体请参考:正则表达式 |
3.2.2 数值类型属性筛选
当筛选的属性为数字类型时,可以看到如上图中标识的判断类型,具体每个判断类型的使用可参考下表:
判断类型 | 类比表达式 | 描述说明 |
---|---|---|
等于 | = | 类同于字符串类型 |
不等于 | != | 类同于字符串类型 |
小于 | < | 所选属性值小于判断值的事件才会进入分析过程 |
大于 | > | 所选属性值大于判断值的事件才会进入分析过程 |
区间 | between . and . | 所选属性值处于设置的判断值所形成的闭区间时,事件才会进入分析流程;如判断值设置为 10 和 100 时,所选属性值需要满足 [10,100] 区间 |
有值 | IS NOT NULL | 类同于字符串类型 |
没值 | IS NULL | 类同于字符串类型 |
3.2.3 时间类型属性筛选
名词解释
绝对时间:
有明确开始和截止时间的一个固定时间范围相对时间:
相对于某个时间点,确定一个开始时间和截止时间的时间范围相对当前时间点:
相对于当前之前的一段时间范围,比如之前 1 小时相对当前时间区间:
相对当前的时间点,确定一个开始时间和截止时间
当筛选的属性为时间类型时,可以看到如上图所示的判断类型,具体每个判断类型使用可参考如下:
绝对时间
如设置绝对时间在 2017-07-04 00:00 至 2017-07-11 00:00,则所选属性时间范围在此区间(包含区间端点)的数据会进入分析过程
相对当前时间点
如相对当前时间点在 1 天之内,则表示当前时间点减一天为起点,当前时间点为终点的时间区间。即 [当前时间点 - 1 天, 当前时间点]
如相对当前时间点 1 天之前,则表示当前时间点减一天为终点之前的时间区间。即 ( 无穷小时间, 当前时间点 - 1 天]
相对当前时间区间
如设置相对当前时间的过去 5 天到过去 3 天之内,则表示以当前时间点 - 5 天为起点,以当天时间点 - 3 天为终点的时间区间,即 [当前时间点 - 5 天, 当天时间点 - 3 天]
相对事件发生时间
此处以事件发生的时间锚点去设置时间区间的起点和终点,所以对于每一条需要判断的事件或用户数据,所对应判断的时间区间是不一样的。
比如我们想要看到购买事件发生前 5 分钟进行注册事件的用户数量时,可设置 注册时间 相对事件发生时间 在之前 5 分钟内。基于“用户注册后,立马购买的商品是吸引用户注册的原因”这样一个假设,我们可以查看那类型商品比较容易吸引用户注册来购买。或者替换成优惠券,可查看那类型优惠券更容易吸引用户。
有值 & 没值
请参考字符串类型中,有值 & 没值的描述
3.2.4 布尔类型属性筛选
当筛选的属性为布尔类型时,可以看到如上图所示的判断类型,具体每个判断类型使用如下:
为真
表示当选择属性值为 TURE 时,数据才会进入分析过程。
为假
表示当选择属性值为 FALSE 时,数据才会进入分析过程。
有值&没值
请参考字符串中,有值 & 没值的描述
3.2.5 带字典类型属性的筛选
在神策分析的元数据管理中,可以对设置维度字典,对于已经设置维度字典的字段,筛选条件如下图,具体的判断字段使用可参考字符串类型中相应类型。
3.2.6 用户分群的筛选
用户分群分为普通分群和预测分群,在进行条件筛选时,对于选择普通分群,则判断条件选择跟布尔类型相同,表示用户是否在该分群之内。对于选择预测分群,则判断条件与字典类型属性字段的筛选相同,这是因为判断一个用户是否属于预测分群并非 100% 确定的,而是分成几种可能性表述的。