1-1简介
基本概念
1.基本属性:每个人都有一些基本属性(性别、年龄、婚否、收人、教育程度)。
行为记录:网上购买行为、查看网页行为、点击行为、购物车行为,从这些行为中判断出用户的一些信息,假如经常网上购买小孩的物品,从此之后可以不判断出小孩的年龄、小孩的性别、等等的一些信息。
2.去购买能力:可以可以确定出用户的购买能力,最终达到打上购买力的等级标志。
3.行为特征:是可以判断用户的行为特征,比如说用户的活跃程度、购物类型。
4.社交网络:这个可以可以确定出他的社交网络。
5.心理特征:比如报出促销的敏感度,购物的真心诚意度。
6.兴趣爱好:颜色的偏好,品牌的偏好。
用户画像的用途
1.精准营销:邮件、短信、
2.用户统计数据:地域、时段
3.数据挖掘:特征、行为
学习目标:
1.知道一点hive数据仓库的特点
2.学会了在用hive并且数据开发
3.进入到解释用户数据的特点
4.完全掌握要如何构建体系用户画像
5.亲密接触换算项目的开发
6.靠积累项目实战经验
主要内容:
1.用户画像项目介绍
2.用户画像建模
3.不使用hive进项数据开发
4.用户画像数据开发
1-2用户画像简介
定义
用户画像(UserProfile)也叫用户信息标签化,客户标签。根据基本信息和行为,用一些标签把用户描绘出出,
具体描述用户的标签就是消费者画像。
最终形成用户画像的技术
1.数据收集:网络日志数据、用户行为数据、网站交易数据
2.行为建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法
3.用户画像:基本属性、可以购买能力、行为特征、兴趣爱好、心里特征、社交网络
源数据
1.动态和静态信息数据:来源于用户填好的个人资料,或是从而反算的数据。要是有不判断的。可以确立模型来判断。比如用户性别如果不填,可以不组建性别模型,实际用户的行为来推测其性别是什么船舶概论概率。
人口属性:性别、生日、年龄、婚否、收人、城市、教育程度、职业、是否是有小孩(数量)、星座、月收入
商业属性:消费等级、消费周期
2.动态信息数据:用户行为再产生的数据:注册、打开浏览器、点击、去购买、签收后、评价。
比较比较重要的行为:购买商品、浏览的网页商品、放入购物车、参与商品。
注册时间、首单时间、潮妈族,纠结啊商品、大消费、退货数量、败家指数、品牌偏好。
用户相互点(TouchPoint)
行为类型:网页、搜索、发表文章、点赞数
外界点(Tag):女装单品页面、女鞋单品页面……
标签分类
1.确认的标签
2.根据算法猜测的标签
标签举例子:
1.用户活跃度:未定购、异常活跃、沉睡、大量流失
2.用户分群:电脑达人、数码潮人、家庭用户、有房一族、网购达人、单身贵族、时尚男女、奶爸奶妈、
拼购用户、超级用户。(参照用户去购买的品类情况,比如说一级品类、二级品类)
1-3用户画像用途
用户画像的作用:
1.分类统计:12星座对雾霾天气的防范指数;奶爸当家指数;
访客画像(男女比例;新老用户比;年龄分布;学历分布)
2.营销帮我推荐:邮件营销;短信营销;push信息。
例确认你有小孩的话,推荐一下一些母婴产品
3.数据挖掘:据用户的数据挖掘出一些用处不大的信息以支持决策。
利用关联规则计算:比较喜欢红酒的人常见喜欢什么品牌?利用聚类算法讲:喜欢红酒的人,年龄段分布情况。
数据挖掘
1.属性再次筛选:属性筛选后、基于组件信息增益的属性打分、属性重要性打分、主成分分析、实现卡方检验的属性再次筛选;
2.具体分类分析预测:决策树、神经网络分类、贝叶斯网络、归类重临树、支持向量机分类、逻辑回归、朴素贝叶斯、分类组合模型;
3.回归预测:20块多项式回归、神经网络回归、广义线性回归、支持向量机轮回、回归两种模型;
4.聚类分析:K均值聚类、基于条件K均值的层次聚类、分布肯定聚类、两阶段聚类;
5.关联分析:购物篮分析、属性关联分析、序列模式分析;
6.时间序列:ARX时间序列
比较喜欢什么东西的人往往很喜欢什么?
做了这个事的人接下来好象会干什么?
最比较经典例子:啤酒与尿布的关系。
私域操盘咨询
申请免费使用
在线咨询