1 Star 11 Fork 1

shuan / 基于电商用户行为,商品,店铺分析

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
BSD-3-Clause

基于电商用户行为、商品、店铺分析

介绍

伴随着电商⾏业在过去⼏年的快速发展,早些年的粗放式经营,依靠价格战、疯狂广告铺展推广,凭着“烧钱”不断融资,就可以在众多平台中存活下来。 不过随着行业的发展、内部\外部局势的挤压,互联网行业无疑已经进入了“红海”时代,依靠早期的粗放式经营,耗费巨量资金成本来取得用户占比,已然不太可行。

对于目前国内用户,已经逐步被各大平台所“瓜分”,同时想方设法提高用户留存率的情况下,对于用户的精细化运营、提高用户对平台的认同,就显得格外重要。随着平台数据量的不断积累,通过数据分析挖掘消费者的潜在需求,消费偏好成为平台运营过程中的重要环节。

本项⽬是针对某电商平台⽤户⾏为数据,使用python语言,探索用户行为规律,寻找高价值用户;分析商品特征,寻找高贡献商品;分析产品功能,优化产品路径。

使用工具

python、Excel2019、jupyter notebook

指标体系搭建

使用“人、货、场”拆解方法,分别评价“用户、商品、平台”的质量

⽤户是整个运营的核心。想要从用户身上实现商业价值,首先必须为用户提供某种服务---只有服务好用户,用户才会舍得为你的产品或者服务买单,服务好用户是前提, 良好的公司经营就一定要提升用户体验,为用户创造价值,通过发展用户、提升活跃用户规模、提升客单价,通过广告、会员等各种商业化形式来获得商业利润。 所有举动都围绕着,如何让更多的人有购买行为。目前平台上的主力消费人群有哪些特征,他们对货品有哪些需求,他们活跃在哪些维度,还有哪些有消费力的人目前不在平台上,而这些就是平台始终不断探索解决的问题。

商品是整个平台的竞争力。商品的分层、用户界面内含的推荐算法,哪些是商品的红海?哪些是商品的蓝海?新商品的冷启动,如何进行动态调整?等等,都是尽可能满足用户内在的购买需求,提高用户体验,引导用户消费。

场对应整个平台的营销,无论是线下平台的设计、用户的引流、广告的投放,还是线上大品牌各大平台的互通,新型的“互联网+”模式,打通全域,都是为了与用户进行更多的互动,更多的进行各方面的内容营销,增强用户对品牌的“忠诚度”,增强对外的影响力,来最终实现品牌的良性发展和商业变现。

确认问题需求

  1. 基于漏⽃模型的⽤户购买流程各环节分析指标,确定各个环节的转换率,便于找到需要改进的环节;
  2. 商品分析:找出热销商品,研究热销商品特点;
  3. 基于RFM模型找出核心付费⽤户群,对这部分⽤户进⾏精准营销。

针对用户近期购买行为,利用RFM模型对用户质量进行聚类分析,生成相应的用户标签。

R:Recency——客户最近一次交易时间的间隔,R值表示客户交易发生的日期。
F:Frequency——客户在最近一段时间内交易的次数。F值表示客户交易越频繁。
M:Monetray——客户在最近一段时间内交易的金额。M值表示客户价值。

RFM模型,优势在于利用时间、频次、价值关系,进行区分轻重用户的方法,在用户标签模型中使用范围相对较广,可解释性强,适用于大多数业务情况。 但RFM模型对于某些商品交易情况下,需要事先进行分类聚类分析,(例如:大宗商品与日用品类因为购买性质存在极大差别,需要事先进行分类)

原始数据结构

taobao_1.csv,327Mb,约600万条数据

用户名 用户唯一id
商品名 商品唯一编号
行为 ⽤户行为类型(1-曝光;2-购买;3-加⼊购物⻋;4-购买下单)
物品类名 品类id
日期 用户行为日期
时间 用户行为时间

输入图片说明

数据分析

1、搭建用户指标体系

1.1、基础指标
指标 说明
uv 独立访客,统计1天内访问的用户数,统计distinct user_id 的数量,需要按日统计(分组)
pv (Page View)访问量, 页面浏览量,统计behavior_type=1的记录数,需要按日统计(分组)
浏览深度 pv/uv
留存率 按日统计,用户次日、二日……返回访问的数量,占当日访问用户数的比例

输入图片说明 输入图片说明 输入图片说明 UV异常分析:每⽇UV数据中,明显异常点为双⼗⼆活动造成,该影响为已知影响。 对于UV周环⽐的分析:⽇常周环⽐数据⼤多⼤于0,说明⽤户程⼀定上升趋势,其中如11⽉26⽇、12⽉2⽇、12⽉7⽇等的数据为下降数据,需要结合其他数据做进⼀步的下降原因分析。双⼗⼆活动后⽤户周环⽐会相应下降,为正常原因。

猜测可能的问题有: 内部问题:产品BUG(⽹站bug)、策略问题(活动结束了)、营销问题等; 外部问题:竞品活动问题(其他平台⼤酬宾),政治环境问题(进出⼝商品限制),舆情⼝碑问题(平台商品爆出质量问题)等;

1.2、RFM模型分析
RFM模型 示意
R 最近一次消费 (Recency)
F 消费频率 (Frequency)
M 消费金额 (Monetary)

输入图片说明

通过RFM模型中的⽤户最近⼀次购买时间、⽤户消费频次分析,分拆得到以下重要⽤户。

可以在后续精细化运营场景中直接使⽤细分⽤户,做差异化运营: 对⾼价值客户做VIP服务设计,增加⽤户粘性同时通过设计优惠券提升客户消费; 对深耕客户做⼴告、推送刺激,提升消费频次; 对挽留客户做优惠券、签到送礼策略,增加挽留⽤户粘性; 对唤回客户做定向⼴告、短信召回策略,尝试召回⽤户

2、搭建商品指标体系

2.1、商品指标

点击量、收藏量、加购量、购买次数、购买转化

输入图片说明

热销商品品类如下所示。 其中’5027‘、’5399‘品类购买转化率较其余商品品类偏低,需要结合更多数据做进⼀步解读。(可能的原因:品类⾃有特性导致⽤户购买较低,⽐如大件商品、⾮必需品、奢侈品等等。)

2.2、对应品类指标

点击量、收藏量、加购量、购买次数、购买转化

输入图片说明

3、搭建平台指标体系

3.1 行为指标

点击次数、收藏次数、加购物⻋次数、购买次数、购买转化

3.2 行为路径分析

特技

  1. 使用 Readme_XXX.md 来支持不同的语言,例如 Readme_en.md, Readme_zh.md
  2. Gitee 官方博客 blog.gitee.com
  3. 你可以 https://gitee.com/explore 这个地址来了解 Gitee 上的优秀开源项目
  4. GVP 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目
  5. Gitee 官方提供的使用手册 https://gitee.com/help
  6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 https://gitee.com/gitee-stars/
BSD 3-Clause License Copyright (c) 2021, shuan All rights reserved. Redistribution and use in source and binary forms, with or without modification, are permitted provided that the following conditions are met: * Redistributions of source code must retain the above copyright notice, this list of conditions and the following disclaimer. * Redistributions in binary form must reproduce the above copyright notice, this list of conditions and the following disclaimer in the documentation and/or other materials provided with the distribution. * Neither the name of the copyright holder nor the names of its contributors may be used to endorse or promote products derived from this software without specific prior written permission. THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.

简介

基于电商用户行为、商品、店铺分析 展开 收起
Python
BSD-3-Clause
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Python
1
https://gitee.com/shuan0712/taobao_2020.git
git@gitee.com:shuan0712/taobao_2020.git
shuan0712
taobao_2020
基于电商用户行为,商品,店铺分析
master

搜索帮助