代码拉取完成,页面将自动刷新
同步操作将从 孙一超/JDD-2017 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
JDD-2017 京东金融大数据竞赛-销量预测-15th解决方案
通过竞赛数据中店铺过往的销售记录,商品信息,商品评价,以及广告费用等信息来建立预测模型,预测店铺未来90天内的销售额。 训练数据包含2017-04-30日之前270天之内若干店铺的每日订单量、销售额、顾客数、评价数、广告费用等数据,下架时间在2017-04-30之后或者未下架的商品数据,以及这些店铺2016年6月-2017年1月每月末后90天内的销售额。
特殊的数据主要包含以下几部分
我们试过非常多的方案,最终选择了使用一个月作为训练区间,该月的前三个月作为特征提取区间
一开始加的特征比较多,因为效果还不错吧,所以也没有根据线上去判断一下哪些特征是否有用,而且这个比赛想构建一个比较稳定的线下验证是非常困难的,因为销量波动还是比较大的,所以更多的时候是以线上来验证我的一些想法。根据特征的重要性来看,跟销售金额有关的特征比较强一些,某些特征重要性非常低但是我也没删除。
因为某些店铺的销量波动实在是太大了,所以除了预测销量的模型之外,我还尝试构建了一个二分类模型,主要来区别销量比较平稳和销量波动很大的商铺,所以最终的模型为:
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。