电商大数据数据推荐算法分析

某电商网站大数据大赛的任务是根据用户4个月在电商网站的行为日志,建立用户的品牌喜好。 评估的指标 准确率: 当然预测的品牌的准确率越高越好 召回率: 检测给用户推荐的商品的实际购买率 算法 协同过滤推荐Collaborative filtering:分析用户兴趣,在用户群中找到指定的用户的相似用户,综合这些相似的用户对某一信息的评价,形成系统对该指定用户对于此信息的喜好预测。 item-based CF : 基于物品的协同过滤,通过用户对于不用物品的评分来评测物品之间的相似性,基于物品之间的相似性做出推荐。 user-based CF : 基于用户的协同过滤,通过不同用户对物品的评分来评测用户之间的相似性,基于用户之间的相似性做出推荐。 数据挖掘算法:主要是在现有数据上进行基于各种算法的计算,从而起到预测的效果,从而实现一些高级别的数据分析的需求。 K-means 逻辑回归 随机森林 统计学习SVM 分类Native Bayes 这里主要是要注意文件与Map的相互转换,为了方便推荐商品,一般把数据表设计为键值对是最好的,所以如果源文件为CSV或者普通的SQL语句,最好是放到一个非关系数据库中(比如Redis之类)的对于key-value支持性非常好的数据库中,当然也可以在代码中直接应用Map映射。 其实感觉在实际操作中比较简单的模型就是用户在浏览一件商品之后,会推荐同类的商品,而且可以通过分析用户的购物车中的商品,来得到一些近似推荐,还有实时推荐可以根据用户最近的cookie的商品信息来推荐。 当用户购买了一件商品之后,隔一个月可以再推荐同类商品(购买即推荐模型),但是这种模型还是有着它自身的很多弊端,比如用户会因为看到更好更便宜的商品而降低用户体验,当然如果对于一些常买类的商品比如衣服,装饰物,礼物等这个模型无疑是很简单有效的。 对于购买即推荐的弊端还可以使用其它算法来弥补。比如前三个月购买,后一个月只有点击。 即是前三个月购买的商品,后一个月还点击查看的用户购买商品的可能性就比较大了,这样可以更加精确的推荐到用户所想购买的东西。 对于点击多次的商品即推荐,设置一个阀值,当用户对这样商品的操作达到了初定的阀值时便推荐,用户购买的几率就会增大。 基于时间权重模型,因为推荐算法的种类太多,交集太多,所以我们需要对于已定的推荐也有一个排序,所以我们使用时间权重来对于用户最近的点击,购买,收藏,购物车行为进行权重计算,比如初定各个操作的去啊是那种,如点击0.5,购买2,等通过公式 delta∗(days/dayGranularity+1)∗dayWeightdeltadaysdayGranularity1dayWeight ,其中delta表示4种行为初始的权重,days表示该行为发生的日期离当前时间的跨度,dayGranularity表示时间粒度,即每隔多少天之后,权重会提高,dayWeight表示每隔dayGranularity 天后权重提升的比例。 ...

December 26, 2016 · 1 min · 赖杰

Ubuntu16.04ionic(jdksdkgradle)环境搭建完全攻略

在Ubuntu16.04当中搭建一个ionic环境还是按照官方教程的来,主要问题是首先要把JDK,SDK搭好,环境变量配好。本文中给的包的下载请不要直接用浏览器下载,很慢,尽量用wget 下载,重要的事说一遍! JDK 下载地址:jdk下载 访问到官网,就可以下载下来一个包文件了,对应着Ubuntu16.04就下载Linux ×64对应的tar.gz包 下载完成之后按以下命令 $ tar -zxvf jdk-8u101-linux-x64.tar.gz #得到jdk1.8.0_101文件夹 $ cd /usr/lib $ sudo mkdir jvm #一般把jdk对应的文件放在/usr/lib/jvm下 $ cd - #回到解包的文件对应的文件夹 $ mv jdk1.8.0_101 /usr/lib/jvm/ 接下来配置环境变量 如果你没有安装zsh之类的终端插件,那么直接vim ~/.bashrc ,加入下面的三行,然后保存重新开一个终端即可(当然也可以修改/etc/profile,然后source) export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_101 #最后这一项要对应你放到jvm下的包的文件名 export PATH=$JAVA_HOME/bin:$PATH export CLASSPATH=.:$JAVA_HOME/lib/dt,jar:$JAVA_HOME/lib/tools.jar 如果安装了zsh,也是同理,vim ~/.zshrc 最后加入上面三行即可 通过java -version验证 SDK 下载地址:sdk下载 这里需要注意的是:你可以选择直接下载Android-Studio,因为Android-Studio中如果你没有安装SDK,那么会帮你下载相关的tool,包之类的,但是速度比较慢,所以推荐先配置SDK。 下载sdk包之后,得到一个android-sdk-linux.tar.gz,然后执行以下命令 $ tar -zxvf android-sdk-linux.tar.gz #得到android-sdk-linux文件夹 $ mv android-sdk-linux /usr/local #把这个文件夹移动到/usr/local下 然后配置环境变量 同上vim ~/....

July 23, 2016 · 1 min · 赖杰

ubuntu 16.04 LAMP环境手动配置以及问题解析

笔者因为前几天ubuntu15.10遇到的显卡驱动导致的循环登录问题烦恼了很久,最后试遍了网上所有方法也是没有解决,遂升级到16.04,本文则主要讨论一下在16.04中配置lamp环境以及可能会遇到的一些问题。(lnmp基本相同) PHP # sudo apt install php7.0 # php -v # PHP 7.0.4-7ubuntu2.1 (cli) ( NTS ) Copyright (c) 1997-2016 The PHP Group Zend Engine v3.0.0, Copyright (c) 1998-2016 Zend Technologies with Zend OPcache v7.0.6-dev, Copyright (c) 1999-2016, by Zend Technologies 看到以上php 信息则表示php7已经安装成功,我们可以借此安装一些extensions curl,mycrypt,sqlite3等 Apache2 # sudo apt install apache2 # apache2 -v Server version: Apache/2.4.18 (Ubuntu) Server built: 2016-04-15T18:00:57 看到以上信息则表示Apache2已经安装成功,这时在地址栏中输入localhost则会跳出相应的Apache信息 当然这时候我们如果打开一个php脚本如phpinfo() ,是不能解析的,这时候我们还需要安装一个模块来让apache2能够顺利解析php代码 # sudo apt install libapache2-mod-php7.0 再次访问包含phpinfo()的文件则可以显示出php的信息...

May 28, 2016 · 1 min · 赖杰

ubuntu各种界面美化大型攻略

序 说实话,如果你刚从windows转到ubuntu,无疑会觉得挺丑的,无论是侧边栏的不习惯,还是现在版本中ubuntu自带的unity桌面(个人感觉还没gnome好看…),还有红红的主题。真的给人一种低逼格低实用的感觉,为毛线Windows10就各种好看,无论是默认窗口的黑灰优雅颜色还是开始项的整洁布局,还是自定义的主题颜色,各种好看好吗,甚至开机都挺好看的,整体蓝色,圆形登陆图标。 获得HIGH BIGGER GRUB 首先我们打开电脑,会进入grub界面,如果不修改grub的背景图片,就用原生的红红的图片,你还会有进ubuntu的冲动吗?太难看! 那么首先修改GRUB的背景 首先找到一张你喜欢的图片,最好是和你的屏幕分辨率一致的 然后把图片的名字修改成background.*(图片的后缀名),然后打开terminal输入 sudo mv background.* /boot/grub/ 接下来用继续输入* sudo gedit /etc/default/grub *,这时gedit会打开这个grub配置文件,找到#GRUB_GFXMODE这个参数,并且把#去掉,在等号后输入你屏幕的分辨率,例:GRUB_GFXMODE = 1920×1080 然后sudo update-grub,最后reboot一下,就行了,是不是感觉整个人都爽了 桌面 进入桌面之后我们可能会觉得侧栏特别不爽,虽然这是一个很合理的分布,但是还是想自己看着好看,那么我们肯定会想到mac上面的桌面分布,把那些快捷图标放到桌面下,而且加上一些动画效果就好了,那么怎么做呢? cairo-dock 说到桌面插件,我们肯定要想到cairo-dock这个神器了 那么cairo-dock可以自定义很多的主题,也可以自定义很多的图标动画效果 那么说一下可能遇到的问题 1.需要开机自启,如果不设置为开机项,那么每次开机后还要重新启动cairo-dock非常的麻烦,所以要手动把它设为开机项,具体怎么弄请自行google。 2.启动器的设置问题,有一些软件你如果直接设置为一个启动器是没有问题的,但是有一些却不行,对于这些不能自动设置为启动器的软件,只能自己去找到路径然后把它设置为快捷方式。 主题字体图标光标 在我们设置完毕桌面之后是不是感觉瞬间清爽了不少,但是还不够,你还是不能对于ubuntu自带的三个不愠不火的主题满意,也不能对ubuntu默认的图标满意,甚至我们更希望光标是一个奇形怪状的样子来配合我们美好的壁纸。 Ubuntu Tweak 这是一个专业的设置各种东西的软件,包括主题光标字体等等 通过这个可以设置主题光标图标,那么那些主题包在网上都可以搜到,并且都有详细的操作步骤,这里就不多赘述了。 终端 作为我们经常要用到的终端当然也要漂亮,这个很简单,只需要自己在首选项设置里面设置就行了,可以设置透明度,颜色背景颜色,甚至自己放一张图片上去,简单轻松且惬意。 浏览器 终于我们把开机桌面主题等等都设置得满意了,我们发现好像ubuntu更加可爱,那么我们日常经常用到的还有浏览器辣! 火狐谷歌神器级插件stylish 这款插件可以根据你访问的特定的一些页面改变其css等,让你的界面更加的好看,比如google就可以设置上很多很赞的背景 get rid of 那些呆板的白色就从这个插件开始。 the end...

March 13, 2016 · 1 min · 赖杰