本以为鄙人学完Andrew Ng的coursera的课还有UFLDL的教程,已经可以自居一隅了,没想到这次参加比赛着实让我长了见识。
下载完数据,一看,OMG!500多M(原谅我见识少)。刚开始啥也不懂,用Excel打开后删除掉其中两列,保存后就没再多看(后来才发现居然就剩30多m,坑爹的Excel)。然后就用这30多兆的数据进行处理,结果可想而知:
总结一下:
- 不会SQL:导致在前期数据删选的时候碰壁
- Matlab不是很熟悉:在导入数据的时候很吃力
思路
- 首先linear regression预测出在19号会有购买行为的用户userName
- 筛选出用户行为是3的商品itemName(本意是筛选出2,3,4的item,奈何机器内存不够)
- 通过userName和itemName进行协同过滤
也不知道这样的思路是否正确,欢迎评论交流,QQ:379940325
时间: 2024-10-05 05:42:00