1、协同过滤
协同过滤不使用item的具体信息,因此可适用性很强,在书籍、电影、音乐上都可用;
协同过滤不适用item的具体信息,因此强者愈强;
冷启动问题无法解决
2、基于内容的推荐
使用声音信号推荐
3、用DL预估偏好
把用户和music各表示成vec
4、提升效率
输入:每个audio,切割成3秒的片段;预测:对这些片段求平均
以梅尔声谱作为输入,横轴是频率,纵轴是时间;
仅在时间维度卷积,不在频率维度卷积,这和图像不一样,图像各个维度内涵一样,音频不一样;
通过下采样,获得时间维度的不变形;
最后一个池化层使用了global tmporal 池化,作者认为音频特征有全局性,不像图片是局部的;
5、训练
Loss:MSE,最小化模型输出向量和CF输出向量的差值
trick:通过时间轴偏移,稍微调整声谱,扩展数据
6、变化(优化尝试)
1)More hidden layers
2)ReLU->maxout unit
3)max-pooling->stocastic pooling
4)拉伸或者压缩时域,扩展数据
5)级联别的CF输出的latent vector
7、分析:我们学到了什么
1)低级表征:最大激活
playlist流派不同,最大激活获取了这种特征(音高)
2)低级表征:平均激活
获取一段时间的平均,获得了和声表征
3)高级表征:
对子音乐类型很有表达能力
8、基于相似度的推荐
效果还不错啦
9、用在哪里
1)推荐集合的来源
2)异常过滤
3)冷启动问题
时间: 2024-09-19 09:26:55