通过item2vec方法推荐歌曲的效果为啥很差? - 知乎

题主最近拿spotify的歌单数据做了一个召回实验。

前提假设一个歌单内部的歌曲是有相似性的,通过基于skipgram的item2vec方法,窗口大小设置2,每个正样本全局随机选4首歌曲做负样本,生成每首歌曲的embedding后,把验证集里用作训练的歌曲做average生成歌单的embedding,然后全局搜索最相似的K首歌作为召回结果,但悲催的是,召回率竟然是0 ?!

虽然这个方法比较naive,但歌单总数100w,歌曲总数200w,训练样本总共10亿+,按说这个数据量学出来的emb是比较可靠的,为什么这么做没有一点效果呢


Original url: Access
Created at: 2019-04-12 15:07:46
Category: default
Tags: none

请先后发表评论
  • 最新评论
  • 总共0条评论