推荐系统深度学习读书笔记-4

Embedding主要作用是将稀疏向量转换成稠密向量

视频推荐往往使用用户的观看序列进行电影的Embedding化

电商平台会使用用户的购买历史作为训练样本

为什么Embedding技术对于深度学习那么重要？

类别、id类特征使用one-hot编码导致样本向量极其稀疏，深度学习模型不利于稀疏特征向量的处理，因此模型中的embedding层会将高维稀疏特征向量转换成稠密低维向量
embedding向量表达能力更强，包含很多潜在的信息
在LSH等快速最近邻搜索技术应用于推荐系统后，Embedding更适用于海量备选item进行初筛

word2vec的两种模型：

为了减轻训练负担，采用负采样，优化目标从一个多分类问题退化成一个近似二分类问题

加快word2vec训练速度的方法还有层级softmax

相比word2vec利用词序列生成词embedding，item2vec利用的物品序列是由特定用户浏览、购买等行为产生的历史行为记录序列

item2vec与word2vec唯一不同：

局限性：

一种对图结构中的节点进行Embedding编码的方法

最终生成的Embedding向量一般包含图的结构信息及附近节点的局部相似性信息

几种不同的GraphEmbedding：

embedding的加入会拖慢整个神经网络的收敛速度，工程上放弃end2end的训练，用预训练embedding层的方式替代

k维的embedding空间中，物品总数为n，那么遍历计算物品和用户向量相似度的时间复杂度是O（kn）

简历kd-tree进行最近邻搜索是常用的快速最近邻搜索方法，时间复杂度可以降低到O（log2n）

局部敏感哈希基本思想：

让相邻的点落入同一个桶，这样在进行最近邻搜索时，仅需要在一个桶内，或相邻的几个桶内的元素中进行搜索即可。

如果保持每个桶中的元素个数在一个常数附近，就可以把最近邻搜索的时间复杂度降低到常数级别。