rasa theory paper - StarSpace: Embed All The Things!(1) - 文章阅读 原文链接 0. 摘要 我们提出了StarSpace,一种通用的神经嵌入模型(neural embedding model),用来处理各种问题:标签任务,如文本分类;排名任务,如信息抽取/web查询,基于协同过滤的推荐系统,基于内容的推荐,多关系图的嵌入,以及学习词、句子或文档嵌入。在每种情况下,模型都是通过嵌入那些由离散特征组成的实体并相互比较来工作的——学习依赖于任务的相似性。一些任务的实证结果显示,StarSpace对于现存的方法而言有高竞争性,同时也适用于这些方法不适用的情况。
插曲:协同过滤和基于内容推荐有什么区别?
1. Introduction 我们介绍的神经嵌入模型StarSpace,能够用来处理很广泛的任务:
文本分类,或者其他的标记任务,如情感分类。 一系列实体的排名,如,对检索得到的web文档进行排名。 基于协同过滤的推荐,如推荐文档,音乐或视频。 基于内容的推荐,内容可以定义成离散特征,如文档中的词。 学习词,句子或文档嵌入。 StarSpace可以被视为处理这些任务的直接的和有效的强基线。在实验中,它被证明与几种竞争性方法不相上下或优于它们,同时它通常适用于那些许多方法都不适用的情况。
该方法通过从实体集合之间的关系学习具有离散特征表示的实体嵌入,直接用于分类任务或排序任务。一般情况下,StarSpace将不同类型的实体嵌入到一个向量嵌入空间中,因此名字中的Star(*),表示所有类型,space表示空间,在这个空间中对它们进行比较。它学习在给定查询实体、文档或对象的情况下排列一组实体、文档或对象,其中查询不一定与集合中的项属于同一类型。
我们使用6种不同的任务来评估方法的质量,包括文本识别,知识库中的链接预测,文档推荐,文章查找,句子匹配和学习通用的句子嵌入。StarSpace的开源项目见:https://github.com/facebookresearch/Starspace。
2. Related Word 隐藏的文本表示,或者是嵌入(embeddings),是词或文档的向量化表示,通常以非监督的方式从庞大的语料库中学习得到。这个领域中关于神经网络嵌入的工作有:(Bengio et al. 2003),(Collobert et al. 2011),word2vec(Mikolov et al. 2013)和最近的fastText(Bojanowski et al. 2017).在我们的试验中,我们和用于无监督嵌入的可伸缩模型的代表word2vec以及fastText进行了比较,同时还在SentEval(Conneau et al. 2017)任务上进行了句子嵌入的比较。
在监督嵌入的领域中,SSI(Bai et al. 2009)和WSABIE (Weston, Bengio, and Usunier 2011)是早期在NLU或信息提取任务((Weston et al. 2013), (Hermann et al. 2014))中使用的模型。更近一点的工作有:(Tang, Qin, and Liu 2015), (Zhang and LeCun 2015), (Conneau et al.