- 现有的方法在表示目标(target)和方面(aspect)时往往会脱离上下文。这种随机初始化或不依赖于上下文的表示方法有三个弊端:1)同一个目标或方面的向量表示在表达不同情感极性的句子中没有得到区分;2)目标不是确定实体时(例如“这个酒店”,“这个餐馆”,“那部电影”等),输入信息无法体现实体本身的价值;3)忽略了目标和方面之间的相互联系。
- 目标和方面在上下文中存在重叠的关联映射关系。在一句话中,一个目标可能会对应多个方面,而不同的方面可能会包含不同的情感极性。另一方面,在同一句话中往往会存在多个目标,所以目标和方面之间会存在错综复杂的对应关系。如图1:
为了使目标表示从上下文中自动生成,所以我们将提取上下文中和目标有高度关联的重要词语来优化目标向量表示:
其中$\lambda u^{'}_i$用来控制稀疏系数矩阵稀疏度。
在方面向量表示优化中,因为方面本身的词语也具有一定的价值,例如方面“Price”,单从词语本身,我们可以知道该方面涉及“价格”相关信息,所以我们保留了方面的原始向量信息。通过将方面本身的词语和稀疏系数矩阵提取到的上下文信息结合可以得到优化后的方面向量表示:
其中 α 用来控制上下文信息对优化向量的影响程度。
因为同一个句子中存在多个目标,而不同的目标又关联多个不同的方面,如何区分不同目标-方面之间的相互联系呢?为了解决该问题,对于每一个优化方面向量,我们不仅考虑它和对应目标之间的距离,同时也关注它和那些无关目标之间的距离,所以我们将目标函数分为了两部分:
通过目标函数的两部分作用,可以使优化后的方面向量尽可能靠近与它相关联的目标,并远离与它无关的目标,从而使输入句子针对不同方面的情感信息得到有效区分。
从表中结果可以看出,本文提出的优化目标和方面向量表示的方法在目标识别和情感分类任务中都取得了更好的表现,这说明了上下文相关的目标和方面表示能提升模型在细粒度情感分析任务中的效果。同时我们可以发现本文提出的目标-方面向量表示可以适用于大部分基于深度学习的目标-方面文本情感分类模型。
可视化部分,本文使用了 t-SNE 对模型学习到的方面向量表示中间结果进行可视化对比实验。从图 3 结果可以看出,本文提出的方法能使不同方面在训练过程中得到更好的区分,有效提升了方面向量表示的质量。
本文提出了一种作用在细粒度情感分析的上下文感知目标和方面向量优化方法。实验结果表明,该向量优化方法可以直接和现有的基于神经网络的目标-方面级别情感分析模型相结合,并取得更好的效果。未来,我们尝试将向量优化方法应用到其他自然语言处理任务中,并进一步改善方法的有效性和通用性。
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。 链接: https://mp.weixin.qq.com/s/VX6SvQsWFi34QouhkPsoHA