关键词:
微博
内容
可信度评估
深度学习
数据类型
摘要:
微博的快速发展使得信息的传播更加快速和便捷,但是虚假信息的传播可能会对广大网民产生负面影响,造成平台管理困难,社会动荡,严重情况下甚至会对国家的发展造成冲击,因此对微博中的内容进行可信度评估具有重要意义。在充满数据的时代,深度学习技术中的循环神经网络、卷积神经网络等模型具有出色的数据挖掘能力,通过对已有数据进行特征挖掘,预测新数据的可信情况,但是微博中蕴含大量不同类型的数据,在特征挖掘时还存在一系列问题。
本文提出的模型按照微博的内容数据、用户数据和传播数据展开,依据各种数据类型存在的问题进行研究,提出了三种基于深度学习的微博内容可信度评估模型,解决对应问题的同时提高了模型在准确率、F1值等评价指标上的评估能力,本文的主要贡献如下:
1.提出基于协同关键点的微博内容可信度评估模型,解决基于内容数据的可信度评估模型在特征选取时存在的不确定性问题。该模型从词语级到句子级分级获取微博文本的关键点,根据关键点的语义进行可信度评估。此外,在词语级编码时协同构建的谣言词库加强相关词语的语义,模型解决了特征挖掘时的特征选取问题,在此基础上提高了内容可信度评估的性能。
2.提出基于情感极性影响力的微博内容可信度评估模型,解决了当在基于内容数据的方法中引入用户数据时容易忽略语义特征和用户特征的空间差异问题。情感极性影响力可以通过微博内容中的语义特征和评论内容中的情感特征解析评论中的情感极性与微博内容的相关程度,获取源文本的可信情况。模型利用双向-局部信息处理方法,提取微博内容语义特征;利用双向长短期记忆网络挖掘评论情感特征;利用注意力机制捕获评论中不同情感极性对于微博内容的影响程度,将得到情感极性影响力用于微博内容可信度评估。将用户特征和语义特征使用合适的方法调整至同一维度,并提高了评估性能。
3.提出基于加强路径的微博内容可信度评估模型,解决了当在基于内容数据和用户数据的方法中引入传播数据时容易忽略语义特征、用户特征和传播结构三者之间的内在联系的问题。该模型将微博文本进行句法和语义分析处理,模型中的输入是一个以微博源文本为根节点的传播树,每个子节点都对应一条评论文本,通过传播树双向结构的递归特征学习过程获取微博文本的内容语义、用户立场和传播结构之间的响应关系,进行更细化的内容可信度评估。