基于word2vec和lstm的综述文献识别研究【字数:10450】
目录
摘 要 I
关键词. I
ABSTRACT II
KEY WORDS: II
引言.. 1
一、 相关研究 1
(一) 文本分类研究现状 1
(二) 循环神经网络模型研究现状 2
二、 数据与研究方法 3
(一) 实验数据 3
(二) 研究方法 3
1. Word2vec简介 3
2. LSTM模型 4
3. 评价指标选取 6
三、 实证研究结果分析 6
(一) 基于LSTM的综述文献识别 6
1. 基于文献标题的LSTM模型 8
2. 基于文献摘要的LSTM模型 9
3. 基于文献标题和摘要的LSTM模型 10
(二) 模型训练结果 11
四、 基于LSTM的综述文献识别 13
(一) 预测分析 13
(二) 结论与展望 15
致谢..16
参考文献 17
附录:LSTM模型训练Python代码 20
图21 Word2vec模型 4
图22 LSTM模型结构 5
图31 Word2vec预训练结果 7
图32系统结构 7
图33模型一损失函数与准确率变化 9
图34模型二损失函数与准确率变化 10
图35模型三损失函数与准确率变化 11
图36模型性能对比 12
表 21 实验数据 3
表 22 混淆矩阵表 6
表 31标注索引映射表 8
表 41 预测结果 13
基于Word2vec和LSTM的综述文献识别研究
摘 要
为研究综述文献在各个领域的作用,将综述文献从大量文献中识别出来是首先需要解决的问题。本文使用WOS数据库的文献数据,利用深度学习算法,使用Word2vec和LSTM模型构建综述文献识别系统,通过构建包含输入层、embedding层、L *51今日免费论文网|www.51jrft.com +Q: ^351916072^
STM层和输出层综述文献识别系统的对文献的标题和摘要字段进行模型训练。本文对基于标题字段模型,基于摘要字段模型,基于标题与摘要字段模型三模型进行训练,通过对三个模型的整体准确率,精准率,召回率,F值多个指标进行性能分析,并使用所训练模型对文献进行实证预测,本文所构建的三个模型均有良好表现,其中,同时使用标题和摘要字段构建的模型性能更佳。实验表明,基于Word2vec和LSTM模型的综述文献识别系统在各指标上均表现出最佳的性能,具备可行性和实用性,其中将文献标题和文献摘要字段的模型体现出最佳性能;在文献综述识别任务上,长文本比短文本为识别提供了更多的文献类型特征。因此,基于Word2vec和LSTM模型的综述文献识别能够为研究综述文献在各领域的作用提供可靠数据。
引言
预测分析
为了更深层次的分析模型性能,本文使用已训练的模型一、模型二和模型三对具体文献的摘要字段和标题字段进行预测分析。选取两篇综述文献的标题字段和摘要字段分别输入(文献摘要①与文献标题①属于同一篇文献,文献②同),通过调取在模型训练过程中构建的词汇索引映射表,将输入的文本转化为向量,将此作为序列输入至对应模型,模型将对输入文本进行预测,得出的预测结果经过已构建的标注索引映射表转换成文本的文献类型输出。识别结果如表41所示。
表 41 预测结果
Figure 41 Forecast
文本类型
文本
使用模型
结果
文献标题①
Antitumor polysaccharides from mushrooms: a review on the structural characteristics, antitumor mechanisms and immunomodulating activities.
模型一
Review
文献摘要①
Mushrooms are popular folk medicines that have attracted considerable attention because of their efficient antitumor activities. This review covers existing research achievements on the mechanisms of isolated mushroom polysaccharides, particularly (1 > 3)betaDglucans. Our review also describes the function in modulating the immune system and potential tumorinhibitory effects of polysaccharides. The antitumor mechanisms of mushroom polysaccharides are mediated by stimulated T cells or other immune cells. These polysaccharides are able to trigger various cellular responses, such as the expression of cytokines and nitric oxide. Most polysaccharides could bind other conjugate molecules, such as polypeptides and proteins, whose conjugation always possess strong antitumor activities. The purpose of this review is to summarize available information, and to reflect the present situation of polysaccharide research filed with a view for future direction. (C) 2016 Elsevier Ltd. All rights reserved.
原文链接:http://www.jxszl.com/jsj/xxaq/606963.html