"景先生毕设|www.jxszl.com

菊花知识体系构建中的实体抽取【字数:15406】

2024-11-03 10:55编辑: www.jxszl.com景先生毕设

目录
摘要 III
引言
一、研究背景 1
(一)英文实体抽取研究 1
(二)基于特定领域的有监督中文实体抽取研究 1
(三)基于无监督学习的实体抽取研究 2
(四)知识体系可视化与知识服务平台 2
二、菊花知识体系语料简介及实体界定 2
三、算法与神经网络架构 3
(一)整体架构 3
(二)模型简介 3
(三)实体识别模型流行趋势与效用 4
(四)神经网络模型架构 4
1.梯度下降模型架构与创新 4
2.激活函数模型架构与创新 6
四、基于无监督学习的预实验与体系框架初步搭建 8
(一)无监督模型预实验 8
(二)评价指标 8
(三)无监督训练模型——Bert与CNN—Bilstm—CRF优势阐释与对比 9
(四)无监督模型中的向量可视化 9
(五)无监督学习中实体与文本长度的关系 10
(六)无监督学习中实体与研究领域的关系 11
五、基于监督学习的实验及分析 12
(一)语料处理 12
1.文本来源 12
2.统一数字 12
3.文本标引 12
4.文本预处理 13
(二)实验环境 13
(三)参数设置 14
(四)实验结果分析 14
1.粗标引下的回归分析 14
2.细粒度标引下的回归分析 16
六、知识体系构建与知识服务平台 19 (一)搭建核心词网 19
1.基于Thesaurus Builder的核心词网存储 19
2.基于Xmind的树状知识体系可视化 19
3.基于pajek的知识体系网络化 20
(二)搭建自动抽取平台 20
七、研究总结 21
致谢 22
参考文献: 23
附录 25
图21标注文本 2
图31研究流程图 3 *51今日免费论文网|www.51jrft.com +Q: @351916072

图32 BGD模型下步长与损失的关系 5
图33 SGD中迭代次数与损失的关系 6
图34 Y—Softplus对比 7
图35激活函数模型损失对比 7
图36 MSE评价方式下模型效果对比 8
图41无监督预训练中Bert与CNN—Bilstm—CRF对比 9
图42无监督向量二维可视化 10
图43文本长度与回归效果关系 10
图44标准测试集下的回归精确度1 11
图45多领域文本回归效果比对 11
图46标准测试集下的回归精确度2 12
图51 CNN—Bilstm—CRF部分代码 14
图52 CNN、CRF、CNN—Bilstm—CRF回归效果分析 15
图53 CRF 与 Bilitm回归效果分析 15
图54模型运算时间 16
图55五类标签回归结果 16
图56脱离语境的二维向量可视化 18
图57蕴含语境的二维向量可视化 18
图61知识体系存储 19
图62知识体系可视化 19
图63知识网络 20
图64自动抽取平台 21
图65自动抽取平台部分代码 21
表51细粒度标引数据统计 13
表52粗标引数据统计 13
表53硬件参数 14
表54二级细粒度标签 17
菊花知识体系构建中的实体抽取
摘要
在当下的研究中,中文的知识体系构建具有很大的空白,由实体抽取到知识体系构建再到面向用户的知识服务平台架构研究具有重大意义,本研究旨在针对上述研究意义提出一套完整的研究方法。以菊花这一研究领域为例,利用实体抽取、知识体系可视化、知识服务平台构架等技术构建了菊花实体抽取方法与菊花知识体系。在实体抽取研究中使用无监督学习抽取的实体搭建了知识体系框架,并且使用向量投影技术阐释了实体在空间中分布的本质特征,采用卷积神经网络模型、循环神经网络模型、条件随机场模型等多种方法进行正式的实体抽取,在研究中提取了数以万计的实体。在知识体系研究中,本文为研究者开发了知识体系的存储方法和可视化方法,采用存储数据库、知识树、知识网络等手段对实体进行处理,无论研究者的需求是知识体系的存储还是知识体系的可视化都可以得到满足。对于用户来说,本研究开发了高效的可视化操作界面,满足用户的知识服务需求,这为知识图谱构建以及知识问答库的构架开辟了新的未来。
ABSTRACT
In the current research, the construction of the Chinese knowledge system has a large gap, from the entity extraction to the knowledge system construction to the useroriented knowledge service platform architecture research is of great significance, this study aims to propose a complete set of the above research significance Research methods. Taking the research field of chrysanthemum as an example, chrysanthemum entity extraction method and chrysanthemum knowledge system are constructed using technologies such as entity extraction, knowledge system visualization, and knowledge service platform architecture. In the entity extraction research, the entities extracted by unsupervised learning are used to build a knowledge system framework, and the vector projection technology is used to explain the essential characteristics of the entities distributed in the space. Various methods have been used to formally extract entities, and tens of thousands of entities have been extracted in the study. In the study of knowledge systems, this paper develops storage methods and visualization methods of knowledge systems for researchers, using storage databases, knowledge trees, knowledge networks and other means to process entities, regardless of whether the needs of researchers are knowledge system storage or knowledge systems The visualization can be satisfied. For users, this research has developed an efficient visual interface to meet the needs of users knowledge services, which has opened up a new future for the construction of knowledge graphs and the structure of knowledge question and answer libraries.

原文链接:http://www.jxszl.com/jsj/xxaq/607030.html