农业古籍断句标点研究
目 录
Abstract 2
Key words 3
第1章 引言 3
1.1 选题背景和意义 3
1.1.1 选题背景 3
1.1.2 选题意义 3
1.2 古籍断句标点的概念和意义 3
1.2.1 古籍自动断句标点的意义 3
第2章 农业古籍断句标点研究与进展 4
2.1 断句标点概述 4
2.1.1 句读 4
2.1.2 标点 4
2.1.3 句读与标点的异同 4
2.2 古籍断句标点研究进展 5
第3章 农业古籍断句标点研究过程 5
3.1 构建断句标点模式库 5
3.1.1 古籍断句标点规律 5
3.2 断句标点模式 5
3.2.1 句法特征断句标点 6
3.2.2 重复字、词断句标点 7
3.2.3 利用时序断句标点 7
3.2.4 数词量词识别法 8
3.2.5 利用“之”断句标点 9
3.2.6 行文格式断句标点 9
3.2.7 禁用断句标点识别法 9
3.3 断句标点规则库 10
第4章 古籍自动断句标点设计、效果评价及结论 11
4.1 古籍自动断句标点设计流程 11
4.2 断句标点效果评价与结论 11
4.2.1 断句标点效果统计 11
4.2.2 结论及展望 11
致谢 12
参考文献 *景先生毕设|www.jxszl.com +Q: @351916072@
12
农业古籍断句标点探究
信息管理与信息系统专业学生 林彬
指导教师 白振田
Sentence Segmentation and Punctuation for Ancient Books on Agriculture
Student majoring in Information Management and Information System Lin Bin
Tutor Bai Zhentian
Abstract: As great intellectual achievements created by ancient Chinese, the collation of ancient books on agriculture will help us to better inherit and study Chinese culture heritage. Sentence segmentation and punctuation are the basis for study of ancient books, however, the traditional approach using artificial identity, which is timeconsuming. This article probes into the issue of segmentation and punctuation for ancient books on agriculture, and summarizes certain pattern for it. It generalize the laws of sentence segmentation and punctuation of the old Chinese language of agriculture books by observing the ancient agriculture books and reference to the relative articles. Then the laws of old Chinese language are used to set up knowledge base.Last the terms in the knowledge base will be translated into regular expression, which could be recognized by computer, and use the Chinese information processing program TextPro to process the ancient books.In experiments, the methods of this punctuation models shows the feasible and potential.
Key words: Chinese information processing; ancient books; sentence segmentation; punctuation; pattern match
第1章 引言
1.1选题背景和意义
1.1.1 选题背景
从先秦散文、楚辞汉赋到魏晋文学、唐宋文学再到元曲、明清文学直至今日的现代文学。这些文学的价值不仅在于它们所传承的信息,也在于文学本身的艺术性。自1946年2月15日世界第一台通用电子数字计算机ENIAC宣告研制成功,人类的计算机技术发展历程在这一新的起点上,开始了长达近一个世纪的高速发展,直至今日全方位渗透我们生活的发展现状。计算机技术之所以能如此快速和侵略性的渗透社会的方方面面,是因为计算机技术具有明显的综合特性,它所运用的技术和手段与现代电子工程、应用物理、机械工程、现代通信技术、生物科学和数学等紧密结合,计算机技术已成为人类社会发展不可或缺的重要载体。中国传统文学作为华夏祖先的历史遗产,如何将计算机技术运用于我们中国传统文学整理当中是很具有研究意义和探索实践意义的!
1.1.2 选题意义
原文链接:http://www.jxszl.com/jsj/jsjkxyjs/42305.html