图书情报领域大数据相关研究的实证分析【字数:11194】
目录
引言
引言
随着网络技术的快速发展,云计算、物联网等新兴技术不断渗透入人们的生活和工作中,发挥着重要的作用,互联网中的数据更是呈指数增长,现在已经是大数据的时代。大数据作为“信息时代的新石油”,其对社会发展的作用不可谓不大,各行各界国内外学者将“大数据”作为研究的重点,力求开拓出顺应大数据时代发展的新方向。
图书情报学是一门以信息作为主要研究对象的学科,然而,大数据时代是一个“信息爆炸”的时代,半结构化甚至非结构化数据更是几何指数上升,因此,无论是获取数据、保存数据,还是分析和处理数据,亦或是更为具体的信息服务等,从目前来看,图书情报领域都面临着巨大的挑战。研究大数据对于图书情报领域来说有着很大益处,不仅能够了解图书馆发展现状及趋势,使图书馆向更加数字化的方向发展,更能帮助信息分析人员从海量情报中准确高效地提取有用的情报,解决各种问题。本文运用文献计量法、社会网络分析法、和内容分析法中的共词分析,从载文量、作者、研究机构、关键词多个角度,利用知识图谱工具,对2008年到2018年的图书情报领域关于大数据的文献进行统计分析与研究,以期发现我国目前图书情报领域大数据的相关研究热点。
相关研究
大数据概述
维基百科对于大数据有较为清晰的解释:即大数据是海量数据的集合,在一定时间内,用常用的软件工具做不到对它进行有效的收集、存储及管理[1]。大数据具有高速处理、结构多样、海量存储的主要特点,能够用于分析、交换、使用,对于发现新知识,推动社会不断发展,有着 *景先生毕设|www.jxszl.com +Q: @351916072@
无法估量的价值[2]。在“大数据”成为人们所普遍接受的专有名词之前,人们通常将大量的数据称之为“海量数据”。“大数据”首次以较为正式的方式出现在公众面前,是在1997年由国际学术组织IEEE发起的会议上,正是在这场会议上,美国学者Michael Cox描述了可视化领域由于其各种限制所引发的“大数据”问题[3]。杨绎[4]认为,现在我们所熟知的“大数据”的定义应该最接近于在2008年9月发表的,从多学科角度出发,系统地向读者们说明并展示了"大数据"的潜在价值的"big data"专刊。到了2011年,“Dealing with Data”的发表,成为了大数据领域里程碑式的存在,它作为“大数据时代”到来的标志,让“大数据”真正成为各学科的研究热点,正式踏上学术界的舞台[5]。
大数据被大众广泛认可有四个主要特征(4V),即体积、速度、种类和价值[6]。体积(Volume)即大数据的容积,大数据时代网络中存储有海量数据,这也造成情报的良莠不齐,数据量越大,价值密度(Value)就越低,价值的“提纯”成为关键问题,对数据的准确度提出了更高要求;多样性(Variety )意味着数据不仅仅是文本数据,还有许多非结构化或半结构化数据,如图片,音频,视频,多媒体;速度(Velocity)快是大数据时代的最显著特征,为了在海量数据中找到有用数据,快速的处理速度对用户有着巨大作用。
图书情报领域大数据的相关研究
自大数据登上学术舞台以来,国内外有关大数据的研究成果显著,黄永勤[7]通过对Web Of Science中大数据相关文献关键词的研究,分析整理了国外大数据的主要研究点,即“大数据的起源、概念和特点”、“云计算”、“可视化”、“生物信息学”、“Map Reduce 和 Hadoop”,并认为大数据科学、技术、工程及应用将成为未来大数据的发展趋势。王宇灿等[8]更是认为,即使现在国际中研究大数据的成果喜人,但仍然处于起步阶段,在研究整体上还没能形成完整的体系,而随着企业竞争的日益激烈,如何为决策者从海量数据中提供有效的决策信息,将成为企业研究的关键问题,大数据在商业领域的应用将会成为未来研究趋势。
相对于国外及其他研究领域,我国图书情报领域关于大数据的研究成果还较为匮乏,但近几年来,相关文献数量逐年增长,说明我国图书管领域和信息领域的学者对于大数据的关注度越来越高,研究也一步步深入,逐渐形成图书情报领域大数据研究体系。
对于我国图书情报领域大数据相关研究热点的划分,学者们依靠信息测量、内容分析、聚类分析、战略坐标等方法来分析收集的文献,将研究热点划分为不同类别。例如张晓瑜等人[9]将其分为八大主题,分别为:大数据在图书馆中的应用;大数据下的传统图书馆如高校图书馆、公共图书馆,新式图书馆如数字图书馆、智慧图书馆;数据挖掘、分析与处理;企业竞争情报;知识服务研究。王春华[10]的划分方式与张晓瑜相似,也是分成八大主题。于雪[11]和陈立容[12]则按照概念、图书馆、服务模式、资源建设、图书情报研究五个方面进行划分。寸淑梅[13]认为目前的研究热点主要集中在大数据在图书馆、信息分析、资源建设、知识服务、企业竞争情报中的作用。
然而,一个学科的研究热点不会是一成不变的,在大数据环境下,区别于曾经学科领域发展缓慢的现象,如今,形式、技术、甚至是人们的思考方式都在持续发生着变化,只有基于最新数据,去探索热点领域最新进展,才能更准确地研究图书馆领域和信息领域的未来发展趋势和方向,以致于让专家学者们掌握它。
数据与方法
数据来源
本文的数据文献来源于CNKI(中国期刊全文数据库)的全部期刊,“篇名=大数据 OR 关键词=大数据”作为检索式,将搜索词设定为精确模式, 限定其学科类别为“图书情报档案”,由于学术界2008年才正式提出“大数据”概念[14],因此检索时间选择2008年为起始年,截止时间为2018年12月12日,共检索文献3996篇,将检索出来的文献外部特征和内容特征以Refworks的格式导出,以便之后用CiteSpace[15]进行分析。
研究方法
原文链接:http://www.jxszl.com/jsj/xxaq/564003.html