PC版
搜索导航
论文网 > 管理学论文 > 档案管理论文

档案学高被引论文引用情感类型分析

  Abstract:We propose a highly cited papers citation evaluation analysis method in archives science based on citation context,define the three type of citation. The paper contributes to the external features and content features of highly cited papers by empirical study citation subject and citation motivation based on archives science papers.
  Keywords:Analysis of citation emotion types ;Archives science ;Highly cited papers
  1 引言
  1927年[1],引用首次被用来对科研进行评价,经过数十年的发展,引文分析的理论和方法体系逐步健全。然而,随着研究和实践应用的深入,引文分析存在的问题也逐渐暴露,如,引用的规范性、引用动机以及只注重被引频次而忽视引文内容导致的引用不规范和引文评价的不科学等问题[2]。随着文本挖掘技术和全文提取技术的出现,基于引文内容分析是引文分析的新方向[3]。引文内容分析可以弥补单纯以被引频次数量评价的不足,将引文的数量和质量结合起来,更好地揭示文献之间的关联性。
  虽然国外已经有关于引文内容分析的实证研究,但国内基于引文内容分析,尤其是基于档案学引文内容分析的研究目前还不多。鉴于此,本文以档案学高被引论文内容分析为基础,深度揭示档案学高被引论文反映的引用主题和引用行为动机研究,对于揭示档案学引文特征具有意义。
  2 数据来源
  本文以档案学高被引论文为样本,样本选择方法为:以CNKI数据库的“中国学术期刊网络出版总库”为数据源,选择“档案学、档案事业”学科领域,不设检索条件加以检索,检索结果按照被引频次递减排序,剔除非学术文献和不相关文献,得到档案学被引频次最高的前100篇论文。检索日期截至2013年底。百篇高被引论文分布于18种期刊中,其中《档案学通讯》最多,有51篇文章,占总数的51%。《档案学研究》12篇。
  3 引文内容特征研究
  引文内容分析指基于引文内容层面的语义关联,对引用句或引用上下文的内容进行关联性分析,以揭示被引文献对施引文献的作用。目前,相关研究主要包括引文类型识别、情感倾向分析和引文主题识别。
  3.1 引文主题识别研究。引文主题识别是从引文文本抽取代表引文的主题词,利用主题分布来揭示被引文献的被引原因以及被引文献对施引文献的主要作用或贡献。
  本文主题识别是通过抽取高被引论文的关键词来实现。百篇高被引论文共有691个关键词,出现频次大于4的关键词有34个,累计频次277次,占总频次的40%。出现频次最高的档案工作者19次,档案管理18次,电子文件17次。
  表1 高频关键词
  利用共词分析方法将我国档案学高被引论文研究主题分为四个主题知识群,一是档案学基础研究与档案事业,包括来源原则、档案学、现行文件、人事档案、档案事业、档案管理、档案工作者、纸质文件、信息安全、文化、政府信息公开关键词。二是电子文件和文件运动理论,包括电子文件管理、电子文件、电子档案、电子文件归档、文件运动和文件生命周期关键词。三是档案信息化与资源开发利用,包括办公自动化、数字化、档案信息化、信息化、数字档案馆、档案信息、档案信息资源、资源开发、利用、档案开放利用关键词。四是档案工作与档案馆,包括档案工作、虚拟档案馆、传统档案馆关键词。
  3.2 引用情感类型研究。引用情感类型识别是通过对施引文献引用被引文献的文本内容,从引用动机和情感倾向分析挖掘施引文献作者对被引文献的观点、态度或立场,主要分为肯定、中立和否定三种基本类型。本文以档案学高被引论文引用情感倾向识别档案学引用情感类型。
  本文根据引用内容,将引用情感类型分为三类,正面引用、负面引用和中性引用。正面引用指施引文献中对引文的观点、结论或方法的肯定和赞同,还包括在引文基础上展开后继工作,或者应用引文中的理论方法和数据以及引用他人的方法或结论和自己研究进行对比等。
  负面引用指施引文献对引文中的观点、结论或方法持否定态度。多是指有商榷性质的文章,或者指出引文研究的不足、缺陷以及目前没有涉及的而本文将要研究内容,主要表述两篇文章研究的不同。
  中性引用指施引文献对引文内容没有表示赞同或反对观点,只做内容论述和在综述研究中出现的引用。情感类型界定如表2。
  表2 情感类型及界定
  由于百篇档案学高被引论文总被引三千多次,涉及施引文献数据量巨大,数据处理困难,本文采用分层抽样调查的方法,保证研究的可行性和科学性。在上述引文主题类型中,依据上述主题分类,在四个主题类团中各抽取一篇代表性文献作为样本研究。研究样本的选择具有代表性:一是涵盖了所有的研究主题,避免因主题不同而产生引文特征不同;二是选取不同作者,既有业界权威,也有不同身份代表,避免权威效应带来研究偏差;三是不同期刊和年代;四是不同层次的被引频次。
  表3 抽样样本数据
  从上述四篇不同主题的文章被引的情感倾向来看,档案学论文多是正面引用,占63%,不含感情色彩的中性引用占35%,只有不到4%的引用是否定性质的。说明在多数情况下,档案学界对所引用文献都是持肯定态度,或是对引用文献高度评价,或是应用引用文献的理论和数据,只有极少数是指出引文不足。   进一步分析正面引用大部分是理论应用、在别人研究基础上的进一步研究和利用别人的研究理论、数据进行实证研究,或者是自我对同一问题的深化研究。因此,理论性强的文章正面引用的可能性更大。如裴友泉[4]等在文章中引用“正如《刍议》所说,目前‘信息孤岛’、项目资金浪费等问题正面临深化的风险……笔者想说是:《刍议》是篇好文章,不仅较系统地梳理了我国电子文件客观存在的问题,给人们以警示与反思”表明对引文的正面肯定。
  实践性的文章和综述性质的文章多是在文章开头的理论综述和研究综述中引用,因此,中性引用的可能性大。如马海群[5]等在文章中引用“由图4可见,数字时代的档案信息资源管理已成为2006年~2007年学者们关注的研究热点之一,冯惠玲(2006)从国家战略的层面上指出:我国电子文件管理战略应借鉴发达国家的先进经验,走上顶层设计、全面规划和集中控制的发展路径”表明对引文没有感情色彩的中性综述引用。
  反面引用的文章很少,说明档案学界在理论争鸣和商榷中不是太活跃,而这仅有的几篇反面引用也不是对于观点的否定,只是指出引文和施引文献研究问题的不同,或者不全面。同时,理论性的文章由于有观点表述更有可能反面引用。如安小米[6]在文章中引用“第一篇《电子文件管理国家战略刍议》,首次提出了我国电子文件管理国家战略研究的问题……该文肯定了电子文件管理问题的严重性,但未对什么是电子文件管理国家战略进行明确解释,由于缺少分析框架,对国外电子文件管理国家战略的研究有待系统和深入”,文章指出引文的不足和缺陷,进而提出本文要研究的内容。同时,学位论文的引用会涉及施引文献对被引文献的多次引用,主要包括在文献综述中的中性引用以及在具体的问题和策略中的正面引用。
  4 结论与展望
  本文提出了一种基于引文内容分析的高被引论文引用特征研究,并以档案学高被引论文为数据源,研究了基于引文内容的主题识别和情感类型识别。指出档案学高被引论文主题既有传统基础理论内容的继续研究,但更多地已关注网络环境下新的理论和应用。具体表现为:一是基础理论和应用研究依旧,新的应用理论逐渐增多。二是信息化催生的档案工作新变化,以及基础理论的应用得到拓展。技术催生电子文件产生、政府信息公开、电子政府、档案网站的建设和数字档案馆等。三是档案工作为社会服务的关系越来越密切。档案学的引用情感类型以正面引用为主,综述性和实践性的文章多是中性引用,而具有商榷性和争鸣性的反面引用文章很少。
  虽然本文从引文内容方面研究了高被引论文的引用特征,但也存在局限。一是引文样本选择的局限。鉴于数据量大,在引文类型研究中,只选择了每个主题中的4篇论文进行研究。二是引文内容分析也只对主题和情感类型进行识别,况且主题识别只选择关键词,没有从标题、摘要甚至全文信息中提取主题标识。未来要在文本挖掘技术和大数据技术下,进行大样本引文内容分析和主题识别。同时,指出引文内容特征还具有学科特征。

相关论文

档案情感论文类型档案学
浅谈农村档案工作存在的问题及措施
钢铁企业档案管理的信息化建设探讨
人事档案管理信息化建设创新路径研究
基于物联网技术的高职体质健康档案系
加强事业单位档案管理信息化建设的思
高校电子新闻档案管理模式构建探讨
试论新时期如何开展人事档案管理工作
新时期农业科研档案管理数字化转型思
论区块链技术在电子档案管理中的实践
做好文秘工作和档案管理工作的研究