PC版
搜索导航
论文网 > 工商管理论文 > 企业研究论文

文本挖掘在企业社会责任报告研究中的应用探析

  [DOI]1013939/jcnkizgsc201719014
  1前言
  随着中国经济和社会的快速发展,企业行为引起的外部性问题和社会公共问题也逐渐突出,为了促进经济、社会和谐和可持续发展,国家有关部门加强了对企业的外部监管,同时也要求企业严格自律,主动承担一定的社会责任并及时向社会报告。越来越多的企业正以积极的姿态履行自己应承担的社会责任,并且在有关部门专门规范的指导下积极披露其履行社会责任情况的信息。从2006年中国企业社会责任的元年到2015年这十年,社会责任报告的总量从32份增长到了1703份,实现了迅速的增长。但是不同于企业的财务信息披露,社会责任披露具有自愿性、选择性、低规范化等特点。可以预测将来法律对企业应承担的社会责任内容会有明确的规范,并对报告披露的内容有着具体的要求,通过文本挖掘技术,发现目前企业社会责任报告内容的特征,对未来规范的制定将会有一定的借鉴意义。
  2企业社会责任
  21概念界定
  企业社会责任金字塔理论,其创立者卡罗尔(2000)认为,四责任模型实际上是利益相关者模型。第一层的经济责任是基本责任,对不同利益相关者的关注各有侧重,影响最大的是所有者和员工;第二层是法律责任,法律是社会关于可接受和不可接受行为的法规集成,法律责任是期望企业依法经营;第三层是伦理责任,企业伦理责任意指企业有义务去做那些正确的、正义的、公平的事情,避免或尽量减少对利益相关者的损害;第四层是慈善责任,慈善责任是寄望企业成为一位好的企业公民,期望企业履行其慈善责任,为社会生活质量的改善做出财力和人力方面的贡献。[1]
  22理论基础:社会契约论
  1937年,被誉为“现代企业理论之父”的科斯在其《企业的性质》一文中开辟了以契约分析企业现象的新思路,奠定了企业契约性质的理论基础。企业在经营活动过程中处理的关系是多方面的,一方面与员工、管理者等内部利益相关者缔结内部社会契约,另一方面与消费者、政府等外部利益相关者缔结外部社会契约,在这个意义上,社会契约理论为企业社会责任奠定了理论基础。乔治?斯蒂纳与约翰?斯蒂纳提出,“社会契约理论”是一种非常抽象的概念,但它却暗含着企业所必须符合公众的期望,契约主要是企业社会责任的一种扩展概念,因为它不加任何严格限制地增强了企业对许多社会因素的义务。[2]根据契约理论,企业与多方缔结了一系列契约,企业社会责任也就是企业对利益相关者承担责任的综合体。契约在本质上就是一种法律,一种在特定人之间形成的特殊关系。可以说,企业的契约本质决定了企业社会责任具备法律属性。
  23相关法律规范
  2005年年底,国务院国资委发起的“中国企业社会责任联盟”正式成立,同时召开了“2005年中国企业社会责任论坛”,制定了国内第一部《中国企业社会责任标准》。2007年12月,国资委发布《关于中央企业履行企业社会责任的指导意见》,其中规定的关于中央企业履行的社会责任内部包括坚持依法经营诚实守信、不断提高持续盈利能力、切实提高产品质量和服务水平、加强资源节约和环境保护、推进自主创新和技术进步、保障生产安全、维护职工合法权益、参与社会公益事业这个八个方面。承担社会责任已被写入法律,《中华人民共和国公司法》第5条第1款规定,公司从事经营活动,必须遵守法律、行政法规,遵守社会公德、商业道德,诚实守信,接受政府和社会公众的监督,承担社会责任。但这宣言式的规定并没有社会责任的具体内容。而且就立法而言,现在已有《公司法》《企业国有资产法》等几部经济法律作出了企业“承担社会责任”的原则性规定,但究竟还有哪些具体的制度是贯彻这一原则性规定的,目前人们还不是很明确,这方面的立法工作与解释工作还需要加强。[3]立法的工作来源于实践,企业主动承担的社会责任也会引导立法工作者将来对企业社会责任的规范。企业社会责任报告正式企业披露其承担责任的载体,通过研究企业社会责任报告,探究其责任内容、责任特征,对以后加强立法工作、引导企业社会责任规范具有一定的参考意义。
  3文本挖掘技术
  31文本挖掘的定义
  “文本挖掘”可以定义为一个知识密集型的处理过程,在此过程中,用户使用一套分析工具处理文本集。与数据挖掘类似,文本挖掘旨在通过识别和检索令人感兴趣的模式,进而从数据源中抽取有用的信息。[4]
  32文本数据分析作业过程
  第一步是进行数据清洗。数据清洗包括数据汇总与统计清洗,数据可汇集来自不同数据库的不同数据,通?^统计计算以了解字段数据之间的关联程度及重复性,进行数据间的相互比对,可以通过专家进行协助校正。
  第二步是建立基本词汇语料库。对文本数据进行自动断词处理,可以从文章中自动学习断出常出现的字词,也可以自定义、新增、修改与删除字词。用户可以汇入或扩充专业词库,强化及运用既有的语料库。之后,自动分析及计算词汇在文本中的分布及其重要程度排序。
  第三步是对文本数据进行分类与聚类。非结构化的数据可进行系统自动聚类与半自动式分类,主要借由机器学习,以能正确建立非结构分类的概念类别与分类的准则。也可利用专家事先所定义的类别,通过彼此间的差异建立分类原则。[5]
  33文本挖掘的应用
  目前我国文本挖掘研究还处在消化吸收国外相关的理论和技术与小规模实验阶段,还没有形成完整的适合中文信息处理的文本挖掘理论与技术体系。文本挖掘技术主要用于商业文档的分类、聚类、总结,主要表现在微博、在线评论等网页数据的主观性内容识别、褒贬情感分类、经济价值挖掘等几个方面。文本挖掘在企业社会责任报告、年度报告、通知公告、法律文书等纯文本式文档中应用较少,有关领域的研究甚至为空白。文章拟以文本挖掘技术,探究其在企业社会责任报告分析中的应用。   4文本挖掘在企业社会责任中的应用探析
  41资料来源
  文章选取了中国国际航空股份有限公司的2016年度企业责任报告作为样本,来探究文本挖掘技术在企业社会责任报告中的应用。中国国际航空股份有限公司,简称“中国国航”,在A股上市,股票代码为601111,第一大控股股东为中国航空集团公司,最终控制人为国务院国资委。该报告下载于中国国航官网,下载后的报告为PDF格式,首先通过手工处理,进行TXT文本化,保留了文本部分。
  42研究工具
  ROST Content Mining,简称ROST CM,内容挖掘软件,是武汉大学沈阳教授研发的用以辅助人文社会科学研究的大型免费社会计算平台。该软件可以实现微博分析、聊天分析、全网分析等功能,用户遍布海内外100多所大学。本文使用的是该软件的分词、词频统计、语义网络分析等功能。
  43分析过程
  431分词后形成高频词
  将文本化后的社会责任报告文档导入ROST CM软件,对文本内容进行分词。非结构化的文本通过分词切分后将会形成独立含义的词语。在分词前,设定企业社会责任报告自定义词表,使一些专业词汇不被进一步分词,包括“企业社会责任”“社会责任”等,保证分词结果的准确,分词之后,最后得到企业社会责任报告高频特征词。将分词后的文档进行词频统计,得到社会责任报告词频表,可以得到每个词语出现的频数(见表1)。摘取词频最多的前30个的词,得到社会责任报告文本高频词汇表。可以看出公司名称“国航”是出现最多的词;其次是“员工”“服务”“安全”“管理”与“旅客”,可以认为该企业社会责任报告关注披露的内部重点在于职工与管理,外部内容在于服务、安全与客户。高频特征词表只能从最直观的出现次数来观测出报告所披露的内容,对于披露内容关键词之间的联系则观察不出来,还需要进一步分析。
  432共现分析
  根据分词后统计的文本词汇库,继续导入ROST CM软件,进行共现矩阵分析。社会责任报告关键词共现是指相同或不同特征的关键词共同出现的现象,共同出现的高频词之间存在着关联,关联程度可以通过共现频次来测量。由于篇幅有限,文章只选取了频次前10的高频词,构建了10×10的共现矩阵(见表2)。可以看出,“提升”与“管理”共同出现了22次,“旅客”与“服务”共同出现了22次,表明报告强调了公司要提升管理,加强旅客服务。通过共现分析,可以看出相邻关键词直接共同出现的频次,观测出报告披露内容特征之间的关联程度。
  433语义网络分析
  对关键词直接进行关联性分析后可以进一步构建出知识地图;共现分析只能观察出关键词之间的直接联系,而社会网络则可以观察关键词之间直接与间接的关联性,以及彼此之间的相关性强弱。通过共现矩阵导入到Ucient中,生成高频关键词共现网络。根据关键词之间关系的紧密程度,通过Netdraw可视化软件导出企业社会责任报告内容关键词语义网络(见下图)。通过关键词语义网络图可以看出,公司名称“国航”处于网络中心,“员工”“服务”“管理”“发展”“旅客”等一系列名词关键词与动词关键词处于网络的第二层核心,一方面与内核“国航”联系,另一方面与外围“理念”“文化”“运营”等第三层关键词联系。第一层“国航”是报告披露的主体,报告披露的内容围绕着主体的一系列行为展开;第二层则是报告披露的核心与纽带,披露出企业社会责任重点关注的内容,一方面是“员工”“服务”等名词反映出报告披露的不同模块,包括员工权益、提供的航空服务、旅客客户等,另一方面是“开展”“推进”“建设”“提升”等一系列动词表明了主体所进行的企业社会责任行为,联系了不同层次之间的名词内容;最外围的“价值”“运输”“培训”“环境”等关键词则是对披露内容的丰富与完善,出现的次数较少,与其他关键词直接关联程度较低。关键词语义网络图
  5结果与展望
  目前,国内的企业社会责任还是以文献综述式、案例式、问卷调查式等方法进行研究,以文本挖掘、内容分析法、数据挖掘等形式的研究较少。企业社会责任报告披露的内容相对较多,内容呈现为非结构化的特征,通过计算机量化,把非结构化文本转化为关键词并进行相应的分析可以更客观地评价企业披露的社会责任的内容与特征。文章借鉴信息学科的文本挖掘技术,通过武汉大学沈阳教授开发的ROST CM软件,对企业社会责任报告内容进行文本处理,通过分词把无序的文本处理为可分析的词汇,对词汇进行统计得到高频词汇表,可以最直接观察出企业社会责任报告披露的重点内容;对关键词进一步分析,通过构建共现矩阵,可以观察出关键词共同出现的频次,即观察出不同关键词的直接联系与关联程度;对共现矩阵进一步转化可以得到关键词语义网络,通过知识地图可以观察出关键词的直接联系与间接联系,并且可以观察出不同关键词直接的关联程度与紧密程度。对社会责任报告内容特征的探究,可以看出企业披露的其主要承担的社会责任,这对以后法律具体规范企业社会责任具有很大的参考意义。
  文章还存在着很多不足,由于时间和精力有限,只选择了中国国航的企业社会责任报告作为研究对象,样本量单一,后期可以选择上市公司近年披露的报告进行批量化研究。文章只是探究了分词、?~频、共现矩阵、语义网络在企业社会责任报告分析中的初步应用,后期进一步的研究还可以深入,比如通过关键词之间的联系与关联程度,探究不同因素之间的影响关系。另外,还可以通过文本挖掘技术中的聚类分析,对关键词进行聚类,与国资委发布的中央企业应该披露的内容进行比照。通过这些进一步的研究,以期可以探究文本挖掘技术在企业社会责任报告研究中的广泛应用。

相关论文

社会责任文本报告应用社会责任
企业财务管理中税收筹划的应用与相关
信息化教学在初中历史课堂中的有效应
浅谈中小民营企业人力资源激励机制的
浅谈管理会计在商业银行经营管理中的
管理会计在商业银行经营管理中的应用
试论舞台美术设计中的LED屏幕应用
写生课程融入学前教育美术教学的应用
试论战略成本会计在企业管理中的应用
社会化电商拼多多盈利模式存在的问题
新文科建设背景下管理类应用型本科人