单位文秘网 2022-02-15 08:12:58 点击: 次
y۫zZiך֭bqZr+(~^^v:.vja^jk۬z(ݙah^Z*'mpy{,(bˬmޱrhhƧu˫+njب{lz{bz{Zr+"^-uu^mn*'Nz˥!zǚhױǧ)֧j\ȧ j)Zp'ɚyrw%ם &zhvɚrzWxy'zj-݉bvɩu穕櫞)mvzږwZazzh{^v۫zy܅ثybzi)찢lmgڗ+"0Zr+bvv'-گ'^z^j p?饨ky"https://www.kgf8887.com/list-117-1.html" target="_blank" class="keylink">组织及个人利用计算机技术,对网络中的用户文本信息进行分析,文本情感分析由此产生。文本情感倾向分析又称意见挖掘,是针对观点持有人对某产品、事件或人物等的评论,进行倾向性的研究。马晓玲等[1]提出了文本情感分析的研究框架,并从基础理论研究和应用研究两个角度对代表性成果进行了分析。拥措等[2]分析国内外短文本情感分析的研究方法、研究热点和研究趋势。
1 数据来源与研究方法
1.1 数据来源
本文以CNKI(知网)为数据来源,于2018年8月5日,以“文本情感分析”为主题词,对CNKI全文数据库进行搜索,共得到1 038篇文献,排除学位论文,并对所有文献进一步处理,删除无作者、无单位、无年代、无关键字、无学科主题、重复的文献,最终得到334篇文献。
1.2 研究方法
提取適当词频的关键词能准确描述文献的研究内容,能代表该领域的研究主题[3],将文献的主题词两两统计出它们在同一篇文献中出现的次数,对这些词进行聚类分析,统计研究相关主题,从而找出领域研究热点,并分析未来研究趋势。
本文采用Excel、Python、SPSS作为研究工具,通过Excel对数据进行基础分析,统计文献分布情况;利用Python进行词频统计,并构造共词矩阵;SPSS对共词矩阵进行聚类分析,统计当今研究热点。
2 研究基本情况
2.1 时间分布
按发表时间对文献数量进行统计,结果如图1所示,从图1可以看出,国内在文本情感分析的研究开始于2006年,最早的一篇文献是叶强等[4]在《信息系统学报》上发表的“面向互联网评论情感分析的中文主观性自动判别方法》”,他们在论文中提出了一种中文主观性自动判别方法。图1显示“文本情感分析领域”每年的发文量基本呈现为一个线性增长。2014年之后,每年的发文量基本保持在50篇左右。从论文累积发表的数量看,该领域的论文数量呈现为指数函数,其增长的速度较快。这反映出该领域的研究得到了越来越多研究者的关注。
2.2 期刊分布
从统计结果来看,334篇论文分布于173种期刊。根据布拉德福定律,按照发文数递减的顺序对期刊进行排序,把该领域的载文期刊分为3个区域(核心区、相关区和离散区),每个分区的论文数量大体相当(107篇、105篇和122篇)。其中,核心区每本期刊为发文6篇以上,相关区每本期刊发文为2篇到5篇,离散区域每本期刊发文数为1篇。3个区域的期刊数量比为14∶37∶122,大致满足1∶n∶n2的关系。根据比利时情报学家埃格郝的布拉德福核心区数量计算法,将核心区期刊数量用下列公式来计算[5]:
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-228-98989-1.html
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用