单位文秘网 2021-07-18 08:13:19 点击: 次
摘要:大数据要求人们改变对因果关系的追问,转而追求相关关系;要求人们改变对精确性的苛求,转而追求混杂性;行业专家及其专业知识的重要性都会因为统计学家和数据分析的出现而变低。这些说法虽然刻画了大数据时代的新特点和动向,但论证不够深入全面,可能会引起误解。其中,第一个论点涉及因果关系与相关关系,第二个论点涉及决定论和概率论,第三个论点涉及统计分析和意义理解。从哲学理路上考察上述论点,我们会发现,尽管大数据時代开辟了一条模糊地利用数据的途径,但如果没有通过理想型的理论对大数据中的相关关系的意义的理解,我们就不知道如何去应用这些相关关系。如果我们不考虑社会理论的价值观念和人生指导意义,而沉湎于预测和操控,就会存在被彻底物化的危险。数据库再大,也是依据已经积累的过去的资料来预测将来,而将来是开放的,所以决策和预测总是存在风险,因此,机器的决策永远不能够取代人的决策。
关键词:大数据;因果关系;相关关系;统计分析;意义理解
中图分类号:C0; TP311.13文献标识码:A文章编号:0257-5833(2018)09-0069-09
作者简介:张庆熊,复旦大学哲学学院教授(上海200433)
一、引言
要讨论大数据时代的社会科学方法论的新特点,让我们从一个例子出发,比如说调研一个二三线城市的房地产开发是否存在过剩的问题。以往社会研究主要采取抽样调查结合统计分析的方法。为了取得数据,我们制定抽样调查的表格,发给那里的房地产开发商、房产中介商和进行房屋交易的居民等,我们让他们填写表格,并结合实地采访。调查的内容包括房屋的价格、建造和出售的时间、空置的比例等。调研的成功取决于样本发放和收回的数量、样本设计、发放对象和统计分析的合理性。这样的调查方法具有局限性。毕竟,样本再多也不等于全体;此外,填表者和受访者由于利益关系或其他的原因可能不愿意说真话。我们希望通过表格设计、样本发放和分析的合理性来弥补这些缺陷,但这不免带有原始数据的不可靠性和主观估算方面的瓶颈。
在大数据时代,这样的调研方法即便不算过时的话,至少也显得少慢差费。实际上,如今许多数据不用问卷调查就可以在具有数据记录的相关网站获得,而且这样的数据是客观真实、全面和动态的。这是因为在互联网时代,大量数据被自动记录下来,即便缺少某一方面的数据,也可以通过相关数据加以印证。例如,某个城市房地产的数据不一定要从房地产部门直接获得,也可以从与房地产相关的部门获得,如从具有水、电、燃气等统计数据的部门获得。现代城市中的房屋要有水、电、燃气三通。要查看这个城市房地产的开发情况,可以查看这个城市一段时期以来安装水表、电表、燃气表的数量,以及水、电、燃气交费的情况。如果安装水表、电表、燃气表的数量多,开通和交费的用户少,说明这里的房屋积压多,空置比例高。我们有了水、电、燃气的数据,就可以从水、电、燃气的交费情况中发现线索。比如,有多少房屋是用来居住的,有多少房屋是用来投资的,然后进行有针对性的问卷调查。
想一想,我们在平时购物和支付的经济活动中,在社交媒体的文字书写和转发中,甚至在打字和语音输入中,不知留下了多少信息,它们在电脑的服务器中被储存下来,通过数据处理,能够被用作各种各样的宏观和微观的统计分析。商家会利用你网上购物成交的记录和浏览商品的记录,让电脑自动估算出你的购物倾向和习惯,向你推荐商品。过去有一种说法:人在做,天在看。在大数据时代,“天眼”就是数据网络,人好像无时不刻不处于无形眼睛的监察。我们在不知不觉中留下数据,而这些网络数据可以在你毫不知情的情况下被加以利用。
本文不是想具体说明大数据的技术应用,而是想从理论上探讨大数据技术应用对社会科学方法论研究的意义。前者是技术的问题,后者是社会科学哲学的理论问题。畅销书《大数据时代》同类的书很多,例如,吴军:《智能时代:大数据与智能革命重新定义未来》,中信出版集团股份有限公司2016年版;李开复、王咏刚:《人工智能:李开复谈AI如何重塑个人、商业与社会的未来图谱》,文化发展出版社2017年版;伊恩·艾瑞斯:《大数据思维与决策》,人民邮电出版社2014年版。我的引证选择《大数据时代》这本书,因为它较为集中地描述了“大数据时代的思维变革”,从而引发我考虑与其相关的社会科学方法论的问题。非常生动地描述了大数据的技术应用和由此带来的重大变革,其中谈到:“当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,‘样本=总体’。”[英]维克尔·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代》,浙江人民出版社2013年版,第27页。从社会科学方法论的角度看,该书除了以上论点外还有如下三个论点值得我们关注和反思:(1)发现关联物,找到相关关系,是预测的关键;知道“是什么”就够了,没有必要知道“为什么”;在大数据时代,我们不必非得知道现象背后的原因,而是让数据自己“发声”。[英]维克尔·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代》,浙江人民出版社2013年版,第2、67-94页。(2)执迷于精确性是信息缺乏时代和模拟时代的产物,依靠大数据的统计概率,接受不精确性,我们才能打开一扇从未涉足的世界的窗户。[英]维克尔·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代》,浙江人民出版社2013年版,第2、45-66页。(3)行业专家和技术专家的光芒,都会因为统计学家和数据分析学家的出现而暗淡,因为后者不受旧观念的影响,能够聆听数据发出的声音。在大数据时代,专业知识以及对这些知识的理解变得不重要了,很多工作可以由统计学家和数据分析学家来做。[英]维克尔·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代》,浙江人民出版社2013年版,第180页。
以上,第一个论点涉及因果关系与相关关系的哲学问题,第二个论点涉及决定论和概率论的哲学问题,第三个论点涉及统计分析和意义理解的哲学问题。尽管《大数据时代》一书通过许多生动的例子刻画了与上述论点相关的大数据时代的思想方法的特征,但我觉得其论证不够深入全面,可能会引申出似是而非的结论。本文试从社会科学哲学方法论角度考察上述论点,以期把思想方法上的问题说得更透彻一些。
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-249-66016-1.html
上一篇:小概率事件特点、原理及其应用
下一篇:关于等可能概型的教法改进
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用