涂子沛:大数据时代,中国需要面对三大挑战

2014/8/16   点击数:1281

[作者] 王启云

[单位] 淮海工学院图书馆

[摘要] 今天的中国,是一个人口大国、互联网大国、手机大国,但却恰恰不是一个数据大国。2010年全年新增的数据量却尚不及美国的十分之一(2011年麦肯锡公司以2010年度各国新增的存储器为基准,对全世界大数据分布辽一个研究和统计。

[关键词]  徐子沛 大数据 中国



摘编自:涂子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活._桂林:广西师范大学出版社,2013.2:240-246 ,即《尾声 挑战中国:摘下“差不多先生”的文化标签》一节

今天的中国,是一个人口大国、互联网大国、手机大国,但却恰恰不是一个数据大国。2010年全年新增的数据量却尚不及美国的十分之一(2011年麦肯锡公司以2010年度各国新增的存储器为基准,对全世界大数据分布辽一个研究和统计。中国约为250PB,美国3500PB,另,日本400PB,欧洲2000PB。1PB为2的50次方字节,美国邮政局一年处理的信件大约为5PB,谷歌每小时处理的数据为1PB。)。中国缺乏的不是可供收集的数据,也不是收集数据的手段,而是收集数据的意识。

黄仁宇,是著名的华人历史学家,他参加过抗日战争,后来在美国学习、研究、深造,成为学贯东西的一代大家。他在晚年时发表了一系列著作探讨中西方社会的异同。他认为:“资本主义社会,是一种现代化的社会,他能够将整个的社会以数目字管理。”数目字管理,即以事实为基础、以数据为核心的精确管理。他总结说:“中国过去百多年来的动乱,并不是所谓道德不良,人心不古,也不是全部军人专横,政客捣乱,人民流离”,而是因为中国未能像西方那样实行“数目字管理”的现代治国手段。他还认为:“一旦某个国家能在数目字管理,到底使用何种数字,尚可以随时商酌,大体上以技术上的要求作主,不必笼统的以意识形态为依归了。”一句话:中国的落后,根源之一正是缺乏以数据为基础的精确管理;而未来中国的进步,也有赖于建立这种精确的管理体系。

阿瑟.史密斯认为,中国人,是一个“漠视精确、思维含混”的民族,他在《中国人的性格.漠视精确》中写道:“中国人完全能够像其他民族一样学会对一切事物都非常精确——甚至更加精确,因为他们有无限的耐心——但我们必须指出的是,他们目前还不重视精确,他们还不知道精确是什么。如果这一看法是正确的,那么就可以有两条推论:其一,我们考查中国历史档案时,必须考虑到中国人漠视精确这一特性。我们采用中国人提供的数字和数量容易使我们自己受骗,因为他们从来就不想精确。其二,对于中国人所提供的冠以‘统计数字’以抬高其权威性的各种材料,必须留有很大的余地。”

和美国的数据资源的丰富、开放相比,不少中国留学生对于国内的数据匮乏有切肤之痛。写论文,做研究,如果能选一个自己熟悉的中国话题,于国于己,都更有意义。可选的话题不少,但常常一数难求,多数选题都逃不出夭折的命运!有些数据国内确实没有,有待收集;还有些数据水分太大,经不起推敲和检验;再有的,被有关部门贴上了“机密”的标签,平民百姓无缘相见。

黄仁宇还对中国人缺乏“数据精神”的根源做了剖析,他认为:在中国传统的学问——理学或道学当中,一直都分不清伦理之“理”与物理之“理”的区别。这两个“理”混沌不分的结果,是中国人倾向于粗略的主观定性、排斥精确的客观定量,从而养成了重形象、重概括、轻逻辑、轻数据的文化习惯。这种文化习惯,使中国人长于相似的“模糊联想”,止步于用逻辑来分析、用数据来证明,最终将表象的相似,当做本质上的相同。但欧洲在中世纪之后,就将“伦理之理”与“物理之理”这两个“理”划分得很清楚了。

现代著名思想家汉娜.阿伦特也曾经对比过中国人和西方人在思维方法上的不同。她的结论是:西方人是“词语思维”,中国人则是“形象思维”,而形象思维不是一种基于逻辑的推理性思维。归根到底,中国人对数据的漠视,源于一种文化上的缺欠:随意、盲目、不求甚解、理性不足。因为这种文化上的不足,科学最终在西方国家起源,当然不足为奇,中国人100多年来只能跟在别人身后亦步亦趋,也是应得的命运。

除了数据的收集和使用,中国在大数据时代需要面对的挑战,还有数据的开放。如果说收集数据是一种意识,使用数据是一种文化、一种习惯,那是否开放数据则是一种态度。

由于互联网的发明,“开放”已经成为人类社会一个不可逆转、不断加速的社会思潮。如雨果所说:你可以阻挡一支入侵的军队,但你无法阻挡一种思想。在这个浩浩荡荡、不断前进的世界大潮当中,我们将发现,中国如果不跟上,我们的处境将会越来越微妙、越来越尴尬、越来越孤立。收集数据、使用数据、开放数据,都是大数据时代我们中国人需要一一面对的挑战。这三大挑战,没有一个不是任重道远。

原文连接:http://blog.sciencenet.cn/home.php?mod=space&uid=213646&do=blog&id=820066