扯淡图书馆核心数据

2013/6/9   点击数:1461

[作者] 此方月

[单位] 此方月

[摘要] 本来是要回复c老师的一句话,边带着怨妇气息在写,突然间有种罪孽罄竹难书的感觉,居然就写成一篇“散”文了……

[关键词]  图书馆 核心数据 服务



本来是要回复c老师的一句话,边带着怨妇气息在写,突然间有种罪孽罄竹难书的感觉,居然就写成一篇“散”文了……

图书馆究竟有没有核心数据?图书馆的核心数据应该是什么?

回答这个问题可能需要很长的论述。

首先,我们没有突破节操地去努力地反思?

我们往往讨论的是图书馆存在的价值是什么?那么,为什么不进一步去想,图书馆有没有存在的必要呢?虽然每一次图书馆灭亡论出来,就要受到毁灭式的轰炸,但我们何不蛋定地想一想,这些言论为什么存在,这些言论有没有哪怕亿分之一的正确率?

这对于笔者这样一个一根杆打到底的图书馆学背景的娃子来说,无疑是一个接近挑战道德极限的问题,但却是不可不问,不可回避的反思基本点。

更何况,答案是残酷的,至少有一部分。在未来一段时间,如果将图书馆看做一个信息服务的机构而言,它的生命力即将透支。只有将图书馆看作一项制度,以保障公益性和信息民主为前提,它才得以永存。

这个道理显然有其深刻的人文启思考,当笔者第一次从《追问图书馆的本质》等文章看到这个观点时,心中激情澎湃,久久无法平伏,至今如是。

然而,当我们将视野放到图书馆的数字化进程中,会发现现实是如此蛋疼,因为我们长久以来的数字化工作、我们长久以来拥抱的所谓书目数据,其思想的基础都源于将图书馆视作一个个机构,而不是视作一个整体性、系统化的制度。

正因为底层思想根源是机构,所以是僵硬的业务,所以是僵硬的数据节点,所以死抱着书目数据,以这样一种思想根源为基础,还谈什么大数据?且不论本身是不是真的够“大”,且不论背后的数据挖掘技术是否合格,没有多种数据源的交叉和互通,哪里来的大数据?

如果将图书馆视作一种制度的话,图书馆的核心数据构建方案和数据采集节点很可能将需要做出极大的调整。甚至我们应该考虑,在有需要的时候,放弃过多针对书目数据的处理,“假手于人”(其实目前的趋势已经是如此)。

但是即便假手于人,即便谷歌和百度是有盲点的,核心在于结构封闭的数据(从商业的角度来讲,淘宝的数据就不对百度开放,fb也是类似的,谷歌无法深入fb的深度数据。从这个角度来讲,只要竞争关系存在,谷歌永远无法收录全世界;只要竞争关系不存在,谷歌马上将陷入垄断官司。从非商业角度来讲,还有大量的政府类和官方数据,这里说的不是每年政府报告,而是类似于药监局的药品信息)

由此,图书馆的数据业务,可能将集中在三个部分:

1. 推动相关技术性和政策性措施,保证谷歌等厂商合理使用书目数据和其他政府类信息的边界和范围,实现深层次的共生关系。

2. 与相关企业或机构共同履行数据长期保存的职责。

3. 开拓更多的数据节点,迅速与图书馆服务相关的实体形成数据互换和交叉,实现,推动新业务的形成。而且,尽可能从最简单做起,迅速积累团队经验和处理经验。

最阳春的一个,就是图书馆的地理位置信息和图书馆的服务信息应当迅速建立起来,并提供和推送给所有的地图类应用和O2O应用,实现深度合作。移动互联网和大量的O2O应用,已经在给无数的用户推送麦当劳、班尼路,却几乎没有推送图书馆的相关信息,这显然要归罪于长期以来,图书馆界缺乏一个完善的图书馆地理信息库(这几乎是痛苦的跨馆合作中最简单的一项了),图书馆是拥有实体,是遍布大街小巷的,却从来没有深入参与到用户的移动生活与O2O生活之中。

而当图书馆的实体功用与原始的书目数据,与公益性组织的数据流、与教育类机构的数据流互相结合,将拥有更多的想象力。

当豆瓣连旅游地点和app都标引了,图书馆却只能抱着书目数据过一辈子么?

说句玩笑话,眼下开发更好的资源发现系统,其价值还不如开发一个图书馆界通用的阅读器软件,也许只有看过网易云阅读、qq阅读、豆瓣阅读之类排山倒海的后台数据分析,才能了解居然俺们从来不知道用户在读些什么,看些什么,花了多少时间,做了多少标记的时候还有更多更多……阿里的王坚说:云计算和大数据,你们都理解错了。说不定,我们连所谓的读者需求都不曾正确知道过。

凌乱的思考和凌乱的感慨,抛砖引玉,别无他求。

原文连接:http://blog.sina.com.cn/s/blog_684a09cb0101899h.html