9月10日出版的《自然》杂志刊登社论——《数据的可耻忽视》(Data's shameful neglect),称如果论文的数据不能保存并及时公开,研究就不可能欣欣向荣地发展。数据的保存管理及公开亟需进一步发展。以下为社论主要内容:
如今,一个研究项目成功与否的评价标准不仅仅是项目本身的文章产出,更包含了研究数据能否与更大的科研群体共享。像基因序列数据库(GenBank)这样的先驱数据库就很好地证明了其在研究新发现中起到的巨大作用,尤其是当多个实验室的数据整合并用一些数据的原创作者意想不到的方法进行分析的时候,更可能有新发现产生。
除了极少数的几个学科外,基本上大多数学科都缺乏技术上、制度上甚至文化上的约束来支持科研数据的公开化,这无疑引起了无法共享数据的科研人员的诟病。而这种缺失的扭转亟待基金支持者、大学及研究者自身的重视。
研究资金支持机构需要意识到保存并公开数字数据是他们的核心任务,需要相应的支持力度。英国的一些基金组织在这方面起了个好头,1993年由7个英国研究理事会创立的联合信息系统委员会(Joint Information Systems Committee)优先发展数据共享服务,并且协助成立了总部位于爱丁堡大学的数据监管中心(Digital Curation Centre),从国家层面来关注数据的研究和发展。其它的一些欧洲机构也在这方面争取主动。
相对而言,美国在这方面显得比较被动,仍然处于追赶过程中。从2005年开始,一个29人的联合工作小组向美国的研究基金支持机构建议怎样发展数据存档和数据存档政策的制订,包括哪些数据可以保存哪些则不宜。目前有一些机构已经开始这样做,另一些则踌躇不前,他们需要加快步伐。
更重要的是,资金支持机构和研究者都应该保证他们不仅要支持存储数据的硬件建设,也要帮助能够方便研究者使用的软件建设。在数据能够以出人意料的方式进行组合的今天,软件能够寻找出数据的原始作者,并在可能的情况下对原创作者予以奖励。
那么,数据该由谁来掌管?基金会和研究机构应该共同建设一些共享数据图书馆。大学图书馆可以承担维护数据并向公众开放的长期任务,大学和各个学科需要承担起对学生的数据教育任务。虽然很多理科的学生有扎实的统计学背景,但是他们的课程中很少包含信息管理的内容,这种观念需要转换,数据管理应该作为基本知识融入到自然明升体育app的每一门课程。(明升手机版(明升官网) 王玲/编译)
更多阅读