我国科学数据库资源现状堪忧

【字体: 时间:2005年07月08日 来源:科学时报

编辑推荐:

  

  资环数据总量最大 农业数据服务最好 四成库藏仍是“孤岛”

        经数字化加工整合的科学数据库,和大型科学仪器、设备、设施、科技文献、自然科技等一样,是一个国家最重要的科技资料。建立完善科学数据共享平台,已被纳入《2004-2010年国家科技基础条件平台建设纲要》,列为一项重要的建设任务。这种情况下,摸清我国科学数据库资源现状,成为亟待解决的课题。

        北京万方数据股份有限公司最近完成的一项调查,范围涉及我国国家级信息机构、国家级科研院所、重点高等院校等903个单位,覆盖资源环境、农业、人口与健康、基础科学与若干科学前沿、工程技术、科技管理等6个领域36个子领域,提供了全面的数据库建设规模、学科和地区分布、建设投入、运行管理以及技术应用等方面的状况,显示我国数据库保存和管理的基础条件令人担忧。 

        总体状况不容乐观

        数据显示,本次调查的数据库共有2459个,数据总量达497.18TB,共获得建库资金28.27亿元,30.9%的数据库积累年限在10~30年之间。六大领域中,资源环境领域数据库个数最多,达1098个;数据总量最大,有406.47TB;获得的建库经费最多,达22亿元;数据积累年限也最长,30~100“年藏”的数据库数量最多。

        不同部门对科学数据库的投资,支持方向也有明显差别:科技部项目在工程与技术领域投入最多,占科技部所有投资总额的33.06%;自然科学基金委最大的投资方向,是工程与技术领域数据库的建设;教育部主要投资在科研管理方面;其它部委项目、多渠道投资、单位自筹和中科院项目,比较偏重于资源环境领域数据库的建设;而与企业及其它机构的外部合作项目,则以基础科学与若干科学前沿领域、资源环境领域和人口与健康领域为重点。

        “突出共享”是科技基础条件平台首要的建设原则。本次对数据库服务情况的调查显示,对外服务数据库的比例超过所有数据库的一半,但各领域之间这个比例相差较大,农业领域高达68.32%,科技管理领域却仅有31.25%。各数据库的有效服务总比例仅35.09%,其中农业领域有效服务约60.46%,据了解与此类数据库共享服务比例高有关;其次的工程与技术领域,有效服务比约32.03%;最低的科技管理领域仅占21.09%。数据库主要服务对象集中在科研机构,其次是本行业和政府,不足32%面向企业。

        各数据库信息基础环境较差,近四成数据库保存在单机或局域网中,不具备网上共享服务条件。能上网的数据库中,24%的数据库通过PC机上网,没有专用服务器。这种不容乐观的情况,在高等院校、国家海洋局、国家林业局、国土资源部、水利部等部门比例高达40%以上,数据库保存和管理条件堪忧。 

        六大领域各有千秋

        调查数据显示,六大领域数据库呈现出各自不同的特点。

        数据库数量、数据总量最大的资源环境领域,地矿和土地科学数据库最多,达311个;遥感数据数据量最大,达243.89TB。22亿元的数据库建设投资,非科字头部门投入最多,有9.64亿元。在气象科学、地震科学、海洋科学、水文水资源科学、地矿和土地科学5个子领域,都建有各自的行业信息中心,数据库个数和数据量都占到该领域的90%以上。生态系统科学以中科院生态观测网最为集中,遥感数据以中科院卫星地面站、气象卫星中心两个单位数据量最大、数据积累年限最长。

        农业领域数据库总数483个,数据总量14.67TB,其中中国农科院和国家林业局是主要建库单位。总建库经费1.57亿元,科技部项目作为主要投资渠道投入占总额的近57.3%。本领域六成数据库可对外服务。在各子领域中,规模最大、建设相对集中的林业科学领域有数据库233个,数据量近11TB,数据积累情况最好,平均数据年限23年以上。

        人口与健康领域数据库总数221个,数据量15.21TB,建库单位涉及约50多个科研院所和医院。其中,卫生部系统建设的数据库达103个,占所调查数据库的46.61%,是本领域数据库最多的系统。建库经费以非科字头部委投资为主,卫生部、国家统计局、军队系统等部门投资占总额的41%。本领域数据积累年限较短,以3年内数据为主。46.15%的数据库可共享,但有效服务比例只有27.6%。

        基础科学与若干科学前沿领域有数据库120个,数据量50TB,数据记录超过23.2亿条。在各子领域中,地球系统科学领域数据库38个,数据量45TB,是本领域中最大的子领域。中科院是拥有此类数据库最多的部门,主要建库经费来自非部委的合作项目。由于本领域数据库大多通过各类科研项目获得数据建成,所属单位比较分散,多由研究室自行管理。

        工程与技术科学领域有281个数据库,数据量10.58TB,数据记录超过17.3亿条。材料科学、生物科学和先进制造共性基础技术领域的数据库个数,依次排在各子领域前列。国资委监管的中央大企业,是本领域最主要的建库单位。建库经费以本部门投入为主,生物技术和材料科学领域投入情况相对较好。该领域已经形成了若干信息中心,但多数仍处于分散管理的状态。

        科技管理领域有256个数据库,数据量235.89GB。科技部在各类科技计划管理方面都建立了相关数据库,其中国家科学技术奖励获奖项目数据库数据量达50GB,其它管理方面的数据库规模都比较小,大多在1GB以下。建库经费一般是本部门或本单位自行投入,数据库对外共享服务比例仅占21.09%,但科技部的共享比例高一些。 

        专家点评

        刘闯 研究员(中国科学院地理科学与资源研究所全球变化信息研究中心主任、国际科学联合会世界数据中心规划组委员):

我认为对这份调查报告是实事求是的。虽然在调查的数据中,估计不同单位上报的数据库存在一些重复统计的情况,但是总的情况是可信的。

        我们国家科学数据共享有了一个开头,这已经是很不容易了。但是,目前有4个问题很突出:其一,科学数据管理与共享方面的投入产出比过高;其二,共享的问题依旧没有从根本上打开局面;其三,市场的应用面太小;其四,国际数据资源开发不够。总之一句话,科学数据的综合效益水平目前还很低。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号