Literature
Home医药经济生物技术技术要闻

生物科学数据的公开与共享成为发展新趋势

来源:华大基因
摘要:随着生物技术的飞速发展,各科研机构建立的数据库也越来越多。如何有效地处理海量数据,如何更好地利用现有数据资源等问题已日益成为许多科研人员所面临的问题。为了促进各种生物科学数据资源的标准化及加强数据交流与共享,来自全球30多家科研机构的50多名研究人员,在牛津大学的带领下,共同建立了一种将生物学各领域产......

点击显示 收起

    随着生物技术的飞速发展,各科研机构建立的数据库也越来越多。如何有效地处理海量数据,如何更好地利用现有数据资源等问题已日益成为许多科研人员所面临的问题。为了促进各种生物科学数据资源的标准化及加强数据交流与共享,来自全球30多家科研机构的50多名研究人员,在牛津大学的带领下,共同建立了一种将生物学各领域产生的大量科学数据进行管理、整合及共享的标准——ISA Commons(http://www.isacommons.org/,)。该项目进展已于2012年1月27日以评论文章在国际著名杂志《自然-遗传学》(Nature Genetics)上在线发表。

    一种有效的数据共享机制可以使数据资源实现最大可能的合理利用,同时可以更好的避免研究中大量实验和数据的重复,从而最大程度的避免资源浪费。但有些学者对数据共享仍有疑虑,如对于一些长期的科研项目而言,阶段性成果的数据共享也极易使抄袭者有机可乘,对经验不足的年轻科学家来讲这种风险尤其明显。尽管存在一些问题,生物科学数据共享还是势在必行,数据库共享将给未来生物学带来巨大的推动作用。

    文章中提到,建立共同的数据标准是非常有必要的。科学研究产生的大量数据和技术正如海啸般猛烈地冲洗着当前的科学,伴随着许多新技术产生的同时,对这些信息的描述也多种多样,目前世界上诸多学科都拥有成熟的数据库,但是没有对入库数据进行统一标准化,因此其作用大打折扣。

    作为该项目参与单位之一的华大基因一直在为实现全球科研数据共享而努力。由华大基因和BioMed Central(简称BMC,生物医学中心)共同主办的《GigaScience》杂志将成为第一个为科研人员提供可选择使用ISA-commons格式提交数据的杂志,数据库中的信息也将以最快的速度向全球的科研人员公布。

    《GigaScience》杂志执行编辑Scott Edmunds表示:“GigaScience数据库中将会包含各种不同类型的‘大数据’,其中所面临的最重要的问题就是如何对这些不同格式的数据进行处理。ISA则具有对多种数据类型的支持能力和新配置的创新能力,将对解决这一重要问题发挥十分重要的作用。”

    高性能计算机已经为海量数据产出的研究带来了革新,《GigaScience》杂志集数据管理、分享及引用于一体,为存储数据的公开及分析提供有利的条件,同时也必将会促进数据的传播与使用。运用华大基因高效能计算平台以及专业生物信息分析,文献与数据库相结合的新形式将会促进数据的透明性和再现性,挖掘数据可利用的最大潜力。在2011年的德国致病性大肠杆菌爆发事件中,华大基因和德国汉堡-埃普多夫大学医学中心的研究人员完成对致病菌的基因组测序后向全球免费公开所有数据,使得整个科学界在第一时间共享了相关信息,这明确证实了数据免费、快速发布的重要性。

作者: 2012-2-16
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具