在线的基因注释资源对于基因组数据的分析来说必不可少。然而,这些在线资源非常分散,研究人员想要了解每个候选基因,通常要访问N个网站。近日,美国诺华研究基金会基因组学研究院的研究人员在《Genome Biology》上发表了一篇
论文,描述了一个统筹和查询基因注释的新资源。这个新资源名为BioGPS,汇集了现有的
遗传资源。
BioGPS的地址为
http://biogps.gnf.org,,它是免费的,让研究人员能自由搜索目的基因的注释。它的开发满足了科研和商业机构的需要。诺华研究基金会计算生物学的资深研究员Andrew Su表示,BioGPS中最突出的两个元素分别是开放的插件界面和自定义的用户界面。
Andrew Su谈到:“假如你现在做了一些图谱分析的实验,像芯片、新一代测序等,发现了10个候选基因。你会如何去了解这些基因?目前有数百个公共的基因资源,许多机构也有内部的数据库,包含了专有的基因注释信息。如何在一个程序和界面下汇集这些分散数据库中的数据?BioGPS的出现,解决了这个难题。”
BioGPS基因注释数据库包含了公共资源的信息以及诺华研究部门所生成的数据。在搜索界面上,研究人员可根据大部分公共符号或Accession Number来寻找基因。BioGPS利用了一个HTML语言的简单插件界面,让大部分以基因为中心的外部数据库包括在内,任何注册的用户也可以自行添加插件。目前,BioGPS拥有269个插件,跨越100个域名。
研究人员还能够自定义页面,以突出显示最常用的资源。大部分以基因为中心的数据库告诉用户,他们应当了解目的基因。BioGPS则相反,它让用户自行组合和安排插件的布局,让每位用户定义他们认为最有用的信息。(生物通 余亮)
作者: