吴云东课题组在NAR上发表WDSPdb数据库
文/胡学佳
WD40重复蛋白家族是真核生物中最大的蛋白家族之一,在人类基因组中,编码WD40重复蛋白的基因大约占1%。WD40蛋白通过与多个蛋白质、DNA或者RNA相互作用,从而组装成不同的复合体。这些复合体调控着多种多样的重要生物学功能,如DNA损伤修复、DNA复制、组蛋白甲基化位点识别、磷酸化位点识别、泛素化底物识别、细胞凋亡小体的组装、囊泡的形成、细胞信号转导、核小孔的形成等,并且该类蛋白上许多突变位点被证明与多种人类疾病有关。
由此可见,WD40重复蛋白家族不仅数量庞大,而且在众多生物学功能中扮演十分重要的角色,但是由于WD40重复蛋白实验研究的困难,关于这个家族蛋白的研究还处于起步阶段。在2013年,吴云东课题组的王飏同学曾开发出一个专门用于WD40蛋白预测的高精确度的软件——WDSP,供领域内同行使用。为了进行系统而全面的分析和更好的服务于该领域,课题组的王飏同学、胡学佳同学、邹旭东同学等人进一步构建了一个WD40重复蛋白专门的数据库——WDSPdb (http://wu.scbb.pkusz.edu.cn/wdsp/)。通过对WD40重复蛋白的系统性识别,预测其二级、三级结构,以及可能的在蛋白相互作用中行使关键作用的热点氨基酸,并整合其他数据库的信息,该数据库最终包含来自3383个物种的共63211个WD40重复蛋白。通过建立一个便捷的数据库网站,研究人员可以十分便捷地查询或下载WD40重复蛋白的已经预测好的二级结构、3D结构,并同时可以查询到其可能的热点氨基酸信息、其他数据库对此蛋白的注释信息,而且还可以对3D结构进行旋转、移动、缩放等操作。目前,这个工作已经发表在Nucleic Acids Research上:Wang, Y., Hu, X.J., Zou, X.D., Wu, X.H., Ye, Z.Q. and Wu, Y.D. (2015) WDSPdb: a database for WD40-repeat proteins. Nucleic Acids Res, 43, D339-344.(全文链接:http://nar.oxfordjournals.org/content/43/D1/D339.long) WDSPdb数据库为WD40重复蛋白的研究提供了一个很好的平台,将会大大推动该类蛋白的研究。
本工作受到了国家自然科学基金委和深圳科技创新委的资助。