综合新闻
陈立宏博士等在《Nucleic Acids Research》杂志在线发表最新一版“病原菌致病因子数据库”
病原菌致病因子数据库(简称VFDB,http://www.mgc.ac.cn/VFs/)由我所陈立宏博士和杨剑研究员等于2004年建立(Chen L et al, Nucleic Acids Res. 2005)并长期维护,经过十多年的不断升级和更新已经逐步发展成为国际上最大的病原细菌毒力因子资源中心,被国内外同行广泛使用。
近年来新一代测序技术带来的生物大数据对病原菌毒力因子相关的数据分析提出了新的挑战。为了满足日益增长的大数据分析需求,陈立宏博士等进一步对VFDB的基础数据进行了整合与优化,一方面改进了底层的数据结构,去除了冗余数据,整理生成由已知毒力因子构成的核心数据集和包括所有潜在毒力因子的完整数据集。另一方面对核心数据集中的所有毒力相关基因的注释信息进行了审核与精炼,提高了VFDB数据库的数据质量。此外,还在VFDB数据库中新增加了不动杆菌、气单胞菌、无形体、伯克氏菌、柯克斯氏体、立克次氏体等六个属的信息和数据,并引入了一个全新的基于JavaScript的图形化用户界面。
该研究工作不仅进一步优化和完善了VFDB数据库,为其后续的发展奠定了基础;而且产生出了适用于大数据快速分析的高质量非冗余毒力因子数据集,为VFDB数据库在大数据时代的广泛应用铺平了道路。该研究论文已收编在生物信息学领域国际著名期刊《Nucleic Acids Research》2016年数据库专刊,并于近期在线发表。