中新社昆明11月12日电 (记者 胡远航)旨在构建全球现生约10500种鸟类基因组图谱的“万种鸟类基因组计划”取得新进展。研究团队已成功发表363种鸟类基因组数据,同时通过这一数据建立全新的无参考序列下多基因组比对和分析的新方法,并基于这一新方法阐明高密度物种取样对生物多样性研究的重要性。
这是记者12日从中国科学院昆明动物研究所获悉的消息。当日,该所研究员张国捷及其团队联合深圳华大生命科学研究院、丹麦哥本哈根大学等多家机构,在国际顶级期刊《Nature》上以封面形式同期发表两篇文章,报道“万种鸟类基因组计划”第二阶段科级别的最新研究成果。
据介绍,科研团队从现存鸟类的各个科级别中选取代表性鸟类物种,共计获得363种鸟类的全基因组数据,覆盖92%的科级别。其中267个物种的基因组数据为首次发布。项目所使用的样品主要来源于全球多个博物馆所保存的鸟类组织样品,包括一些稀有和濒危鸟类物种。
区别于传统的比较基因组学分析依赖于某个基因组作为参考序列建立全基因组比对,研究团队建立全新的无参考序列下多基因组比对和分析方法。该方法极大地提高跨物种的比对效率,减少由于与参考物种遗传距离差异引起的比对偏好和序列丢失。例如,363只鸟类基因组构建的全基因组比对序列总长为981Mb,比之前以鸡和斑胸草雀为参考基因组构建的48只鸟类全基因组比对序列在长度上提升149%。
无参的全基因组比对数据集,为全面解析鸟类遗传多样性特征的演化历程和分子遗传机制提供全新的切入点。研究团队借助这一算法的优势,建立更加完善的同源基因集合,还开发一套鉴定任意演化分支特异获得和丢失序列的方法,从而完整描绘出鸟类物种谱系基因组动态演化图谱。
研究发现,这些动态变化的基因组区域往往存在一些分支特异基因或调控元件,可能与物种特异性状的起源和演化有关。(完) 【编辑:田博群】