科研动态

华南植物园合作完成首个三倍体栽培香蕉T2T参考基因组发布

  • 香蕉是当今世界产量最高的水果,是热带、亚热带地区的主要粮食作物之一。栽培香蕉起源复杂,基因组杂合度高、分型困难,导致其基因组研究相对落后于其它栽培作物。三倍体香蕉是全球栽培香蕉的主力军,其中Cavendish香蕉(AAA)因为易于运输而被大量栽种,其产量约占据香蕉市场的50%。Cavendish香蕉高质量分型基因组的组装和注释将有助于深刻理解栽培香蕉的起源和驯化历史,为香蕉种质资源的遗传评价和种质创新奠定坚实基础。

    2023年8月,Horticulture Research在线发表了中国科学院华南植物园、热带作物生物育种全国实验室-中国农业科学院深圳农业基因组研究所和广西民族大学合作完成的题为“Telomere-to-telomere haplotype-resolved reference genome reveals subgenome divergence and disease resistance in triploid Cavendish banana”的研究论文。这是首次报道三倍体栽培香蕉的高质量分型参考基因组,是继2012年首个野生芭蕉基因组草图发表后,香蕉基因组学领域中又一里程碑事件。

    801070555-1.png

    图1. 巴西蕉

    该研究使用PacBio HiFi、ONT ultra-long和Hi-C测序数据,对巴西蕉(Cavendish的一个高产和优质品种)进行了从端粒到端粒(telomere-to-telomere,T2T)且区分单倍型的从头组装(图2A、2B)。三个组装的单倍型基因组的大小分别为477.16 Mb、477.18 Mb和469.57 Mb,基因组总大小为1.42Gb。分别识别到19、17和17个端粒,除2号和10号染色体外均存在无端粒缺失染色体。经过补洞后全基因组仅在BXJ2上存在2个gap。BXJ1、BXJ2和BXJ3组装BUSCO评估分别为97.40%,97.80%和93.80%(图2E)。BXJ1注释了37,185个蛋白编码基因,重复序列比例为53.76%。BXJ2注释了37,241个蛋白编码基因基因,重复序列比例为54.14%。BXJ3注释了37,178个蛋白编码基因,重复序列比例为55.13%。

    801070555-2.png

    图2. 巴西蕉基因组特征。

    巴西蕉虽然具有单系起源,但三套亚基因组间显示出较大的差异,序列共线性水平较低(图2F)。此外,在不同亚基因组的不同染色体上,发现存在部分明显的易位,主要集中于1号、4号和7号染色体。随后,作者对基因家族扩张收缩历史进行模拟,发现与果实品质及风味相关的基因家族发生了显著的扩张,包括蔗糖/二糖/寡糖代谢通路、淀粉代谢通路以及芳香物质合成相关通路。另一部分显著扩张的基因家族则富集到花粉发育通路,这可能和巴西蕉的单性结实和不育相关。作者进一步对巴西蕉全基因组的抗性基因进行筛选,发现相对野生芭蕉,巴西蕉中存在更少的抗性基因,特别是在3号以及10号染色体上的基因簇。长期以来,枯萎病严重威胁香蕉生长,作者发现3号抗性基因簇所在的区间正好位于此前报道的野生芭蕉抵抗枯萎病的QTL上,反映更少的抗性基因可能与巴西蕉易感枯萎病相关(图3)。此外,作者首次在香蕉中解析了多倍体亚基因组的差异表达模式,发现亚基因组间呈现高度差异表达,进一步印证了巴西蕉亚基因组之间的分化。三倍体香蕉基因组的成功解析为香蕉遗传学和育种提供了重要资源。

    801070555-3.png

    图3. NLR抗性位点在小果野蕉(MAv4)和巴西蕉基因组上的分布。

    中国科学院华南植物园副研究员\硕士生指导教师黄慧润、中国科学院大学2021级硕士研究生刘鑫以及热带作物生物育种全国实验室-中国农业科学院深圳基因组研究所博士研究生Rida Arshad为论文共同第一作者。热带作物生物育种全国实验室-中国农业科学院深圳基因组研究所博士研究生王旭和广西民族大学李伟明副研究员参与了该项研究工作。中国科学院华南植物园葛学军研究员和热带作物生物育种全国实验室-中国农业科学院深圳基因组研究所周永锋研究员为论文通讯作者。该研究得到了国家自然科学基金(32070237,31261140366)以及中国科学院先导战略专项(XDB31000000)资助支持。

    文章链接:https://doi.org/10.1093/hr/uhad153

    责编 : 脱畅