洋金花与木本曼陀罗叶绿体基因组特征与系统进化分析
原标题:洋金花与木本曼陀罗叶绿体基因组特征与系统进化分析
药用植物洋金花Datura metelL.来源于茄科(Solanaceae)曼陀罗属DaturaL.,为一年生草本[1],在《中国药典》2020年版中以干燥花入药,中药材名为洋金花Daturae Flos[2]。洋金花有效成分为东莨菪碱,临床具有平喘止咳、解痉定痛的功效。用于哮喘咳嗽、皖腹冷痛、风湿痹痛、小儿慢惊及外科麻醉[2]。木本曼陀罗Brugmansia arborea (L.) Lagerh.隶属于木曼陀罗属Brugmansia L.,原产于南美洲,我国引入栽培。《中国植物志》将木曼陀罗属作为一个组放在曼陀罗属[1],2者系统发育关系一直存在争议。近年来,基于分子条形码序列的系统发育结果支持木曼陀罗属为一个独立的属[3]。曼陀罗属植物在我国分布范围广,生态适应幅度大,导致该属植物在形态上产生很多变异,种内的遗传变异十分显著,且该属植物花部特 征相似,不易区分[4],形态鉴别困难。中药材洋金花常见的伪品来源于其近缘种曼陀罗D. stramoniumL.和毛曼陀罗D. innoxiaMiller的花[5]。此外木本曼陀罗B. arborea (L.) Lagerh.的花东莨菪碱含量较高,也常被误用作洋金花使用[4],严重影响洋金花中医临床用药安全。近年来,有关洋金花的研究主要集中在化学成分分析和药理学研究等方面[6-7],药用植物洋金花和木本曼陀罗的叶绿体基因组组装、特征和系统进化分析未见报道。
叶绿体是植物最重要的细胞器之一,具有一整套用于光合作用、能量代谢、蛋白质合成及氮、硫同化相关的基因,分布在大小为120~180 kb的环状基因组上,具有结构保守、母性遗传等特点[8-9]。叶绿体基因组一般为闭环双链DNA结构,陆生植物的叶绿体基因组结构通常由1个大单拷贝区域(large single copy,LSC)、1个短单拷贝区域(small single copy,SSC)和2个反向重复区域(inverted repeat,IR)组成[10]。叶绿体基因组拥有相对独立的基因组和遗传序列,并且不像核基因组一般有着复杂的重复序列,其基因序列保守,间隔区变异位点丰富,适宜的进化速率能够为植物不同等级的亲缘关系,系统进化关系及遗传多样性研究提供较为可靠的信息[10]。
随着测序技术的不断改进,测序平台的不断升级,一系列组装和注释软件如plasmid SPAdes [11]、NOVOPlasty [12]、GetOrganelle [13]等的开发与更新,多种重要的药用植物叶绿体基因组已完成测序和分析,如人参Panax ginseng C. A. Meyer [14]、红豆杉Taxus wallichianavar. chinensis (Pilger) Florin [15]、三七Panax notoginseng ( Burkill) F. H. Chen ex C. Chow & W. G. Huang.[16]、铁皮石斛Dendrobium officinaleKimura et Migo [17]、地黄Rehmannia glutinosa (Gaert.) Libosch. ex Fisch. et Mey. [18]、射干Belamcanda chinensis ( L.) Redouté[19]、连翘Forsythia suspensa (Thunb.) Vahl [20]等的叶绿体全基因组序列的分析已有相关报道。本研究以洋金花和木本曼陀罗为材料,利用高通量测序方法测定其基因组DNA序列,并对其叶绿体基因组进行组装和注释。分析药用植物洋金花和木本曼陀罗叶绿体基因组序列特征,IR边界特征,间隔区信息位点变异的特征,并对洋金花和木本曼陀罗及其近缘物种共22种(25个样品)植物的叶绿体基因组序列进行系统发育分析,验证其系统的位置,探讨曼陀罗属与木曼陀罗属的系统关系。为药用植物洋金花及其近缘物种的种质资源的鉴定、群体遗传学和遗传多样性研究奠定基础。
1 材料与方法
1.1 材料
洋金花和木本曼陀罗新鲜叶片釆集于广西壮族自治区药用植物园(22°50′47.14′′N, 108°19′30.06′′E),凭证标本号为XZ-2020-17和XZ-2020-16。叶片用硅胶干燥后,装入取样袋带回实验室,置于−80 ℃冰箱备用。样品由河南农业大学农学院中药材系高致明教授和夏至教授鉴定为茄科植物洋金花D. metelL.和木本曼陀罗B. arborea (L.) Lagerh.,凭证标本保存于河南农业大学标本馆,NCBI的GenBank登录号为OK040953和OK040952。其近缘物种叶绿体基因组序列来源于NCBI数据库,实验材料详细信息见表1。
1.2 DNA 的提取和高通量测序
采用植物DNA提取试剂盒(天根生化科技有限公司)提取样品干燥新鲜叶片的总DNA,利用1%的琼脂糖凝胶电泳检测DNA完整性。样品送至华大生物科技公司后,进行NanoDrop 2000微量分光光度计(美国Thermo Scientific公司)检测总DNA的纯度和浓度。MGISEQ-2000 PE150测序平台测 序,测序完成后,利用华大自主开发的过滤软件SOAPnuke过滤参数。(1)过滤接头:测序read匹配上adapter序列的25%或者以上 则删除整条read;(2)过滤低质量数据:如果测序read中质量值低 于20的碱基占整条read的30%或者以上 则删除整条read;(3)去N:如果测序read中N含量占整条read的1%或者以上,则删除整条read;(4)获得clean reads。数据以FASTQ格式储存,用于后续的拼接和注释。
1.3 叶绿体基因组的组装和注释
叶绿体基因组的拼接釆用NOVOPlasty-master [12]程序,插入片段大小设为150 bp。过滤后的reads用Geneious 11.0.3 [21]拼接软件组装成重叠群,并对组装中的简并碱基,进行人工修正。利用Geneq-Annotation of Organellar(https:// chlorobox.mpimp golm.mpg.de/geseq.html),结合NCBI上已报道的曼陀罗D. stramoniumL.(GenBank登录号NC_018117)注释结果对洋金花和木本曼陀罗叶绿体全基因组进行基因注释,参数为默认值,最后进行手动调整。tRNA用ANAGORNV1.2.38(https://chlorobox.mpimp golm. mpg.de/geseq.html)预测。注释完成后,提交到NCBI数据库(https://www.ncbi.nlm.nih.gov/ genbank/),GenBank登录号为OK040953和OK040952。利用在线工具OGDRAW-DRAW Organelle Genome Maps(https://chlorobox.mpimp-golm.mpg.de/ OGDraw. html)绘制叶绿体结构图。
1.4 叶绿体基因组IR边界的收缩和扩张分析
IR区域在叶绿体基因中具有高度保守性,IR边界的膨胀和收缩被认为是被子植物叶绿体全基因组大小变化的主要机制[20]。其中被子植物叶绿体基因组长度为120~180 kb。在植物进化过程中,IR/SC边界不同程度的扩张和收缩是导致边界和基因组长度多样性的原因[22]。本研究使用Geneious 11.0.3 [21]软件获得茄科10个属11种药用植物叶绿体基因组的IRa/IRb、LSC和SSC和边界基因的序列长度,进行比较分析,探讨茄科植物叶绿体基因组IR边界的收缩和扩张特征。并使用Adobe illustrator软件绘制11种茄科植物叶绿体基因组IR边界对比图。
1.5 叶绿体基因组基因间隔区信息位点分析
在近缘物种中叶绿体基因间隔区往往比叶绿体基因编码区具有更高的变异位点,常被用来分析属间、属内种间物种亲缘关系和系统发育关系。本研究基于茄科10个属22种植物的叶绿体基因组序列特征,利用Geneious 11.0.3 [21]的MAFFT [23]功能进行多重比较,导出Fasta格式文件,后用Phylosuite vl.2.1 [24]提取22个物种叶绿体基因组32个共有的间隔区,统计这些间隔区的信息位点百分率,为下一步构建茄科物种系统进化关系提供分子标记。
1.6 系统发育分析
基于本研究新报道的洋金花和木本曼陀罗的叶绿体基因组,同时选取NCBI已报道的茄科物种叶绿体基因组共22个(25个样品),以近缘的旋花科(Convolvulaceae)植物蕹菜Ipomoea aquatica Forsk为外类群(表1)。利用Phylosuite vl.2.1 [24]软件基于MAFFT [23]参数设置进行多重比对。系统发育分析采用最大似然法(maximum likelihood,ML),利用CIPRES Science Gateway服务器(http://www. phylo.org/)中RAxML(version 8.2)软件[25]构建系统发育树。利用Bootstrap(BS,1000次重复)检验各分支的支持率。系统发育树导出后利用FigTree version 1.4.2进行查看。
2结果与分析
2.1 洋金花和木本曼陀罗叶绿体基因组的结构特征
测序结果去除接头和低质量的数据后,组装和注释后得到洋金花和木本曼陀罗的完整叶绿体基因组。结果表明,洋金花和木本曼陀罗叶绿体基因组均为共价闭合的双链环状分子(图1)。洋金花和木本曼陀罗的叶绿体全基因组长度分别为155 934 bp(表2)和155 939 bp(表2),其中LSC长度分别为86 354 bp和86 278 bp,SSC分别为18 362 bp和18 221 bp,二者的2个IR长度分别为25 609 bp和25 720 bp。洋金花和木本曼陀罗的叶绿体全基因组中GC含量分别为37.9%、37.8%。在LSC区域中GC含量皆为35.9%,SSC区域中GC含量分别为32.3%和32.1%,IRs区域中GC含量相同,皆为43.1%。洋金花和木本曼陀罗的叶绿体全基因组分别注释131和130个基因,洋金花包括85个蛋白编码基因(protein coding genes,PCGs),38个tRNA以及8个rRNA,其中LSC区完全包含58个PCGs和23个tRNA,SSC区包含11个PCGs和1个tRNA,IRs区域内包含11个PCGs和14个tRNA以及全部(8个)的rRNA,另外rps12、rps19、Ycf1基因分别横跨LSC/IRb、LSC/IRb、IRb/SSC和SSC/IRa边界。而木本曼陀罗包括85个PCGs,37个tRNA以及8个rRNA,其中LSC区完全包含58个PCGs和22个tRNA,SSC区包含10个PCGs和1个tRNA,IRs区域内包含12个PCGs和14个tRNA以及全部(8个)的rRNA,另外rps19、rps12、Ycf1、ndhF基因分别横跨LSC/IRb、LSC/IRb、IRb/SSC和SSC/IRa、IRb/SSC边界。详细信息见表2。
2.2 洋金花和木本曼陀罗叶绿体基因组的组成和特征分析
洋金花叶绿体基因组共包括131个基因,非重复基因113个,其中85个PCGs、8个rRNA基因与38个tRNA基因。其中,PCGs中与自我复制相关基因除rRNA基因和tRNA基因外(表3),还包括13个核糖体小亚基基因、11个核糖体大亚基基因和4个RNA聚合酶亚基基因;光合作用相关的基因有45个,包括12个NADH脱氢酶基因、5个光系统I基因、14个光系统II基因、6个细胞色素复合物编码基因、6个ATP合酶基因、1个二磷酸核酮糖羧化酶大亚基基因和1个依赖ATP的蛋白酶单元p基因;此外还有4个其他功能基因及8个未知功能基因。在tRNA中trnI-CAU、trnL-CAA、trnV-GAC、trnI-GAU、trnA-UGC、trnR-ACG、trnN-GUU各有2个拷贝;4个rRNA均有2个拷贝,分别位于反向重复区IRa和IRb。核糖体蛋白大小亚基编码的基因中,rps7、rpl2、和rpl23这3个基因均有2个拷贝,其余为1个拷贝。NADH脱氢酶亚基中的ndhB基因及未知功能蛋白基因Ycf2和Ycf1的拷贝数均为2。内含子在基因表达调控中发挥重要作用,洋金花叶绿体基因组中有15个基因有内含子。其中,trnK-UUU、trnG-GCC、trnL-UAA、trnV-UAC、trnI-GAU、trnA-UGC、rpsl6、rpl2、rpl16、rpoCl、ndhA、ndhB、petB、petD、atpF各有1个内含子,而clpP、ycf3具2个内含子。matK基因位于tmK-UUU基因内,整个编码区为trnK-UUU内含子的一部分,存在序列共用现象;psbD基因的3′端与psbC基因的5′端,atpE基因的3′端与atpB基因的5′端、rps3的3′端与rpl22的5′端重叠。木本曼陀罗和洋金花相比在tRNA上缺少了trnP-GGG,其他基因组成与洋金花一致。
2.3茄科部分物种叶绿体全基因组特征比较分析
茄科植物叶绿体基因组特征的比较分析见表4,洋金花和木本曼陀罗及其近缘物种(共22个物种)叶绿体基因组的序列长度范围介于155 004~157 390 bp, 其中,黑果枸杞的叶绿体全基因组长度最短(155 004 bp),绒毛辣椒的叶绿体基因组最长(157 390 bp)。洋金花的叶绿体基因组长度为155 934 bp,木本曼陀罗的叶绿体基因组长度为155 939 bp,位于茄科其他20个物种的叶绿体基因组长度范围之内。洋金花和木本曼陀罗及其近缘物种(共22个物种)叶绿体基因组GC含量的范围为37.6%~37.9%,山莨菪的GC含量最低(37.6%),洋金花的GC值最高为37.9%,而木本曼陀罗GC含量为37.8%。利用Geneious 11.0.3软件获取洋金花和木本曼陀罗及其近缘物种(共22个物种)叶绿体基因组的IR、LSC和SSC区序 列。结果表明,IR区的序列长度范围介于25 342~25 904 bp,其中Nicotiana sylvestris的IR区最短(25 342 bp),颠茄的IR区最长(25 904 bp),洋金花的IR区的长度为25 609 bp,木本曼陀罗的IR区的长度为25 720 bp,2者均位于茄科其他20个物种IR区长度范围之内。LSC区序列长度范围介于85 737~87 688 bp, 其中洋芋的LSC区长度最短(85 737 bp),绒毛辣椒的LSC区长度最长(87 688 bp),洋金花的LSC区的长度为86 354 bp,木本曼陀罗的LSC长度为86 278 bp,都介于茄科其他20个物种LSC区长度范围之内。SSC区序列长度范围介于17 487~18 642 bp,其中山莨菪的SSC区最短(17 487 bp),Petunia exserta的SSC区最长(18 642 bp),洋金花SSC区长度为18 362 bp,木本曼陀罗SSC区长度为18 221 bp,二者介于茄科其他20个物种SSC区长度范围之内。
2.4 茄科10个属11个物种叶绿体全基因组边界的特征
选取茄科10个属11个物种的叶绿体全基因组,比较分析洋金花和木本曼陀罗叶绿体基因组与茄科其他物种在进化过程中IR/SC边界的扩张和收缩情况(图2)。茄科10个属11个物种叶绿体全基因组的IR-LSC和IR-SSC边界比较显示,IR/SC边界具有高度的保守性,其LSC/IRb边界(JLB),SSC/IRb边界(JSB)、SSC/IRa边界(JSA)和LSC/IRa边界(JLA)的侧翼基因完全相同,但边界基因的扩张程度存在一定的差异。茄科11个物种中,9个物种JLB边界全部位于rps19基因内,其中洋金花和木本曼陀罗的JLB边界扩张范围,位于9个物种之内。但烟草和碧冬茄的rps19基因却全部位于LSC区域,距JLB边界有5 bp。JSB边界扩张范围显示,茄科物种的侧翼基因完全相同,均为ndhF和Ycf1基因,洋金花和木本曼陀罗的SSC/IRb边界(JSB)与洋芋,辣椒和曼陀罗一致,存在ndhF基因于Ycf1基因重叠现象。JSA边界的扩张范围显示,SSC和IRa区域基因完全相同,均为Ycf1基因,Ycf1基因在IRa区长度范围为995~1440 bp,在SSC区长度范 围为4205~4726 bp。其中洋金花和木本曼托罗的Ycf1基因在SSC区域为4527 bp和4422 bp,在IRa区域为1101 bp和1049 bp,位于茄科11个物种JSA边界扩张范围之内。JLA边界扩张范围显示,其侧翼基因完全相同,均为rpl2(位于IRa区)和trnH(位于LSC区)2个基因。其中11个物种的rpl2和trnH2个基因距JLA边界碱基长度范围变异不大,分别为56~166 bp和4~30 bp。洋金花和木本曼陀罗的rpl2和trnH2个基因距JLA边界的序列长度为136、124 bp和8、7 bp,位于11个物种JLA边界扩张范围之内。
2.5 茄科叶绿体基因组基因间隔区信息位点分析
根据茄科10个属22种植物的32个叶绿体基因组间隔区信息序列特征统计结果(表5),在32个共同的叶绿体基因间隔区中,变异位点百分率变化范围为3.49%~18.70%,最高的为trnH-GUG-psbA基因间隔区,其变异位点百分率为18.70%。信息位点超过10%的基因间隔区有11个,分别为ndhC-trnV-UAC、ndhE-ndhG、petA-psbJ、rbcL-accD、rps2-rpoC2、rps4-trnT-UGU、rps16-trnQ-UUG、trnL-UAA-trnF-GAA、trnS-GCU-trnG-GCC、psaC-trnS-UGA、trnH-GUG-psbA。这些变异位点百分率较高的叶绿体基因间隔区,能提供足够多的信息位点,为茄科属间和种间物种进化关系及分子鉴定提供较高的分辨率。
2.6系统发育分析
选取洋金花和木本曼陀罗及其近缘物种共22种(25个样品)叶绿体全基因组进行系统发育树的构建,以旋花科植物蕹菜I. aquaticaForsk作为外类群,利用ML法构建系统发育树(图3)。结果显示取样茄属、辣椒属、枸杞属、曼陀罗属、烟草属、碧冬茄属的单系性都得到100%支持。24个分枝节点中有22个的支持率都为100%,另外2个为98%和99%,聚类结果较为可靠。洋金花和曼陀罗以100%支持率聚在一起,它们所在的曼陀罗属与木曼陀罗属聚在1支,且有100%的支持率。
3 讨论
中药材洋金花作为我国药典收载的药材之一,与其近缘物种木本曼陀罗均富含东莨菪碱,具有重要的药用和经济价值。本研究完成了药用植物洋金花和木本曼陀罗的叶绿体基因组的测序,组装与注释。结果表明,药用植物洋金花和木本曼陀罗的叶绿体基因组,均具有典型的4分区域结构(图1),包括1个LSC区、1对IR区和1个SSC区,长度分别为155 934 bp和155 939 bp。其叶绿体基因组长度位于茄科其他20个物种叶绿体基因组长度范围之内。洋金花和木本曼陀罗的叶绿体全基因组分别包含131和130个基因,洋金花包括85个PCGs,38个tRNA以及8个rRNA,木本曼陀罗和洋金花相比,在tRNA上缺少了trnP-GGG基因,其余基因组成一样。
基于茄科10个属11个物种的叶绿体全基因组IR边界比较分析(图2),洋金花和木本曼陀罗与茄科其他8个属植物的叶绿体基因组IR边界均具有高度的保守性。其LSC/IRb边界(JLB),SSC/IRa边界(JSA)和LSC/IRa边界(JLA)的侧翼基因完全相同,但边界侧翼基因的扩张序列长度存在差异,洋金花和木本曼陀罗的上述边界侧翼基因扩张范围,均为于茄科物种叶绿体基因组IR边界的扩张范围之内。洋金花和木本曼陀罗的SSC/IRb边界(JSB)与洋芋、辣椒和曼陀罗一致,存在ndhF基因于Ycf1基因重叠现象。ndhF基因与Ycf1基因重叠现象同样也出现在龙胆科药用植物叶绿体基因组[26]。IR边界比较分析结果表明洋金花和木本曼陀罗与茄科其他物种的叶绿体全基因组具有较高保守性,叶绿体基因组适合用来解决茄科属级以上分类等级的系统发育关系。
基于茄科10个属22种植物的32个叶绿体基因组间隔区信息序列特征统计表明(表5),茄科的叶绿体基因组编码区较为保守,在32个共同的叶绿体基因间隔区中,变异位点百分率变化范围为3.49%~18.70%,变异位点百分率最高的为trnH-GUG-psbA基因间隔区,其变异位点百分率为18.70%。本研究结果支持韩建萍等[3]结果,支持trnH-GUG-psbA基因间隔区作为药用植物洋金花与其伪品的DNA条形码序列。此外,信息位点超过10%的叶绿体基因间隔区有11个,分别为ndhC-trnV-UAC、ndhE-ndhG、petA-psbJ、rbcL-accD、rps2-rpoC2、rps4-trnT-UGU、rps16-trnQ-UUG、trnL-UAA-trnF-GAA、trnS-GCU-trnG-GCC、psaC-trnS-UGA、trnH-GUG-psbA。这些基因间隔区在茄科的属间和种间提供了丰富的信息位点。由于叶绿体基因组在大多数被子植物中为母系遗传,重组率低,核苷酸置换率适中[27],进一步结合双亲遗传的核基因片段联合分析,为茄科植物属下物种杂交起源,多倍体物种的形成和系统进化分析提供可靠的分子标记片段。
为进一步界定药用植物洋金花和木本曼陀罗在茄科的系统位置,探讨曼陀罗属与木曼陀罗属的系统关系,基于茄科22个物种(25个样品)叶绿体基因组构建系统发育树(图3)显示,茄科各属植物均聚成有较高支持率的分枝。其中洋金花与曼陀罗构成1单系分支(支持率100%),表明药用植物洋金花隶属于曼陀罗属。木曼陀罗属(木本曼托罗为代表)与曼陀罗属(包括洋金花与曼陀罗为代表)组成1单系分支(支持率100%),二者互为姐妹群。木曼陀罗属与曼陀罗属的系统关系一直存在争议,一种认为木曼陀罗属应独立成一属,有的认为应作为曼陀罗属的一个组[1]。Persoon把曼陀罗属内具有木本特性,光滑而不规则开裂蒴果的木本曼陀罗分出,成立木曼陀罗属BrugmansiaL.[28]。《中国植物志》认为Persoon所提出的特征:光滑而不规则开裂的蒴果,在曼陀罗属的另一个组Ceratocaula中同样是存在的,因此将它作为曼陀罗属的一个组[1]。本研究的叶绿体基因组数据结果支持近年来分子系统学研究结果[3,29-30],草本的曼陀罗属和木本的木曼陀罗属是2个独立的属。木曼陀罗属具有一系列独特形态特征(近裔共性)也支持分子数据的结果,如木本的习性、俯垂的花、俯垂的浆果且表面平滑等这些形态特征与曼陀罗属有着显著的区别。
近年来,随着新一代测序技术的成本降低,基于叶绿体基因组序列作为超级条形码对物种的分子鉴定应用越来越广泛[31]。洋金花作为常用中药材之一,其商品中常混有同属有毒植物曼陀罗的花,影响临床用药安全[3-4]。本研究首次报道药用植物洋金花和木本曼陀罗的叶绿体基因组,丰富了曼陀罗属及其近缘属叶绿体基因组数据,比较分析这些近缘物种叶绿体基因组的特征和差异,为中药材洋金花的精准鉴定提供理论依据。此外,茄科植物是许多大宗蔬菜和药用植物的来源,本研究结果不仅为曼陀罗属药用植物的提供分子鉴别,也为茄科植物的分子鉴定,遗传多样性及种质资源保护研究奠定基础。
利益冲突所有作者均声明不存在利益冲突
参考文献(略)
来 源:毕光耀,丁怡宁,王 丽,胡赛文,李贺敏,雷 明,张占江,夏 至.洋金花与木本曼陀罗叶绿体基因组特征与系统进化分析 [J]. 中草药, 2022, 53(22): 7191-7200 .返回搜狐,查看更多
责任编辑: