导读生育酚(维生素E)由于其抗氧化活性在人类健康中发挥着重要作用,植物油是人类饮食中生育酚的最丰富来源。大豆(Glycine max)是世界上植物性油脂和生育酚的主要来源之一,但大豆种子中的生育酚与油脂之间的关系尚不清楚。本文旨在剖析生育酚代谢,为提高α-生育酚含量和大豆油质量提供基础。通过一个大豆群体(>800份大豆材料)的生育酚(tocopherol)和脂肪酸(fatty acid)图谱,发现在大豆驯化过程中生育酚含量增加。生育酚和油脂含量之间也有很强的正相关性。使用代谢物全基因组关联研究策略鉴定了五个生育酚合成途径相关基因座。三个生育酚合成途径基因的遗传变异通过对酶活性的影响来决定大豆群体中总生育酚的含量和组成,主要是由非保守氨基酸取代或基因转录水平的变化引起的。此外,脂肪酸调节转录因子GmZF351直接激活了生育酚合成途径基因的表达,增加了大豆种子中的脂肪酸和生育酚含量。本研究揭示了大豆群体中生育酚途径基因的功能分化,并为开发具有高α-生育酚含量和种子油质的大豆新品种提供了框架。
原名:Genome-wide scan for oil quality reveals a coregulation mechanism of tocopherols and fatty acids in soybean seeds
译名:全基因组关联分析揭示大豆种子中生育酚和脂肪酸共同调节机制
期刊:Plant Communications
IF:10.5
发表时间:2023年4月
通讯作者:王国栋、田志喜
通讯作者单位:中国科学院遗传发育所
DOI号:10.1016/j.xplc.2023.100598

1 天然大豆群体的生育酚和FA图谱
对天然大豆种群的种子样品,通过液相色谱法和二极管阵列检测(DAD)进行生育酚和脂肪酸分析。已有文献通过对50多份大豆为材料,评估了大豆驯化过程中生育酚的变化:通过5000年的驯化,大豆从地方品种最终被驯化为为改良品种。本研究对727份不同大豆的种子材料检测,其中生育酚(tocopherol)含量存在显著差异:δ-T含量在0.03至0.38μmol/g干重(DW)之间,γ-T含量在0.14至0.58μmol/g DW之间,α-T含量在0.0003至0.40μmol/gDW之间,总生育酚(total tocopherol,T-T)含量范围为0.26至0.95μmol/g DW。有趣的是,栽培品种的生育酚含量最高(0.59±0.086μmol/g DW,n=318),其次是地方品种(0.54±0.075μmol/g DW,n=358)和野大豆(0.36±0.044μmol/g RW,n=51)。在大豆驯化过程中,单个生育酚表现出与T-T相似的趋势(图2)。在2014年生长在三个地区(黑龙江省、河南省和北京)的大豆样品中,栽培品种的生育酚含量也最高(0.55±0.074μmol/g DW,n=341),其次是地方品种(0.50±0.084μmol/gDW,n=413)和野大豆(均生长在北京;0.29±0.044μmol/g-DW,n=53;总FA:345±60μmol/g DW)。此外,生育酚分析显示,生长在高纬度地区(中国黑龙江省)的大豆具有相似的T-T含量(0.53±0.071μmol/g DW,总FA:746±72μmol/g DW;n=145),其次是生长在低纬度地区的大豆(0.52±0.087μmol/g RW,总FA:709±85μmol/g DW;n=603)。
图1|简化的大豆种子中的生育酚和脂质合成途径。
图2|2013年种植的大豆群体中的生育酚和脂肪酸分析。(A) 栽培大豆(n=318)、地方品种(n=358)和野大豆(n=51)成熟种子中生育酚(δ-T、γ-T、α-T和T-T)含量。图中展示了总体的最大值、75%四分位数、中位数、25%四分位数和最小值。使用双尾t检验计算P值。(B)不同大豆类群(全部、栽培品种、地方品种和大豆)的脂肪酸(单一脂肪酸和总脂肪酸)与生育酚之间的Pearson相关性分析。星号表示使用双尾t检验计算的显著差异。(*P<0.05,**P<0.01,***P<0.001)。
2 大豆中脂肪酸与生育酚含量呈正相关
在不同地点生长的品种和地方品种大豆种群中,T-T与总脂肪酸(FA)含量呈正相关。例如,黑龙江(高纬度)和河南(低纬度)种植的大豆总FA含量不同(图2)。为了研究大豆中脂肪酸和生育酚之间的关系,分析了大豆材料的脂肪酸图谱,发现T-T和总脂肪酸之间的正相关性与栽培种品种和地方品种中观察到的正相关性相似。在芸薹属油籽和玉米种质中也观察到生育酚和FA之间的类似相关性。这些结果表明,FA和生育酚生物合成的一种可能的协同调节机制在种子植物中是保守的。值得注意的是,α-T始终与C18:3 FA呈负相关,尽管α-T具有最高的不饱和FA抗氧化活性。最近的一项研究还发现,在维生素E含量增加的代谢工程大豆种子中,C18:3 FA含量降低,总FA增加。该现象的一种可能原因是,高含量的α-T可能会抑制FA去饱和酶3的活性,该酶负责将C18:2 FA转化为C18:3 FA,但其潜在机制有待进一步研究。3 大豆种子中生育酚含量的GWAS分析
生育酚性状的GWAS分析鉴定了18个与大豆种子的单个生育酚或T-T相关的SNP位点。SNP基因座分布在11条不同的染色体上:Chr.08、Chr.09、Chr.10、Chr.12、Chr.13、Chr.14、Chr.15、Chr.16、Chr.17、Chr.18和Chr.19(图3)。根据大豆基因组的连锁不平衡阈值,利用每个SNP峰值基因座上下游100kb的区域筛选候选基因。图3所示,通过代谢GWAS策略鉴定了三个已知的生育酚生物合成基因:GmHPPD1与T-T含量相关,GmPBQ-MT1和Gmγ-TMT与生育酚组成和/或比率相关。除了这些已知的生育酚途径基因外,本研究还发现了几种可能调节生育酚生物合成的转录因子。
图3|使用来自大豆群体的2年最佳线性无偏预测数据的生育酚含量GWAS曼哈顿图。以-log10转化的P值对SNPs在20条染色体上的位置作图。显著的生育酚相关SNPs(P<1×10−8,对应于虚线阈值线)以不同的颜色标出(红色:δ-T,紫色:γ-T,绿色:α-T,蓝色:T-T)。候选生育酚生物合成基因以箭头标出。
4 大豆群体GmHPPD1和T-T的遗传变异
在Chr14上检测到最强的T-T关联信号,前导SNP基因座(2241904 bp;P=6.29×10−13)位于GmHPPD1(4-羟基苯基丙酮酸双加氧酶,Glyma14g030400,从2204142到2206726 bp)周围。GmHPPD1有两种可变剪接体:GmHPPD1.1经历正常的内含子剪接并编码490个氨基酸的多肽链,而GmHPPDF1.2不经历内含子剪接,其编码具有409个氨基酸的肽链。生化特征显示,GmHPPD1.1,在体外具有HPPD酶活性。尽管无法检测到内源性尿黑酸(HGA)(图1),但GmHPPD1.1过表达(OE)会使得毛状根中的α-T含量显著增加。因此本研究在589份大豆材料(259份栽培品种、292份地方品种和38份野大豆)的代表性群体中研究了GmHPPD1.1的序列变异。GmHPPD1.1区域有三个代表性单倍型,基于启动子区的一个SNP(包括本研究中的5′端非翻译区;-674位置,C和T)和基因区的一个SNP(编码区的+727位置,A和G)的组合,导致Pro243被Ser243取代(图4A)。Hap1型(n=200)的T-T含量高于Hap2型(n=131)和Hap3型(n=258)。此外,Pro1和CDS1(编码序列1)类型的T-T含量显著高于Pro2和CDS2类型(图4B)。在野生大豆群体中没有潜在的优势等位基因(Hap1),而在地方品种和改良品种中分别检测到34%和39%(图4B)。这些结果表明,GmHPPD1.1可能是在大豆驯化过程中受到选择。值得注意的是,尽管CDS1(Pro243)和CDS2(Ser243)蛋白之间的HPPD催化效率(Kcat/Km)没有显著差异,但CDS1的Kcat值比CDS2高约20%(46.36±3.41对37.63±1.64 s−1,n=3;图4C)。
图4|两个GmHPPD1.1 SNPs对T-T含量的单倍型效应。(A) 在GmHPPD1.1的4.6 kb基因组区域检测到单倍型。黄色和灰色分别代表外显子和非翻译区域。(B)不同单倍型群体种子中的T-T含量;野生大豆、地方品种和改良栽培品种中不同单倍型的频率如右图所示。图中所示最大值、75%四分位数、中值、25%四分位数和最小值。使用双尾t检验计算P值。(C)GmHPPD1.1和GmHPPD 1.1P243S的酶学性质。HPP,4-羟基苯基丙酮酸盐。
5 大豆群体GmPBQ-MT1和γ-T/δ-T的遗传变异
γ-T/δ-T的最强关联信号在Chr.10上检测到,前导SNP基因座(2 597 916 bp;P=1.62×10−18)位于GmPBQ-MT1附近(Glyma.10g030600,2658064-2661302 bp)。拟南芥中MPBQ-MT(At3g63410,VTE3)已被证明能够催化δ-T转化为γ-T。GmPBQ-MT1有两个内含子,编码342个氨基酸的多肽。本文在631份大豆材料(275个栽培品种,320个地方品种,36个野大豆品种)的代表群体中研究了GmPBQ-MT1的序列变异。由一个SNP(编码区+904位置,A和G)确定的GmPBQ-MT1区域有两个代表性单倍型,其导致Ser302被Pro302取代。Hap1(n=426)中的T-T和δ-T含量显著高于Hap2(n=205),这表明Pro302可能在MPBQ-MT活性中发挥重要作用。考虑到野生大豆(17%)、地方品种(62%)和改良品种(80%)中Hap1的频率,其可能在大豆驯化和改良过程中受到选择。值得注意的是,Hap1和Hap2群体之间的α-T没有显著差异,这表明GmPBQ-MT1单倍型对大豆群体内α-T含量的变化影响不大。6 大豆群体Gmγ-TMT3和α-T的遗传变异
由于α-T的维生素E活性远高于δ-T和γ-T,并且与人类健康相关,本研究重点关注了与α-T含量相关的GWAS信号。在Chr.9上检测到最强的α-T关联信号,前导SNP位点(44341827 bp;P=4.35×10−13)位于Gmγ-TMT3附近(Glyma.09g222800,44341874 - 44346311 bp)。另外两个重复的γ-TMT(Gmγ-TMT1,Glyma.12g014200,1025584 - 1029095 bp;GmγTMT2,Glyma.12g014300,1033151 - 1037054 bp)也与大豆群体中的α-T含量有关。生育酚图谱表明,α-T在包括子叶和叶片在内的绿色组织中具有最高积累量。首先在体外和植物体内对三种γ-TMT进行了表征。Gmγ-TMT2主要在叶片和子叶中表达,而Gmγ-TMT2和Gmγ-TMT3主要在发育中的种子中表达。序列分析表明,只有Gmγ-TMT2具有清晰的质体信号肽,这一点已通过亚细胞分析得到实验验证,Gmγ-TMT1和GmγTMT3是胞质溶胶蛋白。体外酶学测定显示,Gmγ-TMT3对γ-T的活性是Gmγ-TMT1和Gmγ-TMT2的三倍。这些数据表明,Gmγ-TMT3在大豆种子中α-T产生中起着重要作用,而Gmγ-TMT2在大豆的绿色组织中与α-T的产生相关。由于Gmγ-TMT3具有与α-T含量相关的高GWAS信号,并且在发育中的种子中具有相对较高的表达水平,因此对其进行深入分析。Gmγ-TMT3含有6个外显子和5个内含子,编码一个303个氨基酸的肽。本文研究了644份大豆材料(265个栽培品种、347个地方品种和32个野大豆品种)的Gmγ-TMT3序列变异。在Gmγ-TMT3的6.4kb基因组区共发现4个SNPs,包括启动子区的两个SNPs(-1709[P1,C或T]和−74bp[P2,C或A])和基因区的两个SNPs(编码区的+661bp[C1,C 或 T(T221或I221)]和编码区的+879bp[C2,A或G(S294或G294)]),共有9个单倍型(图5A)。Hap4(P2C1)材料(n=22)的平均种子α-T含量通常高于其他单倍型。对于Pro和CDS类型,P2类型材料的平均种子α-T含量显著高于P1和P3(图5B–5D)。这些结果表明,Hap4和Pro2是Gmγ-TMT3的潜在优势等位基因,可能提高大豆种子中α-T的含量。单倍型频率分析表明,与地方品种和野生大豆相比,栽培大豆品种具有更低比例的潜在优势Gmγ-TMT3等位基因。野大豆、地方品种和改良品种中Hap4的频率分别为5%、6%和1%(图5C),这表明Gmγ-TMT3在大豆驯化过程中没有受到选择。因此,这些优良等位基因可用于通过标记辅助选择来定性提高大豆品种的α-T水平。接下来,本文研究了四种CDS类型(C1 T221/S294,C2 I221/S294、C3 T221/G294和C4 I221/G294)之间酶活性的差异,其中C1和C4先前已有报道。大豆群体中罕见的单倍型C2 I221/S294和C3 T221/G294的γ-TMT活性显著低于C1和C4,这些结果通过诱变和酶分析得到了验证。这些数据支持了先前的报道,即C1和C4不是高α-T品种和低α-T品种之间α-T含量差异的原因。
图5|γ-TMT3在大豆群体中的序列和等位基因变异。(A)在Gmγ-TMT3的6.3kb基因组区域检测到单倍型。黄色和灰色分别代表外显子和非翻译区域。(B)α-T在9个不同单倍型群体的种子中的表达。图中展示了不同大豆群体的最大值、75%四分位数、中位数、25%四分位数和最小值。不同的小写字母表示利用Tukey多重比较检验确定的P<0.05水平上的统计学显著差异。(C)野大豆、地方品种和改良品种中不同单倍型的频率如左图所示。(D)不同单倍型群体种子中的α-T;野大豆、地方品种和改良品种中不同单倍型的频率如左图所示。图中展示不同大豆群体的最大值、75%四分位数、中位数、25%四分位数和最小值。使用双尾t检验计算P值。
7 GmZF351对大豆种子中生育酚和FA的协同调节作用
大豆群体中T-T和总FA之间的总体正相关表明,生育酚和FA生物合成具有共同的调节机制(图2)。由于GmHPPD1和Gmγ-TMT3启动子区的遗传变异,推测大豆群体中生育酚途径基因的表达水平与生育酚含量之间存在相关性。于是本研究在一个随机选择的小规模大豆种群中测试了这一推测。GmHPPD1和T-T之间以及Gmγ-TMT3和α-T之间检测到正相关(图6A),表明激活转录因子参与了大豆中生育酚的生物合成。迄今为止,尚未在植物中发现生育酚转录因子的功能,而在大豆中已经鉴定出参与FA生物合成的几种类型的转录因子。本文首先筛选了12种已知的FA转录因子(TF)与GmHPPD1和Gmγ-TMT3启动子的结合和激活能力。至少有三种转录因子,GmZF351(Glyma06g290100)、GmZF392(Glyma.12G205700)和GmbZIP123(Glyma.06G010200),可激活烟草中与GmHPPD1或Gmγ-TMT3启动子区结合的萤光素酶(LUC)基因(图6B)。在这三个FA 转录因子中,只有GmZF351和GmZF392在转基因大豆植株中得到了功能验证,并且这两个基因都在大豆驯化过程中受到选择。
图6|GmZF351激活大豆种子中生育酚的生物合成。(A)大豆材料中Gmγ-TMT3(左,数据来自104份材料)和GmHPPD1(右,数据来自104份材料)表达水平和生育酚含量的相关性分析。DW,干重。(B)在N.benthamiana系统中由12个已知的FA转录因子驱动的Gmγ-TMT3(左)和GmHPPD1(右)启动子的激活分析。数据以平均值±标准差(n=3)表示。*P<0.05,**P<0.01,***P<0.001(双尾t检验)。(C)GmZF351- OE大豆毛状根中α-T和四个生育酚基因(Gmγ-TMT3、GmHPT、GmHPPD1和GmPBQ-MT1)的分析。DW,干重;EV,空白对照;ND,无法检测。数据以平均值±标准差(n=4)表示。*P<0.05,**P<0.01,***P<0.001(双尾t检验)。(D)三个独立的GmZF351-OE大豆品系绿色种子中生育酚含量和四个生育酚基因的表达分析。数据以平均值±标准差(n=3)表示。*P<0.05,**P<0.01,***P<0.001(双尾t检验)。
本研究首先测试了GmZF351对大豆毛状根中生育酚生物合成的影响。在GmZF351-OE毛状根中,生育酚生物合成基因(Gmγ-TMT3、GmHPPD1、GmHPT [Glyma.17G061900]和GmPBQ-MT1)的表达水平和α-T含量均显著增加(图6C)。同时,本文分析了三个独立的GmZF351-OE稳定转基因系的绿色种子(开花后10天)中的基因表达和生育酚含量。GmZF351和GmTAG1-1在GmZF352-OE稳定转基因系的种子中都高度上调,与之前的报道一致。GmZF351-OE大豆植株种子中γ-T、δ-T、α-T和T-T的含量不同程度地显著增加(约20%-30%)(图6D),Gmγ-TMT3、GmHPT、GmHPPD1和GmPBQ-MT1的表达水平也相应上调(图6D)。其他生育酚相关基因的表达水平,包括GmTC(Glyma.04G082300)、Gmγ--TMT1和Gmγ-TMT2,在GmZF351-OE种子中也上调。这些结果表明,GmZF351-OE大豆种子中生育酚含量的增加是由生育酚生物合成基因的表达增加引起的。另外,本文研究了GmZF351激活生育酚生物合成基因表达的机制。为了确定GmZF351的特异性结合元件,分析了GmZF351结合的启动子片段。最近的一项研究确定了一段GmZF351结合序列,该序列由两个CT(G/C)(T/A)AA元件(命名为E1E2)组成,它们通常相隔约100bp。如图7A所示,在Gmγ-TMT3、GmHPT、GmPBQ-MT1和GmHPPD1的2kb启动子区域中发现了推定的GmZF351结合元件(E1E2)。使用N.benthamiana系统测试GmZF351是否直接与生育酚基因的启动子区结合。GmZF351直接与Gmγ-TMT3、GmHPT、GmPBQ-MT1和GmHPPD1启动子结合,且相对荧光素酶活性上调两至五倍(图7B)。当E1E2序列从四个测试的生育酚生物合成基因的启动子中删除时,GmZF351的活性显著降低了约50%-60%(图7C)。使用酵母单杂交(Y1H)系统也证实了E1E2序列对GmZF351结合和激活的重要性:E1E2片段显示出比Gmγ-TMT3和GmHPT全长启动子更高的β-gal活性(图7D)。电泳迁移率偏移分析(EMSA)表明,GmZF351可以与Gmγ-TMT3和GmHPT启动子的E1E2探针相互作用(图7E)。以上证明GmZF351可以与关键生育酚相关基因的启动子结合,并在体外和植物中激活表达。
图7|GmZF351结合并激活生育酚生物合成基因的启动子。(A)四个生育酚生物合成基因的2kb启动子区中推定E1E2(元件1和2用红色标出)GmZF351结合位点的分布。启动子区域中的灰色三角形表示单个CT(G/C)(T/A)AA元件。(B)GmZF351在烟草系统中对四个生育酚基因启动子的激活测定。空载体的相对LUC活性设为1。数据以平均值±标准差(n=3)表示。**P<0.01,***P<0.001(双尾t检验)。(C)具有E1E2缺失的四个生育酚基因启动子的激活测定(启动子中标记的位置如A所示)。在本实验中,全长启动子的相对LUC活性设为1。数据以平均值±标准差(n=3)表示。**P<0.01,***P<0.001(双尾t检验)。(D) GmZF351对Gmγ-TMT3和GmHPT的全长启动子和E1E2片段的转录激活能力的定量测量。数据以平均值±标准差(n=3)表示。*P<0.05,**P<0.01,***P<0.001(双尾t检验)。(E)使用EMSA测试来自Gmγ-TMT3和GmHPT的E1E2片段与GmZF351的物理相互作用。
尽管本研究在GmZF351所在的Chr.6(P>1×10−8)上没有检测到强的GWAS信号,但在585份大豆材料(253个栽培品种、291个地方品种和41个野大豆品种)的代表性群体中研究了GmZF351的单倍型。GmZF351区域的三个代表性单倍型由两个SNP确定(编码区A和G中的+155位置;编码区A、G中的+340位置),这导致错义突变(Ile52Thr和Ala114Cys)。Hap1材料(n=43)中的T-T和单个生育酚含量与Hap2材料(n=200)中的含量没有差异,但Hap2材料中的T-T和个体生育酚含量比Hap3材料低7%。在大豆驯化过程中,优良等位基因(Hap3)的频率从野大豆(15%)到地方品种(59%)和及栽培改良品种(65%)呈现增加趋势,而Hap2则表现出相反的趋势,从野大豆(83%)到地方品种(34%)和及栽培改良品种(27%)呈现下降趋势。总之,常见植物籽油中的总维生素E水平取决于物种,从几十到几千微克/克不等。生育酚是人类饮食中的必需营养素,提高生育酚含量,特别是α-T含量,是提高大豆油营养品质的重要育种目标。许多研究表明,γ-TMT基因在各种植物物种产生α-T中起着关键作用。此外,γ-TMT的过表达,特别是与上游基因共表达,会导致大豆种子中T-T和α-T含量增加。然而,传统育种仍然是开发高维生素E水平大豆品种的一种更加可行的策略。本研究鉴定了三个主要天然大豆群体中生育酚生物合成基因(GmHPPD1、GmPBQ-MT1和Gmγ-TMT3)和一个TF基因(GmZF351),为选育具有高α-T和优质油脂的大豆新品种提供了基础。