豆科MIKC型MADS-box基因家族生物信息学分析

张月, 王佳琪, 于子建, 许强, 张岚, 潘玉欣

中国油料作物学报 ›› 2022, Vol. 44 ›› Issue (4) : 798-809.

PDF(7001 KB)
欢迎访问《中国油料作物学报》, 2025年6月24日 星期二
PDF(7001 KB)
中国油料作物学报 ›› 2022, Vol. 44 ›› Issue (4) : 798-809. DOI: 10.19802/j.issn.1007-9084.2021175
遗传育种·生物技术

豆科MIKC型MADS-box基因家族生物信息学分析

作者信息 +

Bioinformatics analysis of MIKC-type MADS-box gene family in legumes

Author information +
文章历史 +

本文亮点

MIKC型MADS-box是一类生物功能丰富的转录因子家族,参与调控植物的生长发育。为深入研究豆科MIKC型MADS-box基因家族生物学特性,利用生物信息学方法在大豆和蒺藜苜蓿中分别鉴定出92和45个MIKC型基因,并将其分为15个亚类。蛋白基序分析发现,大豆与蒺藜苜蓿不同亚类的共同基序不同,基因结构发生变化;共线性分析及K S分析表明,大豆90.5%的基因对和蒺藜苜蓿87.1%的基因对产生于双子叶植物共同经历的三倍化事件之前;大豆基因表达模式分析表明,大豆幼苗期总体表达量高于其他时期,其中SVPSOC1AGL12亚类表达量较高;蛋白互作网络分析表明,大豆SVP蛋白与CO、FT和TFL1蛋白相互作用,一起调控植物开花发育。本研究为进一步揭示MADS-box家族基因的生物学功能奠定基础。

HeighLight

MIKC MADS-box is a biological function rich family of transcription factors, and involved in regulating plant growth and development. In order to study the biological characteristics of MIKC-type MADS-box family genes in legumes, 92 and 45 MADS-box genes were identified in soybean and Medicago truncatula by bioinformatics method, and they were divided into 15 subfamilies. Motif analysis showed that the motifs of soybean and Medicago were different, and the gene structure and function changed. Collinearity and K s analysis showed that 90.5% of the MIKC gene pairs in soybean and 87.1% of the MIKC-type gene pairs in Medicago were generated before the whole genome triplication in dicotyledons. Expression pattern analysis of genes in soybean showed that the MIKC MADS-box genes in soybean seedling stage were expressed higher than other stages, especially the expression of SVP, SOC1 and AGL12 subfamilies. Protein interaction network showed that soybean protein SVP interacted with CO, FT and TFL1 to regulate plant flowering. This study will lay a foundation for the further biological functions of MADS-box gene family.

引用本文

导出引用
张月 , 王佳琪 , 于子建 , 许强 , 张岚 , 潘玉欣. 豆科MIKC型MADS-box基因家族生物信息学分析[J]. 中国油料作物学报, 2022, 44(4): 798-809 https://doi.org/10.19802/j.issn.1007-9084.2021175
Yue ZHANG , Jia-qi WANG , Zi-jian YU , Qiang XU , Lan ZHANG , Yu-xin PAN. Bioinformatics analysis of MIKC-type MADS-box gene family in legumes[J]. CHINESE JOURNAL OF OIL CROP SCIENCES, 2022, 44(4): 798-809 https://doi.org/10.19802/j.issn.1007-9084.2021175
中图分类号: S565.1   
MADS-box基因家族是一类生物功能丰富,在植物中广泛存在的序列特殊的同源异型基因。酿酒酵母的MCMI、拟南芥的AGAMOUS、金鱼草的DEFICIENS和人类的SRF4四种基因的首字母构成MADS-box基因的名称。MADS-box基因的蛋白中都含有1个由约58个氨基酸组成的保守结构域,即MADS盒[1]。根据不同的分类标准,MADS-box基因可分为Ⅰ型和Ⅱ型(MIKC型),也可以分成5个小类:Mα、Mβ、Mγ、MIKCc、MIKC*,其中 Mα、Mβ、Mγ属于Ⅰ型,MIKCc、MIKC*属于Ⅱ型。Ⅰ型植物的MADS-box基因只有1~2个外显子,编码蛋白缺少K(Keratin-like)-box域,含有1个高度保守的MADS域。MIKC型MADS-box基因在植物基因组结构和功能的研究方面较为清楚,一般含有6个内含子和7个外显子[2]。这类型基因通常含有MADS、K-box、I(Intervening)和C(C-terminal)4个结构域,MADS域非常保守,在所有基因中均存在,K-box域半保守,在大部分基因中存在,I结构域和C结构域的保守性很低。
分布于植物中的MADS-box基因功能丰富,参与了植物生长发育的各个时期,包括调控花器官、根的生长发育以及雌雄配子、胚胎、种子、果实的发育等,也参与调控光合作用、营养代谢、多种胁迫响应等途径[3~5]。MIKC型MADS-box基因在花发育的各个时期具有重要调控作用,大部分MIKC型MADS-box基因都是花器官决定基因[6]。MIKCC型包括14个亚类AP1AP3PISTILLATA (PI)AGAMOUS (AG)/SEEDSTICK (STK)AGAMOUS-LIKE6 (AGL6)AGL12AGL15AGL17BSISTER (BS)SUPPRESSOR OF OVEREXPRESSION OF CONSTANS1 (SOC1)SHORT VEGETATIVE PHASE (SVP)FLOWERING LOCUS C (FLC)SEPALLATA1(SEP1) [5,7]。MIKCC型基因亚类的功能各有不同,如SOC1FLCSVP等亚类调控开花的时间,SEP1AP3PIAG亚类决定花器官的特异性,AP1亚类决定花器官和分生组织的特异性[8,9]。有关花器官发育的特异性基因主要源于拟南芥花分化ABCDE 模型。参与花器官形态建成的MIKC型MADS-box 基因AP1属于A类基因,PIAP3属于B 类基因,AG属于C类基因,STK/AGL11SHP属于D类基因,SEP1SEP2SEP3SEP4属于E类基因[6]
MADS-box基因家族的结构和功能在小麦[5]、拟南芥[10]、陆地棉[11]、莴苣[12]和甘蓝型油菜[13]等多种植物中均有研究。拟南芥中共鉴定出107条MADS-box基因,且根据进化关系将MADS-box基因划分为Mα、Mβ、Mγ、MIKCc和MIKC*五类[10]。利用已知序列MADS结构域的多序列比对以及系统发育树分析,小麦201条MIKC型MADS-box基因分为15个亚类,家族基因重复多存在于远端端粒区,亚家族内基因表达模式较相似[5]MADS-box基因表达模式的不同揭示其进化过程出现了功能分化[11,12]
多倍化在植物进化和物种形成中起着十分重要的作用,丰富了物种基因功能的多样性,增强了物种的适应性[14]。豆科是第三大植物科,是动物和人类营养物质的重要来源。研究表明,约1.3~1.5亿年前豆科与其它双子叶植物共有祖先发生了一次全基因组三倍化事件,约5900万年前豆科植物共同经历了一次全基因组二倍化事件,大豆在与其它豆科植物分化后约1300万年前又发生了一次特异性的全基因组二倍化事件[15]。在大豆基因组中鉴定了57个MIKC型基因,均具有保守的MADS和K-box基序,AP1AGAP3PISVPSOC1基因均存在多拷贝现象[8]。全基因组复制事件对MIKC类基因的扩张起重要作用,导致MIKC类基因在进化过程中被选择性保留[13],但多倍化对MIKC型MADS-box基因扩张的影响缺乏深入分析。
本研究基于更新的豆科植物数据库,对大豆(Glycine max)、蒺藜苜蓿(Medicago truncatula)MIKC型MADS-box基因家族的基因结构、蛋白质理化性质、保守结构域、系统发育关系、共线性与进化速率、基因表达模式、蛋白互作等进行分析,为揭示MADS-box家族的生物学功能奠定基础。

1 材料与方法

1.1 大豆、蒺藜苜蓿、葡萄 MIKC型MADS-box基因家族成员的鉴定

从TAIR(http://www.arabidopsis.org/.Araport11)下载拟南芥MADS-box基因家族的蛋白序列,从PeanutBase(https://www.peanutbase.org)数据库下载大豆、蒺藜苜蓿的全基因组数据,从JGI(https://genome.jgi.doe.gov.v2.1)数据库下载葡萄全基因组数据。利用HMMER[16]软件(E值≤0.05),根据文献报道的107个拟南芥MADS-box蛋白序列[9]构建HMM模型,在大豆、蒺藜苜蓿和葡萄全基因组数据中筛选候选基因,通过CDD(https://www.ncbi.nlm.nih.gov)、PFAM(http://pfam.xfam.org)、SMART(http://smart.embl-heidelberg.de/)预测候选蛋白结构域,去除冗余蛋白序列,最终确定含MADS结构域的蛋白序列为MADS-box家族成员。
提取大豆、蒺藜苜蓿与葡萄的MADS结构域蛋白序列,用MAFFT[17,18]对大豆、蒺藜苜蓿、葡萄和拟南芥包含MADS结构域的蛋白序列进行多序列比对,根据序列比对结果利用IQ-TREE[19] 软件和ModelFinder[20]构建系统发育树,初步确定其分类;利用BLAST+[21]将得到的大豆、蒺藜苜蓿和葡萄的MADS-box蛋白序列与拟南芥的MADS-box进行序列比对,按照拟南芥的功能分类[10],对系统发育树的分类进行验证,最终确定MADS-box基因的I型和II型分类。

1.2 豆科MIKC型MADS-box基因家族系统进化分析

将MIKC型蛋白序列进行MAFFT比对,利用IQ-TREE软件和MODELFINDER(最佳拟合模型:JTT+R7)构建系统发育树。参照拟南芥的MIKC型基因功能分类和系统发育树[10],将大豆、蒺藜苜蓿和葡萄的MIKC型MADS-box基因分类,并进行系统发育分析。
利用NOTUNG[22]软件的Rooting Mode功能将MADS-box基因树与物种树作比较,推断基因的复制与丢失事件。

1.3 豆科MIKC型MADS-box蛋白基本理化性质及亚细胞定位分析

利用ExPASy-ProtParam(https://web.expasy.org/protparam/[23] 在线工具预测大豆、蒺藜苜蓿MIKC型MADS-box蛋白质的基本理化性质,包括氨基酸长度、分子质量、等电点、不稳定指数等。利用亚细胞定位工具WolF PSORT(https://wolfpsort.hgc.jp/[24]预测MADS-box基因细胞内定位情况。

1.4 豆科MIKC型MADS-box基因结构分析和蛋白质保守基序分析

利用基因结构显示软件GSDS[25]http://gsds.cbi.pku.edu.cn/)分析MIKC型基因结构;利用序列分析工具MEME[26]http://meme-suite.org/)分析各基因组中MIKC型MADS-box蛋白序列保守基序(motif),其中,基序最大发现数目为20,基序最大长度为50;利用数据处理工具包TBtools[27]将结果进行可视化。

1.5 豆科MIKC型MADS-box基因共线性与K S值分析

利用 MCScanX[28]预测大豆、蒺藜苜蓿和葡萄MIKC型MADS-box基因的复制类型,并对其基因组内和基因组间的共线性进行分析;利用Python语言编写程序,计算该基因家族成员共线性基因对间的同义替换率K S值;利用Circos软件[29]绘制与多倍化事件相关的同源关系图。

1.6 大豆MIKC型MADS-box基因表达模式分析

在NCBI的GEO数据库下载大豆转录组数据(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE99571[30],包括大豆子叶期胚胎(COT.EP)、大豆早熟期胚胎(EM.EP)、大豆中熟期胚胎(MM.EP)、大豆晚熟期胚胎(AA1.EP)、大豆干种子期(Dry)和大豆幼苗期(SDLG.COT)6个组织,计算三次重复实验数据,取其平均值,并使用软件TBtools绘制聚类热图。

1.7 大豆MIKC型MADS-box蛋白互作网络分析

利用 STRING[31]https://stringdb.org/)数据库预测可能与大豆MIKC型MADS-box蛋白相互作用的蛋白质。

2 结果与分析

2.1 大豆、蒺藜苜蓿、葡萄MIKC型MADS-box基因家族成员的鉴定

通过多序列比对和系统发育树分析,4个物种共鉴定出232个MIKC型MADS-box基因,包括拟南芥45个、大豆92个、蒺藜苜蓿45个、葡萄50个(图1)。
图1 4个物种MIKC型MADS-box基因在不同亚类中的数量分布
注:物种树中的圆圈代表物种经历了全基因组三倍化事件,五角星代表物种经历了全基因组二倍化事件

Fig. 1 Quantity distribution of MIKC-type MADS-box genes in different subfamilies of each species

Note: the circle in the species tree represents a species that has experienced whole gemome triplication, and the pentacle represents a species that has experienced whole gemome duplication

Full size|PPT slide

2.2 豆科MIKC型MADS-box基因家族系统进化分析

根据拟南芥MIKC型基因的功能分类和系统发育树[10],将大豆、蒺藜苜蓿、葡萄和拟南芥MIKC型基因分为MIKCC和MIKC*两类,其中MIKCC包括除MIKC*型之外的14个亚类(图2)。从系统发育树看出,除SVPSOC1AGL15亚类外其余亚类树形分布基本符合各物种基因组的多倍化过程,大豆与蒺藜苜蓿亲缘关系较近。SVPSOC1AGL15亚类个别基因不符合基因组的多倍化过程,而且存在部分基因丢失情况。FLC亚类基因在拟南芥发育过程中调控春化开花,基因数量热图显示大豆仅有2个FLC类基因,蒺藜苜蓿缺少FLC类基因。大豆和蒺藜苜蓿AGAP1SEP1亚类基因数量相对较多,基因功能较丰富[32]
图2 拟南芥、葡萄、大豆和蒺藜苜蓿MIKC型MADS-box基因家族系统发育树

Fig. 2 Phylogenetic tree of MIKC-type MADS-box gene family in Arabidopsis, grape, soybean and Medicago

Full size|PPT slide

利用NOTUNG分析MIKC型MADS-box基因在物种树各进化节点上的基因扩增与丢失情况(图3)。4个物种的祖先节点有64个基因发生了复制,大豆和蒺藜苜蓿的共同祖先节点,18个基因被复制,17个基因发生了丢失,基因整体的数目没有发生较大的变化。大豆家族基因复制的数目(+41)比蒺藜苜蓿(+2)的多,而蒺藜苜蓿家族基因丢失的数目(-17)比大豆(-9)多,可以得出大豆MADS-box基因发生了扩增,而蒺藜苜蓿的家族基因发生了丢失。整体来看,4个物种有152个MADS-box基因复制,107个MADS-box基因丢失。
图3 拟南芥、葡萄、大豆和蒺藜苜蓿MIKC型MADS-box基因的复制和丢失

Fig. 3 Duplication and loss of MIKC-type MADS-box genes in Arabidopsis, grape, soybean and Medicago

Full size|PPT slide

2.3 豆科MIKC型MADS-box蛋白基本理化性质分析和亚细胞定位分析

编码大豆MIKC型MADS-box蛋白的氨基酸长度范围从126到354,分子量范围从10915.86到40409.85kD,等电点范围从5.30到10.11(只有极少数蛋白等电点小于7,MIKC*和BS亚类蛋白等电点小于7)(表1)。编码蒺藜苜蓿MIKC型MADS-box蛋白的氨基酸长度范围从50到402,分子量范围从13023.95到7054.27kD,等电点范围从5.22到10.65(只有极少数蛋白等电点小于7)(表2)。
表1 大豆MIKC型MADS-box蛋白的理化性质及亚细胞定位

Table 1 Physicochemical properties and subcellular localization of soybean MIKC-type MADS-boxproteins

亚类

Subgroup

氨基酸数量/aa

Number of amino acids

分子量/kD

Molecular weight

等电点

pI

不稳定系数

Instability index

亚细胞定位

Subcellular localization

MIKC* 325~354 36 688.47~40 409.85 5.65~6.84 44.43~67.16 nucl
PI 181~208 20 907.02~24 394.79 7.82~8.87 45.28~54.38 nucl
AP3 227~243 26 185.89~28 023.26 9.17~9.32 27.88~47.32 nucl
BS 245~246 28 916.87~29 081.13 6.52~6.68 56.90~78.50 cyto
AG/STK 222~247 25 696.40~28 426.04 9.25~9.72 49.32~64.90 nucl
AGL12 203~204 22 990.75~23 297.09 8.93~9.10 40.37~41.04 mito
SEP1 243~255 27 685.27~29 210.10 6.46~8.94 37.17~52.09 nucl
AGL6 230~245 26 573.23~28 603.19 8.62~9.15 43.80~60.34 nucl
AP1 236~253 27 428.39~28 452.56 8.55~9.58 42.13~67.59 nucl,chlo
SOC1 126~237 24 106.42~27 197.87 8.58~9.55 50.98~68.53 nucl
AGL15 126~246 14 182.42~27 941.70 5.30~10.11 44.07~63.45 nucl
SVP 204~248 23 430.83~28 679.29 5.58~9.65 42.38~67.23 nucl
AGL17 97~257 10 915.86~29 299.72 6.97~9.62 44.32~59.50 nucl,cyto
FLC 198~243 22 764.24~27 685.27 6.46~8.77 36.78~40.09 nucl,cyto
注:nucl:细胞核; mito:线粒体; cyto:细胞质; chlo:叶绿体
Note: nucl: nucleus; mito: mitochondria; cyto: cytoplasm; chlo: chloroplast
表2 蒺藜苜蓿MIKC型MADS-box蛋白的理化性质及亚细胞定位

Table 2 Physicochemical properties and subcellular localization of MedicagoMIKC-type MADS-box proteins

亚类

Subgroup

氨基酸数量/aa

Number of amino acids

分子量/kD

Molecular weight

等电点

pI

不稳定系数

Instability index

亚细胞定位

Subcellular localization

MIKC* 318~402 36 080.67~45 575.26 5.22~8.17 41.73~70.43 nucl,chlo
PI 180~181 21 051.41~20 855.95 8.87~9.64 43.43~89.89 nucl,cyto
AP3 229~231 26 609.31~26 941.92 9.16~9.24 31.17~40.92 nucl
BS 232 27 417.37 6.46 45.91 mito
AG/STK 223~260 25 963.57~29 690.34 6.97~9.37 31.46~65.4 nucl
AGL12 202 22 890.77 8.78 43.75 chlo
SEP1 50~250 5 590.64~28 850.58 4.78~9.07 38.73~54.38 nucl,chlo
AGL6 189~251 22 127.54~29 480.69 8.88~9.33 40.99~47.86 nucl,cyto
AP1 62~256 7 054.27~29 223.40 8.24~9.86 41.85~54.42 nucl
SOC1 205~230 23 786.38~26 302.74 7.68~9.51 46.43~52.11 nucl
AGL15 249~256 28 195.10~29 267.42 6.98~8.8 55.05~65.24 nucl
SVP 135~239 15 741.38~27 825.90 5.65~9.25 45.98~53.93 nucl
AGL17 61~278 6 878.05~31 769.53 8.85~10.65 43.00~49.26 nucl,mito
FLC ----- ----- ----- ----- -----
注:nucl:细胞核; mito:线粒体; cyto:细胞质; chlo:叶绿体
Note: nucl: nucleus; mito: mitochondria; cyto: cytoplasm; chlo: chloroplast
理化性质分析结果显示大豆和蒺藜苜蓿MIKC型MADS-box基因所编码蛋白质等电点80%大于7,属于碱性蛋白。蛋白的不稳定系数大于30,属于不稳定蛋白。
亚细胞定位结果(表1表2)表明89%以上的MADS-box基因均定位在细胞核(nucleus),大豆和蒺藜苜蓿均只有7个基因位于其他部位,其余基因均位于细胞核,符合转录因子的特征。

2.4 豆科MIKC型MADS-box基因结构分析和蛋白质保守基序分析

基因结构分析表明MIKC型MADS-box基因结构比较保守,MIKC*型大部分基因含9~11个左右的外显子,只有两条含2~3个外显子;其他14个亚类大部分均有7~8个左右的外显子,只有约8%基因含有2~3个外显子,大豆和蒺藜苜蓿均含有较长的内含子。
蛋白质基序分析结果(图4)表明MIKC型MADS-box蛋白均含有MADS结构域,大部分含有K-box结构域,但MADS-box蛋白序列间I结构域和C结构域的保守性较低,缺乏共有基序。MADS结构域由motif1、motif3、motif5构成,所有蛋白中至少含有其中一个motif,所有的大豆和蒺藜苜蓿蛋白均含有motif1。K-box结构域由motif2、motif4、motif6、motif7、motif12、motif17构成,不同亚家族K-box结构域包含的基序略有不同。例如在PI、AP3亚类中K-box结构域由motif2、motif12构成,在AG/STK,AGL17亚类中K-box结构域由motif2、motif4、motif6构成。MIKC*亚类只有一个基因含有K-box结构域。总体来看,motif1、motif2、motif3、motif4所在蛋白序列数均占全部家族蛋白80%以上。
图4 MIKC型MADS-box蛋白基序分析及基因结构分析

Fig. 4 Protein conserved motif analysis and gene structure analysis in MIKC-type MADS-box genes

Full size|PPT slide

2.5 豆科MIKC型MADS-box基因共线性与K S值分析

基因组复制是基因家族扩张的重要来源。通过检查5种类型的基因复制,即单基因复制、分散基因复制、近端基因复制、串联基因复制和全基因组复制或片段复制,发现83.61%的大豆基因和80%的蒺藜苜蓿基因来自全基因组复制或片段复制。
共线性分析发现,大豆基因组内MIKC型MADS-box共线基因对318对、 蒺藜苜蓿31对、葡萄62对;大豆和蒺藜苜蓿基因组间MIKC型MADS-box共线性基因对87对、大豆和葡萄109对、蒺藜苜蓿和葡萄50对(图5)。大豆基因组内共线性基因对明显多于其他两个物种,蒺藜苜蓿的家族基因共线性基因对最少,与葡萄也仅共有50对基因对。
图5 大豆、蒺藜苜蓿、葡萄MIKC型MADS-box基因共线性分析
注:粉色线条为大豆与蒺藜苜蓿之间的共线基因对,橙色线条为大豆与葡萄之间的共线基因对,棕色线条为蒺藜苜蓿与葡萄之间的共线基因对;蓝色线条为大豆物种内的共线基因对,红色线条为蒺藜苜蓿物种内的共线基因对,紫色线条为葡萄物种内的共线基因对

Fig. 5 Collinearity analysis of MIKC-type MADS-box genes in soybean, Medicagoand grape

Note: lines of different colours represent different collinear gene pairs; pink lines show collinear gene pairs between soybean and Medicago, orange lines show collinear gene pairs between soybean and grape, brown lines show collinear gene pairs between Medicago and grape, blue lines show collinear gene pairs between soybean, red lines show collinear gene pairs between Medicago, the purple for grape

Full size|PPT slide

同义置换率K S,反映物种之间的分歧时间和种内的加倍事件。已有研究表明,约1.3~1.5亿年前豆科与其它双子叶植物共有祖先发生了一次全基因组三倍化事件(K S≈1.31),随后约在5900万年前豆科植物发生了一次共有的全基因组二倍化事件(K S≈0.627),约1300万年前大豆又发生了一次特异性的二倍化事件(K s≈0.164)[15]。大豆MIKC型MADS-box基因K S统计结果显示,1%的共线性基因对(3对)处于0~0.164,2.8%的基因对(9对)处于0.164~0.627,5.7%的基因对(18对)处于0.627~1.310,90.5%的基因对(287对)大于1.310(图6A)。蒺藜苜蓿MIKC型MADS-box基因K S统计结果显示,3.2%的基因对(1对)小于0.627,9.7%的基因对(3对)处于0.627~1.310,87.1%的基因对(27对)大于1.310(图6B)。结果表明,大豆和蒺藜苜蓿分别有96.3%和96.8% MIKC型MADS-box基因对与双子叶植物共有的三倍化事件以及更古老的加倍事件相关。
图6 大豆和蒺藜苜蓿MIKC型MADS-box基因Ks 值分析
注:图6A 红色:0<K S<0.164;橙色:K S:0.164-0.627;蓝色:K S:0.627-1.310;紫色:K S>1.310;图6B 红色:0<K S<0.164,橙色:K S:0.627-1.310,蓝色:K S>1.310

Fig. 6 Analysis of K S value of MIKC-type MADS-box genes in soybeanand Medicago

Note: Lines of different colours represent different K S intervals between different collinear gene pairs.The red shows 0<K S<0.164, the orange shows K S: 0.164-0.627, the blue shows 0.627<K S<1.310, the purple shows Ks>1.310 in Fig.6A; The red shows 0<K S<0.164, the orange shows 0.627<K S<1.310, the blue shows K S>1.310 in Fig.6B

Full size|PPT slide

2.6 大豆MIKC型MADS-box基因表达模式分析

大豆MIKC型各亚类基因在大豆不同发育时期的表达模式和表达量有明显的区别(图7)。大豆发育时期分析显示:AGL12SVPMIKC*亚类表达量较低,SEP1亚类在各时期表达量分布均匀,BSAGL6亚类表达量相对较高。在大豆子叶期胚胎(COT.EP)时期,AP1亚类表达量较高;在大豆早熟期胚胎(EM.EP)时期,AG/STKAP3亚类表达量较高;在大豆中熟期胚胎(MM.EP)时期,MIKC*BS亚类表达量较高;在大豆晚熟期胚胎(AA1.EP)时期,AGL17亚类表达量相对较高,其他14亚类表达量均较低;在大豆干种子期(Dry),各亚类表达量均较低,几乎不表达;在大豆幼苗期(SDLG.COT),AP3PIFLCSVPAGL12亚类表达量较高,其中AGL12基因全部高表达。AGL15亚类中只有gm206s2g01178在大豆子叶期胚胎(COT.EP)时期高表达,这与AGL15亚类功能相关,AGL15亚类基因在在幼胚中高表达, 在根、茎、叶和花中不表达,在幼胚形成过程中具有重要意义,在大豆种子发育过程中起重要调控作用[33,34]。综上,大豆幼苗期表达量高于其他时期,说明MIKC类MADS-box基因在植物幼苗发育过程中起调控作用。
图7 大豆MIKC型MADS-box基因不同发育时期的表达量
注:COT.EP: 大豆子叶期胚胎;EM. EP: 大豆早熟期胚胎;MM.EP:大豆中熟期胚胎;AA1. EP: 大豆晚熟期胚胎; Dry: 大豆干种子期胚胎;SDLG. COT: 大豆幼苗期

Fig. 7 Expression of MIKC-type MADS-box gene family in soybeanat different developmental stages

Note: COT.EP:soybean embryo at cotyledon stage; EM. EP: embryo at early maturity stage; MM.EP: embryo at medium maturity stage; AA1. EP: embryo at late maturity stage; Dry: soybean dry seed stage; SDLG. COT: soybean seedling stage

Full size|PPT slide

2.7 大豆MIKC型MADS-box蛋白互作网络分析

蛋白质相互作用是调控生物生命活动的重要形式。MIKC型MADS-box家族蛋白参与多种生物途径。在线工具STRING结果显示大豆MADS-box家族SVP和LFY间存在相互作用。除此二者还分别与调控植物春化的MAF,光周期的CO以及开花途径FRI,TSF,TFL,GI,FT,LATE等10个蛋白存在相互作用[34~36]图8)。
图8 大豆MIKC型MADS-box蛋白与其它蛋白相互作用网络图

Fig. 8 Protein interaction network between Glycine max MIKC-type MADS-box proteins and other proteins

Full size|PPT slide

3 讨论与结论

MIKC型MADS-box基因在植物发育过程中起核心作用。本研究鉴定出MIKC型MADS-box基因共232个,其中,大豆92个、蒺藜苜蓿45个、葡萄50个、拟南芥45个。根据系统发育关系,4个物种MIKC型基因分为MIKCC和MIKC*两类。MIKCC可进一步分为14个亚类。大豆有2个FLC类基因,蒺藜苜蓿缺少FLC类基因,其原因可能与大豆和蒺藜苜蓿在开花过程中不需要春化有关,导致FLC亚类基因在进化过程中丢失[8]
MADS-box基因都是在进化过程中通过基因重复事件产生的[8,37]。4个物种共同祖先节点有64个基因发生复制,推测双子叶植物共有的三倍化事件和更古老的加倍事件对该基因家族的扩增产生了积极影响。总体上4个物种MADS-box基因复制数目多于基因丢失数目,说明了4个物种MIKC型MADS-box基因在进化的过程中发生了一定程度基因扩增。大豆和蒺藜苜蓿共同祖先节点基因复制与丢失数目基本平衡,说明豆科共有的二倍化事件对该基因家族未产生明显影响;二者MADS-box基因数目相比,大豆复制基因数目较多,丢失较少,推测其原因与1300万年前大豆特异性发生的一次全基因组二倍化事件相关,共线性分析结果也印证了该结论。
理化性质分析揭示大豆和蒺藜苜蓿MADS-box蛋白多为性质稳定的碱性蛋白,主要定位在细胞核,在细胞核中发挥转录调控作用。MADS-box不同亚类间基因结构较为保守,所含motif相似,揭示亚类功能的保守性[13]。基因复制类型推测、共线性以及Ks分析结果显示,大豆和蒺藜苜蓿中该基因家族的扩张主要是全基因组复制或片段重复的作用,而且多数基因来源于双子叶植物的三倍化或更古老的事件,再次说明全基因组复制对MADS-box基因有积极影响[13]
MIKC型MADS-box基因同时对植物生长发育起调控作用。MADS-box不同亚类基因表达模式不同[10,38,39],在陆地棉中MIKC型MADS-box基因调控胚胎发育,控制开花时间等[11]。在高粱中MIKC型MADS-box基因同样在花发育和胚胎发育过程中表达[2]。MIKC型各亚类基因在大豆不同发育时期表达模式也呈现明显的不同,各类基因在不同发育阶段具有不同的功能。本研究结果表明大豆幼苗期总体表达量高于其他时期,其中SVPSOC1AGL12亚类表达量较高。SVPSOC1AGL12亚类在调控幼苗发育过程中确实起到重大作用,与文献研究结果相符[7]。蛋白互作分析结果表明大豆MIKC型MADS-box家族蛋白SVP与CO、FT和TFL1蛋白相互作用,这与文献中蛋白相互作用的实验结果相一致[40]SVPLFYCOFTTFL1这些基因相互作用一起调控植物开花发育。
本研究采用生物信息学方法对大豆和蒺藜苜蓿MIKC型MADS-box基因家族的基因结构、功能、共线性和进化过程进行分析,为豆科植物及其他物种MADS-box基因的研究提供重要参考。

参考文献

1
胡丽芳, 金志强, 徐碧玉. MADS-box基因在果实发育、成熟过程中的作用[J]. 分子植物育种20053(3): 415-420. DOI:10.3969/j.issn.1672-416X.2005.03.018 .
2
郑玲, 谢爱玲, 韩建明. 高粱MADS-box家族基因的鉴定与分析[J]. 东北农业科学201944(5): 26-29. DOI:10.16423/j.cnki.1003-8701.2019.05.006 .
3
苏亚丽, 刘梦佳, 李海峰. 水稻MADS-box基因研究进展[J]. 河南农业科学201645(9): 1-7. DOI:10.15933/j.cnki.1004-3268.2016.09.001 .
4
董金金, 刘伟, 李萌, 等. 银杏MADS-box基因家族的表达及系统发育分析[J]. 植物生理学报201854(6): 1055-1063. DOI:10.13592/j.cnki.ppj.2017.0574 .
5
Schilling S Kennedy A Pan S, et al. Genome-wide analysis of MIKC-type MADS-box genes in wheat: pervasive duplications, functional conservation and putative neofunctionalization[J]. New Phytol2020225(1): 511-529. DOI:10.1111/nph.16122 .
6
赵夏云, 鲜登宇, 宋明, 等. MIKC型MADS-box蛋白对开花调控作用研究进展[J]. 生物技术通报2014(7): 8-15. DOI:10.13560/j.cnki.biotech.bull.1985.2014.07.002 .
7
Becker A Theissen G. The major clades of MADS-box genes and their role in the development and evolution of flowering plants[J]. Mol Phylogenet Evol200329(3): 464-489. DOI:10.1016/s1055-7903(03)00207-0 .
8
胡瑞波, 范成明, 李宏宇, 等. 大豆MIKC型MADS-box基因家族分析[J]. 分子植物育种20097(3): 429-436. DOI:10.3969/mpb.007.000429 .
9
Smaczniak C Immink R G Angenent G C, et al. Developmental and evolutionary diversity of plant MADS-domain factors: insights from recent studies[J]. Development2012139(17): 3081-3098. DOI:10.1242/dev.074674 .
10
Parenicová L de Folter S Kieffer M, et al. Molecular and phylogenetic analyses of the complete MADS-box transcription factor family in Arabidopsis: new openings to the MADS world[J]. Plant Cell200315(7): 1538-1551. DOI:10.1105/tpc.011544 .
11
周娜, 汪露瑶, 张天真, 等. 陆地棉MIKCC基因家族的全基因组分析[J]. 棉花学报201729(6): 495-503. DOI:10.11963/1002-7807.znhy.20170913 .
12
Ning K Han Y Chen Z, et al. Genome-wide analysis of MADS-box family genes during flower development in lettuce[J]. Plant Cell Environ201942(6): 1868-1881. DOI:10.1111/pce.13523 .
13
高虎虎, 张云霄, 胡胜武, 等. 甘蓝型油菜MADS-box基因家族的鉴定与系统进化分析[J]. 植物学报201752: 699-712.
14
肖勇, 杨耀东, 夏薇, 等. 多倍体在植物进化中的意义[J]. 广东农业科学201340(16): 127-130. DOI:10.16768/j.issn.1004-874x.2013.16.002 .
15
Wang J Sun P Li Y, et al. Hierarchically aligning 10 legume genomes establishes a family-level genomics platform[J]. Plant Physiol2017174(1): 284-300. DOI:10.1104/pp.16.01981 .
16
Potter S C Luciani A Eddy S R, et al. HMMER web server: 2018 update[J]. Nucleic Acids Res201846(w1): W200-W204. DOI:10.1093/nar/gky448 .
17
Katoh K Standley D M. MAFFT multiple sequence alignment software version 7: improvements in performance and usability[J]. Mol Biol Evol201330(4): 772-780. DOI:10.1093/molbev/mst010 .
18
Katoh K Rozewicki J Yamada K D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization[J]. Brief Bioinform201920(4): 1160-1166. DOI:10.1093/bib/bbx108 .
19
Nguyen L T Schmidt H A von Haeseler A, et al. IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies[J]. Mol Biol Evol201532(1): 268-274. DOI:10.1093/molbev/msu300 .
20
Kalyaanamoorthy S Minh B Q Wong T K F, et al. ModelFinder: fast model selection for accurate phylogenetic estimates[J]. Nat Methods201714(6): 587-589. DOI:10.1038/nmeth.4285 .
21
Camacho C Coulouris G Avagyan V, et al. BLAST+: architecture and applications[J]. BMC Bioinform200910: 421. DOI:10.1186/1471-2105-10-421 .
22
Chen K Durand D Farach-Colton M. NOTUNG: a program for dating gene duplications and optimizing gene family trees[J]. J Comput Biol20007(3/4): 429-447. DOI:10.1089/106652700750050871 .
23
Schneider M Tognolli M Bairoch A. The Swiss-Prot protein knowledgebase and ExPASy: providing the plant community with high quality proteomic data and tools[J]. Plant Physiol Biochem200442(12): 1013-1021. DOI:10.1016/j.plaphy.2004.10.009 .
24
Horton P Park K J Obayashi T, et al. WoLF PSORT: protein localization predictor[J]. Nucleic Acids Res2007, 35(web server issue): W585-W587. DOI:10.1093/nar/gkm259 .
25
郭安源, 朱其慧, 陈新, 等. GSDS: 基因结构显示系统[J]. 遗传200729(8): 1023-1026. DOI:10.16288/j.yczz.2007.08.004 .
26
Bailey T L Boden M Buske F A, et al. MEME SUITE: tools for motif discovery and searching[J]. Nucleic Acids Res2009, 37(web server issue): W202-W208. DOI:10.1093/nar/gkp335 .
27
Chen C Chen H Zhang Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Mol Plant202013(8): 1194-1202. DOI:10.1016/j.molp.2020.06.009 .
28
Wang Y Tang H Debarry J D, et al. MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity[J]. Nucleic Acids Res201240(7): e49. DOI:10.1093/nar/gkr1293 .
29
Krzywinski M Schein J Birol I, et al. Circos: an information aesthetic for comparative genomics[J]. Genome Res200919(9): 1639-1645. DOI:10.1101/gr.092759.109 .
30
Lin J Y Le B H Chen M, et al. Similarity between soybean and Arabidopsis seed methylomes and loss of non-CG methylation does not affect seed development[J]. PNAS2017114(45): E9730-E9739. DOI:10.1073/pnas.1716758114 .
31
Szklarczyk D Morris J H Cook H, et al. The STRING database in 2017: quality-controlled protein–protein association networks, made broadly accessible[J]. Nucleic Acids Res201745(D1): D362-D368. DOI:10.1093/nar/gkw937 .
32
黄方. 大豆花发育相关基因的克隆与功能研究[D]. 南京: 南京农业大学, 2007.
33
汪潇琳, 陈艳萍, 喻德跃. MADS-box基因GmAGL15在大豆种子发育过程中的表达[J]. 作物学报200834(2): 330-332. DOI:10.3321/j.issn: 0496-3490.2008.02.024 .
34
李玉舒. 梅花成花相关基因SOC1SVPLFY的功能分析[D]. 北京: 北京林业大学, 2017.
35
万薇, 余坤江, 叶波涛, 等. TFL1相关基因调控植物花序发育的分子机制[J]. 植物生理学报202056(3): 367-372. DOI:10.13592/j.cnki.ppj.2019.0358 .
36
罗碧珍, 罗永海. 开花植物CO/FT分子途径的生物学功能和分子进化[J]. 福建农林大学学报(自然科学版)202150(2): 155-163. DOI:10.13323/j.cnki.j.fafu(nat.sci.).2021.02.002 .
37
张加强, 朱开元, 史小华. 芍药MADS-box基因家族的鉴定及适应性进化分析[J]. 分子植物育种201917(21): 6959-6966. DOI:10.13271/j.mpb.017.006959 .
38
Qu Y Bi C He B, et al. Genome-wide identification and characterization of the MADS-box gene family in Salix suchowensis [J]. PeerJ20197: e8019. DOI:10.7717/peerj.8019 .
39
Wei B Zhang R Z Guo J J, et al. Genome-wide analysis of the MADS-box gene family in Brachypodium distachyon [J]. PLoS One20149(1): e84781. DOI:10.1371/journal.pone.0084781 .
40
张頔, 高晓阳, 张轩, 等. 花发育相关基因分子进化与花发育调控网络拓扑中心性的相关性研究[J]. 安徽农业科学202149(8): 1-4. DOI:10.3969/j.issn.0517-6611.2021.08.001 .

脚注

基金

河北省教育厅青年基金(QN2020139)
华北理工大学大学生创新创业项目(X2020087)
PDF(7001 KB)

4305

Accesses

0

Citation

Detail

段落导航
相关文章

/