【豆科基因组】大豆适应性位点GWAS分析[转载]

本文利用99085个高质量SNP 通过STRUCTURE,PCA和neighbour-joining tree的群体结构分析将地方品种分为三个亚群,这些亚群表现出地理上的遗传分化。利用纬度相差10°的两个位置(北京、武汉)收集的表型数据,鉴定了17个与开花时间性状相关的SNP(TAS),包括一个稳定的基因位点Chr12:5914898和以前未检测到的在开花基因E1和E2附近的候选基因。利用与地方种收集地点相关的已公布数据,鉴定出与三个生物气候学变量(温度,日长和降水)相关的27个SNP。在12个生物气候TASs的连锁不平衡(LD)区域内检测到一系列候选开花基因。其中9个TASs在开花时间上表现出显著差异。在44个开花和生物气候TASs中,有38个检测到了驯化、地方品种多样化和适应过程中的选择信号。

测序材料 :2368个种质材料,包括112个野生种(选自中韩俄日,代表广泛的生态地理范围),和2256个地方种(可代表核心种质的表型多样性和地理分布的中国主要的地方种)

测序平台: Life Technologies’ Ion Proton Systems

数据量: 0.75T

筛选后的97个野生种和1938个地方品种(地方种据其地理分布及种植季节类型分为7类);414个核心地方种质

开花时间表型鉴定材料: 2256个地方种,分别种于7月武汉(30.5°N, 114.3°E)、6月北京(40.1°N, 116.7°E),各两次重复;414份核心种质种于广西(2009-2011年)的南宁(7月中),北京(2011-2012)的昌平(5月初,春季型)、顺义(6月末,夏季型),三年2~3次重复。

地理和气候变量: 利用已知数据获得不同品种的经纬度及海拔的坐标,利用坐标在生物气候网站BioClim ( http://www.worldclim.org/bioclim,version 1.4)查询其对应的生物气候变量:年温度变化范围(TAR)及年降水量(AP),最大日光长度(MDL)的计量以表型鉴定为准。

群体结构分析方法

群体结构:软件STRUCTURE

Neighbor-joining tree:APE(V3.2)

PCA:PLINK(V1.9)

Qst-Fst比较:Pstat (V1.2)

LD:PLINK (V1.9)

参考基因组:*Glycine max *Wm82.a2.v1

图1 不同基因型种质的地理分布和大豆基因组的特性。

A:7种生态型:东北春季型(NESp),北方春季型(NSp),黄淮春季型(HSp),黄淮夏季型(HSu),南方春季型(SSp),南方夏季型(SSu) )和南方秋季型(SAu)。

B:20条大豆染色体上共获得99085个SNP。最外圈:大豆20条染色体,灰色为染色体杂合区域,黑色为染色体臂。a:基因密度 b:SNP密度 c-f依次为:野生种、SR、HR、NR的遗传多样性。

多态性、群体结构和多样性

对2035个种质材料进行群体结构分析,共鉴定出1类野生型(wild),三类地方种的亚群(北方种NR,黄淮种HR,南方种SR),和一类混合基因组种质(mixed)。对群体分化程度的鉴定表明,虽然地方种比野生种的数量大20倍,但地方种仍比野生种存在更多的LD(图2D), SNPs更少,多样性也更少(表S5)。选择性清除分析(Fst)的比较结果表明HR和SR之间遗传分化程度最大(0.164),其次是NR与SR(0.136),NR与HR之间差异最小(0.077)。

图2群体结构和连锁不平衡分析

A:样本按生态类型和采集地点的纬度排列

B:对1938个地方种和97个野生种的群体结构分析(K=4)

C:根据99085个SNPs对2035个种质的PCA分析

D:LD衰减距离,landrace代表混合地方种

生物气候变量和开花时间的变化

不同地理位置上开花时间与生物气候变量呈现显著的相关性(图S4),两个地方的每个种质的开花时间也显著相关(图S5)。这些结果表明,虽然可以根据环境因素(不同地点)推测其开花时间,但是同一地点的不同品种间开花时间应主要受遗传因素控制。

图s4 北京和武汉不同气候变量与开花时间的相关性比较

图s5 北京和武汉三个大豆地方种群开花时间的变化

开花时间的GWAS分析

利用GWAS鉴定与开花时间相关的基因,共关联到18个相关位点,代表17个TASs,同时在武汉和北京的Chr12:5914898位置关联到同一个位点。对414份核心种质材料在其余三个地点的GWAS分析,进一步验证了该结果。

图3 地方种开花时间性状相关位点(TASs)的鉴定分析

ABEFG:五个地点开花时间的GWAS分析的曼哈顿图,北京、武汉所用材料为1938个地方种,昌平、顺义、南宁三个地点所用材料为414个核心种质。

灰色水平线表示1%阈值线

红色垂直线表示两个克隆的开花时间基因 E1 、 E2 的基因组位置。

CDHIJ:每个地方种携带早开花位点的TASs数量与开花时间的相关性

生物气候因素的GWAS分析

文中利用GWAS分析鉴定了与三个生物气候变量(温度/TAR,日长/MDL,降水/AP)的适应性相关的基因座,共鉴定到29个显著关联位点,对应27个独特的TASs(图S9)。其中两个SNPs(Chr02:6487107和Chr15:23361474)均分别与MDL和TAR相关。

图s9 大豆地方种与生物气候因素相关的GWAS分析

大豆驯化过程中选择信号的检测以及适应过程中地方品种的多样化

研究比较了地方种和野生种之间的Fst和等位基因频率比较,评估了这些生物气候TASs和开花时间的遗传分化间的关系。17个开花时间TASs和27个生物气候TASs的大部分均在驯化过程中存在强选择。在44个TASs中,有11个同时在驯化、地方种多样化和适应性中经历了选择,有3个仅在驯化过程中经历了选择,24个仅在地方种多样化和适应性中经历了选择,有6个没有表现出被选择。这些分析结果说明了自然和人工选择对特定环境适应性的作用及生物气候变量对大豆地方种之间遗传变异模式的影响。

开花候选基因/QTL的鉴定

E1 、 E2 基因是已知影响开花的基因。文中鉴定到的三个TASs(Chr06:19873100,Chr06:20003061和Chr06:20355903)位于Chr06上 E1 基因附近,且对开花时间的影响不同,在不同的地区表现出不同的表型变异,其地理分布也表现出不同的模式。说明在 E1 附近可能存在一个或多个以前未检测到的开花时间相关基因。

在E2基因附近检测到两个强关联位点Chr10:45520960和Chr10:45521328,通过对携带不同基因型的不同亚群之间表型鉴定,检测到开花时间的显著差异,表明 Glyma.10G224500 是开花时间的相关候选基因。

利用北京和武汉两地点的实测开花时间数据,通过GWAS鉴定了第12号染色体上的两个开花时间TASs(Chr12:5470311和Chr12:5914898)。Chr12:5470311位点与拟南芥开花基因同源且与一开花时间相关TAS连锁;Chr12:5914898位于编码Cyclic Nucleotide-gated Ion Channel 15-Related蛋白的基因 Glyma.12G076800 的内含子上;经表型(图4C,D)及Fst和等位基因频率分析鉴定(图4E)表明两位点均参与了开花时间的调控。

图4 开花时间位点Chr12:5470311和Chr12:5914898的鉴定



  • 18983916549: 寄主—病原物互作指什么?
    党婕:对植物保卫素的特异性抑制作用,以及产生毒素杀死或麻醉植物使防卫基因不能表达。在理论上,这种适应性...寄主抗病性(R)\/感病性(r)等位基因的产物是一类位于细胞表面,具有位点结合构型的受体(recepter)。而...(soybeanlectin)诱导Bmdyrhizobium大豆外缘凝结素SBLspp.孢子萌发及囊化反应诱导真菌Phytopthora半乳糖醛...
  • 18983916549: 什么叫转基因大豆
    党婕:有人说,进口的转基因大豆除了榨油还加工豆腐、豆浆,专家回应说,进口转基因大豆是高油大豆,脂肪含量高,蛋白质含量较低,适合榨油而不适合做豆腐,市场销售的豆腐、豆浆等豆制品是国产非转基因大豆制作的。 推荐: 问题五:什么是转基因大豆? 通过各种技术将目标基因导入至大豆的基因组内,并且有遗传性的大豆。绝对会...
  • 18983916549: CRISPR Cas9知识储备第一弹:简介
    党婕:Crispr-CAS9系统最初在细菌和古生菌中观察到,作为一种适应性微生物免疫系统,提供对外来病毒和质粒的获得性免疫;已测序物种中,40%的细菌和90%的古生菌可观察到CRISPR基因座,且细菌中可能存在一个以上的基因座。 入侵的外来DNA被Cas核酸酶切割,然后以间隔序列的形式被保守的重复序列捕获并整合到crispr位点,所获得的...
  • 18983916549: 如何构建载体
    党婕:这些特异性启动子的克隆和应用为在植物中特异性地表达外源基因奠定了基础。例如,瑞士 C I B A - G E I G Y 公司使用 P R - I A 启动子控制转...3 消除位置效应当外源基因被移人受体植物中之后,它在不同的转基因植株中的表达水平往往有很大差异。这主要是由于外源基因在受体植物的基因组内插入位点不同...
  • 18983916549: 帮忙啊!!!大豆胞囊线虫病害发生之后,要想测其病程相关蛋白,都要测什...
    党婕:多数已克隆的R基因具有较高序列一致性,蛋白产物往往具有相似的结构域,如C-端存在富亮氨酸重复序列(leucine-rich repeat,LRR),N-端存在核苷酸结合位点(nucleotide binding site,NBS),亮氨酸拉链(leucine zipper,LZ),跨膜结构域(transmembrane domain,TM),蛋白激酶(protein kinase,PK),以及果蝇Tool蛋白及哺乳动物白细胞...
  • 18983916549: 基因对基因概念是什么意思?
    党婕:亚麻抗病基因以等位形式存在,而锈菌无毒基因是非等位的。②亚麻抗病性和锈菌的无毒性是显性遗传,而亚麻感病性和锈菌的毒性是隐性遗传。在二倍体基因组中,针对某一特定的抗病基因位点,共有9个亚麻基因型与锈菌基因型的组合,这9种组合互作产生的表现型只有2种,即抗病或感病。抗病表现型只出现在R\/A等位基因对中,...
  • 18983916549: 团队作案HEK293,史上最强搬砖细胞
    党婕:这些细胞在转录活跃的基因组位点上包含一个稳定整合的FRT位点,有针对性的整合Flp-In表达载体,确保高水平目的基因。Flp-In t -293细胞系包含稳定整合的pFRT lacZeo和pcDNA 6 TR(来自T-REx系统)。用Flp- in表达载体和Flp重组酶载体pOG44共转染Flp- in细胞系,可将表达载体定向整合到每个细胞的同一...
  • 18983916549: 瓦维洛夫作物起源学说的内容是什么?
    党婕:Hawkes(1983)认为这种现象应更准确地描述为“类似系列法则”,因为可能不同的基因位点与此有关。Kupzov(1959)则把这种现象看作是在不同种中可能在同一位点发生了相似的突变,或是不同的适应性基因体系经过进化产生了相似的表型。基因组学的研究成果也支持了该理论。此外,瓦维洛夫还提出了“原生作物”...
  • 18983916549: 科学术语有哪些?
    党婕:4. 生物体具应激性,因而能适应周围环境。5. 生物遗传和变异的特征,使各物种既能基本上保持稳定,又...7. 对于有性生殖的生物来说,个体发育的起点是受精卵。8.很多双子叶植物成熟种子中无胚乳(如豆科...RNA聚合酶的结合位点,编码区的上游,非编码序列,人类基因组研究,基因拼接技术,DNA重组技术,转基因,工具...
  • 18983916549: 高中生物知识点
    党婕:应激性生长、发育、生殖遗传和变异生物体都能适应一定的环境和影响环境 生物体的基本组成物质中都有蛋白质和核酸。蛋白质是生命活动的主要承担者。核酸是遗传...人类基因组计划意义:遗传病的诊断、治疗;基因表达的调控机制;推动生物高新技术发展。 在调控序列中,最重要的是位于编码区上游的RNA聚合酶结合位点。在真核...

  • 相关链接

  • 父亲基因杂合变异
  • 基因进化狂潮
  • primer blast验证引物
  • β地贫基因突变28杂合
  • 经验分享为自博友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
    有问题请发邮件给我们
    © 经验分享网