论文摘要:从公共数据库中下载61, 731条草莓表达序列标签(EST),组装后得到系列非冗余EST 14, 948条,总长度为9, 969.35 kb,挖掘到1, 807个SSR,分布在1, 515条序列上,发生频率为10.14%,平均每5.52 kb出现1个SSR。其中,235条系列包含2个或2个以上SSR,76个SSR以复合形式出现。二核苷酸(794个SSR)和三核苷酸(795个SSR)是主要的类型,所占比例分别为43.94%和44.00%。AG/CT(691个)和 AAG/CTT(278个)在二、三核苷酸中占主导地位。利用这些序列,设计47对引物,对生产上主栽的3个日本品种进行多态性研究,44对引物有扩增产物,6对表现多态性。结果表明,从草莓相关EST数据库中开发的EST-SSR引物可行且有用,在草莓品种鉴定、种质资源分析、遗传作图等研究方面有广阔的应用前景。
论文关键词:草莓,标记开发
简单序列重复简称SSR,是一类由几个(多为1-6个)碱基为单位串联重复的DNA序列,表达序列标签简称EST,是来源于一定环境(正常生长或逆境胁迫等)一定组织(根、茎、叶、花、果等)一定长度(20-700bp不等)的cDNA片段,EST-SSR标记是近年来新发展的来自于比较保守的转录区的SSR标记。与普通SSR标记相比,它是功能基因的序列,高质量标记的比率较多;开发过程简单成本低;是一种有功能的分子标记。
随着大规模基因组测序的发展,公共序列数据库中集中了大量可用的EST序列,从公共数据库获得EST序列开发EST-SSR标记是一种非常快速、高效的方法。这种方法已经被越来越多的果树研究者用来开发EST-SSR标记,并在遗传多样性、亲缘关系、功能基因定位、遗传作图中得到应用。目前,已发表的草莓属SSR标记数目约250个,这些标记来源于基因组文库,GenBank序列。草莓相对于其他果树甚至蔷薇科果树开发并发表的SSR标记数目较少,有必要开发大量的SSR标记,尤其是功能性EST-SSR标记,以丰富草莓SSR标记数目,为草莓基因组学研究及育种提供帮助。
本研究从公共数据库中下载草莓EST序列,去冗余处理后,用SSR搜索工具对这些序列进行搜索,对搜索到的包含SSR的EST序列用PrimerPremier5.0设计引物,并用3个主栽草莓品种检测新开发的SSR标记,确定引物的多态性和有用性,为今后开发EST-SSR标记提供参考。
1材料和方法
1.1草莓EST序列来源
草莓EST来自NCBI(美国国家生物技术信息中心)数据库(http://www.ncbi.nlm.nih.gov/)、PlantGDB(http://www.plantgdb.org/)、和http://www.bioinfo.wsu.edu/cgi-bin/gdr/gdr_unigeneV4_project_description.cgi?genus=fragaria三个网站的EST,共计61,731条。
1.2EST-SSR挖掘
首先,用SeqClean(http://www.tigr.org/tdb/tgi/software)去除载体、线粒体叶绿体等序列及冗余,然后用EST-trimmer(http://pgrc.ipk-gatersleben.de/misa/download/est_trimmer.pl)除去5’端或3’端50bp的polyT或polyA,并剔除小于100bpESTs。前处理后的EST通过软件Phrap进行片段重叠群分析和聚类。拼接时设定的初始装配参数为:最小匹配碱基数(minmatch)为20,最小分值(minscore)为40。对错误拼接序列设置比较高的装配参数再次进行拼接、判别,共进行了3次。用SSRIT(http://gramene.agrinome.org/db/searches/ssrtool)检索SSR-EST。筛选标准为:单核苷酸重复的次数在16次或16次以上,二核苷酸重复的次数在6次或6次以上,三至六核苷酸重复的次数在5次或5次以上。同时,也筛选中间被少数碱基(间隔小于10或等于10)打断的不完全重复的SSR。
1.3EST-SSR引物设计
利用PrimerPremier5.0软件设计SSR位点两侧引物。参数设置如下:产物长度范围设为75-350bp,引物长度范围为18-27bp,最佳为20bp。其它参数采用默认值。引物设计时确保产物序列中包括SSR位点。选用软件给出的最优的设计结果合成引物,引物由上海invitrogen设计。
1.4DNA提取、PCR扩增及变性聚丙烯酰胺凝胶电泳
试验材料生产上主栽的日本品种:红颊、明宝,佐贺清香。DNA提取采用CTAB法(陆苏瑀等,2010)。PCR反应体系为25μL,其中包括:1×Buffer,1.5mmol·LMgCl200mmol·LdNTPs,0.3mmol·L引物,0.5UTaq酶,50ngDNA模板,所用试剂均购自Fermentas公司。PCR扩增反应条件是:94℃预变性4min;94℃30s,合适温度退火45s,72℃延伸1min,30-35个循环;72℃延伸5min。PCR产物用8%变性聚丙烯酰胺凝胶电泳在Bio-Rad序列分析电泳槽电泳,75W,1-1.5h。银染法染色(陆苏瑀等,2010)。
2结果与分析
2.1草莓EST-SSR出现的频率和特点
从NCBI等公共数据库下载61,731条草莓EST,检测的系列非冗余EST14,948条,总长度为9,969.35kb,挖掘到1,807个SSR,分布在1,515条序列上,发生频率(检出的SSR的EST数目与EST数目之比值)为10.14%,平均每5.52kb出现1个SSR。(表1)。从表1可知,草莓EST-SSR种类丰富,一至六核苷酸重复类型都能被检出,但各类型的SSR出现频率迥异。单、二、三核苷酸重复基元明显高于四、五、六核苷酸类型,前三者分别占SSR总数的10.90%、43.94%、44.00%,而后三者均不足1.00%。二核苷酸和三核苷酸重复的出现频率相近,数量最多。而数目越多的重复基元出现的平均距离越小。
表1草莓EST中SSR出现频率
Table1OccurrenceofSSRsinstrawberryESTs
重复类型
Repeat type classes
SSR数目
Number of SSRs
百分比
Percentage (%)
平均距离/kb
Mean distance
单核苷酸Mononucleotide
197
10.90
50.61
二核苷酸Dinucleotide
794
43.94
12.56
三核苷酸Trinucleotide
795
44.00
12.54
四核苷酸Tetranucleotide
16
0.89
623.08
五核苷酸Pentanucleotide
六核苷酸Hexanucleotide
合计Total
4
1
1807
0.22
0.05
100
2492.34
9969.35
5.52
表2不同重复基元类型的EST-SSR分布频率
Table2FrequencyofclassifiedrepeattypesinEST-SSR
重复类型
Repeat type classes
重复基元
Repeat motifs
数目
Numbers
百分比
Percentage (%)
单核苷酸
Mononucleotide
A/T
C/G
184
13
10.18
0.72
二核苷酸
Dinucleotide
AC/GT
AG/CT
AT/AT
CG/CG
41
691
61
1
2.27
38.24
3.38
0.06
三核苷酸
Trinucleotide
AAC/GTT
AAG/CTT
AAT/ATT
ACC/GGT
ACG/CTG
ACT/ATG
AGC/CGT
AGG/CCT
AGT/ATC
CCG/CGG
59
278
14
82
38
40
63
141
24
56
3.27
15.38
0.77
4.54
2.10
2.21
3.49
7.80
1.33
3.10
各种主要SSR类型如表2所示,各种不同重复基元出现频率存在很大差异,取百分比高于1%的核苷酸重复基元分析,结果表明A/T在单核苷酸中占了极大份额(10.18%),AG/CT在二核苷酸重复类型中出现频率最高(38.24%),而AAG/CTT是三核苷酸重复类型中的优势基元(15.38%)。二核苷酸重复基元有四种,除AG/CT外,AC/GT、AT/AT比例相关不大,远高于CG/CG。三核苷酸重复基元有十种,AGG/CCT、ACC/GGT、AGC/CGT、AAC/GTT、ACT/ATG、ACG/CTG出现频率分别为7.80%、4.54%、3.49%、3.27%、2.21%、2.20%,AGT/ATC、AAT/ATT出现频率较低。
对于基元重复长度,二核苷酸跨度最大,从12-130bp,三核苷酸跨度小于二核苷酸,从15-42bp;对于平均长度,五核苷酸最大为31.25bp,而三核苷酸最小为17.46bp(表3)。2.2草莓EST-SSR引物设计及其有效性
利用Primer5对235条系列进行SSR引物设计,共设计47对(代号JAAS1-47)引物。用这47对标记扩增生产上主栽的遗传差异较小的三个日本草莓品种红颊、明宝,佐贺清香,以检测引物的扩增成功率以及多态性。结果表明,44对引物能成功扩增,6对引物表现多态性(表3),引物的有效扩增率达93.62%,多态性占12.77%,说明利用草莓EST序列开发EST-SSR标记是可行的,并能有效的用于草莓品种的鉴定。
表3基元类型的重复长度分布
Table3Distributionofrepeattypeclassesbasedonsize
重复类型
Repeat type classes
跨度(bp)
Range
平均长度
Average size
二核苷酸Dinucleotide
12-130
19.87
三核苷酸Trinucleotide
15-42
17.46
四核苷酸Tetranucleotide
五核苷酸Pentanucleotide
六核苷酸Hexanucleotide
20-36
25-40
30
22.40
31.25
30
表4草莓6对多态性EST-SSR引物信息
Table46primerpairsfromstrawberry
引物
Primer
基元
Motif
Tm
℃
引物序列
Primer Sequences
扩增长度
bp
JAAS3
(AG)
62
F-CGAGGTCCCGATGTCGTTGT
R-TGATGCTGGCGTTGATGGTT
135
JAAS7
(CAC)
62
F-AGCAGCAACATTTCCAGACA
R- TCGGGCCTTAACTTCCTCTA
115
JAAS11
(CT)
59
F-TATTCAACCCTCTACCACCA
R-CAACAATCAAAGCTATAAGA
180
JAAS13
(AAG)
61
F-TGCCCTACTTTCACTTTCCT
R-CATACGCAGCGACATCTTCT
85
JAAS38
JAAS44
(CCA)
(TC)
61
60
F-AAGAGCTTTGCGTTTTCCTC
R-CACTATGTCGGCTTTGAACC
F-TTTTACAGACTGCTACAGAG
R-AGATGAAGAAGATGGAGAAG
230
280
M:分子量marker;1-3:日本草莓品种(1:明宝,2:佐贺清香,3:红颊);引物:JAAS1-15
M:marker;1-3:Japanesestrawberrycultivar(1:Meiho,2:Sagahonoka,3:Benihoppe);primer:JAAS1-15
图1不同EST-SSR引物在不同日本品种中的扩增结果
Fig.1TheamplificationresultsofdifferentEST-SSRprimerindifferentJapanesecultivar
前人研究表明,不同物种占优势的EST-SSR重复类型有所差异。在葡萄、柑橘中以三核苷酸重复为主,而在猕猴桃、核桃、杏和桃等中则是二核苷酸重复最多。本研究中,草莓EST-SSR序列中,二核苷酸重复和三核苷酸重复出现频率最高,三核苷酸稍高二核苷酸,二核苷酸重复中以AG/CT占主导,这与蔷薇科植物分布相同,证实了Gupta的观点,但与Powell认为的植物中主要二核苷酸重复是AT/AT相异。AG/CT根据读码框不同可以代表不同密码子如UCU、CUC、GAG、AGA,它们被翻译成甘氨酸、亮氨酸、精氨酸、谷氨酸,而甘氨酸、亮氨酸在草莓等蔷薇科植物中使用频率较高,因此AG/CT在二核苷酸重复中占绝对优势;本研究三核苷酸重复以AAG/TTC重复为主,是植物EST中三核苷酸重复的主要SSR类型。
对含有SSR位点的EST序列设计引物并分析其扩增效率、检验其多态性是标记开发的关键。已有研究表明成功扩增比例最高的是苹果100%,最低的是葡萄62.5%,本研究中设计引物的有效扩增率93.62%,介于两者之间。由于扩增的模板是基因组DNA,因此成功扩增不仅与EST序列质量、引物设计相关,而且与扩增区是否含有内含子显著相关。在标记的多态性比例上本研究为12.77%,导致EST多态性低的原因是由于EST序列的保守性[21]和多态性检验材料的遗传上高度相似性。EST不同区域的引物在不同属间、种间和品种间有不同水平的差异性,5’端和3’端非编码区的引物在品种间和种间多态性较多,尤其是3’端非编码区由于经常发生cDNA的剪切,在品种间的多态性较高,本研究所用EST多采用编码区;同时如果用来源更广、差异更大的材料用于检验,多态性可能会更多。本研究表明基于公共数据库开发的草莓EST-SSR引物是可行的,能用于草莓品种鉴定,并在草莓指纹图谱构建、种质资源分析、遗传作图等研究方面有广阔的应用前景。
参考文献
1 ScottK D, Eggler P, SeatonG, Rossetto M, Ablett E M, Lee L S, Henry R J. Analysis of SSRs derived from grape ESTs[J]. Theoretical and Applied Genetics, 2000, 100: 723-726.
2 ChenC,Bowman K D,Choi Y A,Dang P M,Rao M,Huang S,Soneji J R,McCollum T G,Gmitter Jr F G. EST-SSR Genetic Maps for Citrus sinensis and Poncirus trifoliate[J].Tree Genetics and Genomes,2007,4:1-10.
3 Celton J M, Tustin D S, Chagné D, Gardiner S E. Construction of a dense genetic linkage map for apple rootstocks using SSRs developed from Malus ESTs and Pyrusgenomic sequences[J]. Tree Genetics and Genomes 2009, 5:93-107.
4 ZHU Yan, HAO Yan-bin, WANG Ke-jian, WU Chun-lin, WANG Wei-xia, QI Jian-xun, ZHOU Jun. Analysis ofSSRs information and development of SSR markers from walnut ESTS[J]. Journal of Fruit Science, 2009,26(3):394-398.
5 Graham J, Smith K, MacKenzie K, Jorgenson L, Hackett C, Powell W. The construction of a genetic linkage map of the red raspberry (Rubus idaeus subsp. Idaeus idaeus)based on AFLPs, genomic-SSR and EST-SSR markers[J].Theoretical and Applied Genetics, 2004, 109:740–749.
6 Folta K M, Staton M, Stewart P J, Jung S, Bies D H, Jesdurai C, Main D. Expressed sequence tags (ESTs) and simple sequence repeat (SSR) markers from octoploidstrawberry (Fragaria x ananassa) [J]. BMC Plant Biology, 2005, 5:12-22
7 Bassil NV, Gunn M, Folta K M, Lewers K S. Microsatellite markers for Fragaria from 'Strawberry Festival' expressed sequence tags [J]. Molecular Ecology Notes,2006a,6: 473-476.
8 Bassil N V, Njuguna W, Slovin J P.EST-SSR markers from Fragaria vesca L. cv. Yellow Wonder [J]. Molecular Ecology Notes, 2006b, 6: 806-809.
9 Gil-Ariza D J, Amaya I, Botella M.A, Mu?oz Blanco J, Caballero J L, López-Aranda J.M, VALPUESTA V, S?NCHEZ-SEVILLA J F. EST-derived polymorphic microsatellites from cultivated strawberry (Fragaria × ananassa) are useful for diversity studies and varietal identification among Fragariaspecies [J]. Molecular Ecology Notes, 2006, 6: 1195-1197.
10 Riju A, Rajesh M K, Sherin P T, Chandrasekar A, Apshara S E, Arunachalam V. Mining of expressed sequence tag libraries of cacao for microsatellite markers using five computational tools[J]. Journal of Genetics, 2009, 88:217-225.
11 Li X, Shangguan L, Song C, Wang C, Gao Z, Yu H, Fang J. Analysis of expressed sequence tags from Prunus mume flower and fruit and development of simple sequence repeat markers [J]. BMC Genetic, 2010, 11:66-76.
12 Njuguna W. Development and Use of Molecular Tools in Fragaria [D]. Oregon State University, 2010.
13 LU Su-yu, YU Ming-liang, MA Rui-juan, SHEN Zhi-jun. Analysis of Genetic Diversity and Relationship of Crisp Peach by SSR[J]. Journal of plant genetic resources, 2010,11(3):374-379.
14 JIN Ji-qiang,CUI Hai-rui,CHEN Wen-yue,LU Mei-zhen,YAO Yan-ling,QI Ya,GONG Xiao-chun. Data mining for SSRs in ESTs and development of EST-SSR marker in tea plant [J].Journal of Tea Science,2006,26(1): 17-23.
15 Morgante M, Hanafey M, Powell W. Microsatellites are preferentially associated with nonrepetitive DNA in plant genomes[J]. Nature Genetics, 2000, 30: 194-200.
16 Fraser LG, Havrey C F, Crowhurst R N, De Silva H N. EST-derived microsatellites from Actinidiaspecies and their potential for mapping [J]. Theoretical and Applied Genetics, 2004, 108:1010-1016.
17 JIANG Chun-ya, XU Xiao-biao, LIAO-Jiao, GU Qing-qing, LIU Shan-jun, Cheng Jin-yin. Establishmentof SSR markers based on EST database from Actinindia[J]. Journal of Fruit Science,2010,27(4):622-625.
18 Jung S, Abbott A, Jesudurai C, Tomkins J, Main D. Frequency type distribution and annotation of simple sequence repeats in Rosaceae ESTs [J]. Functional & Integrative Genomics, 2005, 5:136-143.
19 Gupta P K, Balyan H S, Sharma P C, Ramesh B. Microsatellites in plants: a new class of molecular markers[J]. Current Science,1996,70: 45-54.
20 Powell W, Machray G C, Provan J. Polymorphism revealed by simple sequence repeats [J]. Trends in Plant Science, 1996, 1:215-222.
21 Zhang Ping-zhi,Dreisigacker S,Melchinger A E,Reif J C,Mujeeb Kazi A,Van Ginke M,Hoisington D,Warburton M L.Quantifying novel sequence variation and selective advantage in synthetic hexaploid wheat and their backcross-derived lines usingSSR markers [J]. Molecular Breeding, 2005,15:1-10. |