摘 要:为建立口蹄疫病毒(Foot-and-mouth diseasevirus,FMDV)不同血清型与基因型的基因芯片检测方法,设计针对O型8个基因型、A型3个基因型和亚洲1型的特异性探针。从美国GenBank与英国世界口蹄疫参考实验室基因库下载了O型、A型和亚洲1型FMDV的VP1基因序列547条。对每一血清型序列用DNAStar软件ClastalW程序进行多重比对,做系统发育分析并进行基因分型。用生物学软件Bio Sun2.0建立基因型数据库,设计每一基因型的特异性探针。共设计出104条候选探针,通过芯片试验筛选出12条特异性探针。以各型特异性探针所对应的靶序列模板做10倍系列稀释进行PCR扩增,扩增产物与探针杂交,验证各探针的灵敏度。对O型SEA、Euro-SA、ME-SA、WA4个基因型的各条探针的灵敏度进行了检验,结果这些探针能够检测到102数量级拷贝数的阳性靶标。
关键词:口蹄疫病毒;血清型;基因型;VP1基因;基因芯片;寡核苷酸探针
基因芯片又称DNA微阵列,是专门用于核酸检测的生物芯片,也是近年来应用最广泛的微阵列芯片。它是指在固相载体上按照特定的排列方式固定上大量序列已知的DNA片段,形成DNA微矩阵,固定于固相载体上的DNA片段称为探针。将样品基因组DNA/RNA通过PCR/RT-PCR扩增等技术掺入标记分子后,与位于微阵列上的已知探针序列杂交,用于杂交的样品称为靶序列,通过激光共聚焦荧光检测系统对芯片进行扫描,检测杂交信号强度,经计算机软件进行数据比较和综合分析后,即可获得样品中大量基因序列特征或基因表达特征的信息。
口蹄疫病毒(Foot-and-mouth diseasevirus,FMDV)可侵染猪、牛、羊等畜种及其他70多种家养和野生偶蹄动物,是一种烈性传染病。FMDV属于小RNA病毒科(Picornaviridae)、口蹄疫病毒属(Aphthovirus),含有约8500个核苷酸的单股RNA病毒。FMDV有7个不同的血清型,即A、O、C、Asia1、SAT1、SAT2和SAT3型。划分同一血清型的FMDV株普遍采用基因型。以15%的核酸序列差异率为临界值,对105株血清O型毒株VP1基因3′端核苷酸序列进行了同源性分析,使用不加权配对组算法(unweightedpair-group method using arithmeticaverages,UPGMA)绘制了系统发育树,经过分析,对O型FMDV确定了8个主要基因型。由于这些基因型与特定的地域有关,故又称为拓扑型,即中国型(Cathay)、中东-南亚型(ME-SA)、东南亚型(SEA)、欧洲-南美型(Euro-SA)、印尼-1型(ISA-1)、印尼-2型(ISA-2)、东非型(EA)和西非型(WA)。A型病毒株可以分为3个基因型,即欧洲南美型(Euro-SA)、亚洲(Asia)和非洲型(Africa)。亚洲1型核苷酸序列差异比其他血清型小很多,不能将其分为1个以上的基因型。本试验旨在设计口蹄疫病毒O型内8个基因型、A型内3个基因型和亚洲1型的特异性探针,为口蹄疫病毒分型诊断芯片的研究奠定基础。
1 材料与方法
1.1 材料
1.1.1 种毒和样品 O、A、亚洲1型FMDV灭活细胞培养物各1份,由中国农业科学院兰州兽医研究所提供。经赛百盛基因技术公司合成代表6个基因型的6条核苷酸序列(每条约100bp)。
1.1.2 序列来源 从美国GenBank(http://www.ncbi.nlm.nih.gov)与英国世界口蹄疫参考实验室(WRLFMD)基因库(htt://www.iah.bbsrc.ac.uk)下载的547条VP1基因序列。
1.1.3 生物学软件 军事医学科学院开发的生物学软件Bio Sun 2.0,生物信息学处理软件DNAStar,引物设计软件Primer Premier 5.0。
1.1.4 仪器与试剂 iCyclerPCR仪为BIO-Rad公司产品,GenePix4000B扫描仪为Axon公司产品,PixSys5000点样仪为Cartesian公司产品,DU640紫外分光光度计为Beckman公司产品,基因芯片购自CELAssociates公司,Cy3荧光染料购自Amersham公司,PCR试剂、琼脂糖凝胶DNA回收试剂盒、普通质粒小提试剂盒、感受态细胞(TOP10)均购自天根生化科技有限公司,TrlzolReagent购自上海英骏生物技术公司,Takara one step RT-PCR Kit(AMV)和PMD18-TVector购自宝生物工程(大连)有限公司。
1.2 方法
1.2.1 FMDV的VP1基因区序列系统发育树分型 从美国GenBank与英国世界口蹄疫参考实验室基因库下载FMDV的VP1基因序列547条,其中O型FMDV210条,A型FMDV 113条,亚洲1型FMDV 224条。对每一个血清型应用DNA Star软件ClastalW程序进行多重比对,然后用Tree View程序绘制系统发育树,对所下载序列进行基因型划分。
1.2.2 FMDV分型探针设计 应用生物学软件Bio Sun2.0对每个基因型内的序列设计探针。将所要进行基因型探针设计的该基因型所有序列转化集成为一个数据库,导入Datebase forTargets数据库,将该数据库和除该基因型序列以外的所有其他序列做成另一个数据库,导入Datebase for Targets& non-Targets数据库,在相应的对话框内选择探针参数进行探针设计。
通过软件自带的BLAST工具搜索该基因型数据库的其他序列,筛选出能覆盖尽可能多序列的该基因型的通用探针。
1.2.3 探针的筛选 为了减少非特异性杂交,保证芯片杂交的敏感度和精确度,探针设计还要遵循以下原则:探针的Tm值应该接近整个基因组的平均Tm值,上下波动不超过5℃;重复的碱基连续不超过6个;G+C含量在40%~60%;BLAST与其他序列的相似性小于75%,若相似性在75%以上则可能会出现交叉反应;探针连续同源的碱基数不应超过20个。或在进行探针筛选时,将同一基因型的探针一起点制芯片,然后将芯片与靶序列杂交,从而筛选出特异性最好、杂交信号最强的探针。
1.2.4 病毒阳性质粒的构建 用Trizol Reagent提取病毒RNA,一步法RT-PCR进行目的片段的扩增,PCR产物经回收纯化、连接、转化、质粒提取和测序,构建阳性质粒。
1.2.5 靶序列的扩增 将Baxi M K等设计的引物修改为,上游 5′-GCT CGG TAC TAC ACACAG-3′, 下游 5′-GGT TGG ACT CAA TGTCTT-3′,并且在1.1.1中合成的核苷酸序列两端也加上该对引物,扩增片段分别为1 070 bp与100 bp。
PCR反应体系为,无菌去离子水 18 μL,10×PCR buffer 2.5 μL,2.5 mmol/L dNTP 2 μL,2.5U/μL Taq DNA聚合酶0.5 μL,5 μmol上游引物0.5 μL,100 μmol下游引物(荧光标记) 0.5μL,质粒模板DNA 1 μL,总反应体积25 μL。PCR程序为94 ℃ 2 min;94 ℃ 30 s,50 ℃ 1 min,68℃ 1 min,进行35个循环;68 ℃ 5 min,4℃保存。
1.2.6 探针的特异性与灵敏度初步验证 将设计出的探针5′端氨基酸修饰后合成,通过点样仪点到醛基化玻片上(每个探针作2个重复)。对阳性质粒采用不对称PCR进行扩增,PCR体系中的一条引物采用Cy3荧光标记。将PCR扩增产物与探针在42℃条件下进行杂交,验证探针的特异性。将阳性质粒作101~107系列稀释,用稀释后的质粒为模板,PCR扩增产物与探针杂交验证探针的灵敏度。
2 结果
2.1 FMDV基因分型与探针设计
分别应用DNA Star软件中的Clasta l W程序多重比对后,通过TreeView构建系统发育树进行基因分型,并对每一个基因型用Bio Sun2.0设计特异性探针。对O型8个基因型共设计出55条探针,对A型3个基因型共设计出40条探针,亚洲1型FMDV只有一个基因型,设计出了9条特异性探针。共设计出候选探针104条(表1)。
表1 O型和A型FMDV基因分型序列数和设计出的探针数
Table 1 Type O and A FMDV sequence numbers genotyped and probenumbers designed
血清型 Serumtype | 基因型 Genotype | 序列数/条 Number of sequences | 探针数/条 Number of probes |
O | Cathay | 74 | 12 |
ME-SA | 68 | 15 | |
Euro-SA | 21 | 4 | |
SEA | 24 | 13 | |
WA | 4 | 3 | |
EA | 4 | 3 | |
ISA-Ⅰ | 3 | 3 | |
ISA-Ⅱ | 2 | 2 | |
A | Asia | 35 | 18 |
Euro-SA | 24 | 15 | |
Africa | 20 | 7 |
表2列出了本试验中筛选出的12条基因型探针的序列,这些探针的特性见表3。
表2 筛选出的12条FMDV探针序列
Table 2 Twelve FMDV probe sequences screened
探针编号 Probe | 基因型 Genotype | 探针序列 Probe sequence |
1 | Cathay | 5′-GCAAGTACGGTGACACCAGCACTAACAACGTGAGAGGC-3′ |
2 | ME-SA | 5′-TGCAAGTATGGCAGAGCCCCGTGACCAATGT-3′ |
3 | Euro-SA | 5′-TCCAAGGCCTTGCTGGCAATCCACCCACTGAAGCC-3′ |
4 | SEA | 5′-CTGGTGGGTGCGCTCCTCCGTACTGCCACTTACT-3′ |
5 | WA | 5′-CCTTCAAGTTCTGGCCCGGAGGGCGGCGCCGATGCT-3′ |
6 | EA | 5′-TCCGCGGCCTCTTTTGGCCACCCACCCGAG-3′ |
7 | ISA-Ⅰ | 5′-AATGCAGGTACGGTACACACACCACGACCAACGTGA-3′ |
8 | ISA-Ⅱ | 5′-ACACTGGTAGGAGGGCTCGTGCGCGCCGCCACTTA-3′ |
9 | Asia | 5′-ACAAGTACTCCGCGGCCAGTGAGCGCACACGGGGT-3′ |
10 | Euro-SA | 5′-ACCCACCAACACGGTCTAGTGGGTACGTTG-3′ |
11 | Africa | 5′-CGCAGACACCCCAGCACACACTTGTAGGTGCCTTG-3′ |
12 | AsiaⅠ | 5′-GCCTTTGCTAGCTCTTGACACCACTCAGGACCGCCG-3′ |
Table 3 The characteristics of 12 FMDV probes screened
探针编号 Probe | 基因型 Genotype | 探针长度/bp Probe length | 探针VP1位置/bp Probe position in VP1 | Tm/℃ | GC/% | △G |
1 | Cathay | 38 | 401~438 | 78.094 6 | 0.552 63 | -0.08 |
2 | ME-SA | 32 | 402~433 | 77.371 88 | 0.593 75 | -0.48 |
3 | Euro-SA | 37 | 561~597 | 81.340 37 | 0.594 59 | -0.53 |
4 | SEA | 34 | 181~214 | 79.688 86 | 0.617 65 | 0.63 |
5 | WA | 36 | 441~476 | 84.419 85 | 0.666 67 | -2.72 |
6 | EA | 30 | 561~590 | 82.237 47 | 0.7 | -1.52 |
7 | ISA-Ⅰ | 36 | 401~436 | 77.949 19 | 0.527 78 | -1.07 |
8 | ISA-Ⅱ | 35 | 181~215 | 83.444 46 | 0.657 14 | -1.21 |
9 | Asia | 35 | 401~435 | 83.709 61 | 0.657 14 | -1.21 |
10 | Euro-SA | 30 | 166~195 | 75.138 49 | 0.566 67 | -2.83 |
11 | Africa | 35 | 161~195 | 79.271 37 | 0.6 | -0.24 |
12 | AsiaⅠ | 36 | 561~596 | 79.864 93 | 0.611 11 | -0.05 |
2.3 探针的特异性与灵敏度验证
已经验证了部分探针的特异性与灵敏度,以ME-SA特异性探针的灵敏度为例(图2)。
图1 特异性探针筛选
Fig.1 Specific probe selection
A.空白;B.质粒拷贝数为102数量级;C.质粒拷贝数为103数量级;D.质粒拷贝数为104数量级;E.质粒拷贝数为105数量级;F.质粒拷贝数为106数量级
A.Blank;B.102 plasmid copy numbers;C.103 plasmid copy numbers;D.104plasmid copy numbers;E.105 plasmid copy numbers;F.106 plasmid copynumbers
图2 ME-SA特异性探针的灵敏度
Fig.2 The sensitivity of the ME-SA genotype probe
3 讨论
基因芯片技术从产生到现在才不过短短十几年的时间,但它在生命科学各个领域的应用已经展示出了其蓬勃的生命力。它的主要特点是高通量、微型化和自动化。基因芯片上可以高度集成成千上万密集排列的探针,能够在很短时间内分析大量的生物分子,使人们能够快速准确地获取样品中的生物信息,检测效率是传统检测手段的成百上千倍。因此,以基因芯片为手段的研究将会有巨大的商业价值和良好的发展前景。
FMDV开放阅读框(ORF)中编码着4种结构蛋白,该4种结构蛋白的基因区称为P1区,依次编码1A(VP4)、1B(VP2)、1C(VP3)和1D(VP1)。FMDV7个血清型的结构蛋白氨基酸组成数不同,在4种结构蛋白中,差异最大的是VP1,其次为VP3和VP2。根据FMDV7个血清型编码衣壳表面基因VP1的3′末端序列的系统发育分析,得到了与7个血清型相对应的7个基因世系,证明了这些基因世系与血清型密切相关,而衣壳编码区以外的基因组任意一端都与血清型无关。因此,在进行FMDV分型诊断芯片的探针设计过程中,选择用VP1基因序列设计探针。
用生物学软件Bio Sun2.0进行探针设计,能够将许多需要进行探针设计的序列组建成数据库,从而针对数据库进行探针设计,这就比单纯对一条序列进行探针设计的软件具有方便、快捷和高通量处理的优点。BioSun2.0虽然能够对所要设计探针的序列根据需要进行组库(如Cathy基因型数据库),方便快捷地设计出探针,但是它所设计出的探针只与Targets数据库中相应的序列是一一对应的,即特异的。要检验该探针能否探测到其他序列,还要通过软件自带的BLAST工具搜索该基因型数据库的其他序列,筛选出能覆盖尽可能多序列的基因型的通用探针,并尽量减少探针的数目,以便简化试验和降低成本。根据常规的探针设计参数,我们把探针的长度控制在30bp~38 bp之间,探针的Tm值控制在75 ℃~85 ℃之间。经过Bio Sun2.0设计出的探针再用其BLAST程序对下载的所有口蹄疫病毒序列数据库进行搜索,从理论上排除探针的非特异性杂交。
将设计出来的探针合成后通过点样仪点至醛基化的玻片上,将阳性样品用荧光标记的引物进行PCR扩增。PCR产物与芯片进行杂交,验证探针的特异性和敏感性。已经确定了12条探针的基因型特异性,检验了O型SEA、Euro-SA、ME-SA、WA4个基因型的各条探针的灵敏度。下一步工作将验证更多探针的特异性与灵敏度,并结合临床样本确定每一条探针的cut off值。
分享到:
展开全文