建立一个GE探针设计任务 |
|
“基因表达谱 (GE)探针设计”过程基于您上传的目标序列数据或GenBank参照号来创建探针。关于此过程的详细信息,请参阅关于基因表达谱(GE)探针设计。
您可以使用一个向导来全过程指导您通过“GE探针设计”来创建一个微阵列。
您必须是一名eArray注册用户。请参阅如何注册。
您必须拥有或者一个包含您的目标序列数据的FASTA格式文件,或者一个包含一个GenBank参照号列表的文本文件。对于GenBank参照号,文件必须包含用换行(回车)符号分隔的参照号。文件名不能包含任何空格。请为上传创建一个压缩(*.zip格式)版本的文件。
如果对于您想要的物种没有可用的“安捷伦建立”的物种转录组数据库,请准备一个FASTA格式文件,其中包含自定义的转录组数据,用来作为探针设计过程中的一个相似数据库。请为上传创建一个压缩(*.zip格式)版本的文件。
点击工作区标签。“GE探针设计”在合作中不可用。
设置应用类型至表达谱,如有必要。“GE探针设计”仅创建表达谱类型探针。
点击探针
> GE探针设计。
“GE探针设计”框将出现。
在页面顶端,选择以下方法之一:
碱基组成优先法 – 创建长度全部相同的探针,基于一个经验决定的的最佳基本组成配置。此方法为标准GE探针设计方法。它与安捷伦协议和大多数真核生物配合得最好。
解链温度(Tm)匹配法
– 创建的探针全部具有相近的预测解链温度(Tm)。对于原核生物,此方法是一个很好的选择。
在探针详细信息框中设置以下参数。其中一些参数仅适用于解链温度(Tm)匹配法。
参数 |
说明/详细信息 |
设计任务名称 |
输入一个名称,这样您过后可以以此辨识出此具体的GE探针设计任务。 |
探针长度 |
输入生成探针的最大长度。最大允许长度为25到60个碱基对。 安捷伦发现,对于安捷伦原位微阵列平台上的大多数实验,一个长度为60个碱基对的探针能够提供敏感度和专一性之间的最优平衡。 |
每目标序列探针数 |
为每个目标序列选择从1到10个探针。这是探针设计过程为每个上传的目标序列返回的最大探针数量。如果该目标序列质量较差(例如,如果它们包含重复序列和/或载体序列),那么探针设计过程就可以返回少于您所指定数目的探针。 因为生成探针的长度和高质量,安捷伦建议,您每个序列只创建一个探针。然而,如果每个目标序列创建了多个探针,您可以在一个验证过程后从中选择最好的探针。 |
屏蔽 |
eArray总是在探针设计过程中两个选项都使用,且它们不能被禁用。 载体序列 – 在探针设计过程中识别和忽略杂质片段。目标序列可能包含不是从研究样本中得来的杂质片段。这些片段通常都是来自克隆和放大过程中使用的克隆载体(例如,质粒、噬菌体、BAC、YAC)。 重复序列 – 在探针设计过程中识别和忽略目标序列中的重复序列。任何一个生物的基因组都包含零散分布的重复序列和低复杂度DNA序列。这些重复序列对于特定物种来说是独特的,它们在整个基因组中重复很多次,因此也存在于转录组中。重复序列区域不适合用来设计特异性强的探针。 |
探针取向 |
选择以下选项之一: 有意义链 – 取向于有意义链或"编码链"的探针,它们的序列和目标信使RNA(mRNA)序列相同。当样品制备方法产生cDNA或cRNA分子时,请选择此选项。 反义链 – 取向于反义链或"模板链"的探针,它们的序列是和目标信使RNA(mRNA)序列反向互补的。如果您在利用由RNA直接标记产生的样本时,请选择此选项。 |
设计选项 |
请选择您偏好的设计过程。这些选项只有当您在每个目标序列上设计多个探针时才有意义。 最优探针法 – 相比于让探针在探针选择窗口中均匀分布,探针设计过程更偏好选择最优可用探针。 最优分布法 – 相比于选择最优质量的探针,探针设计过程更偏好让探针在探针选择窗口中均匀分布。 |
偏置3'端设计 |
如果您想要让生成的探针集中于每个目标序列3'端的1,000个碱基对,请选中此选项。 如果您使用安捷伦(或其他公司)的线性放大标记方式,在目标序列3'端选择探针是十分重要的。由于聚合酶反应活性的衰减,线性放大通常产生比起始模板要短的序列。因为这样的原因,大多数标记产物只能代表每个目标序列3'端大约1000个碱基对。所以在这个区间设计探针是非常必要的。 |
允许探针被剪切 |
(仅可用于解链温度匹配的GE探针设计任务) 如果选中此复选框,则允许探针被剪切至短于“探针长度”处的长度。此操作可以使解链温度(Tm)接近目标解链温度(Tm)。探针不会被被剪切到少于45个碱基对。 从概念上说,一个探针越短,它的可用互补序列就更少,这就降低了它的专一性,或者破坏了了它与目标序列形成一个稳定的双螺旋的能力。然而,这种情况十分严重的风险却很低。 |
最优探针解链温度 |
(仅可用于解链温度匹配的GE探针设计任务) 输入探针设计过程的目标解链温度(Tm)。 在此温度下,DNA的两条互补链中,双链形式和单链形式以50:50的混合。 基于两个因素来选择探针的解链温度的:
实际操作中,目标解链温度应该比杂交温度高20° C左右。例如,如果杂交温度为60°C,那么目标探针解链温度就为80°C。 |
在目标序列文件详细信息下设定以下参数。目标序列文件包含序列或GenBank参照号,eArray用之来生成探针。
物种 – 选择想要的物种。物种是必填的。
选择以下上传选项之一:
以FASTA格式上传 – 点击浏览。选择想要的FASTA格式目标序列文件,然后点击打开。您的文件的名称将出现在框中。eArray要求文件应为压缩格式(*.zip格式)。
上传GenBank参照号 – 点击浏览。选择想要的GenBank参照号文件,然后点击打开。您的文件的名称将出现在框中。eArray在开始“GE探针设计”过程之前,先将文件中的GenBank参照号分解为实际的序列。eArray要求文件应为压缩格式(*.zip格式)。
在转录组详细信息下,选择您想要探针设计过程使用的转录组数据类型。探针设计过程应用转录组数据作为一个相似度数据库,从而消除那些有可能和非目标序列产生高度杂交反应的探针序列。
使用目标文件作为转录组 – 使用在目标文件中定义的序列作为转录组相似数据库。如果您要为一个生物定义一个“全部转录组”微阵列,此生物未被包含在安捷伦转录组集合中,且目标文件表示了目标转录组中大部分或全部的转录本。此选项适用于包含实际序列数据、或者包含GenBank登录号的上传目标文件。
选择安捷伦提供的转录组(按物种) – 选择一个安捷伦可用物种的转录组数据库。如果存在转录组适用于您的物种,请选择此选项。这些转录组作为相似数据库,是特别为GE探针设计而构建的。请从列表中选择想要的物种。
注意:您在这里选择的物种会覆盖您之前所选择的物种。
上传转录组文件
– 应用一个FASTA格式的转录组文件作为相似度数据库。如要选择此选项,请点击浏览。选择想要的转录组文件,然后点击打开。该文件的物种就会显示在文本框中。eArray要求一个压缩版本(*.zip
格式)的文件格式。
点击提交。
eArray将验证您上传的文件格式,并将您的探针设计任务提交至安捷伦进行处理。一个消息会通知您,探针设计完成时您将收到一封电子邮件。
点击退出。
一个查找结果框会在页面底部出现。使用此框来监测任务状态。当该任务的状态为“已完成”时,您就可以查看、下载、或删除结果,或者用此结果创建一个新探针组。
“GE探针设计”是一个计算密设计集的过程。您的设计任务可能需要一天或更多时间来完成,取决于您的文件的大小和队列中排在您任务前面的其他用户的任务数量。
相关链接