序列捕获探针叠瓦式设计

 

“序列捕获探针叠瓦式设计”创建的序列捕获探针以平均的间距覆盖到指定的基因组区域上。您可以自定义叠瓦式设计过程使用指定的测序技术和流程、并选择序列捕获探针的长度和叠瓦式设计的密度。如果您愿意,您可以使用一个向导来让eArray引导您设计并提交一个使用序列捕获探针叠瓦式设计的序列捕获探针文库 — 请参阅应用序列捕获探针叠瓦式设计来创建序列捕获探针文库(使用向导)。更多关于序列捕获探针叠瓦式设计的详细信息请参阅本主题最后部分的更多序列捕获探针叠瓦式设计的详细信息

  1. 点击工作区标签。在合作中不能使用“序列捕获探针叠瓦式设计”。

  2. 设置应用类型靶向序列捕获。

  3. 点击探针 > 序列捕获探针叠瓦式设计。

    “序列捕获探针叠瓦式设计”页面会出现。

  4. 设置以下参数。全部均为必填。

参数

说明/详细信息

设计选项

设计任务名称

为此“序列捕获探针叠瓦式设计”任务输入一个名称。

测序技术

从列表中,选择您想要用来分析您的目标DNA片段的DNA测序仪。

测序流程

从列表中选择想要应用的流程,eArray会显示对于您选中的DNA测序技术可用的测序流程。

设计策略

通常情况下,请选中使用最优化参数。选择此选项后,根据您选择的测序技术和测序流程,eArray会自动为“设计策略”、“序列捕获探针长度”、“序列捕获探针叠瓦频率”、以及“允许在禁止区域上发生重叠”几项设置最优值。

如要手动设置全部这些选项,请不要选中使用最优化参数。则此选项就可以设置了。

设计策略处,选择以下选项之一:

  • 中心式 – eArray将序列捕获探针布局于所选目标片段的中心,也就是说,每一组探针对目标序列两端进行同等的覆盖。这一选项确切应用您所选择的“序列捕获探针叠瓦式设计”频率。

  • 修正式 – eArray设计一组叠瓦式序列捕获探针,它们准确的覆盖它们各自的目标片段。此选项调整探针之间的重叠程度,以达到精确并且平均的叠瓦式频率。通过这一选项设计的探针不会延伸进入非目标片段。您实际的叠瓦式设计频率可能会和您选择的频率略有不同。

序列捕获探针长度

(仅当不选中使用最优化参数时可以编辑。) 当前,eArray支持的长度为120个核苷酸。

  • 注意:
    一个序列捕获探针文库中的全部序列捕获探针都应为同一长度。如果您想要将两个或多个源中的序列捕获探针合并到一个序列捕获探针文库,请确保全部序列捕获探针的长度都相同。

序列捕获探针叠瓦频率

(仅当不选中使用最优化参数时可以编辑。) 请选择序列捕获探针叠瓦频率。这将设置叠瓦的密度。该密度也会被“设计策略”所影响。

  • 1x – eArray会端对端的将序列捕获探针叠瓦到每个目标片段。序列捕获探针覆盖目标片段的全部碱基,没有重叠。

  • 2x – eArray会让序列捕获探针在叠瓦每个片段时都重叠50%。每个碱基被两个探针所覆盖。

  • 3x – eArray 会让序列捕获探针在叠瓦每个片段时都重叠33%,每个碱基被三个探针所覆盖。

  • 4x – eArray 会让序列捕获探针在叠瓦每个片段时都重叠25%,每个碱基被四个探针所覆盖。

  • 5x – eArray 会让序列捕获探针在叠瓦每个片段时都重叠20%,每个碱基被五个探针所覆盖。

  • 注意:取决于您的其他设置,实际的叠瓦密度可能会在每个片段的5'端和3'端略少于所设定的值。

允许在禁止区域上发生重叠

(仅当不选中使用最优化参数时可以编辑。) 如要更改此值,请先选中它,然后输入您希望的碱基对之间的举例。eArray生成的序列捕获探针有可能会延伸至此长度。这样的延伸可能会进入您所选择的“基因组禁止区域”。为了达到最优结果,最大的设置长度为20 bp。

目标详细信息

物种

选择想要的物种。该物种就是由您的目标序列数据所代表的物种。

基因组版本

(只读) 此框显示了您所选物种的基因组版本,eArray将使用此版本来生成序列捕获探针。

基因组目标片段

应用chrX格式来输入目标片段:<start>-<end> (例如,chr21:1000000-1500000)。多个片段用分隔符"|"分隔。

或者,您也可以上传一个基因组片段的文件。创建一个*.txt文件的列表,每行含有一个片段。每行结束另起一行 — 也就是,在一个文字处理软件中,每行结束都点击回车。然后参照以下步骤:

  1. 在“基因组目标片段”框的旁边,点击上传。

  2. 选择想要上传的文件,然后点击打开。
    eArray会上传片段列表,并以分隔符分隔的格式来在“基因组目标片段”框中显示它们。

基因组禁止区域

选中以下任意选项:

  • 避免标准重复序列区域 – eArray会在“序列捕获探针叠瓦式设计”过程中排除一个重复基因组区域的标准集合。这些区域是通常产生质量低劣的探针的基因组区域。系统会默认选择此选项。

  • 自定义禁止区域 – 在“序列捕获探针叠瓦式设计”过程中,eArray会排出您在此指定的基因组区域。请按以下格式输入片段:chrX:<start>-<end> (for example, chr21:1000000-1500000)。多个片段请用分隔符"|"分隔。或者,您可以上传一个基因组片段的列表。以*.txt格式创建一个列表。每行包含一个换行符 — 也就是,在一个文字处理软件中,每行结束都按下回车。然后参照以下步骤:

  1. 在“自定义禁止区域”框旁边,点击上传。

  2. 选择想要上传的文件,然后点击打开。
    eArray会上传片段的列表,并将它们以分隔符分隔的形式显示在“自定义禁止区域”框中。

  1. 点击上传。
    eArray会提交您的“序列捕获探针叠瓦式设计”任务到安捷伦来进行处理。一个消息会通知您,任务完成后您将收到一封电子邮件。

  2. 点击退出。

    “序列捕获探针叠瓦式设计”页面会出现。您的“序列捕获探针叠瓦式设计”任务会出现在页面底部的“查找结果”框中,在那里您可以监测它的状态。该页面不是动态更新的 — 点击刷新来将该框更新至最新版本。

状态名称和含义

状态

描述

排队中

任务已经被提交到了安捷伦,但是还没有对它进行任何操作。

设计中

任务已经被提交到了安捷伦,并且已经开始处理。

已完成

任务已经被安捷伦完成,并且结果已经可以供您使用。

错误

任务已经被提交到了安捷伦,但存在问题。您必须重新提交您的任务。eArray会发送给您一封电子邮件,告知您产生的错误。此电子邮件可能会包含关于该错误的额外信息。

 

您的“基因组叠瓦式设计”任务可能需要花费一天或几天才能完成,这取决于队列中排在您的任务前面的任务数量,以及您上传文件的大小。当eArray完成了您的“基因组叠瓦式设计”任务后,您将收到一封电子邮件,并且任务的状态会变为“已完成”。You 您就可以查看下载结果了,您也可以从它们来创建一个新的序列捕获探针组

 

更多序列捕获探针叠瓦式设计的详细信息

关于靶向序列捕获中的序列捕获探针文库,安捷伦可以提供什么指导?

在生成自定义的SureSelect靶向序列捕获探针文库时,安捷伦建议:

多大的基因组区间可以被靶向序列捕获?

在每个试剂盒中,安捷伦可以生产含有多达55,000个序列捕获探针的序列捕获探针文库。当前可用的序列捕获探针长度为120个核苷酸,默认的叠瓦式频率为2X。给定这些参数后,您靶向序列捕获的空间可以达到3.3 Mb。如果您增加叠瓦式设计频率,此值会降低。

被靶向序列捕获的最大区域是什么?

假设使用长度为120-mer的序列捕获探针并运用2X的叠瓦式设计频率,能捕获的最长单个基因组区间将是3.3 Mb。然而,您可以选择在叠瓦式设计时避免某些区间,也就是基因组禁止区域。这些区间可以包含默认的标准重复区域集合,以及您指定的自定义区间。这样可以增加能被捕获的区间的大小。

为什么2X叠瓦式设计很有帮助?

以2X密度进行叠瓦式设计的序列捕获探针交错的覆盖目标区域。如果一个探针的末端覆盖了某一目标序列,那么覆盖同一区间的另外一个探针的中间段将会覆盖这一目标序列。对于使用末端测序(end-sequencing)的测序技术,例如Illumina technology,2X叠瓦式设计可以帮助对DNA片段中间的区域进行更有效的测序。

如果我没有达到序列捕获探针文库的容量,我应该增加叠瓦式设计频率吗?

是的。叠瓦式设计的频率越高,靶向序列捕获的结果越好。

在一个序列捕获探针长度设置为120个核苷酸时,什么是活跃捕获长度?

120个核苷酸。

如果一个目标区域短于序列捕获探针的长度会怎样?

eArray会将序列捕获探针集中在目标区域的中间。序列捕获探针序列将会包含足够长的相邻基因组区间以填满探针到它的全长。

DNA测序能力是由探针长度还是由所剪断的基因组DNA片段的长度来决定的?

所剪断的基因组DNA片段长度。如果一个长度为120-mer的序列捕获探针能够捕获一个500个碱基对的DNA片段,那么整个500个碱基对的片段都可以用于测序,而与它其中哪一段和120-mer的序列捕获探针结合无关。

相关链接

序列捕获探针

靶向序列捕获和eArray