上传序列捕获探针 |
|
您可以准备一个包含序列捕获探针的文件并将其上传到您eArray中的账户中。您也可以基于上传文件中的序列捕获探针来创建一个新的序列捕获探针组。稍后,您可以使用该序列捕获探针来创建一个序列捕获探针文库。如果您愿意,您可以使用一个向导来让eArray引导您完成创建和提交含有上传序列捕获探针的序列捕获探针文库的全过程 — 请参阅从上传的序列捕获探针创建序列捕获探针文库(使用向导)。
此帮助主题包含两个部分:
如要上传序列捕获探针至eArray,您必须首先以正确的格式创建一个序列捕获探针文件,这样eArray才能解析它。
eArray支持以下文件类型用于序列捕获探针上传:
Microsoft Excel 文件 (*.xls) – 注意:如果您使用Microsoft Excel 2007来创建文件,请将其保存为Excel 97-2003 兼容模式工作表。这样文件就被保存为所需的*.xls格式。
Tab-delimited文本文件(*.tdt or *.txt) – 仅在一条记录(行)的各个域(栏目)之间放入制表位(tab)。在每条记录(行)的结尾使用换行符号。
eArray支持以下文件格式:
简化格式 – 两个栏目:
序列捕获探针ID号 – 探针序列的一个唯一标示符,最多包含15个字符。序列捕获探针ID号不能为空。
序列捕获探针序列 – 探针的碱基序列,取向为从5'端到3'端。序列的长度必须为20到60个核苷酸,并且必须仅包含大写字母A、C、G、和T。所有序列的长度必须相同。序列不能为空。
完整格式 – 八个栏目:
序列捕获探针ID号 – 探针序列的一个唯一标示符,最多包含15个字符。序列捕获探针ID号不能为空。
序列捕获探针序列 – 探针的碱基序列,取向为从5'端到3'端。序列的长度必须为20到60个核苷酸,并且必须仅包含大写字母A、C、G、和T。序列不能为空。
基因组片段 – 基因组中与该序列捕获探针相关联的片段,例如chr1:1-10000。此栏可以为空。
序列捕获探针基因组位置 – 序列捕获探针在基因组中的精确位置,例如chr1:1-169。此栏可以为空。
登录号 – 对于每个探针都是唯一的标识符,指一个核苷酸序列,为相关联探针的目标和/或作为该目标的产品的蛋白质序列。登录号是用成对的<source>|<ID>格式来表示的。<source>是登录号所在数据库的符号,<ID> 是对于探针唯一的标识号。例如,ref|NM_015752是一个<source>|<ID>对,其中 ref (NCBI Refseq)是源,NM_015752是该源的一个唯一的标识号。登录号的框内可以含有多个<source>|<ID>对,用分隔符"|"分隔。例如,gi|7657630|ref|NM_015752是一个登录号,给出了同一个探针序列的一个NCBI基因标识号( gi),以及一个Refseq标识号。登录号可以为空。
基因符号 – 一个唯一的基因名称的缩写。基因符号可以为空。
描述 – 一个对表现型、基因产品、或其功能的描述。描述可以为空。
Strand – 序列捕获探针的取向,可以为 + (有意义链) 或 – (反意义链)。如果序列捕获探针没有指定取向,eArray就会认为是有意义链。您的序列捕获探针文件即可以包含有意义链序列捕获探针,也可以包含反意义链序列捕获探针。
注意:
•
当前,eArray支持序列捕获探针长度为120个核苷酸的SureSelect靶向序列捕获探针文库。
•
如果您想要上传反意义链序列捕获探针,或者有意义链和反意义链的组合,请使用完整文件格式。该格式包含Strand栏目,您在其中为每个序列捕获探针指定有意义链 (+) 或反意义链(
–
) 取向。
在上传文件中,eArray:
接受任何栏目顺序 – 您标记栏目是上传过程的一部分。
接受额外的栏目 – 在您在上传过程中标记栏目时,请确保将任何额外栏目标记为忽略。
接受,但不会理解栏目标题 – 请确认您在上传过程中标记栏目时选中我上传的文件包含“栏目标题”。
不接受双引号或单引号、尖括号、或左斜线或右斜线。
忽略空白行。
认为一行内的所有条目均有制表位分隔,即使条目实际为空。
注意:一次最多可向eArray中上传200,000个探针。来自极大上传文件的探针可能较长时间都不会出现在您的账户中。
参数 |
说明/详细 |
序列捕获探针参数详细信息 |
|
物种 |
在下拉列表中选择想要的物种。 |
在上传中移除重复序列捕获探针 |
一个重复序列捕获探针与文件中另外一个序列捕获探针拥有相同的探针ID。如果您选中此复选框,eArray会上传您的文件中每个重复集合的第一个序列捕获探针,并忽略其他。
|
序列捕获探针优先级 |
这些选项指定了,当eArray发现您上传文件中有序列捕获探针匹配(拥有相同的探针ID和序列)系统中已存在的序列捕获探针,eArray会怎样处理。选择以下选项之一: 更新已存在序列捕获探针的注释 – 上传的匹配序列捕获探针的注释会替换已存在序列捕获探针的注释。您可以用此选项来重新注释已存在的序列捕获探针。 跳过已存在序列捕获探针 – eArray会忽略上传的匹配序列捕获探针。 如果序列捕获探针已存在,则取消上传 — 如果发现一个上传的匹配序列捕获探针,eArray会取消整个上传过程。 |
长度 |
当前,eArray支持长度为120核苷酸的序列捕获探针。 |
上传探针文件详细信息 |
|
上传类型 |
选择以下选项之一: 仅上传序列捕获探针 – 从上传文件的数据创建序列捕获探针,并将其作为eArray中您可使用的独立序列捕获探针。 创建新序列捕获探针组 – 从上传文件的数据创建序列捕获探针,并将所有探针置于一个序列捕获探针组中。为序列捕获探针组输入一个名称。 |
上传文件 |
|
文件格式 |
选择简化格式或完整格式。文件格式定义了上传文件中具体的可用数据类型。请参阅上面的准备一个序列捕获探针文件来上传。 |
文件类型 |
从列表中选择合适的文件类型。文件类型定义了文件中的数据项目怎样被具体指明和区分。eArray接受以制表位分隔的文本(*.tdt and *.txt)文件和MS-Excel (*.xls)文件。
|
点击下一步。
“定义上传文件栏目”框会出现在页面底部,包含您文件前几行数据的预览。
eArray不会解析序列捕获探针文件中任何已存在的栏目标题数据。如果您的序列捕获探针文件的第一行是一行栏目标题,请选中我上传的文件包含“栏目标题”,这样eArray就不会将文件的标题行解读成一组序列捕获探针数据。
在“定义上传文件”框中,在每个栏目下面的列表中,选择最匹配上面具体栏目数据的标签。
序列捕获探针ID和序列捕获探针序列都是必填栏目。如果您希望上传过程忽略一个指定的栏目,请选择忽略。每个标签您只能使用一次,但“忽略”除外,您可以使用多次。
点击上传。
eArray将处理上传文件,并创建序列捕获探针。如果您选择了“创建新序列捕获探针组”,eArray同时会创建一个序列捕获探针组。请确认仔细阅读本主题中关于序列捕获探针组和重复序列捕获探针的说明。
一个消息会通知您您的文件已经被成功提交至上传队列,当上传过程完成后,eArray会发送个您一封邮件。
点击关闭。
您可以在工作区主页的“未完成任务”框中监测上传过程。在eArray完成您的上传后,您可以查找您的新序列捕获探针和序列捕获探针组,并应用它们来创建一个序列捕获探针文库。
“序列捕获探针上传”页面会出现,您可以建立另外一个序列捕获探针文件上传。
注意:您无法通过上传序列捕获探针来创建一个补充序列捕获探针文库。
相关链接