DNASTAR怎么比对质粒和测序结果 DNASTAR质粒测序错配位点怎么定位-DNASTAR中文网站

　　做质粒测序核对时，最容易走偏的地方，不是软件不会比，而是前面没有先把参考序列、读段质量和冲突位点分开看。DNASTAR官方资料已经把主线说得很清楚，SeqMan Ultra适合做Sanger数据组装与分析，既能在参考序列基础上做比对，也能在装配后查看色谱图、覆盖度和冲突位点；如果是克隆验证场景，SeqBuilder Pro还会直接给出不一致区域和SNP列表。

　　一、DNASTAR怎么比对质粒和测序结果

　　先把一句话说透，质粒和测序结果做比对时，更稳的做法不是先盯共识序列，而是先把质粒序列作为参考，再让测序读段往参考上对齐。这样后面看错配、插缺和覆盖范围都会更直观。

　　1、先准备质粒参考序列

　　把质粒全长序列先整理成可直接导入的参考文件，再把测序得到的ABI读段一起加入项目。DNASTAR官方在Sanger组装流程里明确写到，建立项目时可以同时输入reads和reference sequence，这一步先做对，后面才谈得上定位差异。

　　2、优先做参考引导比对

　　如果你手里本来就有质粒标准序列，就不要先走纯拼接。官方专门提供了Reference Guided Alignment of Sanger ABI Data这类参考引导流程，用来把多条Sanger读段对齐到已知参考上，后面比较样本、查看trace和分析SNP都会更省事。

　　3、比对后先看覆盖再看碱基

　　进入Alignment视图以后，先看整段质粒是不是被读段覆盖到了，再去看具体差异。官方流程说明里提到，分析阶段要先看coverage和conflicts，这个顺序很重要，因为有些看起来像错配的位置，根子其实是覆盖太浅，不是质粒真的变了。

　　4、需要验证克隆时可直接走验证流程

　　如果你的目标不是普通序列比对，而是确认克隆质粒是否和设计完全一致，SeqBuilder Pro的Clone Sequence Verification会直接输出Clone Verification Summary，里面会标出读段对齐位置、不一致区域和SNP列表，排查起来会更快。

　　二、DNASTAR质粒测序错配位点怎么定位

　　错配位点最怕只看文本序列。真正稳的定位方法，是先把冲突位置找出来，再回到原始峰图和质量分数去确认这是不是可靠差异。DNASTAR官方在SeqMan Ultra里把这几步入口都给出来了，所以定位时不要只用一种证据。

　　1、先用冲突搜索缩小范围

　　在Alignment视图里先用搜索工具找Conflict，官方教程里就给了这个顺序，意思很明确，也就是先把有争议的位置集中挑出来，再逐个看，不要整段从头扫到尾。

　　2、再把含变异的读段排到上面

　　如果读段很多，直接用By Variant排序会更高效。官方在Alignment view toolbar里说明，这个排序会把带variant bases的reads提到上方，适合先锁定真正参与冲突的那几条序列。

　　3、打开峰图和质量分数一起看

　　定位错配位点时，不能只看字母。官方写得很清楚，点击序列名前面的加号可以展开ABI色谱图，工具栏还能显示quality scores。峰高、峰形和质量分数一起看，才更容易分清是真错配、双峰混样，还是末端质量下降导致的假差异。

　　4、末端错配先怀疑修剪问题

　　如果差异主要堆在读段两端，不要先把它当成质粒突变。官方教程里明确提到，DNAMAN不对，是DNASTAR这个流程会先按trace质量和vector做trimming，必要时还能把被修掉的末端重新露出来检查。也就是说，两端发黄、峰形差、冲突多的位置，先看是不是低质量或载体残留更稳。

　　三、DNASTAR比对时为什么总会看偏

　　很多人不是不会用工具，而是顺序反了。前面没有先定参考序列，中间不看覆盖，后面又只盯着错配字母，最后自然会把能解释清楚的问题看得越来越乱。DNASTAR官方给的入口其实已经足够完整，问题通常出在没有按顺序用。

　　1、只看共识不看原始读段

　　共识序列适合看整体，不适合单独拿来判每个冲突位点。尤其做质粒验证时，真正要下结论的地方，还是得回到具体读段和色谱图。

　　2、只看错配不看覆盖

　　有些位置看着不一致，其实是因为那里只有单向覆盖，甚至只剩单条读段。官方把coverage放在分析步骤前面，就是因为覆盖不够时，错配的解释本来就不稳。

　　3、只看字母不看峰形和质量

　　官方已经把chromatogram和quality scores两套证据都放进Alignment视图里了，若还只盯着A、T、C、G四个字母，很多末端噪声和双峰位点都会被误判成真实突变。

　　总结

　　DNASTAR怎么比对质粒和测序结果，DNASTAR质粒测序错配位点怎么定位，关键都不在最后那一下人工改单碱基，而在前面的顺序有没有跑对。先把质粒序列作为参考做参考引导比对，再用Conflict搜索和By Variant排序缩小范围，随后回到ABI峰图和质量分数确认每个可疑位点，这样做出来的结果会稳很多，也更适合拿去做克隆验证和后续实验判断。