在DNASTAR里看覆盖度,先要分清你看的到底是“整段contig的覆盖分布”,还是“某个功能区、基因或片段的平均覆盖深度”。官方帮助把这两层分得很清楚,SeqMan Ultra里既有Contig Coverage和Coverage track这类按位置看的入口,也有表格列里的Coverage Depth这类按区域汇总看的数值,所以先把视图用对,后面判断低覆盖区段才不会乱。
一、DNASTAR怎么查看序列覆盖度
先看整段覆盖,再看局部明细,会比一上来只盯平均值更稳。官方文档里,Contig Coverage就是专门看contig覆盖分布的报告视图,而Coverage track则是在装配结果里直接按位置显示覆盖情况。
1、先打开覆盖相关视图
如果你要看整条contig哪些位置高、哪些位置低,优先看Contig Coverage或Coverage track。官方说明里写到,Coverage track会直接把不同位置的覆盖状态画出来。
2、颜色先这样理解
官方教程里提到,覆盖图里绿色代表高于阈值的覆盖,红色代表低覆盖区域;Coverage track里还会用粗绿和细绿区分是否同时满足Coverage threshold和Minimum number on each strand这两个条件。也就是说,不是只要有绿色就一定够稳,还要看是不是满足双链数量要求。
3、看局部区域时再查Coverage Depth
如果你不是看整段曲线,而是想知道某个基因、CDS或feature的平均覆盖深度,可以看表格里的Coverage Depth。官方说明里写得很清楚,这个值是该区域所有位置覆盖深度的平均值,数值可以从0一直到项目里的最大覆盖深度。
二、DNASTAR序列覆盖度低的区段怎么判断
低覆盖区段不要只凭肉眼觉得“这段绿得浅”,更稳的做法,是先定阈值,再看颜色,再结合双链数量和局部数值一起判断。官方帮助里已经把这套逻辑写进了Coverage threshold和Minimum number on each strand这两个参数里。
1、先设Coverage threshold
官方文档说明,Coverage threshold是判断覆盖是否足够的最低门槛,低于这个值的位置或区段,会在Contig Coverage报告里标成“Below coverage threshold”。所以低覆盖判断的第一步,不是猜,而是先把阈值设清。
2、再看是不是两条链都够
只看总覆盖有时不够,官方还提供了Minimum number on each strand这个条件。若某段虽然总覆盖不低,但正负链支持不平衡,在Coverage track里也不会落到最稳的显示状态。
3、局部区段还要结合平均深度
如果某个feature的Coverage Depth很低,哪怕整条contig平均看起来还行,这个功能区本身也仍然属于薄弱区。官方表格列说明里专门强调,Coverage Depth能显示非常低但不为零的覆盖值,这对判断边缘低覆盖段很有用。
三、覆盖度低的区段怎么看得更准
真正排查时,不建议只看一张图。更稳的顺序,是先在Coverage track找低覆盖位置,再回到feature或具体区段看Coverage Depth,最后再看有没有冲突位点或局部问题一起出现。官方搜索功能也支持查找冲突列,这对复核低覆盖区是否伴随不稳定碱基很有帮助。
1、先找红区或低阈值区
在覆盖图里先把明显低于阈值的区段找出来,这一步是最快的初筛。官方教程里红色本身就是低覆盖提示。
2、再核对该段的Coverage Depth
如果红区刚好落在目标基因、外显子或CDS上,就继续看这个区域的平均Coverage Depth,是接近零,还是只是略低于要求。这样判断会比只看颜色更稳。
3、最后看是否伴随冲突位点
官方帮助提到,SeqMan Ultra可以查找并高亮单个冲突列或连续冲突区。如果某段既低覆盖,又伴随冲突位点集中出现,通常就更值得重点复核。
总结
DNASTAR怎么查看序列覆盖度,关键是先分清整段覆盖视图和局部平均覆盖深度这两层,再用Coverage track和Coverage Depth配合着看。DNASTAR序列覆盖度低的区段怎么判断,更稳的做法是先设Coverage threshold,再看颜色提示和双链数量,最后再回到具体feature的Coverage Depth去确认。这样看下来,低覆盖区段会比只盯一条曲线更容易判断清楚。
