该部分是数据清洗前的准备工作,主要的作用是通过观测QC样本的峰面积的boxplot以及整体样本中代谢物的缺失情况来补充batch信息,如果没有观测到明显的批次效应则可以直接进行后续分析。
操作界面

Data Cleaning => Overview 左侧sidebar
一般为设置参数的选项,这部分参数主要是针对可视化颜色选项的,第一个图就是QC样本峰面积箱线图,这里提供了两个选项,一个是根据批次上色,另一个是根据上样顺序上色,比如这里我们已知该实验分了两个批次,批次产生的原因主要是前期样品通过上样瓶进行上样,而后期样品通过96孔板上样,在上样体积上出现了显著差异,如果前期不知道换了上样方式会带来批次效应,从该图也可以明显观测到。

同样,通过所有样本散点图的分布可以看出batch3的缺失值显著升高,这可能是更换上样方式后代谢物含量下降,低Intensity的代谢物检出效率变低,导致缺失率升高。
基于此我们一方面可以核对sample info
中的批次效应信息,同时结合实验记录我们也可以补充遗漏的批次效应信息。
交互操作

交互操作使得我们可以很快的从图中提取出有用的信息,比如上图中我们发现在负谱中一个叫Outlier
的样本缺失值达到了90%以上,通过交互操作我们可以快速的获得该样本的id,方便我们后期对该离群样本进行删除或者重新补测。
---The end---
Jul 27, 2024 by Shawn Wang, HENU, Kaifeng, Henan, China.