FASTQC使用

, 18 Dec 2019



fastqc:一种用于高通量序列数据的质量控制应用程序。

安装

–help

fastqc –help

# 命令行使用
fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN

参数说明

-h --help
-v --version
-o -output dir
- casave 文件来自原始 casave 输出
-nano 文件来自 naopore 序列,采用 fast5 格式
-extract 如果设置,则压缩输出
-j --java  java二进制文件完整路径
-nogroup 禁止读取2500bp以上的碱基组
-f 跳过正常文件格式检测,强制使用指定格式 bam | sam | bam_mapped | sam_mapped | fastq
-t --threads 多线程,每个线程 250 M
-c --contamin 指定包含列表的非默认文件,污染物筛选过多的序列(哈希)
-a -adapters 指定包含列表的非默认文件,包含一组已经命名的Adapter(哈希)
-l 指定一个非默认文件,限制将用于确认 warning / Fairure,或者从结果中删除一些模块, cofiguration --> limits.txt
 -k -kmers 指定要在Kmer中查找的长度,必须在2-10 之间,默认为7
-q -quiet 安静模式,在标准输出上禁止所有的进度消息,只报错
-d --dir 一个目录用于写入临时文件当生成图像时, 默认系统临时目录

生成文件解读

当使用1个fastq文件时,使用命令mkdir fastqc && fastqc -o ./fastqc ref.fastq.gz

会在目录下生成一个html以及.zip文件,zip文件就是画图的数值以及图片。所以fastqc结果看html即可。 - html解读 R2 这一部分中√代表”PASS”;!代表”WARN”;x代表”FAIL” 1.Basic Statics Basic Statics