下一代測序 (NGS)/SOAPdenovo
外觀
我們從 SRR001665 獲得了 E coli 資料,你可以鍵入
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_1.fastq.gz wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_2.fastq.gz
解壓這兩個檔案
gunzip SRR001665_1.fastq.gz gunzip SRR001665_2.fastq.gz
你需要獲取 SOAPdenovo 和資料準備模組
wget http://soap.genomics.org.cn/down/x86_64.linux/SOAPdenovo31mer.tgz tar xvzf SOAPdenovo31mer.tgz
我們還必須製作一個配置檔案。我們將此命名為 cont.config
#maximal read length max_rd_len=36 [LIB] #average insert size avg_ins=200 #if sequence needs to be reversed reverse_seq=0 #use for contig building only asm_flags=1 #in which order the reads are used while scaffolding rank=1 #fastq files q1=./SRR001665_1.fastq q2=./SRR001665_2.fastq
然後,我們使用 31 的 Kmer 大小進行支架構建(讀取長度為 36)。我們透過指定“all”引數使用整個 SOAP 管道,透過將 asm_flags 設定為 3,同一個庫也將用於支架構建。在這種情況下,SOAP 將因無浮點異常而終止於支架構建步驟。然而,仍然可以在 EC.contigs 中找到重疊群。
./SOAPdenovo31mer all -K 31 -s cont.config -o EC