跳到內容

下一代測序 (NGS)/SOAPdenovo

來自維客教科書,面向開放世界的開放書籍

我們從 SRR001665 獲得了 E coli 資料,你可以鍵入

 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_1.fastq.gz
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_2.fastq.gz

解壓這兩個檔案

 gunzip SRR001665_1.fastq.gz
 gunzip SRR001665_2.fastq.gz

你需要獲取 SOAPdenovo 和資料準備模組

 wget http://soap.genomics.org.cn/down/x86_64.linux/SOAPdenovo31mer.tgz
 tar xvzf SOAPdenovo31mer.tgz
 

我們還必須製作一個配置檔案。我們將此命名為 cont.config

 #maximal read length
 max_rd_len=36
 [LIB]
 #average insert size
 avg_ins=200
 #if sequence needs to be reversed 
 reverse_seq=0
 #use for contig building only
 asm_flags=1
 #in which order the reads are used while scaffolding
 rank=1
 #fastq files
 q1=./SRR001665_1.fastq
 q2=./SRR001665_2.fastq


然後,我們使用 31 的 Kmer 大小進行支架構建(讀取長度為 36)。我們透過指定“all”引數使用整個 SOAP 管道,透過將 asm_flags 設定為 3,同一個庫也將用於支架構建。在這種情況下,SOAP 將因無浮點異常而終止於支架構建步驟。然而,仍然可以在 EC.contigs 中找到重疊群。

 ./SOAPdenovo31mer all -K 31 -s cont.config -o EC
華夏公益教科書