下一代測序 (NGS)

對下一代測序技術的最新綜合的需要

對低成本測序的高需求推動了高通量測序的發展，該技術也被稱為下一代測序 (NGS)。在單個下一代測序過程中，會同時產生數千或數百萬個序列。下一代測序已成為一種商品。隨著各種經濟實惠的桌面測序儀的商業化，NGS 已進入傳統溼實驗室生物學家的視野。正如近年來所見，全基因組規模的計算分析正越來越多地被用作促進生物醫學研究中新發現的支柱。然而，隨著測序資料量的呈指數級增長，分析瓶頸尚未解決。

當前的 NGS 資訊學來源非常分散。初學者可以閱讀各種期刊的評論文章，關注Biostar^[1]或SEQanswers ^[2]等論壇的討論主題，或註冊各種機構組織的課程。找到一個集中的綜合要困難得多。書籍是可用的，但該領域的發展速度如此之快，以至於書籍章節在印刷出來時可能會過時。此外，讓少數作者不斷更新他們的文字的成本可能會佔用他們很多時間。

借鑑討論論壇中明顯的好意和社群精神，並利用維基媒體基金會提供的協作工具，我們提議啟動關於 NGS 的協作華夏公益教科書的編輯。我們的計劃是收集足夠的文字，以激勵人們為其做出貢獻，實質上提供與論壇相同的資訊，但以更整潔的形式。最終，我們的目標是建立一個集體實驗室手冊，解釋 NGS 的關鍵概念並描述最佳實踐。

目標受眾

這組動態材料是為實驗室生物學家（具有無或基本生物資訊學經驗的博士後研究生和早期職業博士後研究人員，並對 NGS 資料分析表現出興趣）設計的。隨著社群的貢獻以及該領域的需要和趨勢的發展，可能會新增高階材料。線上材料的靈活性應允許讀者在第一次閱讀時忽略細節，但可以立即獲得他們需要的細節。但是，總體結構和風格應優先為非生物資訊學讀者設計。

某些章節附帶實踐練習，以便讀者可以熟悉這些步驟。

在資料分析中卡住了嗎？

從線上社群尋求幫助，包括Biostar和SEQanswers，請確保您遵循Dall’Olio 等人^[3]制定的指南。

關於本書

前四章是關於生物資訊學和NGS的廣義概念的概述。它們是“必備先決條件”，將在本書的其餘部分中提及
- 在引言中，我們從測序技術、它們的特性、優缺點開始，涵蓋了它們可以檢測的各種生物學過程，並以關於常見測序術語的部分結束，對該領域進行了幾乎完整的概述。最後，我們以典型測序流程概述結束。
- 在大資料中，我們將處理處理典型NGS資料量時出現的一些（可能意想不到的）困難。從在世界各地運送硬碟驅動器，到您在計算機中組裝資料時所需的記憶體量，這些問題往往讓新手感到意外。我們將深入探討為解決這些問題而開發的檔案格式、檔案和演算法。
- 在外部的生物資訊學中，我們將討論生物資訊學家使用的介面。我們將展示帶有文字介面和閃爍游標的命令列，但也展示專門為生物資訊學流程開發的更友好的圖形使用者介面 (GUI)。
- 在預處理中，我們將討論控制NGS資料集質量和清理低質量資料的最佳實踐。

接下來的五章描述了可以使用參考基因組序列進行的分析，假設參考基因組可用
- 在比對中，我們將討論如何將一組讀取比對到參考資料集。
- 在DNA變異中，我們將描述如何使用比對讀取來呼叫變異（無論是SNV、CNV還是斷點）。
- 在RNA中，我們將解釋如何從比對的RNA-seq讀取中確定外顯子、亞型和基因表達水平。
- 在表觀遺傳學中，我們將描述用於確定表觀遺傳特徵（如組蛋白或CpG甲基化）的拉下測定。
- 在染色質結構中，我們將討論用於確定染色質結構的技術，例如組蛋白的位置或DNA位於細胞核中的不同染色體區域的物理鄰近性。

最後，最後兩章將描述在沒有參考基因組的情況下進行的分析
- 從頭組裝將描述如何從NGS讀取中組裝基因組。
- 從頭RNA組裝將解釋如何僅從NGS讀取中組裝轉錄組。

細節

在預處理中，fastq、QC、修剪、錯誤校正等。
在比對中，格式、演算法、評估。
在DNA變異中，協議、格式、資料庫、視覺化。
在RNA中，轉錄組學流程、工具、基因預測、格式、資料庫。
在表觀遺傳學中……亞硫酸氫鹽測序，
在染色質結構中……chipseq eh？
在從頭組裝中，演算法、流程、工具、資料庫。
在RNA組裝中，與DNA組裝相關的相似之處、差異和挑戰。

參考文獻

↑ Parnell, Laurence D. (2011年10月27日). "BioStar: An Online Question & Answer Resource for the Bioinformatics Community". PLoS Computational Biology. 7 (10): e1002216. doi:10.1371/journal.pcbi.1002216. {{cite journal}}: Unknown parameter |coauthors= ignored (|author= suggested) (help)
↑ Li, J.-W. (2012年3月13日). “SEQanswers：一個用於協作解碼基因組的開放獲取社群”. 《生物資訊學》. 28 (9): 1272–1273. doi:10.1093/bioinformatics/bts128. {{cite journal}}: 未知引數 |coauthors= 被忽略 (|author= 建議) (幫助)
↑ Dall'Olio, Giovanni M. (2011年9月28日). “從線上科學社群獲取幫助的十個簡單規則”. 《PLoS 計算生物學》. 7 (9): e1002202. doi:10.1371/journal.pcbi.1002202. {{cite journal}}: 未知引數 |coauthors= 被忽略 (|author= 建議) (幫助)

[1] Parnell, Laurence D. (2011年10月27日). "BioStar: An Online Question & Answer Resource for the Bioinformatics Community". PLoS Computational Biology. 7 (10): e1002216. doi:10.1371/journal.pcbi.1002216. {{cite journal}}: Unknown parameter |coauthors= ignored (|author= suggested) (help)

[2] Li, J.-W. (2012年3月13日). “SEQanswers：一個用於協作解碼基因組的開放獲取社群”. 《生物資訊學》. 28 (9): 1272–1273. doi:10.1093/bioinformatics/bts128. {{cite journal}}: 未知引數 |coauthors= 被忽略 (|author= 建議) (幫助)

[3] Dall'Olio, Giovanni M. (2011年9月28日). “從線上科學社群獲取幫助的十個簡單規則”. 《PLoS 計算生物學》. 7 (9): e1002202. doi:10.1371/journal.pcbi.1002202. {{cite journal}}: 未知引數 |coauthors= 被忽略 (|author= 建議) (幫助)

[1]

[2]

[3]

對下一代測序技術的最新綜合的需要

目標受眾

在資料分析中卡住了嗎？

目錄

關於本書

細節

參考文獻