跳轉到內容

下一代測序 (NGS)

50% developed
來自華夏公益教科書,開放的世界,開放的書籍
(從 下一代測序 重定向)

對下一代測序技術知識的最新綜合的需求

[編輯 | 編輯原始碼]

對低成本測序的高需求推動了高通量測序的發展,高通量測序也稱為下一代測序 (NGS)。在單個下一代測序過程中同時產生數千或數百萬個序列。下一代測序已成為一種商品。隨著各種經濟實惠的臺式測序儀的商業化,NGS 已成為傳統溼實驗室生物學家的觸手可及之物。正如近年來所見,全基因組範圍的計算分析正越來越多地用作促進生物醫學研究中新發現的支柱。然而,隨著測序資料量的指數級增長,分析瓶頸尚未解決。

NGS 資訊學的當前來源非常分散。新手可以閱讀各種期刊的綜述文章,關注諸如 Biostar [1]SEQanswers [2] 等論壇上的討論主題,或註冊各種機構組織的課程。找到集中的綜合資訊要困難得多。書籍是有的,但該領域的進展如此之快,以至於書籍章節在印刷出來時就有可能過時。此外,讓少數作者不斷更新他們的文字的成本可能要佔用他們很多時間。

借鑑討論論壇中顯而易見的善意和社群精神,並利用維基媒體基金會提供的協作工具,我們建議啟動 NGS 協作華夏公益教科書的編輯工作。我們的計劃是收集足夠的文字,以便人們有動力為其做出貢獻,基本上提供與論壇相同的資訊,但以更整潔的形式。最終,我們的目標是建立一個集體實驗室手冊,解釋關鍵概念並描述 NGS 的最佳實踐。

目標受眾

[編輯 | 編輯原始碼]

這套動態材料專為實驗室生物學家(沒有或只有基礎生物資訊學經驗的博士後期學生和早期職業博士後研究人員,並表現出對 NGS 資料分析的興趣)設計。隨著社群的貢獻以及該領域的不斷發展和需求,可能會新增高階材料。線上材料的靈活性應允許讀者在第一次閱讀時忽略細節,但可以立即訪問他們需要的細節。然而,整體結構和風格應優先為非生物資訊學讀者設計。

有些章節包含實踐練習,以便讀者可以熟悉這些步驟。

資料分析卡住了嗎?

[編輯 | 編輯原始碼]

請從線上社群(包括 BiostarSEQanswers)尋求幫助,請確保您遵循 Dall’Olio 等人 [3] 制定的指南。

  1. 介紹 50% developed
  2. 大資料 0% developed
  3. 外部生物資訊學 100% developed
  4. 預處理 50% developed
  5. 比對 50% developed
  6. DNA 變異 50% developed
  7. RNA 50% developed
  8. 表觀遺傳學 25% developed
  9. 宏基因組學 50% developed
  10. 染色質結構 0% developed
  11. 從頭基因組組裝 75% developed
  12. 從頭 RNA 組裝 50% developed
  13. 全基因組關聯研究 25% developed
  14. 整合平臺 25% developed
  15. 作者
華夏公益教科書開發階段
文字稀疏 0% 正在開發的文字 25% 成熟的文字 50% 已開發的文字 75% 全面的文字 100%

關於本書

[編輯 | 編輯原始碼]
  • 前四章是對生物資訊學和NGS的廣泛概念的總體介紹。它們是“必備先決條件”,並在本書的其餘部分中被引用。
    • 簡介中,我們對該領域進行了幾乎完整的概述,從測序技術、它們的屬性、優缺點開始,涵蓋它們可以檢測的各種生物學過程,並以關於常見測序術語的章節結束。最後,我們以典型測序流程的概述結束。
    • 大資料中,我們處理處理NGS資料的典型體積時出現的一些(也許出乎意料的)困難。從在世界各地運送硬碟驅動器,到您在計算機中組裝資料時所需的記憶體量,這些問題通常讓新手感到驚訝。我們將深入瞭解檔案格式、存檔和演算法,這些演算法已被開發出來來處理這些問題。
    • 從外部看生物資訊學中,我們將討論生物資訊學家使用的介面。我們將介紹具有文字介面和閃爍游標的命令列,但也會介紹專門為生物資訊學管道開發的更友好的圖形使用者介面 (GUI)。
    • 預處理中,我們將討論控制NGS資料集質量的最佳實踐,以及清除低質量資料。
  • 接下來的五章描述了可以使用參考基因組序列進行的分析,假設參考基因組序列可用。
    • 比對中,我們將討論如何將一組reads對映到參考資料集。
    • DNA變異中,我們將描述如何使用對映的reads來呼叫變異(無論是SNV、CNV還是斷點)。
    • RNA中,我們將解釋如何從對映的RNA-seq reads中確定外顯子、亞型和基因表達水平。
    • 表觀遺傳學中,我們將描述用於確定表觀遺傳性狀(如組蛋白或CpG甲基化)的拉下拉測定。
    • 染色質結構中,我們將討論用於確定染色質結構的技術,例如組蛋白的放置或當DNA位於細胞核中時不同染色體區域的物理接近度。
  • 最後,最後兩章將描述在沒有參考基因組的情況下進行的分析。
    • 從頭組裝將描述如何從NGS reads組裝一個基因組。
    • 從頭RNA組裝將解釋如何僅從NGS reads組裝轉錄組。
  1. 預處理中,fastq、QC、修剪、錯誤校正等。
  2. 比對中,格式、演算法、評估。
  3. DNA變異中,協議、格式、資料庫、視覺化。
  4. RNA中,轉錄組工作流程、工具、基因預測、格式、資料庫。
  5. 表觀遺傳學中... 硫代亞硫酸鹽測序。
  6. 染色質結構中... chipseq eh?
  7. 從頭組裝中,演算法、工作流程、工具、資料庫。
  8. RNA組裝中,相對於DNA組裝的相似性、差異和挑戰。

參考文獻

[編輯 | 編輯原始碼]
  1. Parnell, Laurence D. (27 October 2011). "BioStar: An Online Question & Answer Resource for the Bioinformatics Community". PLoS Computational Biology. 7 (10): e1002216. doi:10.1371/journal.pcbi.1002216. {{cite journal}}: Unknown parameter |coauthors= ignored (|author= suggested) (help)
  2. Li, J.-W. (13 March 2012). "SEQanswers: an open access community for collaboratively decoding genomes". Bioinformatics. 28 (9): 1272–1273. doi:10.1093/bioinformatics/bts128. {{cite journal}}: Unknown parameter |coauthors= ignored (|author= suggested) (help)
  3. Dall'Olio, Giovanni M. (28 September 2011). "Ten Simple Rules for Getting Help from Online Scientific Communities". PLoS Computational Biology. 7 (9): e1002202. doi:10.1371/journal.pcbi.1002202. {{cite journal}}: Unknown parameter |coauthors= ignored (|author= suggested) (help)
華夏公益教科書