資料科學:導論/像程式設計師一樣思考
外觀
< 資料科學:導論

首先,請您在華夏公益教科書註冊(並在下面列出您的資訊),以便我們瞭解我們的共同貢獻者。此外,請遵守華夏公益教科書的編輯指南、風格手冊和政策和指南。謝謝。
其次,我們每個章節只需要基本、清晰、直接的資訊。我們不是試圖做到詳盡或全面——本書的價值在於跨學科的簡單綜合。還有其他途徑可以詳細闡述特定主題的深度和複雜性。在做出貢獻時,請保持“初學者心態”。同時,請限定每個章節的範圍,使其可以在一小時的課堂時間內講授。如果一個章節需要超過一小時才能講授,那它可能過於詳細。
- 在可能的情況下,請按照維基百科和維基詞典中定義的方式使用術語和概念。這樣,學生就可以參考相應的維基百科/維基詞典頁面,更深入地理解該概念。
第三,這是一本跨學科的書。我們希望幫助人們將資料科學應用於所有領域。因此,我們需要各種各樣的簡單示例和簡單練習。
第四,請遵循每個章節的簡單結構:要點總結、討論、更多閱讀、練習和參考文獻。我們希望“更多閱讀”部分連結到線上資源。“參考文獻”部分可能包含離線資源。要開始一個新頁面,您應該使用來自此原型頁面的維基標記。
第五,與任何華夏公益教科書一樣,請隨時進行更正、擴充套件解釋並在必要時進行新增,即使它不是“您”的章節。使用討論頁面來解釋可能存在爭議的更改。
第六,一些語法規則
- 請將學生應該學習的關鍵術語和短語加粗。
- 使用“程式碼”標籤放置函式和程式碼片段的名稱:
<code>lm()</code> - 使用內聯連結
[[ ]]連結到維基百科、維基詞典、維基共享資源、華夏公益教科書和其他維基媒體基金會屬性。 - 使用參考文獻(<ref> </ref>)連結到“外部”來源——包括線上和離線資源。
- 如果要新增影像或圖表,您應該將其載入到維基共享資源中,而不是上傳到華夏公益教科書。
- 如果合適,在上傳圖表時新增標籤
{{Created with R}}。
- 如果合適,在上傳圖表時新增標籤
- 如果使用R標準包以外的其他包,請在每個函式後用括號將包名稱加粗:<code>MCMCprobit()</code> ('''MCMCpack''')
- 您可以使用第三章資料定義作為如何編寫章節的示例。
最後,非常感謝您自願加入我們的團隊!
這是跨越兩個章節的專案#1。組建3-4人的小組。這個小組將一起完成整個專案。
- 作為一個小組,檢視人口普查網站上的幾個資料集。共同選擇一個表格並下載它。選擇表格的一個子集進行分析。
- 將資料輸入R。使用R生成資料的表格和繪製圖表。識別任何有趣的結果。
- 準備一個幻燈片簡報,其中包括方法描述、結果表、結果圖表或繪圖、重要發現以及小組在此專案過程中獨立學習的關於資料科學的幾件事的列表。
注意:您的小組可以專門負責某些任務,但每個人都需要參與作業的所有階段。此外,到目前為止涵蓋的章節並沒有教你完成此作業所需的所有知識。請盡你所能利用你所知道的知識。此作業的目的不僅僅是向講師展示你學習了前面章節的多少內容,它本身也是一個學習體驗。此作業旨在讓學生髮現章節中未包含的知識。
您可以自由
- 共享——複製、分發、展示和表演作品(此維基中的頁面)
- 混搭——改編或創作衍生作品
在以下條件下
- 署名——您必須將此作品歸因於華夏公益教科書。您不得暗示華夏公益教科書以任何方式認可您或您對本作品的使用。
- 相同方式共享——如果您更改、轉換或構建此作品,您只能在與本許可證相同或類似的許可證下分發由此產生的作品。
- 放棄——如果您獲得版權持有人的許可,則可以放棄上述任何條件。
- 公共領域——如果作品或其任何部分根據適用法律屬於公共領域,則許可證不會以任何方式影響其狀態。
- 其他權利——許可證不會以任何方式影響以下任何權利
- 您的合理使用權或其他適用的版權例外和限制;
- 作者的署名權;
- 其他人可能對作品本身或作品的使用方式擁有的權利,例如宣傳權或隱私權。
- 通知——對於任何再使用或分發,您必須向其他人明確說明此作品的許可條款。執行此操作的最佳方法是連結到以下網頁。
