資料科學:入門/像統計學家一樣思考

首先,請在華夏公益教科書上註冊自己(並在下面列出自己),以便我們知道我們的共同貢獻者是誰。此外,請遵守華夏公益教科書的編輯指南、風格手冊和政策和指南。謝謝。
其次,我們每個章節只需要基本、清晰、直接的資訊。我們不是試圖面面俱到或完整——這本書的價值在於對不同學科的簡單綜合。在其他地方可以更詳盡地闡述某個特定主題的深度和複雜性。在做出貢獻時,請將自己置於“初學者的心態”。請同時控制每個章節的範圍,以便在一個小時的課堂時間內講授。如果該章節需要超過一小時來講授,可能過於詳細。
- 在儘可能的情況下,請按照維基百科和維基詞典中的定義使用術語和概念。這樣,學生就可以參考相應的維基百科/維基詞典頁面,以更深入地理解概念。
第三,這是一本跨學科的書。我們希望幫助人們將資料科學應用於所有領域。因此,我們需要各種各樣的簡單示例和簡單練習。
第四,請遵循每個章節的簡單結構:主要要點總結、討論、更多閱讀、練習和參考文獻。我們希望“更多閱讀”部分連結到線上資源。參考文獻部分可以包含離線資源。要開始新頁面,您應該使用來自**此原型頁面**的維基標記。
第五,與任何華夏公益教科書一樣,請隨時進行更正、擴充套件解釋並根據需要新增內容,即使這不是“您的”章節。使用討論頁面解釋可能引起爭議的更改。
第六,一些語法規則
- 請**加粗**學生應該學習的關鍵術語和短語。
- 使用“程式碼”標籤將函式和程式碼片段的名稱括起來:
<code>lm()</code> - 使用內聯連結
[[ ]]指向維基百科、維基詞典、維基共享資源、華夏公益教科書和其他維基媒體基金會屬性。 - 使用引用(<ref> </ref>)指向“外部”資源——包括線上和離線資源。
- 如果您想新增影像或圖表,應該將其載入到維基共享資源中,而不是上傳到華夏公益教科書中。
- 如果適用,在上傳圖表時新增標籤
{{Created with R}})。
- 如果適用,在上傳圖表時新增標籤
- 如果使用與**R**標準包不同的包,請在每個函式後用括號加粗包的名稱:<code>MCMCprobit()</code> ('''MCMCpack''')
- 您可以使用第三章資料的定義作為如何編寫章節的示例。
最後,非常感謝您自願加入我們的團隊!
章節摘要
[edit | edit source]當資料科學家像統計學家一樣思考時,他們會從變數的角度思考。任務是瞭解與問題及其解決方案相關的變數的集中趨勢、分佈、相關性和聚類。
討論
[edit | edit source]作業/練習
[edit | edit source]這是跨越四個章節的專案#2。組建 3 人或 4 人的小組。三人小組的成員可能與專案#1 的小組成員不同。四人小組中最多隻能有兩名學生重複參加專案#1 的小組。該小組將共同完成整個專案。
- 複製伽利略的“斜面”實驗。首先設計研究並寫下您的計劃。列出所需材料,指定要使用的方法,確定要測量的變數,建立資料記錄表等。
- 根據設計進行實驗。拍照。記錄您的資料結果。
- 將資料輸入 R。使用 R 生成資料表和繪製資料圖。看看是否可以在您的資料圖上繪製伽利略試圖發現的理論曲線。
- 準備一個幻燈片簡報,其中包括對方法的描述、裝置的圖片、原始資料的表格、分析結果的表格、結果的圖表、該小組在該專案的過程中自己學習到的有關資料科學的幾件事的列表。
注意:您的小組可以專門負責某些任務,但每個人都需要參與作業的所有階段。此外,到目前為止涵蓋的章節不會教您完成此作業所需的一切。請盡力利用您所知道的知識。此作業不僅僅是為了向講師展示您已經學習了多少個以前的章節,而且該作業本身也是一個學習體驗。該作業旨在讓學生髮現章節中未包含的知識。
更多閱讀
[edit | edit source]- Huff, Darrell (1991) [1954]. 如何用統計資料撒謊 (新版 ed.). 紐約: 企鵝。 ISBN 0-14-013629-0.
{{cite book}}:|edition=has extra text (help) - Best, Joel (2001). 該死的謊言和統計資料:從媒體、政客和活動家那裡解開數字的謎團. 加州伯克利: 加州大學出版社。 ISBN 0520219783.
參考文獻
[edit | edit source]版權宣告
[edit | edit source]您是自由的
- 要**分享**——複製、分發、展示和表演作品(來自此維基的頁面)
- 要**重新混合**——改編或創作衍生作品
在以下條件下
- **署名**——您必須將此作品歸功於華夏公益教科書。您不能暗示華夏公益教科書以任何方式認可您或您對該作品的使用。
- **相同方式共享**——如果您更改、轉換或構建此作品,您只能在與本許可證相同或相似的許可證下分發由此產生的作品。
- **放棄**——如果您獲得版權持有者的許可,可以放棄上述任何條件。
- **公有領域**——如果作品或其任何部分根據適用法律屬於公有領域,則該狀態不受許可證的影響。
- **其他權利**——許可證不會以任何方式影響以下任何權利
- 您的公平交易或合理使用權,或其他適用的版權例外和限制;
- 作者的道德權利;
- 其他人可能擁有的與作品本身或作品的使用方式相關的權利,例如宣傳權或隱私權。
- **通知**——對於任何再利用或分發,您必須向其他人明確說明此作品的許可條款。最好的方法是連結到以下網頁。
