跳轉到內容

資料科學:入門/資料準備和元資料

來自Wikibooks,開放世界中的開放書籍


第20章:資料準備和元資料



貢獻者須知(章節完成後刪除此部分)

[編輯 | 編輯原始碼]

首先,請您在華夏公益教科書註冊(並在下面列出您的使用者名稱),以便我們瞭解我們的共同貢獻者。此外,請遵守華夏公益教科書的編輯指南樣式手冊政策和指南。謝謝。

其次,我們每個章節只需要基本、清晰、直接的資訊。我們不是試圖面面俱到或完整——本書的價值在於跨學科的簡單綜合。在其他地方可以詳盡地闡述某個特定主題的深度和複雜性。在進行貢獻時,請保持“初學者的心態”。請同時限定每個章節的範圍,使其可以在一個小時的課堂時間內教授。如果一個章節需要超過一個小時來教授,它可能過於詳細了。

  • 在儘可能的情況下,請按照維基百科和維基詞典中定義的方式使用術語和概念。這樣,學生就可以參考相應的維基百科/維基詞典頁面來更深入地理解該概念。

第三,這是一本跨學科的書。我們希望幫助人們將資料科學應用於所有領域。因此,我們需要各種各樣的簡單示例和簡單練習。

第四,請遵守每個章節的簡單結構:要點總結、討論、延伸閱讀、練習和參考文獻。我們希望“延伸閱讀”部分連結到線上資源。“參考文獻”部分可以包含離線資源。要開始一個新頁面,您應該使用來自此原型頁面的維基標記。

第五,與任何華夏公益教科書一樣,請隨時進行更正、擴充套件解釋和必要時的新增,即使它不是“您”的章節。使用討論頁面來解釋可能存在爭議的更改。

第六,一些語法規則

  • 請將學生應該學習的關鍵術語和短語加粗
  • 使用“程式碼”標籤將函式和程式碼片段的名稱括起來:<code>lm()</code>
  • 使用內聯連結 [[ ]]連結到維基百科、維基詞典、維基共享資源、華夏公益教科書和其他維基媒體基金會屬性。
  • 使用參考文獻(<ref> </ref>)連結到“外部”來源——包括線上和離線來源。
  • 如果您想新增影像或圖形,您應該將其載入到共享資源中,而不是上傳到華夏公益教科書中。
    • 如果適用,在上傳圖形時新增標籤{{Created with R}}
  • 如果使用與R標準包不同的包,請在每個函式後用括號加粗包的名稱:<code>MCMCprobit()</code> ('''MCMCpack''')
  • 您可以使用第三章資料定義作為如何編寫章節的示例。

最後,非常感謝您自願加入我們的團隊!

章節總結

[編輯 | 編輯原始碼]

載入資料

[編輯 | 編輯原始碼]

資料清洗

[編輯 | 編輯原始碼]

資料轉換

[編輯 | 編輯原始碼]

建立元資料

[編輯 | 編輯原始碼]

作業/練習

[編輯 | 編輯原始碼]

延伸閱讀

[編輯 | 編輯原始碼]

參考文獻

[編輯 | 編輯原始碼]
[編輯 | 編輯原始碼]

您可以自由

  • 共享——複製、分發、展示和表演作品(來自此維基的頁面)
  • 混搭——改編或創作衍生作品

在以下條件下

  • 署名——您必須將此作品歸因於華夏公益教科書。您不得暗示華夏公益教科書以任何方式認可您或您對本作品的使用。
  • 相同方式共享——如果您更改、轉換或構建此作品,您只能在相同或類似的許可證下分發產生的作品。
  • 放棄——如果您獲得版權持有人的許可,則可以放棄上述任何條件。
  • 公共領域——如果作品或其任何元素根據適用法律屬於公共領域,則該狀態不受許可證的影響。
  • 其他權利——許可證不會影響以下任何權利
  • 您的合理使用權或其他適用的版權例外和限制;
  • 作者的署名權;
  • 其他人可能在作品本身或作品的使用方式中擁有的權利,例如宣傳權或隱私權。
  • 通知——對於任何再使用或分發,您必須向其他人明確說明此作品的許可條款。最好的方法是連結到以下網頁。
http://creativecommons.org/licenses/by-nc-sa/3.0/
華夏公益教科書