跳轉到內容

商業智慧/文件框架資料來源

來自華夏公益教科書
  • 目的:識別框架和相關資料來源的資料位置
  • 輸入:KPI、維度和預算列表
  • 活動:識別填充儀表板和報告資料所需的資料來源
  • 輸出:維度、事實和預算列表
  • 文件:輸出是框架資料來源的文件

此步驟需要從概念(KPI、維度)轉換到度量(資料)。直接測量概念很難,甚至不可能。如何測量收入?毛收入還是淨收入?目標不是找到正確的度量,而是根據驅動戰略的理論找到最合適的度量。因此,需要在資料庫和資料倉庫中搜索近似概念的度量。最後一步是確定資料來源中的最低分析級別。這完成了 KPI(概念)和事實(度量)之間的聯絡。

元資料目錄

[編輯 | 編輯原始碼]

請注意,完成此目標的難易程度取決於元資料目錄完整性的程度。元資料目錄“是承載所有描述資料倉庫的資料的資料庫 (Poe et al. 1997)”。它很難實現,因為對於資料倉庫專案,“流程就是交付品 (Poe et al. 1997)”。理想情況下,資料架構和元資料目錄將易於訪問。如果不是這樣,找到度量將變得更加困難。

此階段還將需要資料倉庫管理員的輸入。採訪管理員應該提供有關架構的知識,這將證明在理解如何將概念與度量匹配方面非常寶貴。

記錄框架的資料來源需要

  • 瞭解企業資料倉庫架構
  • 獲取資料來源元資料
  • 將概念與適當的資料庫或資料倉庫列匹配

瞭解企業資料倉庫架構

[編輯 | 編輯原始碼]

首先,我們需要識別資料倉庫架構的組成部分。這些包括 (Poe et al. 1997)

  • 從源系統、資料庫、檔案等提取資料。
  • 源系統中的資料在載入到資料倉庫之前被整合。
  • 資料倉庫是一個專為決策支援設計的只讀資料庫。
  • 用於訪問資料倉庫的前端工具或應用程式。

因此,企業資料架構包括用於填充資料倉庫的所有資料來源、資料倉庫的結構、從資料倉庫到資料中心的提取資料,以及如何提取這些資料並由使用者或業務部門使用。

資料倉庫架構

[編輯 | 編輯原始碼]

Poe 等人 (1997) 涵蓋資料倉庫架構並提供示例圖表。借鑑他們的作品,第一個企業資料架構在圖中展示,該圖展示了“資料倉庫供應資料中心”。請注意,資料庫可以是任何型別的資料來源。目標是識別公司中的所有資料來源。這是因為每個資料來源都可能包含列,在資料庫樣式資料儲存的情況下,這些列可以測量 KPI。這些可能存在於資料中心、資料倉庫或資料庫中。請注意,從資料倉庫或資料中心結構中提取必要資料比從資料庫中提取資料要容易得多。

圖:資料倉庫供應資料中心


另一種資料倉庫架構在圖中展示,該圖描述了沒有企業資料倉庫的情況。這種結構存在一些困難,因為它不太可能在易於提取的結構中,在資料庫之外存在度量和資料。這種情況在大型組織中通常很少見。

圖:沒有企業資料倉庫

最後,有一個案例,即整合資料庫供應資料倉庫。在這種情況下,業務使用者或業務部門都提取資料用於報告目的,也更新資料。無論源型別如何,重要的是獲取企業資料倉庫架構,特別是每個資料來源的元資料。

圖:整合資料庫供應資料倉庫

組織資料來源元資料=

[編輯 | 編輯原始碼]

元資料是關於資料的資料。它提供有關以下方面的資訊

  • 資料結構
  • 資料庫內部或之間資料結構之間的關係

對於資料倉庫,有兩種型別的元資料

  1. 整合元資料顯示源系統和倉庫之間的關聯
  2. 轉換元資料將資料從倉庫對映到終端使用者的前端工具

轉換元資料很重要,因為它包含業務名稱和層次結構。

將概念與資料庫或資料倉庫事實匹配

[編輯 | 編輯原始碼]

最後,有必要識別與概念密切匹配的資料庫列。例如,如果準時出發是我們想要測量的 KPI,目標是找到對此概念的充分度量。運營資料庫或資料倉庫應該有一列識別火車計劃離開的日期和時間以及實際離開的日期和時間。

聯合太平洋事實

將概念與資料庫或資料倉庫事實匹配

[編輯 | 編輯原始碼]

另一個活動是識別將用於分析事實的維度。例如,商品組合是一個重要的維度。每磅貨物費率是否因商品組合而異?平均費率是多少?是否值得針對特定客戶以增加該商品組合的貨物?

聯合太平洋維度
華夏公益教科書