HSC 資訊處理與技術/資訊系統與資料庫
- 將資料組織成資訊(需要小心,否則資料將變得毫無意義,使用資料字典)
- 分析資訊以獲得知識(訪問資訊系統的目的,透過表格、查詢和報表進行分析,基於此資訊做出決策)
資料必須在被資訊系統分析之前進行組織。但是,這必須小心謹慎,否則生成的資訊將毫無意義。這可能需要排序、彙總或分類。資料使用資料字典等結構進行組織。
訪問資訊以及由此產生的知識是資訊系統的目的。為了讓人們獲得知識,資訊必須進行分析。資訊系統提供了一系列用於資料分析的工具,如表格、查詢和報表。人們根據從資訊系統接收的資訊做出決策。
- 事務處理系統 (TPS)- 收集、儲存、修改和檢索組織的日常事務,例如銷售點終端。有兩種型別的交易處理
- 批處理將交易資料收集到一個組中,並在以後進行處理,目前用於資料以紙質形式存在的情況,如支票。這種型別存在時間延遲。
- 即時處理在每個事務立即處理並提供即時確認的情況下工作,但它確實需要訪問聯機資料庫。
- 決策支援系統 (DSS)- 透過提供資訊、模型和分析工具來幫助人們做出決策。它們可以每天使用,也可以在組織需要對意外事件做出反應或進行更改時使用。專家系統是一種 DSS。
- 專家系統- 提供資訊並解決否則需要該領域經驗豐富的人(專家)才能解決的問題。它們在診斷、監控、選擇、設計、預測和培訓方面很有用。專家系統會向用戶提出一些問題,並將答案與知識庫進行比較,知識庫是專家提供的通用事實和“如果-那麼”規則的集合。然後它必須推理以獲得解決方案。這些並不總是正確的,選擇權在於使用者。
- 管理資訊系統 (MIS)- 為組織的管理人員提供資訊。MIS 提供有關組織績效的基本事實,例如預算或報告。對如何衡量績效的認識為員工提供了動力,並有助於做出決策。一種特殊型別稱為執行資訊系統 (EIS),它專為滿足高階管理人員的資訊需求而設計,並提供戰略性資訊。
- 辦公自動化系統- 為人們提供有效的方式在組織中完成管理任務。它們使用文字處理器、資料庫等軟體工具,以及通訊技術。
- 地理資訊系統 (GIS),地理資訊科學或地理空間資訊研究是一種旨在捕獲、儲存、操作、分析、管理和呈現所有型別地理參考資料的系統。[1] 簡單來說,GIS 是製圖學、統計分析和資料庫技術的融合。
- 資料庫資訊系統 (DIS)- 大多數資訊系統 (IS) 將資料儲存在資料庫中。資料庫由資料庫管理系統 (DBMS) 訪問。DBMS 是一種軟體包,允許使用者管理資料。一些示例包括;MS Access、FileMaker Pro、MySQL。
使用資料庫的資訊系統被稱為資料庫資訊系統。資料庫由資料庫管理系統 (DBMS) 訪問,DBMS 本身不包含任何資料,而是一個軟體包,允許使用者輸入、維護和提供對資料庫的訪問許可權。使用者可以選擇需要哪些資料以及如何以有意義的方式顯示資料。術語“資料庫”通常用來代替 DBMS。
組織是整理、表示和格式化資料的過程。資料庫是有組織地收集資料。
資料庫只是一個整理和儲存資料的地方,以便以後可以為特定目的檢索資料。電話簿是一個非計算機資料庫,它按人員的姓氏字母順序組織資料。搜尋人員姓名可以檢索到他們的電話號碼。紙質檔案系統是一個非計算機資料庫。它涉及紙張、資料夾和檔案櫃,以有組織的方式儲存資料。在檔案櫃中搜索資料夾可以檢索到單張紙。非計算機資料庫通常是組織資料的最佳方式。從書籍中獲取資訊或從檔案櫃中訪問資訊很方便。人們可以輕鬆且廉價地使用非計算機資料庫來組織資料。他們不需要計算機或計算機技能。非計算機資料庫更容易保持安全,並且更私密。資料更難用於其他目的。例如,電話簿不允許小偷搜尋地址並找到房屋的電話號碼。計算機化資料庫正越來越多地用於組織和儲存資料。一些例子包括稅務記錄、圖書館系統、汽車登記、學生記錄、CD-ROM 百科全書和人口普查資料。與非計算機化資料庫相比,計算機化資料庫有幾個優勢
- 易於編輯
- 儲存量大
- 快速檢索。
- 顯示選項。
計算機化組織方法包括平面檔案系統、資料庫管理系統和超媒體。
• 與非計算機化方法相比,計算機化資料庫(如汽車登記和 CD-ROM 百科全書)有幾個優勢
- 易於編輯。資料可以被修正和更新,而無需重新輸入。
- 儲存量大。資料儲存在磁碟上,並在需要時檢索。
- 快速檢索。資料被快速準確地搜尋和排序,以獲取所需資訊。
- 顯示選項。資料以表格、表單和報表等多種方式呈現。
平面檔案資料庫將資料組織成一個單一表格,適合許多小型應用程式,使用名為檔案、記錄、欄位和字元的資料結構。
- 檔案是資料塊。當您在計算機上完成了一些工作後,它就被儲存在一個檔案中。地址資料庫是一個檔案。資料庫中的檔案被分成一組相關的記錄。
- 記錄是關於資料庫中一個特定條目的事實集合。在地址資料庫中,記錄是關於一個人的姓名、地址和家庭電話的資訊。記錄被分成一個或多個相關的欄位。
- 欄位是資料庫中資料的特定類別。在地址資料庫中,姓氏、名字、街道、郊區、郵政編碼和家庭電話是欄位。欄位中的資料項由字元組成。
- 字元是人們可以使用的資料的最小單位。字元包括字母、數字和特殊符號。
鍵是用於排序和檢索資訊的欄位。通常,每個鍵都包含一個僅適用於一個記錄的唯一專案。當記錄被排序時,鍵被使用,因此不必讀取或檢索所有資料。鍵有不同型別。單鍵是一個欄位,其中每個資料項都是唯一的。在選擇單鍵時必須小心,因為某些欄位(如姓氏)並不總是唯一的。
- 組合鍵或複合鍵是由兩個或多個欄位連線在一起形成的。當任何欄位中的資料項不能保證是唯一的時,它被使用。例如,組合鍵可以由諸如性別和出生日期之類的欄位組成。
- 主鍵是一個單鍵/唯一鍵或複合鍵,必須有值。主鍵不能為空或為 null。
- 次要鍵是一個包含有用資料項的欄位,通常用於搜尋。與其他鍵不同,次要鍵並不總是唯一的。
關係資料庫使用一系列相關表格來組織資料。在表格之間建立關係,以提供一種靈活的方式來操作和組合資料。表單用於檢視、輸入和更改表格中的資料。關係資料庫是最常用的資料庫結構。關係資料庫中資料的組織涉及一個模式。
模式(發音為“skee-ma”)是資料庫的資料定義。它是整個資料庫的有組織的計劃,顯示了資料的查詢位置和方式、資料的描述以及資料的邏輯關係。在關係資料庫中,模式定義了實體、屬性和關係。
- 實體是關於其收集和儲存資訊的事物。學校資料庫中有一個實體代表學生、教師、班級以及學生和班級。平面檔案資料庫將為這些實體中的每一個建立單獨的檔案。
- 屬性是實體的定義屬性。學校資料庫中的學生實體具有諸如 LastName、FirstName 和 PhoneNumber 之類的屬性。實體的每個屬性都包含一個數據項。屬性與平面檔案資料庫中的欄位相同。
- 關係是實體彼此關聯的方式。在學校資料庫中,實體使用鍵(例如 StudentID)相關聯。實體以三種方式相關聯。
- 一對一關係是指第一個實體中的每條記錄與第二個實體中的恰好一條記錄相關聯。例如,在小學中,每個班級只有一名教師,每名教師只與一個班級相關聯。
- 一對多關係是指第一個實體中的一條記錄與第二個實體中的多條記錄相關聯,但第二個實體中的任何記錄只與第一個實體中的一條記錄相關聯。例如,一個學生可以從圖書館借閱許多書籍,但任何一本書一次只能被一個學生借閱。
- 多對多關係是指第一個實體中的每條記錄與第二個實體中的多條記錄相關聯,第二個實體中的每條記錄與第一個實體中的多條記錄相關聯。例如,每個學生學習許多科目,每個科目都被許多學生學習。
外部索引鍵是一個表格的屬性(欄位),它是另一個表格的主鍵。在學校資料庫中,StudentID 屬性是學生和班級表格的外部索引鍵,也是學生表格的主鍵。一個表格的外部索引鍵中的資料必須與另一個表格的主鍵中的資料匹配。
次要鍵是一個被識別為適合為資料建立索引的欄位,例如姓氏。它用於以不同於主鍵的順序對資料進行排序。事實上,一個表格可以有多個次要鍵,每個欄位都可以是次要鍵。
有關實體的資訊顯示在表格中。表格是將資料組織成列和行的形式。它有時被稱為關係。表格的列也是實體的屬性或記錄的欄位。列中的資料必須具有相同的資料型別並具有不同的名稱。表格中的一行也稱為實體的元組或一條記錄。每一行必須由一個鍵唯一標識。一行和一列的交點儲存一個特定資料項,例如學校資料庫第一行第二列的“Rebecca”。表格中的行和列可以以任何順序檢視,而不會影響表格的內容。
使用表單以不同的目的檢視資料。表單用於檢視、輸入和更改表格中的資料。表單的佈局可以更改。使用者可以定位欄位、標題、說明和圖形。精心設計的表單提供有關所需資料和適用於特定欄位的任何資料輸入規則的資訊。例如,欄位名稱“性別 (M/F)”清楚地說明了所需的資料型別以及如何輸入。在關係資料庫中,表單可以基於單個表格或多個表格。
資料獨立性
消除資料冗餘
更輕鬆地維護資料完整性
集中式安全 - 更大的資料控制
體積龐大
成本高
需要更多硬體
故障影響更大
資料建模是識別實體、實體之間的關係以及實體的屬性的過程。它用於開發資料庫的模式。資料建模對於建立高效的資料庫至關重要。有許多用於資料建模的工具,例如資料字典、示意圖和規範化。
資料字典是資料庫中每個欄位(屬性)的全面描述。它包含有關資料庫中每個條目特徵的資訊,例如欄位名稱、欄位大小、資料型別和欄位描述。
- 欄位名稱是欄位的名稱。應仔細選擇它,以避免混淆。欄位名稱應相對較短,但清晰且無歧義。
- 資料型別(或欄位型別)是可以儲存在欄位中的資料型別。每個欄位都以單個數據型別儲存資料。一些常見的資料型別包括文字、備忘錄、數字、貨幣、是/否和日期/時間。邏輯欄位包含邏輯值“真”或“假”。
- 資料格式顯示資料的顯示方式。
- 欄位大小或寬度是指每個欄位允許的字元數。它應限制在可能需要的最少字元數,因為較小的欄位大小可以讓資料庫執行得更快。
- 描述指定欄位的內容。
- 示例提供欄位中有效條目的示例。
資料字典是資料庫開發中的一項基本工具。它包含元資料,即有關資料的資訊。它為同時參與專案的每個人提供了一個共同的基礎。例如,如果人們正在處理不同的實體,他們可以參考資料字典以檢查特定屬性是否已存在。這減少了資料庫中的資料冗餘(任何不希望的資料重複)。
示意圖是幫助定義資料庫並開發模式的圖形工具。一種常見的示意圖稱為實體關係圖。實體關係圖 (ERD) 是一種識別實體並顯示實體之間關係的圖形方法。它有助於確定要包含在資料庫中和從資料庫中排除的資料。ERD 強制人們對資料庫有一個共同的理解。它們是解釋資料庫的有用工具。ERD 有多種表示法。
規範化是將資料組織成表格的過程,以便使用資料庫的結果是明確的且符合預期。這是一個細化過程,旨在減少資料冗餘。規範化會導致一個更高效但更復雜的資料庫,因為資料被分離到更多表格中。例如,一個表格用於跟蹤客戶購買和產品的價格。如果你刪除了一個客戶,你也會刪除一個價格。規範化將透過將此表格分成兩個表格來解決這個問題:一個表格是關於每個客戶及其購買的商品,另一個表格是關於每種商品及其價格。對任一表格進行新增或刪除都不會影響另一個表格。規範化程度已按形式定義,例如
- 第一正規化 (1NF) - 將資料項移到單獨的表格中,其中每個表格中的資料都是類似型別。每個表格都分配了一個主鍵。1NF 是規範化的基本級別,通常對應於資料庫的定義。
- 域/鍵正規化 (DKNF) - 鍵唯一地識別表格中的每一行。域是每個屬性的允許值集合。強制執行鍵和域限制可確保在修改資料庫時不會出現問題。DKNF 是大多數設計人員力求實現的最終規範化級別。
超媒體是將多種媒體的連結地址進行電子化連線,提供了一種簡單方便的資訊導航方式。資訊儲存在一個包含文字、影像、音訊、影片或可執行程式的檔案集中。每個檔案都是獨立的,資訊透過超文字檢索。超文字是一種系統,它允許文件相互交叉連結,使用者可以透過點選連結從一個文件跳轉到另一個文件。連結,或超連結,透過突出顯示的專案(通常是帶下劃線的單詞或圖形)來指示電子連線。超文字作者必須指定每個連結所訪問資訊的地址。如果另一個計算機是連結的目標,則該計算機稱為節點。超媒體和超文字最著名的應用是全球資訊網。在網路上,每個文件都透過其統一/通用資源定位符 (URL) 訪問。
網頁使用超文字標記語言 (HTML) 建立。HTML是一組特殊的指令,指示如何顯示和導航文件的各個部分。HTML 文件實際上是包含 HTML 指令的文字檔案。許多應用程式將以 HTML 格式儲存文件並插入特殊指令。HTML 文件在 Web 瀏覽器中檢視。HTML 編輯器是一種專門用於編寫 HTML 程式碼的軟體程式。HTML 中的指令使用 HTML 標籤給出。HTML 標籤是元資料,或關於資料的資訊。標籤由左尖括號 (<)、標籤名稱和右尖括號 (>) 組成。標籤通常成對出現,例如 <H1> 和 </H1>,用於開始和結束標籤指令。結束標籤看起來像開始標籤,只是在括號內的文字前面有一個斜槓(/)。每個 HTML 文件都包含某些標準標籤,例如 <head> 和 <body>。<head> 標籤位於標題之前,<body> 標籤指示實際文字的開始。
URL 是 Web 上檔案或資源的地址。它通常以小寫字母書寫,作為一條完整的無空格的線。URL 的主要部分是
- 協議 - 用於訪問 Web 上特定資源的傳輸方法。在大多數情況下,協議將是“http://’(超文字傳輸協議)。
- 域名 - 資源所在的特定計算機的地址,例如“www.hi.com.au”。域名可以用 IP 地址代替。
- 檔案路徑 - 要檢索的檔案的完整路徑。它可能是一個簡單的檔名,也可能是一個目錄路徑,例如“atlas/about.htm”。域名和檔案路徑之間用正斜槓 (/) 分隔。
URL 必須完整且準確;如果不是,則找不到檔案或資源。不必記住 URL。Web 瀏覽器具有儲存網站地址的功能。這些儲存的 URL 被稱為書籤或收藏夾,可以組織到類別或資料夾中以節省您的時間。
故事板是一系列框架,每個框架代表不同的動作或螢幕影像。它是一個用於組織超媒體的工具。故事板繪製在紙上或使用計算機。它們經常被編輯。它們定義每個螢幕及其特定的媒體型別。故事板由導航路徑、資訊和圖形組成。它們很受歡迎,因為它們易於構建,易於閱讀,並且可以在每個階段進行修改。有四種故事板佈局
- 線性 - 一個簡單的順序路徑,可以快速設定
- 分層 - 頂部到底部設計的順序路徑;使用者從開頭開始,向下移動到多媒體產品
- 非線性 - 無結構;使用者可以在任何方向在不同的佈局之間移動
- 組合 - 以上佈局的融合。
資料庫管理系統用於提供安全高效的方法,從資料庫中儲存和檢索資訊。
資料庫管理系統 (DBMS)- 是一種軟體包,允許使用者訪問資料庫,以便他們可以輸入、維護和檢視資料。在 DBMS 中,資料被組織成表,在表單中檢視,使用查詢檢索,並在報告中顯示。DBMS 以多種方式操作資料,例如搜尋和排序。它們還執行許多工以幫助使用者開發和維護資料庫
- 使用資料字典組織資料
- 使用示意圖顯示實體之間的關係
- 檢查資料輸入中可識別的錯誤
- 允許靈活地更改資料庫的定義
- 限制授權人員對資料的訪問
- 提供有關資料庫效能的資訊。
- 順序訪問是指按照順序訪問資料。資料按照儲存順序訪問。它不需要資料項的確切位置。順序訪問比直接訪問慢得多,在需要立即處理的情況下不實用。這是訪問儲存在磁帶上的資料的唯一方法。
- 直接訪問是指在不訪問先前資料項的情況下訪問資料。資料根據數學過程或演算法儲存在特定的儲存位置。直接訪問使用此演算法來計算資料的近似位置。如果在此處找不到資料,計算機將搜尋後續位置,直到找到它。直接資料通常需要使用索引,這稱為索引訪問。
- 索引- 是一個包含有關資料位置資訊的表。透過參考索引並獲取資料的精確位置來訪問資料。索引方法廣泛用於在磁碟上儲存資料,以及儲存資料庫中資料的邏輯位置。
分散式資料庫- 是位於多個站點上的資料庫。它們充當單個數據集合,這些資料在地理上分散。分散式資料庫減少了如果所有站點的所有使用者都必須訪問一個集中式資料庫而產生的資料傳輸成本。但是,它們使得更難獲得資料庫的完整檢視。分散式資料庫通常需要同步以保持其最新狀態。兩階段提交是 DBMS 的一部分,用於維護分散式資料庫的一致性。它檢查資料庫的兩個部分是否都已準備好傳輸,然後執行傳輸。
- 線上儲存使用使用者直接控制的外部裝置,例如硬碟驅動器。
- 離線儲存使用使用者不直接控制的外部裝置,例如集中式資料庫。
線上和離線儲存都使用各種外部裝置和儲存介質
- 硬碟- 是一種由金屬或玻璃製成的儲存裝置,表面覆蓋有磁性材料。通常安裝或固定在具有儲存容量(以 Gb 為單位)的機箱中,並使用直接訪問進行訪問。
- 光碟- 是一種聚碳酸酯塑膠磁碟,表面覆蓋有金屬反射層。資料使用雷射讀取和寫入,資料使用直接訪問檢索。型別
- CD-ROM(光碟只讀儲存器)為 12 釐米,可儲存 650 兆位元組。方便儲存恆定資料。
- DVD-ROM(數字通用光碟只讀儲存器)與 CD 的物理尺寸相同,但儲存介於 4.7 兆位元組和 17 兆位元組之間。
- 可移動盒帶- 是一種硬碟,外殼為塑膠或金屬盒帶,可以像軟盤一樣拆卸。速度快(但不像固定硬碟那麼快),使用直接訪問。兩種型別
- 磁碟儲存 100 或 250 兆位元組的資料,傳輸速率為 1 兆位元每秒。 - Jaz 磁碟是 Zip 的升級版本。它們儲存高達 2 千兆位元組的資料,傳輸速率為 5.5 兆位元每秒。
- 磁帶 - 是一條非常薄、長的塑膠帶,表面塗有一層薄薄的磁性材料。磁帶繞在盒式磁帶內的 2 個卷軸上。它們可以以低成本儲存大量資料,使用順序訪問,通常用作備份介質。
加密和解密
[edit | edit source]加密是指對資料進行編碼的過程,解密是指對資料進行解碼的過程。這是實現資料安全的最有效方法。資料被編碼、傳輸,然後轉換回其原始形式。加密對於金融交易至關重要,在網際網路上廣泛使用。方法通常涉及對位模式的複雜操作。一個問題是找到一種方法,這種方法既難以解碼又便於使用。兩種主要型別
- 非對稱加密需要一個用於加密的金鑰和一個用於解密的金鑰。常用方法是公鑰加密,它涉及一個廣泛可用的公鑰用於加密,以及一個保密的私鑰用於解密。兩者都是使用複雜的數論開發的。
- 對稱加密對加密和解密使用相同的金鑰。常用方法是資料加密標準 (DES)。
資料備份和安全
[edit | edit source]備份 - 是資料的另一個副本,可用於重建系統。DBMS 包含備份和恢復功能,其中備份在指定時間建立。如果系統發生故障,恢復過程將重建資料。它使用最後完成的備份和一個日誌,該日誌列出了自上次備份以來 DBMS 完成的所有操作。備份和恢復的成功取決於實施適當的程式。備份通常儲存在異地或防火保險箱中。備份消除了替換資料的需要,而替換資料是一項非常昂貴的操作。
資料安全 - 包含一系列保護資料的安全措施。首先,使用密碼、個人物品和生物識別裝置限制授權使用者的訪問。進一步的安全措施包括加密和防火牆。
- 防火牆 - 檢查任何試圖訪問網路的人的密碼(也可以用於網際網路),以驗證和驗證傳入的資料。安裝和維護成本高昂。大型系統需要不止一個,因為需要在關鍵點設定障礙。
資料備份
[edit | edit source]防火牆
[edit | edit source]用於操作資料的工具
[edit | edit source]排序
[edit | edit source]排序是指按特定順序排列資料的過程。在資料庫中,有意義地組織資料更容易使用。排序按升序或降序進行。排序可以在多個欄位(屬性)上進行,以便按最有效的方式排列記錄。
搜尋
[edit | edit source]搜尋是指檢查資料庫以檢索資料的過程。在小型資料庫中,執行此操作的有效方法是瀏覽或使用“查詢”或“搜尋”命令。在大型資料庫中,它使用查詢完成。
查詢示例
[edit | edit source]結構化查詢語言
[edit | edit source]查詢 - 是對資料庫的搜尋,以查詢符合特定條件的記錄。這是您向資料庫提出的問題。結果通常顯示在表格中,但可以用作表單、報表、圖表或其他查詢的基礎。查詢還可以同時更新或刪除多個記錄,並對資料執行計算。查詢以以下形式構建:-
<Field name> <Operator> <data>.
資料通常稱為條件。構建查詢的常用方法是查詢示例,這要求使用者在欄位旁邊輸入條件。如果對資料庫的搜尋涉及兩個或多個實體,則稱為關係查詢。
查詢語言 - 是一種專門設計用於搜尋資料庫的語言。
結構化查詢語言 (SQL) 是一種用於訪問和操作關係資料庫中資料的查詢語言。SQL 語句包含用於執行特定任務的關鍵字。在 SQL 中搜索時,務必使用正確的語法。在大多數 DBMS 中,關鍵字為大寫,欄位用逗號分隔,實體和該實體中的屬性用句號分隔,搜尋條件或資料項用雙引號括起來。關鍵字 ORDER BY 按升序 (ASC) 或降序 (DESC) 對欄位進行排序,預設情況下為升序。
運算子用於構建某些查詢。運算子表示要執行的操作。運算子分類為關係運算符或邏輯運算子
- 關係運算符 (=, <>, <, >, <=, >=) 是表示兩個表示式之間關係的字元或符號。
- 萬用字元代表一個或多個未知字元。常用的萬用字元包括 (*),它替代任意數量的字元,以及 (?),它替代只有一個字元。
- 邏輯運算子 (AND、OR、NOT) 用於組合查詢,以便在多個欄位上執行搜尋。理解 AND 和 OR 運算子之間的區別很重要
- AND 運算子要求第一個和第二個查詢都為真,因為它檢索滿足兩個條件的記錄。
- OR 運算子要求第一個或第二個查詢為真,因為它檢索滿足其中一個條件的記錄,例如“姓氏 = Howe”或“郊區 = Kearns”。
- 示例
SELECT ARTWORKS.ArtisName, ARTWORKS.ArtistSurname, GALLERIES.GalleryName, ARTWORKS.Cost //SELECT 屬性
FROM GALLERIES INNER JOIN ARTWORKS ON GALLERIES.GalleryID = ARTWORKS.Gallery //FROM 實體
WHERE (((ARTWORKS.Cost)>5000)) //滿足這些條件
ORDER BY ARTWORKS.ArtisName DESC; //ASC 或 DESC 順序
使用搜索引擎
[edit | edit source]搜尋引擎 - 是一個包含已索引網站的資料庫,允許關鍵字搜尋。搜尋引擎用於搜尋超媒體。索引是一個表,其中包含有關資料位置的資訊。索引允許使用關鍵字搜尋找到文件。搜尋引擎的索引是透過定期掃描網路以查詢新網站並接受網頁作者提交的網站來構建的。掃描通常由稱為蜘蛛、爬蟲或機器人的程式完成。它們將找到的任何文件的 URL 傳送回搜尋引擎的索引軟體。此索引軟體從網站收集資訊,例如標題和關鍵字,然後在資料庫中對其進行索引。每個搜尋引擎都採用不同的方法來構建其索引,這就是為什麼使用不同的搜尋引擎搜尋相同的關鍵字會得到不同結果的原因。輸入與感興趣的主題相關的關鍵字。大多數搜尋引擎允許在一系列關鍵字上進行搜尋。當用戶請求關鍵字時,搜尋引擎會掃描索引並顯示包含該關鍵字的網站列表。選擇合適的關鍵字對於搜尋的成功至關重要。應使用多個單詞、同義詞,並且應該非常具體。搜尋引擎允許使用布林運算子,例如“AND”、“OR”和“NOT”來細化搜尋。一些搜尋引擎還提供詞典。
詞典是按類別組織的網站列表(例如,體育)。它們是查詢網路資訊的另一種方式。網站所有者需要註冊網站才能將其包含在目錄中。因此,目錄通常只涵蓋網路上可用頁面的很小一部分。目錄對於查詢有關一般主題的資訊很有用。
搜尋引擎如何工作?
[edit | edit source]搜尋機器人 - 是一個訪問網站並收集資訊以供搜尋引擎索引的程式。Alta Vista 使用一個名為 Scooter 的機器人。
細化搜尋
[edit | edit source]顯示是指將資訊系統或資料庫的輸出結果呈現出來,以滿足特定目的。
報表 - 是對資料進行格式化和組織後的呈現(例如發票)。DBMS允許對報表進行完全控制,可以以表格或列的形式進行設計。可以插入標題、對資料進行排序、選擇欄位、切換欄位、更改列寬以及選擇記錄。報表的用途決定了其內容、格式和樣式。在建立報表之前,使用者需要透過構建查詢來選擇所需的記錄。接下來,他們選擇欄位,將欄位放置在適當的位置,進行格式化和排序。大多數DBMS都提供諸如計數和求和之類的功能。大多數DBMS報表都包含以下部分
- 報表頁首 - 在報表開頭只出現一次。它包含諸如徽標、報表標題和日期之類的專案。
- 頁首 - 顯示諸如標題、列標題或每頁頂部所需的任何資訊。出現在報表頁首之後,位於報表的首頁。
- 詳細資訊 - 部分顯示大部分資訊。
- 頁尾 - 顯示諸如日期、頁碼或任何其他在每頁底部需要的資訊。
- 報表頁尾 - 在報表結尾只出現一次,位於最後一頁的頁尾之後。它顯示諸如報表總計之類的專案。
不同檢視 的資料庫是使用窗體構建的。窗體用於檢視、輸入和更改表中的資料,並且可以更改佈局。使用者可以定位欄位、標題、說明和圖形。設計精良的窗體可以提供有關所需資料的解釋,以及適用於特定欄位的任何規則。良好的設計原則包括
- 標識報表目的的標題
- 諸如表格或列之類的佈局,可以有效地呈現資訊
- 水平或垂直平衡的頁面文字
- 報表中一致的樣式
- 帶有清晰描述性標題的列
- 適當的空白
- 頁首中的頁碼和日期,以及頁尾。
資料來源 - 是開發資料的個人或組織。資料可能來自非正式來源,例如對話、會議或觀察,也可能來自正式來源,例如報告、書籍或官方檔案。正式來源通常提供邏輯組織的資料。但是,無法保證其準確性。資料來源受版權法保護。未經許可,人們不能複製他人的作品,違反版權是非法的。網路上的大多數資料受版權保護。未經所有者確認和許可,不得使用網站上的文字、音訊等。但是,版權法對學生使用資訊進行研究做出了特殊規定。如果正確引用,學生被允許使用原始作品的合理部分。這包括作者的姓氏和首字母或組織的名稱、完整作品或網頁的標題、URL、文件日期和下載日期。
資料訪問 指的是資料對人們的可用程度。資訊自由法案旨在允許個人瞭解政府和其他公共機構正在儲存哪些資料。它規定,個人有權訪問與個人相關的資訊,但不得侵犯他人的隱私。這些資訊可以免費釋出。然而,知道儲存了哪些資料並不意味著知道它是如何使用的。人們可以使用我們的偏好、弱點和習慣來為自己謀利。此類資料的擁有權和控制權是一個倫理問題。
隱私 是指個人控制個人資料的權利。對於那些與資料庫打交道的人來說,這是一個主要關注點,尤其是在資料庫連結導致隱私侵蝕的情況下。
資料完整性 描述了資料的可靠性。可靠的資料是準確的、最新的和相關的。無法保證網際網路上的資訊是可靠的,因為在網際網路上很容易釋出資訊。
資料驗證 用於檢查資料的輸入。
- 範圍檢查 - 如果資料限制在特定值的較小範圍內,則使用該方法。
- 列表檢查 - 當資料可以與一組可接受的資料進行比較時使用該方法。
- 型別檢查 - 用於確定資料型別是否正確。
- 校驗位 - 是根據程式碼數字中的數字計算得出的數字,然後作為額外數字新增到該數字中。
資料的準確性 - 指其沒有錯誤的程度。收集的個人資料並不總是準確的。這種不準確可能是由於收集或輸入資料時出錯、資料與個人不匹配或資訊過時造成的。應提供檢查和更改不正確資料的機會。通常需要比較來自多個不同來源的資料,以確定哪些資料是準確的。
資料倉庫 是從不同資料來源收集資訊的資料庫。它是一個原始資料的儲存區域,可以對其進行分析,以幫助組織做出決策。資料倉庫的內容通常是歷史性的和靜態的,如果發現新的需求,它將發生變化。獲取資訊的更復雜方法是資料探勘。
資料探勘 是一個尋找資料庫中儲存的資料之間關係和模式的過程。它對資料進行排序,並找出有趣的和有用的聯絡(例如,在超市的交易中)。一個問題是,許多模式是偶然發生的,在決策中沒有價值。它引發了隱私和資料所有權的問題。]
OLTP 指的是最佳化資料庫以提高線上效能。根據http://www.databasejournal.com,這種最佳化包括將資料組織成多層。
- 業務邏輯層 – 規則和流程,經過最佳化,可以快速處理頻繁請求
- 表示層 – 客戶端唯一執行的操作
- 資料層 – 處理事務所需的所有資料
OLAP 是關於分析歷史資料,以提取資訊。過去,這是一個緩慢的過程,因為經過適當規範化的資料庫將資料儲存在離散的表中。它透過基於實際資料庫快照預先構建資料集來實現這一點。檔案大小會膨脹,因為資料不再規範化,但查詢速度快得多。
更多資訊請訪問
http://www.ebroadcast.com.au/lookup/encyclopedia/ol/OLAP.html
http://office.microsoft.com/en‐au/excel/HP101774371033.aspx
向下鑽取是指獲取一組概括結果並深入檢視這些結果的一部分。例如,“5 月的降雨量相對較高”包含一些資訊。如果你問,“是整個月都在下雨,還是間歇性地下的?”,你就正在向下鑽取。
進一步向下鑽取可以檢視降雨量的逐日、逐時或逐分鐘分析。有一個很好的演示在
http://www.quietlyscheming.com/blog/charts/chart‐drilldown‐animations/