跳轉到內容

實驗設計食譜/第 9 章:響應面方法

來自華夏公益教科書,開放的書籍,為開放的世界

正在分析的資料集包含了 403 名患者的潛在 2 型糖尿病的醫療指標資料。使用響應面方法,實驗將測試 4 個因素中的哪些因素表明對 2 型糖尿病發病的易感性,其衡量指標是響應變數,即糖化血紅蛋白百分比。世界衛生組織建議使用至少 6.5% 的糖化血紅蛋白閾值來確定 2 型糖尿病的存在。由於實驗設計(3^k)的性質,需要將 4 個預測變數縮減為三個水平才能用於線性模型。這是透過將小於單個列分位數的值定義為“1”,將大於或等於第一個分位數且小於或等於第三個分位數的值定義為“2”,並將大於第三個分位數的值定義為“3”來完成的。 [1]

以下食譜使用來自 R 包 Ecdat 的資料。該資料集包含美國年輕男性在美國的工資資訊。除了工資外,該資料集還包括各種特徵,如受教育年限、居住地、職業、種族等。這四個因素被用於響應面方法來檢驗哪些因素可能有助於解釋每小時工資的對數的變化。結果發現,種族和受教育年限都有顯著的主效應,而受教育年限和居住地之間的互動作用也顯著。找到駐點後,將它們歸類為最小值、最大值、脊線、鞍點等。 [2]

以下食譜包含一個實驗設計,該設計旨在確定四個解釋性因素對甘蔗收穫量(噸/公頃)的影響,每個因素具有兩個以上水平。一個線性模型將被用來分析區域組、位置、年齡和收穫月份的變化是否影響收穫甘蔗量的變化。將採用響應面方法來估計殘差、係數和方差分析,以分析四個因素的主效應。結果發現,只有收穫月份對甘蔗收穫量有影響。 <http://rpubs.com/maxwinkelman/46036>

以下食譜演示了正確使用響應面方法來分析四個因素對單個響應變數的影響。本實驗分析採用 3^k 設計,並使用 R 包“rsm”進行分析。正在分析的資料集是 2012 年美國的一組犯罪率統計資料。 [3]

本實驗旨在分析各種成分對建築用混凝土混合物整體強度的影響。我們試圖透過使用響應面模型進行分析來確定本實驗的最優設定。每個因素都具有 4 個以上水平,原假設是,由於這些因素中的任何一個的變化,對混合物強度的影響都沒有。然而,從實驗結果中,我們拒絕了原假設,因為存在一些顯著的主效應和互動作用效應。可以在以下連結中訪問此分析:http://rpubs.com/Uzma_1004/45921

以下食譜使用來自 R 包 Ecdat 的資料。該資料集包含 1998-1999 年加利福尼亞州學生成績的資訊。該資料集還提供了許多其他資料列,這些資料可能對進行實驗很有用。具體而言,分析了四個因素對分數結果的影響:教師人數、電腦數量、符合減價午餐資格的學生百分比以及地區平均收入。這些因素被用於響應面方法來估計殘差、係數和方差分析,以分析四個因素對響應變數,即平均累積考試分數的影響。 http://rpubs.com/macchm/46054

本食譜在分析關於酒後駕車和死亡率的資料集時,使用響應面方法。使用 4 個因素(啤酒稅、最低飲酒年齡、平均行駛里程和失業率),每個因素有 3 個水平,建立了一個線性模型,並使用響應面方法來執行方差分析,以及確定具有最佳響應變數(最小值或最大值)的駐點。 [4]

以下食譜是關於電腦價格和可能解釋價格差異的因素。在本分析中,我們建立了一個線性模型,並使用響應面方法來測試選定的因素如何影響電腦價格。選定的因素是:以 MHz 為單位的時鐘速度 (speed)、以 MB 為單位的硬碟大小 (hd)、以 MB 為單位的記憶體大小 (ram) 以及以英寸為單位的螢幕大小 (screen)。使用這四個因素構建一個包含二階效應的線性模型,然後使用“rsm”進行引數估計,並分析不同響應面圖中的駐點。 http://rpubs.com/chenh16/46081

在本研究中,我們使用響應面方法來檢驗“克拉”、“顏色”、“淨度”和“證書”對新加坡鑽石價格的影響,並使用該方法確定最佳狀態。結果表明,鑽石石價格的變化不僅是由樣本隨機化造成的,而且還分析了所選變數的主效應、雙向互動作用效應和純二次效應。在最佳價格分析中,獲得了鞍點,沒有找到區域性最大值/最小值。 [5]

在本研究中,進行了四因素多水平實驗,以檢視某個團隊在某個賽季獲得的擊球數('H')、本壘打數('HR')、三振出局數('SO')或保送數('BB')是否對該團隊在某個賽季獲得的失利數('L')有統計學意義的影響(這是本分析的響應變數)。執行方差分析 (ANOVA) 作為一種方法來確定這些因素對響應變數 'L' 的重要性,並且使用響應面方法來確定響應變數 'L' 的最佳操作特性(因為它與線性模型相對應)與它 的二階響應面及其駐點的表徵。 [6]

本食譜正在檢查來自 Ecdat 包的 C's of diamond stones 資料集的定價。我們正在檢視 4 個不同的因素,每個因素都有 2 個或更多個水平,它們如何影響新加坡的價格。此方法用於建模和分析響應變數(鑽石價格)受到多個變數(克拉、顏色、淨度、證書)影響的問題,目標是最佳化此響應。從響應面方法,我們可以找到是否存在任何最大值、最小值、鞍點或脊線。 - Cheryl Tran http://rpubs.com/tranc3/46123

以下食譜檢查了來自 Ecdat 包的 Computers 資料集。響應面方法用於確定四個因素對電腦價格的影響,這四個因素具有 3 個或更多個水平,即硬碟大小、螢幕大小、記憶體大小和速度。因素水平被操縱,以便可以使用響應面方法。目標是確定電腦速度和螢幕、記憶體和硬碟大小是否可以透過方差分析來解釋速度的變化。與往常一樣,執行統計分析,檢查模型充分性,並討論意外情況。 [7]


2016 年專案

Bjarke H 本實驗分析了來自 Ecdat 包的 Star 資料集。主要重點是使用專案 3 中的模型進行響應面方法,以及新增連續變數。響應面是使用 RSM 包計算的。 http://rpubs.com/bjarke1/project4

Cole K 本食譜分析了來自 Ecdat 包的 Housing 資料集。Housing 資料集查看了溫莎的房屋銷售價格。這是一個包含 1987 年橫截面的資料集,共有 546 個觀測值。本食譜的目標是在 R 中使用 RSM 包來最佳化在第 7 章:分數因子方法中建立的模型。這是透過使用等高線圖和透檢視進行視覺化來完成的,然後檢查模型的充分性。 http://rpubs.com/Kristencole3/235877

Deshpande R 本分析側重於瞭解學生的不同屬性如何影響他們的學校出勤率。資料集包含 2008 年葡萄牙 649 名學生的 30 個屬性,但實驗側重於性別、課外活動參與、飲酒和到校時間。本研究使用 RSM 技術分析了這四個自變數對缺勤次數的影響。分析考察了主效應、雙因素互動作用和純二次項。等高線圖和視覺化也用於理解 RSM 結果。 http://rpubs.com/rajanideshpande/235909

Trevor C. 本食譜分析了 Motor Trend 資料,該資料突出了汽車的效能和設計因素。一些主要因素是發動機型別、變速箱型別、汽車重量和氣缸數量。使用 RSM 技術研究了這些因素的影響,主要分析主效應和雙因素互動作用效應。我們使用分數因子設計和線性方差分析設計作為基線方法。提供了等高線圖和透檢視以幫助讀者視覺化和理解資料以及所執行的分析。 http://rpubs.com/trevorcorrao/235911

Benjamin B. 該專案研究了包含 93 個觀測值的汽車資料集。首先,使用部分因子設計,研究了哪些因素會影響價格。有兩個 2 水平因素和兩個 3 水平因素,這些因素被分解成 2 水平因素。這些因素包括安全氣囊、驅動、手動變速器和產地。然後,根據別名結構、主效應、互動效應和方差分析分析結果。接下來,在檢查了主效應、別名和方差分析結果後,建立了模型。使用該模型,還將案例擴充套件到響應面方法。結果與預期一致,其中驅動、手動變速器和產地對汽車價格的影響最大。部分因子設計和響應面方法的結果一致。 http://rpubs.com/byeonb/doeproject4_ver1 [8]

  1. Trevor Manzanares http://rpubs.com/manzat/45910
  2. Jane Braun http://rpubs.com/braunj6/46024
  3. Anthony D'Amato http://rpubs.com/adamato/46049
  4. http://rpubs.com/Tothk2/Recipe9
  5. Wei Zou http://rpubs.com/serena049/doehw09
  6. Brendan Howell http://rpubs.com/howelb/46118
  7. Ali Svoboda- http://rpubs.com/svoboa/46230
  8. Benjamin B. http://rpubs.com/byeonb/doeproject4_ver1
華夏公益教科書