社會研究方法/指數、量表、型別學
指數、量表和型別學
定量資料分析需要構建兩種型別的變數測量方法——指數和量表。這些測量方法經常被使用,並且很重要,因為社會科學家經常研究那些沒有明確和明確指標的變數——例如,年齡或性別。研究人員經常將大量工作集中在有關人們群體態度和取向方面,這需要多個專案來提供對變數的指示。其次,研究人員試圖從非常低到非常高(反之亦然)建立序數類別,而單個數據項無法確保,而指數或量表可以。
雖然它們存在差異(將在後面討論),但兩者具有共同的因素。
兩者
- 是變數的序數測量
- 可以根據特定變數對分析單位進行排序
- 是變數的複合測量(基於多個數據項的測量)
指數是一系列是/否問題的總和,然後將其合併成一個單一的數值分數。
它們通常是某種社會現象數量的度量,並在比率測量級別構建。更復雜的指數根據每個專案在所測量概念中的重要性對其進行加權(例如,在一個多項選擇測試中,不同的問題值不同的分數)。一些間隔級別指數沒有加權計數,但包含其他指數或量表(例如,大學錄取根據 GPA、SAT 分數、論文對申請人進行評分,並從每個來源獲得不同的分數)。
- 專案選擇
- 表面效度(或邏輯效度)
- 單維——複合測量應只代表概念的一個維度。
- 一般或特定——您包含的專案的性質將決定具體或一般地測量變數。
- 方差——為了保證方差,您可以a)選擇幾個專案,這些專案的響應將人們在變數方面大致平均地分開 b)選擇方差不同的專案
- 經驗關係的考察
- 雙變數關係:兩個變數之間的關係。
- 多變數關係:兩個或多個變數之間的關係。
- 指數評分
- 確定指數分數的理想範圍
- 確定是否要給指數中的每個專案賦予相等或不同的權重
- 確保標準化權重——除非有充分的理由,否則專案應被賦予相等的權重。
- 處理缺失資料
- 您可以選擇將其排除在指數構建和分析之外
- 將缺失資料視為可用響應之一
- 分析缺失資料並解釋其含義
- 將缺失資料分配一箇中間值或平均值
- 將值分配給評分變數的比例。
- 指數驗證
- 專案分析
- 評估測量中包含的每個專案是否做出獨立貢獻,還是僅僅重複了測量中其他專案的貢獻
- 外部驗證
- 透過檢查其與同一變數的其他假定指標的關係來檢驗有效性。
--Trp26 (談話) 18:01, 2010 年 4 月 22 日 (UTC)
量表
- 為了討論量表,我們必須定義它。量表是對態度或情感強度的衡量。具體來說,量表存在於資料的序數級別。通常,量表使用序數測量級別構建,該級別按順序排列專案以確定贊成或反對程度,但不提供關於程度之間距離的任何意義。
- 李克特量表是研究界最常用的量表之一。該量表包括將數值分配給關於特定主題的情感強度(或中立性),然後嘗試標準化這些響應類別,以提供對量表中專案的相對強度解釋。諸如“強烈同意”、“中等同意”、“中等不同意”和“強烈不同意”之類的響應是可能在李克特量表或基於該量表的調查中找到的響應。
- 語義差異量表類似於李克特量表,但是,它不是允許不同的響應程度,而是要求受訪者根據兩個完全相反的形容詞對某事進行評分。
- 現實生活中使用的量表的例子是鮑格達努斯社會距離量表。該量表由埃默裡·鮑格達努斯開發,用於確定人們與那些與自己不同的人(包括其他種族、宗教和階層的人)交往和社交的意願。
- 瑟斯頓量表與鮑格達努斯或李克特量表完全不同。該量表由路易斯·瑟斯頓開發,是一種尋求使用受訪者來回答調查問題並確定問題重要性的格式。一組受訪者,即一組“評委”,為不同的變數分配不同的權重,而另一組受訪者則實際回答調查中的問題。
- 古特曼量表由路易斯·古特曼開發,是今天使用最多的量表型別。與瑟斯頓量表一樣,古特曼量表認識到不同的問題提供了不同的偏好指示強度。它基於這樣的假設:同意最強的指標也意味著同意較弱的指標。它使用一個簡單的“同意”或“不同意”量表,沒有偏好強度的任何變化。
- 關於量表有兩個誤解,其中一個是將資料組合成量表受到研究樣本觀察的影響。因此,從一個樣本中獲得的一個量表的資料可能不符合另一個量表。因此,可以對資料組合進行多次縮放,因為它最初是在研究早期能夠實現的。第二個誤解與特定量表有關。由此,給定的專案或資料可能有助於確定構成量表的要素,而不是量表本身。
量表與指數
- 總的來說,量表被認為比指數功能更強大,因為儘管兩者都是序數測量,但量表通常會考慮它們提出的問題的強度和它們衡量的情感。
加權指數的一個例子是美國勞工統計局的消費者價格指數 (CPI),它代表了典型消費者購買的商品價格總和。在計算該指數時,商品按其在一般人群中購買的數量(相對於其他商品)進行加權,因此購買頻率更高的商品將對指數值產生更大的影響。
抽樣
為什麼要抽樣?
- 在大多數情況下,研究整個總體可能不可行
- 抽樣允許研究人員從總體中更小、更易於管理的子集收集資訊。這些資訊可用於代表更大的總體。
如何抽樣
- 為了抽樣,研究人員必須首先指定一個目標總體,關於該總體將進行概括
- 目標總體是研究人員想要研究的案例池。
- 使用抽樣框將目標總體轉化為潛在物件的實際清單
非機率抽樣
- 任何樣本選擇方式不以機率論為基礎的技術。
- 非機率抽樣通常是實地研究和比較歷史研究的唯一可行方法
- 非機率抽樣型別包括
便利抽樣:一種非機率抽樣方法,其中樣本總體依賴於可獲得的受試者
- 不允許控制代表性
- 只有在風險較低的方法不可用時才合理
- 使用這種方法時,研究人員必須對概括非常謹慎
目的性或判斷性抽樣:一種非機率抽樣方法,其中選擇要觀察的單位是基於研究人員關於哪些單位最有用或最有代表性的判斷
- 在研究以下內容時,這種方法很有用
- 總體的小子集
- 兩組比較
- 偏差案例
滾雪球抽樣:一種非機率抽樣方法,其中每次接受採訪的人員都可能被要求建議更多的人進行採訪
- 經常用於實地研究,以及用於研究特殊人群
- 例如:連結的網站,特定人群
- 但是,這可能會使樣本產生偏差
配額抽樣:一種非機率抽樣方法,其中根據預先指定的特徵選擇樣本中的單位,因此,總樣本將具有與假設存在於所研究總體中相同的特徵分佈
- 類似於機率抽樣,但有一些問題
- 配額框必須準確
- 樣本元素的選擇可能存在偏差
隱藏人群:社會中通常在傳統的機率抽樣方法中被忽略的群體
- 包括:吸毒者、駭客社群、無家可歸者、非法移民、流動工人、大學生等。
- 可能被汙名化或難以找到
- 通常使用各種滾雪球抽樣方法來接觸
- 在目標抽樣中,案例透過鏈式推薦從特定社群收集,併為已知的層級設定預設配額
- 在受訪者驅動抽樣中,對帶來感興趣人群中更多受試者的受訪者提供金錢獎勵
機率抽樣
- 一般來說,樣本是根據機率論選擇的
- 通常用於大規模調查
- 如果正確執行機率抽樣,它將提供對所研究總體的更真實表示。
- 如果總體的所有成員在所有方面都相同,那麼就沒有必要進行仔細的抽樣程式。(但是,這種情況很少相同)
- 從總體中抽取的樣本必須包含總體中存在的相同變化
- 機率樣本通常比其他型別的樣本更具代表性,因為偏差較少
- 這很難做到,而且往往不能100%準確地完成。
- 機率論允許研究人員估計樣本的準確性或代表性。
- EPSEM(等機率抽樣方法)樣本是指每個總體成員被選入樣本的機率相等的樣本。
抽樣偏差
- 當樣本不典型或不能代表總體時,就會發生抽樣偏差。
- 這並不總是人為造成的。通常,研究人員的地理位置、獲取總體的便捷性以及對隨機接近陌生人的個人舒適程度等因素都會影響偏差。
抽樣設計
- 簡單隨機抽樣:機率抽樣的一種形式,其中將案例分配給數字,並使用隨機數生成器生成一組隨機數。
- 系統抽樣:機率抽樣的一種形式,其中列表上的每個第 n 個數字都包含在樣本中。
- 分層抽樣:機率抽樣的一種形式,其中將案例分為有意義的興趣組(性別、種族等),然後從每個組中隨機抽取樣本。
- 多階段整群抽樣:最初對“自然”組(例如:城市)進行抽樣,之後再對更小的子集(城市街區)進行抽樣。
抽樣很重要
- 抽樣不當會降低使用研究結果進行總體推斷的有效性。
- 樣本量越大 + 分層越多 = 結果更具代表性
- 對於小型總體,需要較高的抽樣比例。
- 無論總體規模大小,6-800 個案例通常就足夠了。
記錄和分析樣本
- 首先,機率論是數學的一個分支,它提供了進行準確研究所需的工具——數學抽樣方法、統計分析以及查詢總體引數的方法。機率論使用樣本分佈來實現這一點。
- 研究結果通常以點圖的形式表示,每個樣本的均值用 x 軸上的一個點表示。隨著研究的重複進行,樣本的均值通常會被重複,因此它們的點只是簡單地放在它們的重複點上。具有特定均值的樣本數量在 y 軸上表示。隨著越來越多人接受調查,圖形變得越來越高,直到通常只有一個真正的均值單獨地矗立在中間。
- 引數通常由樣本調查確定。
- 抽樣誤差——在統計學中稱為標準差——可以透過對引數 P 和 Q 相乘,然後除以每個樣本中的案例數量,再取平方根來計算。這是一個重要的數字,因為它可以讓研究人員瞭解數字在總體引數周圍的分佈範圍。
•68% 的樣本估計值將落在引數之上或之下一個標準差內。•95% 的樣本估計值將落在引數之上或之下兩個標準差內。•99.9% 的樣本估計值將落在引數之上或之下三個標準差內。•如果引數之一是 1.0 或 0.0,則標準差將為 0。•標準誤差隨著樣本量的增加而減小。
- 置信區間是總體引數估計值所在的範圍。
- 置信水平是總體引數在某個置信區間內的機率。
•這些數字通常透過做出最佳猜測,然後加減一個合理的數字來確定(例如,如果您認為總體中有 20% 的人將擁有某個特徵,則可以最初將置信區間設定為 10% 到 30% 之間)。
- 在所有這些過程中,總體規模幾乎無關緊要。
•當樣本太小時,會計算有限總體校正。這由以下平方根表示:總體大小減去樣本大小,除以總體大小減 1。
總體和抽樣框
- 抽樣框是從中選擇樣本的構成總體的元素列表(例如:人口普查區塊)。
- 抽樣框顯然必須與所研究的總體一致。
- 它們並不完美——不可避免地會遺漏一兩個方面。
- 所有元素在抽樣框中應具有同等的代表性。
- 基於樣本的發現可以解釋為抽樣框元素的代表。
抽樣設計型別
簡單隨機抽樣:通常用於社會研究的“基本抽樣方法”。研究人員通常會獲取一個抽樣框,然後隨機選擇數字。如果可能,這由計算機完成。
系統抽樣:獲取潛在受試者列表,然後選擇列表中每個第k個元素以供納入。第一個受試者應隨機選擇。結果與隨機抽樣大致相同,但執行起來更加繁瑣,因此使用較少。系統抽樣利用:•抽樣間隔,即選定受試者之間的距離(總體規模 / 樣本規模)•樣本中受試者的比例:總體中潛在受試者的比例
分層抽樣:對抽樣的修改,包括在形成樣本之前將總體劃分為同質的層,以提高組內的代表性。它具有透過同質性降低抽樣誤差的優勢,但也具有透過較小的樣本量增加抽樣誤差的缺點。它增強了用於劃分組的任何變數的呈現。分層適用於簡單隨機抽樣、系統抽樣或整群抽樣。人們可以透過簡單地使用他們計劃使用的任何方法來完成此操作,但要在分層組內進行。•分層變數是被用來對樣本進行分層的特徵。
多階段整群抽樣:包括列出和抽樣的步驟。當人們利用不同的亞群體來獲取樣本時,就會進行整群抽樣。例如,從特定街區中提取受試者來回答有關市政府的問題。從其位置選擇元素,然後分析其特徵,這些特徵將使其成為特定研究的合適受試者。然後根據資料選擇合適的受試者。•這可能會產生更具偏差的樣本。有時,例如在醫學研究中,這是可取的。•出現的問題是,隨著群集數量的增加,元素數量也必須增加。通常情況下,在這種情況下,元素會更加同質化。•研究人員通常受到最大受試者數量的限制。•理想情況下,研究人員希望擁有大量的群集和儘可能小的元素數量。
樣本加權
- 預設情況下,大多數總體成員並非完全透過隨機選擇。
- 加權是為樣本中具有不同選擇機會的不同成員分配不同“權重”的行為。
- 通常,這意味著從某個區域選擇的人數會發生偏差,以確保維持適當的特徵比例。
術語
•代表性:樣本的特徵分佈與它所抽樣的總體保持一致。
•EPSEM:每個總體成員具有相同選擇機會的抽樣。
•元素:總體中的任何部分——可以是成員、位置或可衡量的特徵。
•研究總體:包含進行研究所需的所有特徵;樣本從這裡選擇。
•隨機選擇:抽樣方法,總體中的每個成員都有相同的選擇機會。
•抽樣單元:被視為選擇物件的人或一群人。
•引數:總體內的可變因素。
•統計量:樣本內變數的描述。
•抽樣誤差:未研究整個總體而產生的預期誤差程度。
•置信區間:總體引數估計值所在的範圍。
•置信水平:總體引數在某個置信區間內的機率。
•抽樣框:具有資格進行研究的個人列表。
•加權:為顯示不同選擇機率的受試者分配不同的權重。
型別學是對觀察結果進行分類,以反映它們在兩個或多個變數上的屬性。
- 通常,個人可能希望將變數放入一個組織良好的格式中。這就是型別學發揮作用的地方。型別學包括由多個變數交叉產生的類別集。
其他重要術語:相關性:兩個變數之間的經驗關係,即 1. 一個變數的變化與另一個變數的變化相關聯,或者 2. 一個變數的特定屬性與另一個變數的特定屬性相關聯。相關性本身並不構成兩個變數之間的因果關係,但它是因果關係的一個產物。虛假關係:兩個變數之間巧合的統計相關性,證明是由第三個變數引起的。分析單位:研究的物件或誰。在社會科學研究中,最典型的分析單位是個人。社會產物:社會人或其行為的任何產物。可以是分析單位。生態謬誤:僅僅根據對群體的觀察而錯誤地得出關於個人的結論。還原論:一些研究人員的錯誤:嚴格限制(減少)被認為與所研究現象相關的概念型別。社會生物學:基於認為社會行為可以完全用遺傳特徵和行為來解釋的觀點的正規化。橫斷面研究:基於代表單一時間點的觀察的研究。縱向研究:涉及在不同時間點收集資料的研究設計。趨勢研究:一種縱向研究,其中對某個總體的特定特徵進行時間監控。一個例子是蓋洛普民意調查系列,展示了選民在整個競選期間對政治候選人的偏好,即使在每個時間點都採訪了不同的樣本。佇列研究:一種研究,其中對某個特定的亞群體或佇列進行時間研究,儘管資料可能來自每個觀察集中不同的成員。例如,一項對每五年傳送一次問卷的研究將是一項佇列研究。小組研究:一種縱向研究,其中資料從同一組人(樣本或小組)在多個時間點收集。