跳轉到內容

情報強化/證明

來自華夏公益教科書,開放的書籍,為一個開放的世界

情報強化
介紹 | 資訊篩選 | 資訊把握
資訊評估 | 資訊發明 | 資訊利用

不同級別的證明

[編輯 | 編輯原始碼]

存在著許多不同級別的證明。有些人傾向於將一切都視為證明,而另一些人則什麼都不認為是證明。擁有良好的判斷能力,以決定什麼構成一個好的證明,是高智商的明顯標誌。一個對科學證明一無所知的人,無法識破偽科學的證明,因此可能會四處走動,相信不真實的事情。智商的一個衡量標準是,一個人對現實的模型與現實本身之間的對應關係。

科學證明

[編輯 | 編輯原始碼]

科學方法的要素

[編輯 | 編輯原始碼]

以上是假設演繹法,它包括在第一步和第四步中的觀察。每個步驟都可能存在錯誤,因此要進行同行評審

科學方法依賴於對調查物件的仔細表徵。(主題也可以被稱為問題未知。)例如,本傑明·富蘭克林正確地將聖埃爾摩之火描述為電氣性質,但要確定這一點需要一系列的實驗和理論。在尋找主題的相關屬性時,這種仔細的思考可能也需要一些定義和觀察;觀察通常需要仔細的測量和/或計數。

對相關數量進行系統、仔細的測量或計數收集,通常是像鍊金術這樣的偽科學與像化學這樣的科學之間的關鍵區別。進行的科學測量通常會被製成表格、圖表或地圖,並對它們進行統計處理,例如相關性和迴歸。測量可以在受控的環境(例如實驗室)中進行,或者在或多或少難以觸及或無法操作的物件(例如恆星或人口)上進行。測量通常需要專門的科學儀器,例如溫度計、分光鏡或電壓計,科學領域的進步通常與其發明和發展密切相關。

測量需要對相關數量使用操作定義。也就是說,科學數量的描述或定義方式是透過如何測量它來進行的,而不是透過一些更模糊、不精確或“理想化”的定義。例如,用安培測量的電流,可以在操作上定義為在一定時間內沉積在電化學裝置電極上的銀的質量,該裝置在某些細節上有所描述。事物的操作定義通常依賴於與標準的比較: “質量”的操作定義最終依賴於使用文物,例如儲存在法國實驗室中的特定鉑金千克。

科學術語的定義有時與它們的自然語言用法有很大不同。例如,質量重量在日常對話中經常互換使用,但在物理學中卻有著不同的含義。科學數量通常以其度量單位來表徵,這些單位可以隨後用傳統的物理單位來描述,以便在傳達工作時進行交流。

科學工作中的測量通常還伴隨著對其不確定性的估計。通常透過對所需數量進行重複測量來估計不確定性。不確定性也可以透過考慮用於計算的各個基礎數量的不確定性來計算。對事物的計數(例如,在特定時間某個國家的人口數量)也可能由於所用方法的限制而存在不確定性。計數可能只代表所需數量的樣本,其不確定性取決於所使用的取樣方法和所採集的樣本數量。

假設發展

[編輯 | 編輯原始碼]

假設包括對主題的建議解釋。它通常會提供因果解釋或提出一些相關性。

觀察通常具有存在語句的形式,說明所研究現象的某個特定例項具有某些特徵。因果解釋通常具有普遍語句的形式,說明現象的每個例項都具有特定的特徵。從任何一系列特定觀察中推斷普遍語句在邏輯上無效。這就是歸納問題。許多解決方案被提出來解決這個問題,包括可證偽性貝葉斯推理

科學家利用一切可利用的資源——自己的創造力、其他領域的理念、歸納法系統性猜測等——來構想對正在研究的現象的可能解釋。對於提出新的假設,並沒有明確的指導方針。科學史充滿了科學家聲稱獲得“靈感閃現”或“直覺”,然後促使他們尋找證據來支援或反駁他們想法的故事。 邁克爾·波蘭尼將這種創造力置於他對方法論討論的核心。

從假設中進行預測

[編輯 | 編輯原始碼]

一個有用的假設將能夠透過預測,使用演繹推理,來進行實驗評估。如果結果與預測相矛盾,那麼正在檢驗的假設是不正確或不完整的,需要修改或放棄。如果結果證實了預測,那麼假設可能是正確的,但仍需進一步驗證。

愛因斯坦的預測(1907):光在引力場中彎曲

愛因斯坦的廣義相對論對可觀察到的時空結構做出了幾個具體的預測,比如預測引力場中會彎曲,並且彎曲的程度與該引力場的強度密切相關。 亞瑟·愛丁頓1919日食期間的觀測結果支援廣義相對論,而不是牛頓的萬有引力

預測指的是實驗設計,其結果目前未知;經典的例子是埃德蒙·哈雷對哈雷彗星迴歸年份的預測,該彗星在他去世後迴歸。對(未知事物)的預測不同於結果已經可以知道的結果)。

一旦做出預測,就會設計一個實驗來檢驗它。實驗可以尋求對假設的確認證偽。然而,實驗並非絕對必要。在以觀察為基礎的科學領域,實際實驗的設計必須不同於經典的實驗室科學;例如,迦勒底人的觀測結果被用於巴塔尼的工作中,當他確定了地球歲差的值時,這項工作跨越了數千年。

科學家假設進行實驗的人具有開放和問責的態度。詳細的記錄至關重要,有助於記錄和報告實驗結果,並提供程式有效性和完整性的證據。他們還將協助複製實驗結果。這種傳統可以在喜帕恰斯(公元前190年-公元前120年)的工作中看到,他在2100多年前(比巴塔尼早1000年)確定了地球歲差的值。

實驗的完整性應該透過引入控制來確定。進行兩個幾乎相同的實驗,只有一個實驗改變了正在測試的因素。這有助於進一步隔離任何因果現象。例如,在測試藥物時,重要的是要仔細測試,確保藥物的假定效果僅由藥物產生。 醫生可以透過雙盲研究來做到這一點:比較兩個幾乎相同的病人組,其中一組接受藥物,另一組接受安慰劑。病人和醫生都不知道誰接受了真正的藥物,從而隔離了藥物的影響。

實驗完成後,研究人員會確定收集到的結果(或資料)是否符合預測。如果實驗結論與預測/假設不符,那麼就回到失敗的假設並重新進行。如果實驗看起來“成功”——即符合假設——那麼其細節就會被髮表,以便其他人(理論上)可以複製相同的實驗結果。

評估和迭代

[編輯 | 編輯原始碼]

測試和改進

[編輯 | 編輯原始碼]

科學過程是迭代的。在任何階段,一些因素都可能導致科學家重複過程的早期部分。未能提出一個有趣的假設可能導致科學家重新定義他們正在考慮的主題。假設未能產生有趣且可檢驗的預測可能導致重新考慮假設或對主題的定義。實驗未能產生有趣的結果可能導致科學家重新考慮實驗方法、假設或對主題的定義。

科學是一個社會性的事業,只有當科學工作能夠被科學界驗證時,它才會被接受。至關重要的是,實驗和理論結果必須由科學界中的其他人進行復制。研究人員為了這個願景獻出了生命;格奧爾格·威廉·裡希曼在試圖複製1752本傑明·富蘭克林風箏實驗時,被球狀閃電擊中額頭而喪生(1753年)。

重新評估

[編輯 | 編輯原始碼]

所有科學知識都處於不斷變化之中,因為在任何時候都可能出現新的證據,與長期持有的假設相矛盾。一個特別突出的例子是的理論。長期以來,人們一直認為光是由粒子組成的。 艾薩克·牛頓,以及在他之前的許多古希臘人,都相信它是這樣,但他的“光是由粒子組成的”觀點被支援波動說的證據推翻了,波動說最顯著地是在19世紀初由英國醫生托馬斯·楊提出。光作為波很好地解釋了觀察到的光的衍射和干涉,而光作為粒子的理論則不能解釋。在19世紀的大部分時間裡,光的波動解釋被廣泛認為是不可辯駁的正確觀點。然而,在世紀之交,人們進行了一些觀察,這些觀察無法用光的波動理論來解釋。這組新的觀察結果可以透過馬克斯·普朗克的量子理論(包括光電效應布朗運動——這兩者都來自阿爾伯特·愛因斯坦)來解釋,但不能用光的波動理論來解釋。當然,粒子的理論也解釋不了。 更多…

同行評審評估

[編輯 | 編輯原始碼]

科學期刊採用同行評審的過程,在這個過程中,科學家的手稿由科學期刊的編輯提交給(通常是一到三位)熟悉該領域的同行(通常是匿名的)科學家進行評估。評審人可能會或可能不會推薦發表、建議修改後發表,或者有時會推薦發表在其他期刊上。這有助於保持科學文獻不受非科學或奇談怪論的影響,有助於減少明顯的錯誤,並且通常可以提高科學文獻的質量。在經過此過程之前就向大眾媒體宣佈的工作通常不受歡迎。有時同行評審會抑制非傳統工作的傳播,而有時又過於寬容。同行評審過程並非總是成功,但已被科學界廣泛採用。

可重複性

[編輯 | 編輯原始碼]

科學觀察結果的可重複性或複製性,雖然通常被描述為在科學方法中非常重要,但實際上很少被實際報道,而且實際上也常常沒有做到。評審人和編輯有權利,並且通常會拒絕僅僅聲稱複製了一些觀察結果的論文,因為這些論文缺乏原創性,沒有包含任何新內容。偶爾也會發表關於無法複製結果的報告——主要是在存在爭議或懷疑存在欺詐行為的情況下。然而,他人無法複製結果的威脅,對大多數科學家來說是一個非常有效的威懾力量,他們通常會在嘗試發表之前多次複製自己的資料。

證據和假設

[edit | edit source]

證據以不同的形式和質量出現,這主要是由於潛在的假設。一個潛在的假設,“比空氣重的物體掉落時會落到地面”不太可能引起太多爭議。然而,像“外星人綁架人類”這樣的潛在假設是一個非凡的斷言,需要確鑿的證據。許多非凡的斷言也無法經受住奧卡姆剃刀的考驗。

假設的優雅

[edit | edit source]

在評估一個假設時,科學家傾向於尋找“優雅”或“美麗”的理論。與這些詞語在英語中的通常用法相反,科學家在腦海中有著更具體的含義。“優雅”(或“美麗”)指的是一個理論能夠儘可能簡潔地解釋儘可能多的已知事實,或者至少以與奧卡姆剃刀一致的方式,同時在審美上令人愉悅。


每個人都有理由學習什麼是科學證明。即使你從未做過科學工作,它也能幫助你評估他人的工作,並保護自己免受騙術的侵害。也許更重要的是,它將使你能夠在一般情況下更清晰地思考。

統計學

[edit | edit source]

每當你聽到廣告說一種新的肥皂或乳液在某種意義上被科學證明具有積極的效果時,統計學就被使用過(或者他們對證明的科學性撒謊)。統計證明背後的哲學思想是這些

  1. 制定一個可以透過實驗(測量)來證偽的假設
  2. 決定你想要什麼樣的確定性水平。95% 和 99% 是常見的選擇。
  3. 進行可能證偽假設的實驗。

例如,假設你想看看懷孕期間飲酒與孩子的智力之間是否存在聯絡。那麼你可能會從以下方面開始

假設:母親在懷孕期間飲酒降低孩子的智力。

這就會產生以下反假設或零假設

零假設:母親在懷孕期間飲酒不會降低孩子的智力。

現在我們希望對結果有 99% 的把握。這意味著錯誤的風險是 1%。在進行大量測量並將測量結果透過統計學工具處理後,我們將能夠得出以下結論

  1. 我們無法在 1% 的錯誤風險內拒絕零假設,或者
  2. 在 1% 的錯誤風險內,零假設被拒絕,有利於假設。

如果結果是 2,我們就“統計地證明”了懷孕期間飲酒會降低孩子的智力。當然,這個例子是經過簡化的。我們所說的飲酒是什麼意思?什麼數量,以及多久一次?我們如何衡量智力?這些也必須被明確說明。

公理方法

[edit | edit source]

公理方法是每個數學理論的基礎。一個完整的理論由公理和蘊涵構成。*“公理”的其他名稱是“前提”、“假設”和“假設”。為了論證的目的,公理總是被認為是真實的,無需討論。每次我們說“假設”,我們都在描述一個公理。當一個陳述無疑(邏輯地)從另一個陳述中得出時,我們就有一個蘊涵。

假設所有的人類都有藍色的眼睛。讓我們把它作為一個公理。現在假設梅林達是一個人類。(這是另一個公理。)那麼梅林達有藍色的眼睛。關於梅林達眼睛顏色的任何其他結論都是錯誤的,因為公理被定義為真實的(除非有人能證明這兩個公理相互矛盾,在這種情況下,其中一個必須被丟棄,但那是另一個故事)。

人們有不同的公理。看看這個信念:“如果我們每天早上不往龍的洞裡扔煎餅,太陽就不會升起”。你可能會說這很不合邏輯。但確實,在合適的公理下它是合理的。

公理

  1. 洞裡有一條龍。
  2. 如果龍不吃煎餅,它就會死。
  3. 只有龍才能讓太陽昇起。

現在,如果沒有人給龍煎餅,那麼龍就會死(假設龍不能自己做煎餅)。但如果龍死了,那麼就沒有人讓太陽昇起!這個結論是從公理中邏輯推匯出來的。重點是,即使是鐵桿神秘主義者也可能在他們的思考中使用邏輯;只是他們的假設很奇怪。

大多數人不會有意識地思考他們在爭論時什麼是公理,什麼是蘊涵。此外,大多數人寧願死也不願改變他們的任何生活公理。人們有最奇怪的公理,比如“恆星的不同排列對人類有不同的容易檢測到的影響”。也許他們有充分的理由擁有這些公理。然而,擁有這些公理,他們認為自己正在理性思考,而且他們確實在理性思考!只要蘊涵從他們的公理中邏輯地推匯出來,他們就在理性思考!至少,根據“理性”的一個定義。另一個定義可能是“一個理論是理性的,如果它與物理現實有很好的相關性”。但隨後,許多數學理論就不是理性的;例如,大多數非歐幾里得幾何(以及根據閔可夫斯基-愛因斯坦理論,歐幾里得幾何也是!)。而我們希望數學理論是“理性的”,所以後者不是一個好的定義。

一個智慧的生物應該意識到,不同的人和不同的文化有不同的公理。練習相信奇怪的事情可能是一個好主意。注意你的公理!不要相信它們,只是把它們當作公理看待!每次你換內衣時就換公理,如果你經常換內衣的話。

如果你從未聽說過奧卡姆剃刀,現在正是學習它的最佳時機。這是一個原則,它大致說:如果你必須在兩個同樣好的解釋現象的理論之間做出選擇,請選擇公理數量最少的那個。

簡短的重複

  1. 儘量不要相信你日常生活中使用的公理,只是把它們當作公理看待,它們很可能被改變。這將幫助你理解其他人。
  2. 迷信的人很可能很理性,而且他們經常很理性。他們只是有一些奇怪的公理。
  3. 儘量少做假設(也就是說,使用奧卡姆剃刀)。小心不要得出過於大膽的結論。如果你祈禱上帝,你的祈禱立刻得到了回應,這是否意味著《古蘭經》或《聖經》是真實的?這是否意味著你當地教堂所傳講的東西是真實的?還是這是否意味著印度教徒是對的?

*在數學理論中,引入了稱為形式系統的東西,它更加嚴格(例如,邏輯規則不是被認為是理所當然的)。然而,在日常生活中,公理方法已經足夠好了。

歸納推理

[edit | edit source]

歸納歸納推理,有時被稱為歸納邏輯,是一個推理過程,在這個過程中,給定前提,一個論點的結論很可能為真,但並非確定。它是根據對特定標記的有限觀察,將屬性或關係歸因於型別;或者根據對反覆出現的現象模式的有限觀察,制定規律。例如,歸納用於使用以下特定的命題

  • 冰是冷的。
  • 當用球杆擊打時,檯球會移動。

推斷出以下一般的命題

  • 所有的冰都是冷的。
  • 對於每一個作用,都有一個大小相等、方向相反的反作用。

有效性

[edit | edit source]

大多數人學習的形式邏輯是演繹的,而不是歸納的。一些哲學家聲稱他們創造了歸納邏輯體系,但歸納邏輯是否存在仍存在爭議。與演繹推理不同,歸納推理得出的結論並不一定與最初的假設具有相同程度的確定性。例如,所有天鵝都是白色的結論顯然是錯誤的,但在歐洲人定居澳大利亞之前,人們可能認為它是正確的。歸納論證從不具有約束力,但它們可能是有力的。歸納推理在演繹上是無效的。(在形式邏輯中,一個論證是有效的,當且僅當論證的前提不可能為真而結論為假。)

歸納問題(即尋找對歸納推理的理由)的經典哲學處理是由蘇格蘭人大衛·休謨提出的。休謨強調,我們日常的推理依賴於重複經驗的模式,而不是演繹有效的論證。例如,我們相信麵包會滋養我們,因為它在過去是如此,但至少可以想象麵包將來會毒害我們。

休謨說,一個堅持對所有事物進行合理的演繹證明的人會餓死。他主張一種基於常識的實用懷疑主義,而不是對一切事物的徹底懷疑主義,在這種懷疑主義中,人們接受了歸納的必然性。

20 世紀的發展以截然不同的方式構建了歸納問題。它可以被看作是對要將哪些概念擬合到觀察(參見綠藍的條目)或將哪些圖形擬合到一組觀察到的資料點的選擇,而不是對要對未來做出什麼預測的選擇。

歸納有時被描述為從過去推斷未來的推理,但在其最廣義的意義上,它涉及根據觀察到的東西對未觀察到的東西得出結論。從當前證據中推斷過去(例如考古學)被認為是歸納。歸納也可以是跨越空間而不是時間,例如,根據我們在銀河系中觀察到的東西對整個宇宙的結論,或者根據過去的經濟表現得出國家經濟政策。

華夏公益教科書