動物行為/操作性條件反射

操作性條件反射，有時被稱為工具性條件反射或工具性學習，最初由愛德華·L·桑代克（1874-1949）廣泛研究。桑代克最著名的作品研究了貓從各種自制的謎題箱中逃脫的行為。當貓第一次被限制在箱子裡時，它們需要很長時間才能逃脫。然而，隨著經驗的積累，無效的行為發生得越來越少，而成功行為發生得越來越快，使貓能夠在連續的試驗中以越來越短的時間逃脫（維基百科）。

B.F. 斯金納（1904-1990）在桑代克發表他的著作約 40 年後擴充套件了桑代克提出的理論。斯金納關於動物對環境進行操作的觀點使他分析了行為如何受到其後果的影響。被稱為斯金納箱的裝置測量任務是否完成以及完成任務需要多長時間。斯金納箱包含一個杆，按下該杆會觸發食物顆粒的釋放。斯金納認為，當動物執行適當的動作時對其進行獎勵會增加重複該行為的可能性。當一隻老鼠偶然撞到杆子上時，會釋放出一個食物顆粒，斯金納觀察了老鼠找到食物顆粒所需的時間。當老鼠學會每次它碰巧踩到杆子上就會釋放出一個顆粒時，老鼠學會了按下杆子並立即找到食物。這種訓練被稱為操作性條件反射（Alcock）。

如今，斯金納的操作性條件反射仍然被用來訓練動物。所有參與海洋世界專案的動物都是使用正強化操作性條件反射訓練的。當動物表現出期望的行為時，訓練員會獎勵動物，以鼓勵該行為在以後被示意時執行。正強化是如果在反應之後出現就會增強反應的刺激（動物如何學習）。負強化也可以用來鼓勵某種行為。區分負強化和懲罰理論之間的差異很重要。負強化僅僅是去除不愉快的刺激或疼痛（伯恩斯坦）。例如：一個使用播放悅耳歌曲的鬧鐘的人可能會經常按掉鬧鐘或在床上賴著。為了讓他自己起床後立即關掉鬧鐘，這個人可能會將鬧鐘的聲音改為令人討厭的噪音。為了去除令人討厭的刺激，這個人會立即起床關掉鬧鐘。知道如何去除令人討厭的聲音會增加這個人起床後立即關掉鬧鐘的可能性。另一方面，懲罰理論引入了厭惡刺激來降低某種行為的可能性。

操作性條件反射在包括人類在內的許多動物的學習行為中都有體現。它通常完全沒有被注意到，但也可以作為訓練中的一種故意工具使用。當幼兒探索他們的世界並學會透過適當的行為消除不愉快的刺激並滿足願望時，他們正在透過操作性條件反射學習。

另見桑代克的效果律

參考文獻

Bernstein, D. A., Penner, L. A. 等。心理學。第 6 版。霍頓·米夫林公司：波士頓，2003 年。

Alcock, John。動物行為。第 7 版 Sinauer Associates, Inc.：桑德蘭，2001 年。

“動物如何學習”。海洋世界/布希花園動物資訊資料庫，2002 年。檢索自全球資訊網 2004 年 12 月 5 日。 http://www.seaworld.org/animal-info/info-books/training/how-animals-learn.htm。 yo0 yo ihdouifhjsijfd owifuh woihn