조작적 조건화(操作的條件化, Operant Conditioning)는
행동주의 심리학의 이론으로,
어떤 반응에 대해 선택적으로 보상함으로써
그 반응이 일어날 확률을 증가시키거나 감소시키는 방법을 말한다.
여기서 선택적 보상이란 강화와 벌을 의미한다.
조작적 조건화는 작동적 조건화(作動的條件化),
도구적 조건화(道具的 條件化, Instrumental conditioning)라고도 한다.
< 반응행동과 조작행동 >
반응행동은 고전적 조건화에서 사용된
반응과 같이 자극에 의해 직접적으로
유발된 반응으로 침을 흘리는 행동이나
동공의 수축, 무릎 반사 등이 이에 속한다.
반면에 조작행동은 어떤 자극에 의해 일어나는 것이 아니라
스스로 일어나는 행동, 혹은 어떤 자극이 있었다고
하더라도 그것이 무엇인지 알 수 없었던 경우의 행동을 말한다.
스키너는 외부적 자극에 초점을 맞춘 고전적 조건화를
S(Stimulus)형 조건화라고 칭하면서 조작에 관심을 가진
조작적 조건화를 R(Response)형 조건화라고 구분하기도 했다.
즉, 조작행동은 어떤 유기체가 능동적으로 환경에
작용을 가하는 행동을 말한다.
조작행동으로 형성되는 조건을 조작적 조건화라고 하는데,
유기체가 행하는 조작행동은 결과에 따라
증가하기도 하고 감소하기도 한다.
이를 통해 어떤 반응을 증가시키거나
감소시키는 것이 조작적 조건화인 것이다.
< 스키너 상자 >
조작적 조건형성은 스키너 상자를 통해 실험되고 증명되었다.
스키너 상자는 빈 상자 안에 지렛대가 하나 들어 있으며,
이 지렛대는 먹이통과 연결되어 있어 지렛대를
누르면 먹이가 나오도록 되어 있다.
이 상자를 가지고 조작적 조건형성을
실험했는데, 그 과정은 다음과 같다.
배고픈 상태의 흰 쥐를 스키너 상자에 넣는다.
이렇게 배고픈 상태로 만드는
것을 박탈이라고 한다.
흰 쥐는 스키너 상자 안에서 돌아다니다가
우연히 지렛대를 누르게 된다.
지렛대를 누르자 먹이가 나온다.
지렛대와 먹이 간의 상관관계를 알지
못하는 쥐는 다시 상자 안을 돌아다닌다.
다시 우연히 지렛대를 누른 흰 쥐는
또 먹이가 나오는 것을 보고 지렛대를
누르는 행동을 자주 하게 된다.
이러한 과정이 반복되면서 흰 쥐는
지렛대를 누르면 먹이가 나온다는
사실을 학습하게 된다.
위의 실험에서 흰 쥐가 지렛대를 누르는 행동은
먹이에 의해 강화된 것이다.
만약 지렛대를 눌렀을 때 먹이가 나오지 않았다면
지렛대를 누르는 행동을 학습하지 못했을 것이다.
이렇게 어떤 행동을 한 뒤에 유기체가 원하는 것을
제공하는 것을 강화(Reinforcement)라고 한다.
고전적 조건화에서는 강화를 조건화의 과정에서
무조건자극(UnConditioned Stimulus)을 부여하는 것으로
명명했지만 조작적 조건화에서는 조건화의 과정에서 부여하는
보상을 의미하는 것으로 쓰는 것이다.
조작적 조건화가 이루어지기 위해서는 강화가 중요한 역할을 한다.
< 강화이론 >
스키너는 유기체가 어떤 행동을 한 결과가
스스로에게 유리하면 그 행동을
더 자주 하게 된다고 보았다(1953)
이때 그 행동의 결과로 주어진 것으로
행동의 빈도를 높이는 자극을 강화인(Reinforcer)이라고
하는데(Chance,1999), 이런 강화인은 일차적
강화인과 이차적 강화인으로 나누어 볼 수 있다.
먼저 일차적 강화인(Primary Reinforcer)은
유기체의 행동을 직접적으로 증가시킬 수 있는 강화인이다.
예를 들면 음식이나 물과 같은 것이 되겠는데,
당장 배고픈 유기체에게 음식으로 만족을 주는 것으로써
바로 다음 행동을 증가시킬 수 있다.
면에 이차적 강화인(Secondary Reinforcer)은
유기체의 행동을 바로 증가시키지 못한다.
하지만 일차적 강화인과 연합하여 행동
을 증가시킬 수 있는데, 쿠폰이나 토큰 등이 이에 해당한다.
즉, 쿠폰이나 토큰으로도 유기체를 강화할 수 있지만
그것은 유기체를 직접 강화하는 것이 아니라
일차적 강화인과 교환할 수 있기 때문에 강화가 가능하다는 것이다.
이차적 강화인으로써 가장 대표적인 것이 돈이다.
돈은 여러 종류의 일차적 강화인과 교환할 수 있기
때문에 일반화 된 강화인이라고 부르기도 한다.
< 정적강화와 부적강화 >
강화는 어떤 행동을 한 뒤에 유기체가 원하는
자극을 제공하여 행동의 빈도수를 높이는 것을 말한다.
하지만 선호자극의 제공 뿐 아니라 혐오자극의
제거로도 유기체를 강화시킬 수 있는데,
선호자극의 제공으로 행동의 빈도수를 높이는
강화를 정적강화라고 하고 혐오자극의 제거로
행동의 빈도수를 높이는 강화를 부적강화라고 한다.
정적강화(Positive Reinforcement)는 선호자극의
제공으로 유기체를 강화시킨다.
교사가 학생들의 발표를 유도하기 위해 발표를
할 때마다 추가점수를 제공하거나 사탕을 하나씩
주는 것은 정적강화의 예가 되는데, 여기서는
발표라는 행동의 빈도수를 높이기 위해 추가점수나
사탕이라는 선호자극을 제공함으로써 학생을 강화시킨 것이 된다.
반면에 부적강화(Negative Reinforcement)는
혐오자극의 제거로 유기체를 강화시키는 것을 말한다.
부적강화도 정적강화처럼 결과적으로 유기체가
유리하다고 느끼게끔 하는 것이지만 선호자극을 제공하지 않고
혐오자극을 제거하는 것으로 강화한다는 점에서 차이가 있다.
화장실 청소를 하도록 되어 있는 아이에게
'오늘 수업에 열심히 참여하면 화장실 청소를 하지 않아도 좋다'라고
이야기하여 아이가 수업에 열심히 참여하였다면,
화장실 청소라는 혐오자극을 제거함으로써
수업에 열심히 참여하는 행동을 증가시킨 것이 된다.
< 정적 처벌과 부적 처벌 >
조작적 조건화에서는 단지 유기체가 하는
행동의 빈도를 증가시키는 것만을 이야기하지는 않는다.
어떤 행동을 수정하기 위해서는 특정 행동의 빈도를
감소시킬 필요가 있는데, 이때 혐오자극을 제공하거나
선호자극을 제거함으로써 행동의 빈도수를 감소시킨다(Chance, 1999).
이렇게 행동의 빈도를 증가시키는 강화와 대별되는 것이 약화(벌)이다.
벌은 유기체의 행동의 결과로 어떤 선호자극을
제거하거나 혐오자극을 제공하는 것을 의미한다.
특히 혐오자극을 제공하는 것을 수여성 벌이라고 하는데,
수여성 벌의 대표적인 예로 체벌을 들 수 있다.
학생이 바람직하지 못한 행동을 했을 때 교사가
체벌을 가함으로써 그 행동을 더 이상 하지 않게 만드는 것이다.
반면에 선호자극을 제거하는 벌은 박탈성 벌이라고 한다.
박탈성 벌은 그동안 받아오던 강화인을 제거한다는 말과 같다.
박탈성 벌의 대표적인 예로 '타임아웃'(Time out)이 있다.
타임아웃은 어떤 학생이 교실을 시끄럽게 하는 경우,
그 학생을 일시적으로 교실 밖으로 추방하는 것이다.
편하게 교실에서 앉아 공부할 기회와 친구들과 함께 있을
기회를 박탈당하는 것은 직접적인 혐오자극을 부여하는 것이 아니라
선호자극을 제거하는 박탈성 벌에 해당한다.
< 처벌을 적용할 때 주의해야 하는 점 >
처벌을 적용할 때 주의해야 하는 점은,
유기체가 스스로 바람직하지 않다고 여기는
행동을 했는데에도 불구하고 처벌을 제공하지 않는다면
유기체는 그 행동이 틀린 행동이 아닐 수 있다고 믿는다는 것이다.
처벌에는 이와 같은 부작용이 가능한데,
가장 대표적인 부작용은 처벌을 받은 유기체는
다른 유기체에게 공격적인 행동을 자주 보인다는 것이다.
혹은 부정적인 정서반응과 거짓말, 변명 등의
회피반응을 보이기도 한다.
이러한 처벌의 부작용의 다양한
측면으로부터 처벌의 문제점이 지적된다.
하지만 불가피한 상황이라면 다음을 고려해야 한다.
처벌의 강도는 강할수록 그리고 즉각적으로 제공할수록
바람직하지 못한 행동의 인식이 보다
분명하다는 점에서 그 필요성이 제기된다.
그러나 주어지던 벌이 없으면 부적강화로 여길 가능성이
있다는 점에서 문제 행동이 일어날 때마다 처벌을 제공해야
한다는 부수적인 문제점을 발생시키며 또한 행위와
처벌간에 객관적이고 합리적인 타당성이 강해야한다는 점은
처벌이 목적하는 행동의 감소를 위한 필요충분조건이 아니다는
것이 대부분 심리학자들의 관점이다.
따라서 바람직하지 못한 행동은 벌을 제공하기보다는
또는 제공하더라도 대안적 행동을 확실히 제시하고
선택의 필요성을 중립적으로 제안해야 한다.
또한 처벌은 '문제 행동이 일어날 때마다 처벌을 제공해야 한다.
주어지던 벌이 없으면 부적강화로 여길 가능성이 있다.'
라는 처벌계획에서처럼 문제행동과 그에대한 처벌은 제공자(처벌자)와
처벌받는 이와의 관계에서 관심이라는 자극과 반응이
강화되고있을수있다는 또다른 측면에서처럼 처벌계획이
왜곡될경우 부정적으로 노출될수있다는점에서 안정적이지않다는 견해가 있다.
따라서 처벌과 보상을 동시에 사용하는것이
처벌만을 사용하는것보다는 유의미할 수 있다.
< 프리맥 원리 >
프리맥(Premack,1962)은 물질적 자극이 아닌
스스로의 행동도 강화인 역할을 할 수 있음을 알게 되었다.
프리맥에 의하면 유기체가 자주 하는 행동은
잘 하지 않는 행동을 증가시키기 위한 강화인으로 사용될 수 있다.
쉽게 예를 들자면 컴퓨터게임을 좋아하는 아이에게
일정한 양의 수학문제를 풀게 한 뒤에
컴퓨터게임을 하도록 허락하는 것이다.
이렇게 되면 컴퓨터게임은 수학문제를 풀게
하기 위한 강화인으로써 작용하게 되는 것이다.
그러나 컴퓨터게임을 먼저 한 뒤 수학공부를 시키면 효과가 없다.
프리맥 원리의 강화인은 어떤 긍정적 행동을
한 뒤에 제공해야 바른 효과를 얻을 수 있다.
조작적 조건형성
[ operant conditioning, 操作的條件形成 ]
요약 행동수정의 원리 중 하나로,
행동을 이끌어 내기 위해 행동 후의 자극을 조정하여
바람직한 행동을 통해 바라는 후속자극을 얻음으로써 반응을 강화하는 것
분야
행동치료
도구적 조건형성(instrumental conditioning), 작동적 조건형성이라고도
부르는 조작적 조건형성은 행동을 반응행동과
조작행동의 두 가지 유형으로 구분한다.
반응행동은 자극에 의해 야기되는 반사 혹은 자동적 반응을 의미한다.
예를 들어, 밝은 불빛을 받으면 동공이 수축되는 반응이다.
조작행동은 제시되는 자극 없이 자발적으로 방출되는
행동으로 반응에 따르는 사건에 따라 강해지거나 약해진다.
반응행동은 선행사건이 통제하는
반면 조작행동은 그것의 결과가 통제한다.
스키너(Skinner)는 스키너 상자를
통해 조작적 조건형성을 연구하였다.
스키너 상자는 동물행동에 각기 다른 강화가 주는
효과를 연구하기 위해 고안한 기구인데,
여기서 비둘기는 레버를 조작하는 행동으로 먹이를
제공받고 이러한 행동을 바로 조작행동이라 한다.
조작적 조건형성에서는 결과를 산출하기 위해
환경을 조작하는 행위를 강조한다.
조작 행동의 예로는 읽기, 쓰기, 운전하기,
포크 사용하기 등이 있다.
이러한 행동들은 대부분 우리가 일상생활에서
하는 중요한 반응에 해당된다.
행동이 이끌어 낸 환경변화가 강화적일 경우,
즉 유기체에게 어떤 보상을 제공하거나 혐오자극을 제거하면
그 행동이 다시 일어날 가능성이 커지고, 환경변화가 강화를
낳지 못하면 그 행동이 다시 일어날 가능성은 작아진다.
조작적 조건 형성
[ operant conditioning , 操作的 條件 形成 ]
1. 요약
특정 행동이 그 행동의 결과들과 연합되어
이루어지는 학습을 의미한다.
1930년대의 행동심리학자인
스키너는 조작적 조건 형성이
①특정 행동, ②행동의 결과,
③해당 특정 행동의 재발 가능성의
세 요소를 가지고 있다고 정의했다.
2. 강화물과 처벌제
여기서 특정 행동의 결과는
만족스럽거나 또는 불만족스러울 수 있다.
만족스러운 결과는 '강화물'이라 불리며,
특정 행동이 재발할 가능성을 증가시킨다.
반대로 불만족스러운 결과는 '처벌제'라 불리며,
특정 행동이 재발할 가능성을 감소시킨다.
즉 '강화물'은 특정 행동을 강화시키고
'처벌제'는 특정 행동을 처벌한다.
3. 정적과 부적
강화와 처벌은 특정 행동이 재발할 지,
그렇지 않을 지에 대한 것으로 각각은 모두
긍정적이거나 부정적일 수 있다.
이는 가치판단의 문제가 아닌,
자극의 유무에 달려 있어,
정적은 자극 제시를 의미하고 부적은 자극 제거를 뜻한다.
즉 정적 강화와 정적 처벌에서는 자극이 제시되고,
부적 강화와 부적 처벌에서는 자극이 제거된다.
이때 제시되거나 제거될 수 있는 자극에는
매력적 자극과 혐오 자극이 있다.
정적 강화에서는 매력적 자극이 제시되며 즐거운
결과에 따라 특정 행동을 더 하도록 강화시킬 것이며,
정적 처벌에서는 혐오 자극이 제시되어 불쾌한 결과에
따라 특정 행동을 덜 하게 할 것이다.
부적 강화에서는 혐오 자극이 제거되며 이는
곧 불쾌한 결과가 없어지는 특정 행동을
더하도록 강화받을 것이며, 부적 처벌은 매력적 자극을
제거하여 즐거운 결과를 없애는 특정 행동을 덜 하는 것으로 처벌받을 것이다.
4. 강화물의 종류
'강화물'은 학습 필요 여부에 따라
일차적 강화물과 이차적 강화물로 나뉘는데,
일차적 강화물은 본래부터 강화물로서의 특성을
지녀 강화적 특성이 학습될 필요가 없고,
이차적 강화물은 학습을 요하는 것으로
대부분의 강화물들이 이 범주에 해당한다.
특정 행동을 매번 강화하는 것을
'계속적 강화계획'이라 하고, 매번 강화하지 않는 것은
'부분적 강화계획'이라 한다.
'부분적 강화계획'은 총 4가지로 비율을
달리하거나 시간 간격을 달리할 수 있다.
고정비율 계획에서는 고정된 횟수만큼
특정 행동을 하면 강화물이 제공되지만,
변동비율 계획에서는 강화물을 얻기 위한 특정
행동의 횟수는 정해져 있지 않다.
또한 고정간격 계획에서 강화물은 일정시간
경과 후 제공되지만 변동간격 계획에서
강화물은 언제 제공될 지 모른다.
조작적 조건 형성
[ operant conditioning ]
개체의 반응이 그 결과에 따라 앞으로
계속 그런 반응이 일어날지, 더 이상 그런 반응이
나타나지 않을지가 결정된다.
만일 어떤 반응의 결과로 행위자에게 보상이
주어지면 다음에 그런 반응이 일어날 가능성이 증가하고,
반대로 특정 반응 이후에 보상이 없든지
처벌이 가해지면 다음에 그 반응을 할 가능성이 줄어든다는 것이다.
이때 ‘조작적’ 이라는 말은 학습자가 목적을 가지고
환경을 조작한다는 뜻이다.
다른 면에서 보면 원하는 사건의 발생(보상)을 위한
도구로 자신의 행동 반응을 사용한다는 의미에서
‘도구적 조건 형성’ 이라 고도 한다.
[네이버 지식백과] 조작적 조건 형성 [operant conditioning] (실험심리학용어사전, 2008., 곽호완, 박창호, 이태연, 김문수, 진영선)
[네이버 지식백과] 조작적 조건 형성 [operant conditioning, 操作的 條件 形成] (두산백과 두피디아, 두산백과)
[네이버 지식백과] 조작적 조건형성 [operant conditioning, 操作的條件形成] (상담학 사전, 2016. 01. 15., 김춘경, 이수연, 이윤주, 정종진, 최웅용)
위키백과
댓글