본문 바로가기
죽을때까지 공부

어떻게 학습을 하는가?

by 아둘람 2022. 8. 23.

1. 고전적 조건형성

 고전적 조건형성은 '파블로프식 조건형성'이라고도 불린다. 파블로프는 개의 침 흘리는 반사행동을 연구하였다. 음식을 보고 침을 흘리는 것은 생물학적인 반사행동으로, 파블로프의 기본 실험 세팅은 개에게 여러 가지 음식을 주고 침 반응을 측정하는 것이었다. 그런데 파블로프는 개들이 음식을 주기도 전에 침을 흘리는 예비적 침 반응을 보이는 것을 발견하였다. 개는 음식이 담긴 그릇을 보고도 침을 흘렸고, 개에게 먹이는 주는 실험실 스텝을 보고도 침을 흘렸다. 음식이 나올 것을 예측하는 다른 자극이나 사건이 일어날 때 침을 흘리는 것은 자동적인 반사행동은 아니다. 즉 이런 반응은 학습된 것이었다. 

 고전적 조건형성에서 생리적인 반응을 만들어 내는 자극과 연합되어 반응을 일으키는 자극을 중성 자극이라고 한다. 중성 자극은 다른 자극을 예측하게 하고 그 예측된 연합이 조건형성이 되는 것이다. 예를 들어 공포영화를 볼 때 무서운 장면이 나오기전에 먼저 어떤 음악이 나오게 되는데, 영화를 보다가 그 음악이 나오면 우리는 벌써 긴장이 되고 공포감을 느낀다. 그 특정 음악은 무서운 장면이 나올 것을 예측하게 하고, 그 음악만으로도 무서운 장면이라는 공포감을 일으키는 자극과 연합되어 공포 반응을 일으키는 것이다.

 

파블로프의개
파블로프의 개

 

 파블로프는 개에게 먹이를 주기 바로 전에 소리 자극이 제시되면 개는 소리만 듣고도 침을 흘리는 것을 발견했다. 즉 소리자극이 먹이와 함께 제시되는 과정이 조건형성이 된 것이다. 이 실험은 음식이 주어지지 않고 중성 자극인 소리가 먹이와 연합되어 침 분비 반응을 일으키는 학습을 만든 것이다.

 이 실험에서 음식을 무조건 자극이라고 불렀는데, 이는 동물이 생물학적으로 자연스러운 반응을 만들어 내는 자극이기 때문이다. 이 자극에 대한 반응 , 즉 음식을 보면 침을 분비하는 반응을 무조건 반응이라고 불렀는데, 이 반응은 학습된 것이 아니기 때문에 조건형성이 된 행동은 아니다. 무조건 반응은 무조건 자극에 대한 반사적인 행동이다. 동물에게 특별한 반응을 일으키지 않는 중성적인 자극이 개가 침을 흘리도록 연합될 때 이를 조건 자극이라고 한다. 

  중성적인 자극이 무조건 자극과 반복적으로 함께 제시되면 동물은 중성적인 자극에도 무조건 반응과 동일한 반응을 보이게 되는데, 이러한 반응을 조건 반응이라고 한다. 파블로프의 개는 음식의 출연과 소리 자극의 연합을 획득하게 되어 학습이 확립된 후에는 소리 자극만으로도 침을 분비하는 조건 반응을 일으키게 된 것이다. 이런 과정을 고전적 조건형성이라고 한다.

 

2. 고전적 조건형성의 원리

 고전적 조건형성이 진행되는 과정에는 몇 가지 원리가 있는데, 첫 번째는 무조건 자극과 조건 자극의 연합을 획득하는 것이다. 무조건 자극과 조건 자극이 함께 제시되는 시기가 고전적 조건형성이 이루어지는 기간이다. 많은 연구에서 고전적 조건형성의 획득에서 무조건 자극과 조건 자극이 제시되는 시간적 근접성이 중요하다는 것을 알아냈다. 

 무조건 자극과 일관되게 연합된 조건 자극은 그 자체로서 가치를 가지게 된다. 돈이 그런 경우이다. 돈 자체는 물리적 특성으로서의 가치가 없지만, 돈이 연합된 자극이나 사건들의 가치로 인해 돈에 가치가 부여된다. 돈 자체는 우리를 편하거나 배부르게 하지 않지만, 돈에 부여된 가치는 편안함이나 배부름과 연합되어 있으며, 이러한 조건형성을 이차 조건형성이라고 부른다.

 예를 들어 파블로프의 개가 소리 자극은 계속 듣지만 음식물이 제공되지 않는다면 어떤 반응이 나타날까? 처음에는 소리만 듣고도 침을 흘리지만, 이런 행동은 점점 줄어들어 마침내는 소리 자극이 들려도 더이상 침을 흘리지 않게 된다. 이 과정을 소멸이라고 한다. 

 그러나 조건형성된 연합학습이 소멸된 후에 휴지 기간을 갖고 나서 또다시 조건 자극을 제공하면 학습된 반응이 다시 나타난다. 이를 조건 반응의 자발적 회복이라고 한다. 이 현상은 일단 소멸된 학습도 완벽하게 지워지지 않는다는 것을 보여준다. 

 

3.  레스콜라-바그너 모형

  레스콜라와 바그너는 동물이 기대를 설정할 수 있어야만 고전적 조건형성이 일어난다는 것을 이론화하였다. 파블로프의 개는 먹이를 주는 실험실 스텝이 가까이 다가올 때는 침을 흘렸지만, 다른 사람이 개에게 다가갈 때는 침을 흘리지 않았다. 실험실 스텝은 음식과 연합하여 조건 자극이 되었지만, 다른 사람은 조건이 자극이 되지 않은 것이다. 

 레스콜라-바그너 모형에 따르면 조건 자극-무조건 자극 연합은 기대하지 않았거나 놀랄 만한 사건이 있을 때 더 잘 일어난다. 학습이론가들은 예상하던 사건과 실제로 일어난 사건에 대한 차이를 예측 오차라고 하며, 예상하지 않았던 자극이 주어질 때 이를 양의 예측 오차, 예상하던 자극이 주어지지 않을 때 이를 부정 예측 오차라고 한다.

 예를 들면 집에서 키우는 개는 주인이 자신의 음식을 준비하는 소리를 알아차리고 음식을 기대하게 된다. 그런데 그런 준비하는 소리 없이 음식을 받게 되면 이는 양의 예측 오차가 된다. 반면 준비하는 소리가 들렸는데도 음식을 받지 못하면 이는 부정 예측 오차가 되는 것이다. 개가 음식과 연합하고 있던 소리가 들리지 않고 음식을 받는 일이 반복되면 개는 그 준비하는 소리 말고도 다른 환경의 조건이 음식을 예측할 수 있는지 찾게 되고 나중에는 새로운 조건 자극-무조건 자극 연합을 학습하게 된다.

 

4. 공포증과 중독

 공포증은 실제로 위협이 되지 않는 환경이나 사건에 대해 필요 이상의 큰 공포심을 갖는 것을 말하는데, 고전적 조건형성 이론에 따르면 이는 어떤 두려웠던 경험이 일반화된 것이라고 한다.

 

 동물은 고전적 조건형성에 의해서 공포에 중립적인 대상에 대해 공포심을 갖게 될 수 있는데, 이러한 과정을 공포 조건형성이라고 한다. 예를 들어 특정한 소리 자극이 나타난 후 동물에게 전기 충격을 몇 번 주고 나면 동물들은 소리 자극에 공포 반응을 보인다. 공포 반응에는 여러 가지 행동이 있는데, 순간 얼어붙은 것처럼 움직이지 못하는 것도 공포 반응의 하나이다.

 고전적 조건형성은 중독에도 관련이 있다. 커피를 늘 마시는 사람의 경우 커피의 향이 조건 자극이 될 수 있어 커피 향을 맡는 것만으로도 커피의 각성 효과를 얻을 수 있다. 마찬가지로 약물중독 환자에게는 약물 투입과 관련된 환경이 조건 자극이 될 수 있다. 따라서 치료가 되어 더 이상 약물중독자가 아닌 경우에도 약물 투입과 관련된 환경이나 친구들을 만나면 다시 금단 현상이 나타나 약물에 손을 대는 경우가 있다.

 

5. 조작적 조건형성

 자발적인 행동을 학습의 유형으로 만드는 과정으로 조작적 조건형성이 있다. 이는 동물의 행동의 결과가 미래의 환경을 결정하는 학습의 유형이다. 돌고래가 점프를 하면 먹이를 받게 될 때, 점프를 하는 행동이 먹이라는 미래의 환경을 결정한다는 것을 학습한 것이다. 즉 조작적 조건형성은 능동적인 행동에 대한 연구이다.

 

 효과의 법칙은 만족스러운 상태가 되는 행동을 더 많이 하고 불만족스러운 상태가 되는 행동을 적게 하게 된다는 것이다.

 

 조작행동이란 환경에 어떤 영향을 주는 동물의 행동을 가리키는 용어이다. 이는 어떤 행동은 그 결과 환경을 바꾸고, 이 바뀐 환경이 동물의 행동을 더 많이 일어나게 할 수도 더 적게 일어나게 할 수도 있다는 것이다. 이러한 학습은 고전적 조건형성과는 다른데, 고전적 조건형성에서는 동물의 행동과 관계없이 무조건 자극이 주어진다. 파블로프의 개의 경우 개가 침을 흘리든 말든 간에 음식은 항상 주어지고, 그러한 과정을 통해 '무조건 자극-무조건 반응'의 연합이 학습된 것이다.

 수족관에서 돌고래가 공중으로 점프하고, 재주를 넘는 것과 같은 행동들은 단순한 자극-반응으로의 행동의 관계로는 설명할 수 없다. 이러한 행동들은 조성의 결과이며, 이것은 최종 희망하는 행동으로 이르는 연속 단계에 대한 강화로부터 생기는 학습이다. 한 세트의 행동의 결과가 다음 행동을 조성하고, 그 세트의 결과가 다음 행동을 조성하는 식으로 진행된다. 즉 최종적으로 원하는 행동에 가까운 행동을 동물이 행했을때 보상을 주어 원하는 행동을 강화시키는 것이다.

 강화는 그로 인해 행동이 더 많이 발생하게 되는 자극이나 사건을 말하며, 처벌은 어떤 행동을 감소시킬 수 있는 자극이나 사건을 말한다.

 스키너는 강화를 정적 강화와 부적 강화로 구분하였다. 자극이 제시되는 것이 행동을 증가시키면 정적 강화가 되고, 자극을 제거하는 것이 행동을 증가시키면 부적 강화가 된다. 여기서 부적 강화는 처벌이 아니다. 부적 강화는 없어졌을 때 그로 인해 안도감을 줄 수 있는 경우로 생각할 수 있다. 예를 들어 통증을 가라앉히기 위해 진통제를 복용하는 것, 안전벨트를 착용하여 자동차  경고음을 제거하는 것 드이 부적 강화의 사례이다. 

 강화는 행동을 증가시키는 반면, 처벌은 행동을 감소시킨다. 처벌 자극은 어떤 것이든 행동의 빈도를 감소시킨다. 신속하고 확실한 처벌 자극은 원하지 않는 행동을 강력하게 감소시킬 수 있다. 금지된 사물을 건드린 쥐가 전기 자극을 받으면 그 행동을 멈추고, 어린아이가 뜨거운 난로를 만져서 손을 데면 아이는 더 이상 난로를 만지는 행동을 하지 않는다. 충동적으로 저지르는 범죄 행동의 경우 중형의 위협보다는 신속하고 확실한 처벌 자극이 더 효과적으로 그 행동을 줄인다는 연구도 있다.

 강화와 처벌의 형태는 부모가 자녀를 교육할 때 나타난다. 그러나 많은 심리학자들이 양육과 관련한 처벌에 큰 문제점이 있음을 지적한다. 처벌은 학습에 일반적으로 강화보다 덜 효과적이라고 하는데, 그 이유는 여러 가지가 있으나 처벌은 대체행동을 제시하지 않기 때문에 학습에 효과적이지 않다고 알려져 있다. 한편 처벌은 공포를 가르칠 수도 있다. 연구결과 처벌 받은 아동이 공격성이 높아지고 저하된 자존감을 보일 가능성이 많음을 보여준다. 공격적이며 하대하는 부모들이 학대하는 가정 출신인 경우가 많다. 따라서 오늘날 대부분의 심리학자들은 강화를 선호한다. 올바르게 행동하는 것에 주목하고 그것을 칭찬하는 것이 중요하다.

 

 

6. 조작적 조건형성에 영향을 미치는 요인

 조건형성은 행동과 강화의 연합이 타고난 본성적 행동과 비슷할 때 가장 효과적이다.

 톨먼은 연구를 통해 강화 없이도 학습이 일어나는 잠재학습을 보여주었다. 잠재학습은 그저 관찰하는 것만으로도 배우는 경우에 발생하는데, 이는 모든 학습은 어떤 형태로든 강화가 필요하다는 행동주의적 입장에 반기를 드는 것이었다.

 톨먼의 연구에서 세 집단의 쥐들은 매일 복잡한 미로에 놓여졌다. 첫 번째 집단은 미로를 탐색하는 것에 대해 어떠한 강화도 받지 않았다. 쥐들이 미로 끝에 있는 목표 상자에 도달할 때까지 그냥 놓아두었을 뿐이다. 두 번째 집단은 목표 상자에 도달했을 때 음식이 주어지는 강화를 받았다. 세 번째 집단은 처음 10일 동안은 첫 번째 집단과 똑같이 아무런 보상 없이 미로를 돌아다녔으나, 그다음 7일 동안은 음식 보상을 받았다. 연구 결과 이 세 번째 집단의 행동은 첫 10일 동안 첫 번째 통제 집단의 쥐들처럼 행동했으나, 마지막 7일 동안 매일 강화받아 온 두 번째 집단의 쥐들과 매우 비슷하게 행동했다.

 톨먼의 연구 결과는 보상 없이 미로를 탐색하던 쥐들이 미로의 구조에 대해 많은 것을 이미 학습했다는 것을 보여준다. 톨먼은 미로를 보상 없이 탐색하던 쥐들이 미로에 대한 정신적 그림이라고 할 수 있는 인지도를 만들었다고 주장했다. 

 

 일상생활에서 그 자체로 가치가 있는 활동에 보상을 주면 사람들은 그 활동을 덜 즐거워한다. 즉 지나친 보상은 스스로 행동하려는 내재적 동기를 망가뜨릴 수 있다. 반면 스스로 그 자체에서 보상을 받는 것이 아니라 외적 보상을 받거나 처벌을 피하기 위한 행동은 외재적 동기를 위한 것이다. 사람의 마음과 행동이 궁금하고 배우고 싶어서 심리학을 공부하는 경우와 졸업 학점을 위해서 공부하는 경우의 차이가 내재적 동기와 외재적 동기의 차이이다.

 연구 결과에 따르면, 실제로 자신이 수행하고 있는 일의 의미와 중요성에 초첨을 맞추는 사람들이 일을 더 잘할 뿐 아니라, 궁극적으로 외재적 보상도 더 많이 받게 된다. 사람들에게 선택권을 주는 것도 내재적 동기를 높일 수 있다. 그러나 일을 제대로 수행하고 있다는 것을 인정하는 외재적 보상도 물론 효과적일 수 있다. 스포츠 경기에서 승리하거나 상을 받는 것은 사기를 높이고 스포츠의 즐거움을 증가시킬 수 있다. 

 

7. 뇌의 보상센터

 올즈와 그의 동료들은 주의 여러 뇌 부위에 작은 전극을 삽입하여 쥐가 레버를 누를 경우 자기 자신의 뇌에 직접 전기적 자극을 가할 수 있도록 하였다. 이 연구에서 발견한 것은 뇌의 어떤 특정한 영역을 전기적으로 자극하는 것은 쥐들에게 매우 긍정적인 경험을 하게 한다는 것이었다. 특정 영역에 전극이 삽입된 쥐들은 수 시간 동안 생명에 필요한 음식이나 물도 무시하고 뇌에 직접 자극을 받으려고 하였다. 이 연구 결과는 뇌에서 보상을 주는 구조가 있다는 것을 보여주었다.

 후속 연구에서 연구자들은 뇌에서 자극을 통해 보상을 주는 몇 개의 구조와 경로를 확인했다. '뇌의 보상센터'라고 알려진 이 구조는 내측 전뇌속을 포함하며, 중뇌에서 시상하부를 통해 측핵으로 이어지는 경로이다. 이 경로는 먹고 마시는 행동과 성 행동과 같은 쾌락을 포함하는 행동들에 중요한 역할을 한다고 알려져 있다. 또한 이 경로는 도파민 분비와 관련이 있다. 최근의 연구들은 도파민이 보상 그 자체보다 보상의 기대와 더 밀접하게 연결되어 있음을 보여주었다. 특히 도파민은 단순히 좋아하는 것보다 어떤 것에 대한 요구나 갈망과 더 밀접하게 연관된다.

 기본적 요구를 희생하고서라도 뇌에 직접 자극을 받으려고 했던 쥐들에게 도파민의 활동을 차단하는 약을 투여하자 쥐는 이 경로를 자극하는 것을 멈추었다. 

 한 연구에서 남성들이 매력적인 여성을 보거나 돈을 받을 것을 기대할 때 측핵의 활동이 증가함을 보여주었다.

 

8. 관찰학습

  관찰학습은 다른 사람의 행동에 노출된 후에 새로운 행동을 배우거나 행동을 수정하는 것을 말한다. 이러한 학습을 사회적 학습이라고 하는데, 사람들이 환경에 적응하는 데 결정적으로 중요한 역할을 한다. 특히 어린이들은 대부분의 행동을 어른이 하는 행동을 보고 배우게 된다. 

 확산 사슬은 개인이 처음 다른 개인이 한 행동을 관찰함으로써 그 행동을 배우고, 그 행동은 또 다른 개인들이 행동을 배우는 모델로 사용되는 것을 말한다.

 대부분 사람들은 자기가 다른 사람을 모방한다는 것을 인정하고 싶어 하지 않지만, 실제로 사람들은 다른 사람을 보고 따라한다는 많은 연구 증거들이 있다.

 

대부분의 사람들은 다른 사람들을 모방한다

 

9. 거울 뉴런

거울 뉴런은 동물이 특정 행동을 할 때 반응하는데, 동시에 다른 동물이 그 특정 행동을 하는 것을 관찰할 때에도 반응한다. 다른 도물이 하고 있는 행동을 관찰할 때 이 뉴런들이 그 행동을 거울처럼 투영하고 있는 것이다. 거울 뉴런의 한 가지 이론은 우리의 공감 능력에 거울 뉴런이 신경적 바탕을 이룬다는 것이다. 다른 사람이 종이에 손가락을 베어 아픈 것을 보면 내가 다친 것처럼 손가락을 움찔하게 된다. 다른 사람이 고통에 반응하는 것을 보면 우리 뇌에 있는 거울 뉴런이 활성화 된다.

 사람들은 앞에 앉아 있는 사람이 하품을 하면 같이 하품을 하고, 웃을 때 같이 웃는다. 또 사랑하는 사람의 고통을 볼 때 그 고통을 공감한다. 한 연구에서는 실제 통증과 관련된 두뇌 활동은 사랑하는 사람의 통증을 관찰하는 두뇌에도 반영된다는 것을 보여주었다.

'죽을때까지 공부' 카테고리의 다른 글

언어와 지능  (0) 2022.08.27
생각의 요소들  (0) 2022.08.24
감각과 지각  (0) 2022.08.22
뇌(brain)  (0) 2022.08.21
신경계 (nervous system)  (0) 2022.08.20

댓글