공부하는 머리, 세상 사는 머리가 따로 있나? IQ와 SAT에 관한 담론
“얜 누굴 닮아 공부를 이렇게 못한대?”
이 말은 출생의 비밀을 파헤쳐 보자는 뜻보다는 공부는 머리가 좋아야 잘하는데 대상이 되는 아이가 공부를 못하는 것은 머리가 나쁘기 때문이며 지능은 유전이니 부모 중 한 사람이 나쁜 머리의 소유자일 것이다 라는 의심을 표현하는 것이다. 또는 부모 중 1인이 하는 말이라면 본인의 머리는 나쁘지 않다는 강한 부정과 함께 배우자와 그 가계에 대한 책임 추궁의 의도가 담겨 있다.
인간의 염색체 하나에 들어있는 정보의 양은 500 페이지짜리 책 약 4천 권에 해당한다. 출생해서 14세가 될 때까지 매초 3천만 개의 시냅스(Synapse)가 형성된다. 시냅스는 신경세포와 신경세포 사이의 연결 공간으로 뇌의 화학적 작용이 일어나며 시냅스가 많다는 것은 뇌작용의 활성도가 높다는 것을 의미한다. 뇌 과학이 발달했다고는 해도 여전히 인간 두뇌의 기능과 작용은 밝혀지지 않은 부분이 더 많다. 그런데 지능검사를 통해서 인간의 지적 능력을 정확히 측정할 수 있을까? 한 개인이 가진 인지적 잠재력 즉 학습 능력과 더 나아가 발전 가능성을 표준화된 시험이 충분히 평가할 수 있을까? 전자는 우리가 흔히 IQ 테스트라고 하는 지능 검사이고, 후자는 SAT, ACT와 같은 표준화된 시험이다.
지난 5월 25일부터 28일까지 보스턴에서 개최된 심리 과학 협회 (Association for Psychological Science, APS) 연차 학술대회에서 표준화된 시험(standardized tests)에 대한 경고가 나왔다. 코넬 대학의 심리학자인 로버트 스턴버그 (Robert J. Sternberg)교수가 그 주인공인데 스턴버그 는 심리학에 평생 기여한 공을 인정받아 APS의 ‘윌리엄 제임스 펠로우(WILLIAM JAMES FELLOW) 상’을 수상하면서 자신의 의견을 제시했다.
Scientific American을 통해 설명한 그의 주장을 살펴보았다. (이하 Q는 질문, S는 스턴버그의 답변)
Q: 당신의 주장에 따르면 SAT와 ACT와 같은 대학 입학 시험과 IQ (Intelligence Quotient) 테스트는 우리 사회의 발전을 돕는 것과는 거리가 있는 지적 능력의 소유자, 즉 똑똑한 바보(smart fools)를 선발하고 있다고 주장했는데 이 테스트들의 문제점이 무엇인가?
S: SAT, ACT, GRE (내가 알파벳 테스트라고 부르는)와 같은 테스트는 학문적 지식과 일반적 지성 및 관련 기술을 합리적으로 측정하는 좋은 방법이다. IQ 테스트와의 상관 관계가 높으며 인생에서의 많은 것들(예를 들면 어느 정도의 학업 성적, 급여, 성취할 수 있는 직업의 수준같은 것들)을 예측한다. 그러나 매우 제한적이다. 오늘 내가 주장했던 내용은 테스트가 실제로 우리에게 해가 될 수도 있다는 것이다. 학교 성적같은 매우 좁은 범위에서의 학업 능력에 대한 지나친 강조는 여러 가지 이유로 나쁜 것일 수 있다. 시험 잘 보고 전화기나 컴퓨터를 잘 다루는 기술은 훌륭하긴 하지만 세상을 더 좋은 곳으로 만드는 데 필요한 정도에는 미치지 못한다.
Q: 당신이 말한 표준 테스트가 해롭다는 증거는 무엇인가?
S: 20 세기에 IQ는 전 세계적으로 30점 증가했으며 미국에서는 그 증가가 계속되고 있다. 30점은 엄청난 수치다. IQ100의 평균과 영재 IQ 130의 두 표준편차의 차이와 같다. IQ가 높아졌으니 만족해야 하겠지만 나는 다음과 같은 의문을 갖는다.
상승된 IQ를 가진 사람들이 오늘날 우리가 세계에서 겪고있는 문제들 - 기후변화, 호황이었던 시기를 능가하는 이 나라의 소득 불균형, 오염, 폭력, 사람들이 결코 상상할 수 없었던 정치적 상황같은 것들을 왜 해결하지 않는가?
내가 주장하는 것은 창의력, 상식, 지혜와 동떨어진 지능은 그다지 긍정적이지 않다는 것이다. 이것은 종종 타인에게 피해를 주면서까지 자신을 발전시키는 이기적인 사람이 되기도 한다. 이런 테스트는 잘못된 사람을 선발하는 것뿐만 아니라 우리에게 필요한 것들을 잊게 만든다.
지능검사
<종의 기원>으로 진화 생물학의 토대를 만든 찰스 다윈의 사촌인 골튼(Francis Galton)경은 최초로 지능을 과학적으로 측정하려고 시도했다. 1884년~1890년 기간에 그가 일했던 런던의 사우스 켄싱튼 박물관에서 사람들은 소액으로 자신의 지능을 검사 받을 수 있었다. 역사적으로 유명한 지능검사법을 만든 학자는 프랑스의 심리학자 알프레드 비네(Alfred Binet)다. 그는 학업성취도를 예측할 수 있는 방법을 찾기 위해 동료인 테오도르 시몽(Théodore Simon)과 함께 1905년 지능검사법을 개발했다. 어휘력(염세주의자의 뜻은 무엇인가?), 이해력(사람들은 왜 때때로 돈을 빌리는가?) 그리고 어휘 사이의 관계(오렌지, 사과, 배의 공통점은 무엇인가?) 같은 것들을 측정했는데 이는 행동상 문제가 있으나 정상적인 사고 능력이 있는 아이들로부터 정신지체아들을 구별해 내는 것이 목표였다.
비네의 지능검사는 학업성취도의 예측에 꽤 성공적이었다는 평가를 받았다. 오늘날 광범위하게 활용되고 있는 지능검사는 스탠포드대의 루이스 터먼(Lewis M. Terman)이 비네의 검사를 변형, 표준화시킨 스탠포드-비네 지능검사(Stanford-Binet Intelligence scales)다.
지능검사와 같은 측정 방식은 보다 정교해져서 학업 적성검사 형태로 발전하는데 제2차 세계대전 중 심리학자들은 사병들을 심사하는 방법의 개발을 요청 받았다. 그 결과가 언어능력을 검사하는 ‘군대알파’ 그리고 판토마임으로 지시하는 실행 검사인 ‘군대베타’였다. 이어서 1926년 언어능력과 수리능력을 측정하는 오늘날 SAT의 기원이 되는 검사가 도입되었다. 이렇게 발전해온 지능검사가 예측할 수 있는 것은 무엇일까?
보통 지능검사의 결과와 학업성적과의 상관관계는 약 0.4~0.6이다. 그러나 개인의 수행능력 예측에 있어서는 25%정도만 설명할 수 있을 뿐 75%는 설명하지 못한다. 직업수행 능력, 봉급, 구직과 같은 일에 지능검사를 활용할 때 그 예측의 타당성은 더욱 낮아진다고 알려져 있다. 따라서 학자들은 학업성취도에는 지능검사로 측정할 수 없는 훨씬 더 많은 것이 관련되어있다고 주장한다.
한편 지능검사는 인종에 따른 사회적 차별의 도구로도 이용되었다. 즉 백인이 가장 ‘지능적’인 반면 여타 인종들은 뒤떨어지므로 백인들의 보호를 받아야한다는 논리를 정당화하는 데 기여했던 것이다. 미국으로 이주해오는 사람들은 엘리스섬에 도착하자마자 지능검사를 받았는데 그 결과 러시아인의 87%, 유태인의 83%, 이태리인의 79%가 ‘정신박약자’였다는 어처구니 없는 이야기가 있다. 이런 터무니없는 결과는 전통적 지능검사가 일종의 ‘문화특이성’을 가지고 있다는 판단의 근거가 된다. 이에 따라 문화가 서로 다르면 지능검사의 항목을 달리 해석한다는 사실이 밝혀졌다.
지능이론
하버드대학 교수 하워드 가드너(Howard E. Gardner)는 1983년 『정신의 구조: 다중 지능 이론(Frames of Mind: The Theory of Multiple Intelligences)』이라는 저서에서 기존의 IQ에 반하는 새로운 접근을 시도하면서 ‘다중 지능 이론(theory of multiple intelligences)’을 역설했다. 그는 인간의 능력은 단일한 것이 아니라 적어도 7가지 지능이 파이 조각처럼 서로 작용하며 이들 능력 하나하나는 똑같이 중요하다고 주장했다.
가드너가 말한 7가지 지능은 언어(verbal-linguistic), 논리·수학(logical-mathematical),
공간(visual-spatial), 음악(musical-rhythmic), 신체(bodily-kinesthetic), 자기 성찰(intrapersonal), 인간 친화(interpersonal) 등이었다. 그는 15년 뒤에 자연(naturalistic) 지능을 추가했으며, 좀더 근원적인 질문을 할 수 있는 능력, 즉 실존(existential) 지능의 추가 가능성도 언급했다.
가드너는 다중 지능 이론이 필요한 이유에 대해서 이렇게 설명했다. “교육은 개인이 중심이 되어야 한다고 생각한다. 모든 학생이 똑같이 마쳐야 할 교과과정이 있다 해도 한 사람 한 사람이 가장 잘 학습할 수 있는 방법을 찾기 위해 노력해야만 한다. 만일 신체 지능이 매우 발달한 학생이 논리 지능과 언어 지능만 중요하게 평가하는 학교에 배치된다면 그 학생의 자존감은 낮아질 것이다. 어떤 분야에서 무한한 가능성이 보이는데도 그 능력을 발전시킬 기회를 얻지 못하는 것은 잔인한 일이다. 물론 신체 지능이란 축구를 하는 것부터 외과 수술을 하는 것까지 상당히 넓은 범위를 포함한다.”
전통적인 IQ 중심의 지능이론에서 탈피한 현대의 대표적인 지능이론 중 하나가 1985년 로버트 스턴버그가 제안한 "지능의 삼위 일체 이론 (triarchic theory of intelligence)” 이다. 스턴버그는 지능은 단일 요인으로 구성되어 있는 것이 아니라 구성적 지능, 경험적 지능, 상황적 지능 등 3개 요인으로 구성되어 있다고 말했다. 구성적 지능은 정보를 효율적으로 처리하는 능력이다, 우리가 일반적으로 '지능'이라고 부르는 것인데, 새로운 지식을 획득하고 과제 해결에 논리적으로 적용하는 능력을 말한다. 경험적 지능은 일반적으로 '통찰'이라고 부르는 것으로, 서로 관련이 없는 요소들을 연관시키거나 새로운 것을 유추할 수 있는 능력이다. 그리고 상황적 지능은 일반적으로 '직관'이라고 부르는 것으로 정규 교육을 통해 길러지는 것이 아니라 일상 경험에 의해 획득하고 발달하는데 일상의 문제를 해결하고 사회생활에 잘 적응하는 능력이다. 따라서 그는 "성공은 단순히 아이큐가 높은 사람이 하는 것이 아니고 자신이 원하는 것이 생겼을 때 언제 누구에게 어떻게 말을 해서 최대의 효과를 거둘 수 있는지를 아는 실용지능(Practical Intelligence)이 높은 사람이 한다"고 주장한다.
지능검사와 SAT
지능검사 도구를 만든 비네는 자신이 쓴 논문에서 이것은 아무것도 아니며, 이를 통해 사람을 평가하거나 단체로 이 테스트를 시행해서는 안 된다고 밝혔지만 미국으로 건너 오면서 비네가 하지 말라는 대로 테스트는 치러졌고 그것이 SAT로 발전됐다. 이제 우리가 사용하는 표준화된 시험은 어떤 학생이 어느 대학에 들어 갈지를 결정하는 핵심적인 역할을 한다.
대학 입시에서 사용하는 다른 평가 방법과 마찬가지로 표준화 시험에도 장단점은 있다. 탁월하지는 않지만 개인과 집단에게 표준화 시험은 대학에서 학업성적을 예측하는 지표가 된다. SAT 점수가 400점 이하인 학생은 700점 이상인 학생보다 명문대에서 좋은 성적을 받을 가능성이 평균적으로 낮다. SAT와 ACT같은 시험은 나쁘지 않지만 온전하지도 않다. 이 시험은 주로 기억력과 분석 기술을 측정한다. 그러나 이런 능력은 대학과 사회생활에서 성공하는데 필요한 일부 기술일 뿐이다.
시험이 원래 나쁘다는 말이 아니라 시험이 우리에게 주는 정보가 불완전하다는 말이다. 시험으로 우리가 알 수 있는 정보가 충분하지 않다는 뜻이다. 스턴버그는 대학에 입학을 시킬 때도 학업 기술과 일부 추가 요소만 고려하지 말고 세상을 더 낫게 바꿀 수 있는 학생의 잠재력까지 충분히 고려해야 한다고 강조 한다. 실제로 스턴버그는 터프츠 대학의 학장으로 있으면서 열린 질문을 제시하고 답을 평가하는 도구를 제공하는 컬라이더스코프(Kaleidoscope) 프로젝트를 시행했는데 이 방법은 신입생의 학업 성공을 SAT와 고등학교 GPA보다 더 정확하게 예측했다고 한다. 신입생의 교과외 활동과 리더십, 적극적 시민 의식도 예측했다. 컬라이더스코프를 사용한 해엔 신입생의 SAT 평균과 고등학교 GPA 평균도 올라갔다. 터프츠 대학은 현재도 이 방법을 활용하고 있다.
가드너박사는 똑똑하다고 칭찬할 만한 능력은 성적이 좋은 경우뿐 아니라 여러 다른 재능들에도 있기 때문에 시험 점수로 사람들을 1등부터 꼴찌까지 줄 세우는 것을 반대한다며 다음과 같이 말했다. “지능검사를 보다 정교하게 보완한 검사 중 하나가 미국 고등학생들이 대학 입시를 위해 치르는 SAT 다. 언어 점수와 수학 점수를 중시하는 일종의 단일 지능 위주의 테스트이다. 20세기 산업 패턴에 맞춰진 테스트로 이런 시험으로는 다른 사람들을 이해하고 자기를 바로 보는 능력, 예술적인 자질, 창의력은 평가할 수 없다. 실제 우리 생활에서 매우 필요한 능력임에도 불구하고.”
또 가드너는 “그렇다고 논리적 사고를 평가하는 IQ 테스트가 그 사람의 미래를 잘 맞추는 것도 아니다. 한 가지에 초점을 둬서 검사하는 것보다 훨씬 다양한 조건들을 더해서 검사를 하면 예측성이 눈에 띄게 떨어진다. 사람의 미래를 뭐라 예측한다는 것이 참 부질없음을 알게 한다.” 고 하면서 성적이 좋으니까 법대 가면 잘할 거라는 기대감도 IQ 위주로 평가해서 나온 건데, 법은 논리와 언어 능력이 동등하게 요구되기 때문에 수학 잘한다고 법대 교수가 될 거라는 기대는 틀렸다는 것이다. 의사도 마찬가지. 과학과 의학에다 환자까지 다룰 수 있어야 하는데 환자의 얼굴을 보며 상태를 읽어내는 능력은 IQ가 아니라 인간 친화 지능에 더 가깝다며 바로 이 인간적 교감 때문에 우리는 기계가 아닌 사람 의사를 찾아간다는 것이다. 또한 누가 훌륭한 판매 능력을 갖춘 마케터인지 알려면 시험 성적에 중점을 두면 안 된다고 강조한다. 또 새로 발명품을 만들어야 한다면, 이때는 그 어떤 시험도 미리 줄 수 있는 정보가 없다고 밝혔다.
가드너는 여러 사람이 평가받는 시험은 우선 치르기 편리해야 한다는 이유 때문에 과거부터 언어·수리 능력 위주로 출제해온 거라며 “그런 시험지에는 큰 질문들은 나오지 않습니다. ‘왜 우리는 죽는가’, ‘사랑이 무엇인가’, ‘사람들은 왜 싸우지’, ‘한국과 일본 사이에 천 년 넘게 흐르는 긴장은 어떻게 설명해야 할까’ 이런 사유하는 질문들은 답하는 데도, 점수를 주는 데도 시간이 오래 걸리니까요. 하지만 이런 질문에 쉽게 몰두하는 능력을 갖춘 이들이 있습니다. 실존 지능(existential intelligence)이라고 논문을 발표할까 생각하고 있는데요. 이런 큰 질문들은 종교와 철학 그리고 때로는 문학으로 승화되죠. 이런 능력은 테스트로 알 수 없죠. 수리능력, 언어능력이 독창성, 창의력, 공감력보다 더 중요하다고 평가되어서는 안 됩니다. 21세기는 협력하는 작업이 훨씬 중요해요. 이것도 우리가 종이에다 연필로 적어서 테스트할 수 있는 능력이 아니죠.”
IQ 신봉자였던 루이스 터먼은 1921년 정부로부터 막대한 연구비를 지원받아 지능지수에 대한 대대적인 연구를 시작했다. 우선 초등학교와 중학교 교사의 추천을 받아 가장 명석한 아이들 25만 명을 추려냈다. 터먼은 우수한 학생들을 대상으로 다시 IQ 검사를 실시해 지능지수가 140이 넘는 아이들 1,470여 명을 뽑아냈다. 이후 수십 년 동안 터먼은 이 아이들을 면밀히 추적 관찰했다. 그는 이 아이들 중에서 다음 세대를 이끌어갈 엘리트가 나올 것이며 어른이 되면 대부분이 뛰어난 성취를 이룰 것이라는 사실을 믿어 의심치 않았다. 그러나 수십 년이 지나도 터먼의 천재 집단에서는 세상을 놀라게 할 만한 뛰어난 업적을 낸 사람은 나오지 않았다. 물론 사회적으로 성공을 거둔 사람들은 몇 명 있었으나, 그 비율은 그저 평범한 아이들 중에서 성공한 사람이 나오는 비율과 비슷했다. 터먼의 천재 집단에서는 단 한 명의 노벨상 수상자도 나오지 않았지만, 지능지수가 충분히 높지 않다는 이유로 조사 대상에서 제외되었던 아이들 중에서는 두 명의 노벨상 수상자가 나왔다. 수십 년의 추적 조사 끝에 터먼은 어쩔 수 없이 다음과 같은 결론을 내릴 수밖에 없었다. " IQ와 성취도 사이에는 그 어떠한 상관관계도 없다.”
노벨 물리학상 수상자인 리처드 파인만(Richard Phillips Feynman)의 IQ는 123으로 알려져 있다. 통상 천재로 생각하는 140에는 턱없이 부족한 수치이다. 멘사(Mensa)클럽에서 그에게 가입을 권유했을 때, 그는 “나는 당신들보다 지능지수가 낮아 가입할 수가 없다”고 잘라 말하며, 지적 허영에 찬 멘사(Mensa)를 비꼬기도 했다.
Vol.123
노벨 물리학상 수상자, 가주교육신문, 리처드 파인만(Richard Phillips Feynman), 멘사(Mensa)클, Mensa, 다중 지능 이론(theory of multiple intelligences), 다중 지능 이론, 정신의 구조, 하버드대학 교수 하워드 가드너, 로버트 스턴버그, 지능의 삼위 일체 이론, triarchic theory of intelligence, 가드너박사, 지능검사와 SAT, 컬라이더스코프, GPA 평균, IQ와 SAT, Richard Phill