콘텐츠로 건너뛰기

LLM으로 학습하기: 학습을 촉진할까? 뇌를 잠식할까?

최근 연구에 따르면, 생성형 AI(Generative AI)를 교실에 도입하기 전에 학생들이 먼저 글쓰기 능력을 제대로 갖춰야 한다는 사실이 밝혀졌습니다.

LLM으로 학습하기- 학습을 촉진할까? 뇌를 잠식할까?

포스트 작성 방법론: @gemini-pro와 @claude-4-sonnet이 Dust 플랫폼을 통해 [Mind on ChatGPT 논문, Dan Rockmore 강연, 뉴요커(New Yorker) 기사]를 바탕으로 LLM을 교육에서 사용하는 것과 계산기를 사용하는 것의 차이에 관한 함의를 다룬 에세이를 작성했습니다. Rockmore 교수는 글쓰기 학습이 비판적 사고를 길러주어, 이 과정이 사람들을 더 나은 LLM 사용자로 만들어 주기에, 교실에 LLM을 도입하기 전에 먼저 글쓰기를 충분히 가르쳐야 한다고 주장합니다. @claude-4-sonnet은 MIT 연구가 실제로 어떤 실험을 진행했는지 더 깊이 설명하고, 단순히 검색한 자료에 의존하기보다는 연구 내용을 중심으로 서술했으며, 실험 참가자들이 누구였는지, 어린 학생들에게 미칠 수 있는 영향과 관련된 의문점도 별도 단락으로 상세히 다뤘습니다. 전체적으로는 Substack에 게재하기 적합하도록 가볍게 편집하고 서식을 조정한 내용입니다.

어떤 혁신적인 기술이라도 교실에 도입되면 자연스럽게 기대감, 불안, 토론이 반복되는 사이클이 발생합니다. 수십 년 전, 포켓 계산기가 등장했을 때 학생들이 기본 산수 능력을 잃을까 우려하는 목소리가 있었습니다. 오늘날에는 더 복잡하고 심도 있는 논쟁이 대형 언어 모델(LLM)의 등장과 함께 일어나고 있습니다. 이 LLM은 명령에 따라 세밀하고 일관된 텍스트를 생성하는 정교한 인공지능입니다. 계산기는 계산 도구였으나, LLM은 의사소통과 창작의 도구로 교육의 미래에 중대한 질문을 던지고 있습니다. 그러나 MIT의 최신 신경과학 연구는 계산기 비유가 학생들이 이 기술을 이용할 때 뇌에서 일어나는 일을 근본적으로 잘못 해석하고 있음을 보여줍니다. 계산기는 더 많은 학생이 수학적 추론에 참여하도록 도왔지만, LLM은 연구자들이 ‘인지 부채(cognitive debt)’라고 부르는 현상을 만들 수 있는데, 이는 비판적 사고력을 구축하는 뇌 활동이 줄어드는 측정 가능한 현상입니다.

우리의 The AI Productivity Paradox 에세이에서 밝혔듯이 “새로운 기술이 있다는 것만으로 생산성이 향상되지 않고 조직 변화, 역량 강화, 비즈니스 프로세스 혁신과 같은 보완적 요인이 필수적입니다.” 교육 분야에서는 AI가 학습 가속화를 이루려면 교사가 LLM을 교실에 도입하기 전에 이를 위한 토대를 마련해야 합니다. 직장에서는 사람이 학교에서 배운 비판적 사고 능력을 갖추었다고 생각하는데, Agency 창업자 Elias Torres는 이번 Training Data 에피소드에서 많은 기업이 AI를 계산기처럼 착각하며 “이 정도 완벽함을 요구”하고 “기술과 그 능력을 완전히 오해하고 있다”고 지적합니다.

기술적 유사성의 매력

다트머스 대학의 Dan Rockmore 교수는 뉴요커(New Yorker) 기사 What It’s Like to Brainstorm with a Bot에서 많은 학자들이 AI 협업에 느끼는 진정한 흥분을 잘 담아내고 있습니다. 그의 동료인 Luke Chang이 긴 운전 중 ChatGPT를 사용해 까다로운 시각화 문제를 해결한 연구 성과 사례는 AI가 Rockmore가 말하는 ‘워크숍의 끊임없이 움직이는 동료’로서 지닌 가능성을 보여줍니다. Chang의 경험은 다음과 같은 낙관적 시각을 대표합니다. 즉, AI를 정교한 사고 도구로 사용하면서 자신이 창의적 과정의 주체임을 유지하고, 기계의 패턴 인식 능력을 적극 활용하는 능력 있는 연구자의 모습입니다.

그러나 이러한 역사적 유사성은 LLM과 그 전신들 간의 중요한 차이점을 감추고 있습니다. 특히 계산기 비유는 생성 AI가 교육에 직면시킨 고유한 신경학적 도전 과제를 인지하는 것을 방해하는 개념적 함정이 되어버렸습니다.

LLM이 학습에 미치는 영향을 포괄적으로 조사한 연구는 MIT 미디어랩 연구진이 수행한 Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task입니다. 이 연구는 주관적 인상이나 이론적 우려를 넘어, 학생들이 학업에서 AI를 사용할 때 뇌에서 실제로 벌어지는 일을 직접적인 신경학적 증거로 제시합니다.

연구진은 54명의 참가자를 세 그룹으로 나누어 정교한 실험을 설계했습니다. ChatGPT를 이용해 에세이를 작성한 LLM 그룹, 전통적인 웹 검색을 이용한 검색 엔진 그룹, 그리고 어떤 디지털 보조도 없이 에세이를 쓴 뇌만 사용한 그룹이었습니다. 참가자들은 수개월에 걸쳐 네 차례의 세션에서 에세이를 작성했으며, 작성 과정 동안 뇌파 측정(EEG)을 통해 뇌 활동이 지속적으로 모니터링되었습니다.

실험 설계는 특히 기발했습니다. 처음 세 개 세션에서는 참가자들이 각자 배정된 그룹에 머무르도록 했습니다. 하지만 네 번째, 중요한 세션에서 연구자들은 조건을 바꾸어서, ChatGPT를 사용하던 참가자들은 어떠한 도구도 없이 글을 쓰도록 했고(LLM에서 뇌로, LLM-to-Brain), 반대로 도구 없이 글을 쓰던 참가자들에게는 처음으로 ChatGPT 사용 권한을 주었습니다(뇌에서 LLM으로, Brain-to-LLM). 이 교차 설계 덕분에 연구진은 이전의 AI 사용이 이후 독립적 글쓰기 수행에 미친 영향과, 기초 능력이 좋은 참가자들이 AI 보조에 어떻게 적응했는지를 관찰할 수 있었습니다.

에세이 주제는 예술, 자선, 행복 등 SAT 시험 에세이 질문에서 뽑은 것으로, 진지한 사고와 분석이 필요한 복잡한 문제들이었습니다. 참가자들은 한 에세이에 20분씩 배정받았고, 연구진은 최종 작성한 에세이뿐만 아니라, 참가자들이 자신의 글에 대한 주인의식, 자기 글에서 인용할 수 있는 능력, 결과에 대한 만족감에 관한 상세한 인터뷰도 진행했습니다.

인지 부채의 신경학적 현실

연구 결과는 계산기 비유에 근본적인 도전이 되는 놀라운 패턴을 보여주었습니다. ChatGPT를 사용한 참가자들은 인간 교사와 AI 심사위원 모두에게 높은 평가를 받은 에세이를 작성했지만, 그들의 뇌는 다른 이야기를 하고 있었습니다. 이 학생들은 과제가 덜 인지적인 노력을 요구한다고 느꼈으며, 실제로도 그렇다는 사실이 밝혀졌습니다.

역동적 지향 전송 함수(dDTF)라는 정교한 분석 기법을 활용해 연구진은 다양한 인지 기능과 관련된 여러 주파수 대역에서 뇌의 연결성 패턴을 측정했습니다. 그 결과는 명확했습니다. 외부 지원이 많아질수록 뇌 연결성이 체계적으로 감소하는 경향이 나타났습니다. 디지털 도움 없이 글을 쓴 뇌만 그룹이 가장 강하고 광범위한 신경 네트워크를 보였고, 웹 검색기를 사용한 그룹은 중간 수준, LLM의 도움을 받은 그룹은 뇌 영역 간 연결성이 가장 약했습니다.

특히 LLM 그룹은 주의력, 작업 기억, 언어 처리에 중요한 전두엽과 측두두정 피질 영역에서 알파 및 베타 주파수 대역이 크게 감소했습니다. 언어 처리가 주로 이루어지는 왼쪽 반구에서 감소가 특히 두드러졌습니다. 이는 ChatGPT가 단순히 글쓰기 기술을 보조하는 데 그치지 않고, 사고력을 구축하는 핵심 인지 작업까지 대신하고 있음을 시사합니다.

연구진은 이 현상을 소프트웨어 공학에서 기술 부채에 비유하여 ‘인지 부채(cognitive debt)’라고 명명했습니다. 불량한 프로그래밍이 장기적인 유지 보수 비용을 초래하는 것처럼, AI 지원의 단기적 이점이 장기적인 인지 발달의 비용으로 나타날 수 있다는 의미입니다.

가장 충격적인 발견은 네 번째 세션에서 나왔습니다. 조건이 바뀌었을 때, AI 지원에 익숙해진 LLM-to-Brain 참가자들은 ChatGPT 없이 글을 써야 할 때 뇌 연결성이 약해졌습니다. 그들의 뇌 활동 패턴은 외부 인지 지원에 의존하게 되어 독립적인 글쓰기에 필요한 신경망을 다시 활성화하는 데 어려움을 겪고 있음을 보여줍니다.

더욱이 이 참가자들은 비지원 글쓰기에서 LLM 특유의 어휘를 편향적으로 사용하는 경향을 보였는데, 이는 그들의 사고 방식이 언어 모델의 언어적 특성에 영향을 받았음을 시사합니다. 또한, 몇 분 전에 쓴 에세이를 인용하는 능력도 현저히 저하되어 기억 인코딩과 유지에 문제가 있음을 드러냈습니다.

반면, 처음으로 ChatGPT를 사용한 Brain-to-LLM 참가자들은 전혀 다른 양상을 보였습니다. 인지 능력이 감소하는 대신 “기억 회상 능력이 높아지고 광범위한 후두두정 및 전전두엽 영역이 다시 활성화”되었습니다. 이들은 AI를 진정한 도구로 활용하면서도 인지적 주체성과 뇌의 활성 상태를 유지하는 것으로 나타났습니다.

비판적 사고의 전제 조건

이제 Rockmore 교수 등 여러 연구자들이 제기한 중요한 논점에 이르게 되었습니다. Santa Fe 연구소에서 있었던 최근 강연에서 그는 글쓰기를 배우는 과정 자체가 사실상 비판적으로 생각하는 법을 배우는 과정이라고 설명합니다. MIT 연구는 이 개념에 대해 신경학적으로 입증하는 증거를 제시합니다. 전통적인 글쓰기에서 보이는 뇌의 연결성 패턴이 인지 능력이 형성되고 강화되는 증거로 확인되기 때문입니다.

이 연구 결과는 학생들이 AI 도구를 생산적으로 활용하기 위해서는 강력한 기초 사고 능력을 먼저 갖춰야 한다는 점을 시사합니다. Brain-to-LLM 그룹 참가자들은 튼튼한 인지 역량을 바탕으로 ChatGPT와 상호작용했기에 성공할 수 있었습니다. 이들은 AI가 제시하는 아이디어를 평가하고, 자신의 목소리를 유지하며, 도구에 의존하지 않고 전략적으로 활용하는 모습을 보였습니다.

MIT 연구는 AI 사용이 교육에 미치는 광범위한 영향을 이해하기 위해 심리적 요인도 측정했습니다. LLM 그룹 참가자들은 뇌만 이용한 그룹 참가자들과 비교해 자신이 쓴 에세이에 대해 ‘주인의식’이 일관되게 낮게 나타났습니다. 이는 자신이 쓴 생각과 AI가 만든 아이디어를 명확히 구분하지 못하는 진정한 불확실성을 반영합니다.

가장 우려되는 점은 LLM 그룹 참가자들이 자신이 작성한 글에서 특정 구절을 인용하는 능력이 크게 저하되었다는 사실입니다. 이들은 자신의 글에서 특정 부분을 기억해 달라는 요청에, AI 도움 없이 글을 쓴 참가자들보다 현저히 낮은 수행을 보였습니다. 이는 인지적 부하 감소가 단순히 글쓰기 과정에만 영향을 미친 것이 아니라, 기억 형성과 유지 과정에도 부정적 영향을 끼쳤다는 점을 시사합니다.

교육 현장에 주는 시사점

MIT 연구 결과는 AI를 교육 현장과 직장에 어떻게 통합할지에 대한 시사점을 제공합니다. 증거는 기술 습득 순서가 매우 중요하다는 점을 말해줍니다. 학생들은 AI 도구를 생산적으로 활용하기 전에 전통적인 방법으로 탄탄한 글쓰기 및 비판적 사고 능력을 길러야 합니다.

이는 AI를 교실에서 완전히 금지해야 한다는 의미가 아니며, 현 시점에서는 불가능해 보이기도 합니다. 하지만 너무 이른 도입이 오히려 역효과를 낼 수 있다는 점을 인지하는 것이 중요합니다. 목표는 학생들이 AI 산출물을 수동적으로 소비하는 사용자가 아니라, 사려 깊고 비판적인 AI 사용자로 성장하도록 돕는 데 있어야 합니다.

연구는 몇 가지 핵심 원칙을 제시합니다.

  • 기초가 우선: 학생들은 AI 도움을 받기 전에 핵심 글쓰기 및 사고 기술을 먼저 완전히 습득해야 합니다. 전통적 글쓰기 훈련을 통해 만들어진 신경 경로는 AI 사용 시 인지적 주체성을 유지하는 데 필수적입니다.
  • 인지적 참여: AI 도구를 도입할 때에는 신경 활동을 줄이지 않고 유지할 수 있는 방식으로 설계하고 사용해야 합니다. 협업이 목표이지, 인지적 책임 회피가 되어서는 안 됩니다.
  • 소유감과 기억: 교육 방식은 학생들이 자신의 아이디어에 대한 소유감을 유지하고 자신의 작업을 기억하는 능력을 강조해야 하며, 과도한 AI 의존은 이러한 능력을 위협할 수 있습니다.

MIT 연구에서 18~39세(평균 22.9세) 보스턴 인근 대학 출신 성인 54명이 참가했음을 주목해야 합니다. 이들은 이미 수년간 전통 교육을 통해 탄탄한 글쓰기 및 비판적 사고 능력을 갖춘 성인이었습니다. 이 인구집단의 한계 때문에, 특히 중고등학생 등 아직 기초 인지 능력을 발전 중인 어린 학생들에게는 어떤 영향을 끼칠지에 대한 중요한 질문이 남습니다. 연구자들은 과거 연구를 인용하며 “어린 사용자가 AI 도구에 더 많이 의존하고, 이로 인해 인지 수행 점수가 더 낮게 나타났다”는 점을 지적하며, 대학생에서 관찰된 인지 부채 효과가 청소년층에서 훨씬 심각할 수 있음을 시사합니다.

저자들은 AI 도구가 “학습 향상을 위한 전례 없는 기회”를 제공한다고 인정하면서도 신중한 고려가 필요하다고 경고합니다. Brain-to-LLM 그룹 같이 자율적 글쓰기에 익숙해진 참가자가 AI를 효과적으로 활용하며 뇌 활동을 유지한 경험에 비추어, 아직 이런 기초가 없는 어린 학생들은 인지 부하를 줄이는 이 과정에서 뇌 연결성이 감소하는 영향을 더 크게 받을 수 있다며, 향후 추가 연구를 통해 이를 확인해야 한다고 밝혔습니다.

잘못된 접근이 갖는 위험

MIT 연구는 지금까지 주로 이론에 머물렀던 우려에 대한 실증적 증거를 제공합니다. 참가자들의 뇌에서 측정된 ‘인지 부채’는 AI 의존의 실제 비용을 나타내며, 시간이 지날수록 학생들이 외부 인지 지원에 더 많이 의존하게 되면서 누적될 수 있는 문제입니다.

Rockmore 교수가 뉴요커(New Yorker) 기고문에서 지적하듯, 우리는 “AI 지름길로 교육받은 세대”를 만들 위험에 처해 있습니다. 이 세대는 “독립적인 사고, 창의적 문제 해결, 지적 몰입에 필요한 기초 능력이 부족할 수 있습니다.” MIT 연구는 이것이 과장이 아니며, 신경학적으로 측정 가능하다는 점을 보여줍니다.

계산기 비유가 위험해진 이유는 그것이 완전히 틀렸기 때문이 아니라 인지적 위험을 근본적으로 잘못 표현하고 있기 때문입니다. 계산기는 수학적 사고를 보조하지만 대체하지는 않습니다. 그러나 신경영상 연구는 LLM이 교육이 키우려 하는 핵심 인지 과정을 대체할 수 있음을 보여줍니다.

앞으로 나아갈 길은 AI 통합이 단순히 새로운 도구 도입을 넘어 학습, 인지, 지적 발달 방식에 대한 근본적인 변화를 의미한다는 것을 인식하는 데 있습니다. 우리는 학생들이 AI와 작업할 때 신경 참여와 인지적 주체성을 유지할 수 있도록 기초 인지 능력 개발을 우선시해야 합니다.

인간 사고의 미래는 이 순서를 올바르게 이해하는 데 달려 있을지도 모릅니다. 우선 스스로 사고하는 법을 배우고, 그 다음에 기계와 함께 사고하는 법을 익히는 것입니다. MIT 연구는 이 구분을 위한 신경학적 지도를 제공하며, 왜 중요한지에 대한 강력한 근거를 제시합니다.


원문: Learning with LLMs: Cognitive Shortcut or Cognitive Debt?


blog by ash에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

태그:

댓글 남기기

LLM으로 학습하기- 학습을 촉진할까? 뇌를 잠식할까?

blog by ash에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기