[인공지능 연재] 바벨탑은 무너졌을까?
현안과이슈 / by 나드 / 작성일 : 2023.06.30 / 수정일 : 2023.08.31



[인공지능 질문하기] (2) 바벨탑은 무너졌을까?

 

인공지능이 불러올 혁신에 대한 기대감의 이면에서 학자들의 목소리를 전합니다. 함께 읽고 싶은 기사를 번역하고, 널리 알려진 오류를 바로잡습니다. 연재를 통하여 인간과 기술의 관계 맺기를 돌아보고자 합니다.

Anton Joseph von Prenner
역사 속의 바벨 탑은 고대 메소포타미아 바빌론의 신전으로 추측된다. 이보다 자주 언급되는 바벨 탑은 성경에 등장한 우화적 상징으로서, 신의 권위에 대한 인간의 도전이자, 그에 대한 신벌로 인류에게 주어진 소통불가능성을 가리킨다.
 

 

처음에는 온 땅의 언어가 하나요 말이 하나였더라 … 이는 여호와께서 거기서 온 땅의 언어를 혼잡하게 하셨음이니라 (성경, 창세기 11장 중)

2013년 포르투갈에서 설립된 한 번역 업체는 이를 가져와 언바벨(Unbabel)이라는 사명을 짓기도 했다. 처음부터 기계 번역의 속도를 강점으로 내세웠던 이 회사는, 현재 인공지능을 활용한 인간 번역(AI-powered human translation)이라는 홍보 문구를 사용한다.

이러한 번역 전문 서비스가 아니더라도, 기계 번역은 이미 우리 삶 깊숙이 들어와 있다. 페이스북, 인스타그램, 트위터 등 다양한 소셜 미디어 플랫폼은 기계를 통한 자동번역 기능을 제공하고 있으며, 번역 품질 또한 꾸준히 개선되는 중이다. 국내 IT 기업 중에서는 2016년 네이버가 인공지능 기반 번역 서비스 파파고(Papago)를 공개했으며, 2019년 카카오는 카카오 i 번역을 출시하여 카카오톡에서 간편하게 번역 챗봇을 이용할 수 있게 했다.

그리고 2023년을 휩쓴 인공지능 ChatGPT를 사용해보면, 인공지능의 출력 결과물을 조정하는 조건인 프롬프트를 사용하여 번역물의 개성까지 확보할 수 있다. 이러한 진전을 보고 있노라면, 얼핏 인류는 조만간 언어의 장벽을 허물어뜨릴 것처럼 느껴진다. 더 이상 외국어를 공부하지 않아도 한국어와 외국어를 자유로이 번역할 수 있다는 점은 무척 고무적이다. 한국에서 인공지능을 두고 비치는 열광 중 하나는 이제 영어를 공부할 필요가 없다는 해방감이기도 하다. 그러나 언어의 장벽을 무너뜨린다는 말은 어떤 의미일까.   


ⓒ 카카오, 네이버
 
구글 번역이 등장한 후 오래도록 한국어와 영어 기계 번역의 품질을 높이기 위해서는 일본어 중역을 하라는 팁이 떠돌았다. 한국어-영어 간 번역물보다 일본어-영어와 한국어-영어 간 번역물이 많으므로, 한국어와 영어 사이 일본어를 거치면 보다 매끄러운 번역을 얻을 수 있다는 것이다. 
이처럼 뛰어난 번역 성능을 누릴 수 있는 건 사용자의 수가 많으며, 이미 적극적인 번역이 이루어지는 언어들이다. 언어학 비영리 단체 에스놀로그의 통계에 따르면, 2023년 가장 많이 사용되는 언어의 순위는 다음과 같다.


2023년 기준, 사용자 수가 가장 많은 언어는 14억 명이 넘는 인구가 사용하는 영어이다. 뒤를 잇는 언어는 차례대로 중국(북경)어, 힌디어, 스페인어, 프랑스어, 아랍어, 벵골어, 포르투갈어, 러시아어, 우르두어다. 현재 인공지능을 구성하는 거대 언어 모델(Large Language Model)은 이름처럼 막대한 정보를 필요로 한다. 이때 정보의 양이 풍부하고 품질이 높을수록, 출력물의 품질은 높아진다. 동일한 인공지능 서비스를 사용할 때에도 한국어보다 영어를 사용할 때 출력하는 결과가 훨씬 풍부해지는 것이다.

이처럼 정보가 풍부하며, 이미 적극적인 번역이 이루어지는 언어들을 고자원 언어(high-resource language)라고 한다. 영어, 중국어, 러시아어, 일본어와 같은 언어가 이에 속한다. 인공지능의 발전을 딛고 번역의 품질이 개선되면서, 지배적인 언어의 영향력이 더욱 강해지고 있는 것이다. 노스웨스턴 대학교의 이중 언어 및 심리언어학 연구소 소장인 비오리카 마리안Viorica Marian은 이러한 현상을 우려한다. 그는 언어가 사용자에게 어떠한 영향을 미치는지 연구하며, 서로 다른 언어를 사용하는 사람은 상이한 안구 운동과 두뇌 활동을 보인다고 말한다.

Trolley Problem

'트롤리 문제'는 일종의 사고 실험으로, 참가자는 열차의 선로를 바꿀 수 있는 사람이 된다. 이때 답변 중 사용하는 언어 또한 요인인 것으로 나타났다. 제1언어로 답한 참가자는 20%, 제2언어로 답한 참가자는 33%가 선로를 바꾸어 다섯 사람을 위해 한 사람을 저버리겠다고 답했다. 
외국어를 사용할 때의 답변이 달라지는 이러한 현상을 '외국어 효과'라고 한다. "우리는 언어 경험이 주는 프리즘으로 세상을 바라봅니다." 언어의 다양성은 때로 사고의 다양성을 담보하기도 하는 것이다.

​매해 약 9개의 소수 언어가 사라지는 것으로 알려져 있다. 이러한 소수 언어는 인공지능이 수집하는 정보에 포섭될 확률이 극히 낮다.​ 현재 사용되는 약 7,000개의 언어 중 3,045개의 언어는 '멸종 위기'이며, 이는 전체 언어의 42퍼센트 이상이다.​ 언어의 소멸이 잘 와닿지 않는다면 한국어와 영어를 예로 들어 생각해보자. 한국어 사용자가 영어로 개발된 인공지능을 이용하고, 한국어를 영어로 바꾸고, 영어 사용자에게 영어로 말을 건다. 이러한 일이 반복되면 영어 사용자가 한국어를 배우고 이해할 필요는 점점 줄어들 것이다.


언어란 단순히 문자와 문법의 조합이 아니다. 상투적인 표현처럼, 언어에는 언중의 문화와 사고방식, 지역, 민족, 정체성 등이 녹아있다. 인공지능의 발전을 딛고 바벨 탑이 무너진다면, 이를 장벽의 극복보다도 영어의 범람이라 부르지 않을 수 있을까.

[관련 기사] (제목 클릭)
AI could cause a mass-extinction of languages — and ways of thinking, The Washington Post, Viorica Marian


[관련 문헌]
Costa, Albert & Foucart, Alice & Hayakawa, Sayuri & Aparici, Melina & Apesteguia, Jose & Heafner, Joy & Keysar, Boaz. (2014). Your Morals Depend on Language. PloS one. 9. e94842. 10.1371/journal.pone.0094842.
SIMONS, Gary F.. Two centuries of spreading language loss. Proceedings of the Linguistic Society of America, [S.l.], v. 4, p. 27:1–12, mar. 2019.

 

 



 


작성자 : 나드 / 작성일 : 2023.06.30 / 수정일 : 2023.08.31 / 조회수 : 2354

코멘트를 달아주세요!



 목록으로