본문 바로가기
중국과 문화/중국의 언어

한자의 곤경: 타자기에서 인공지능까지

by 중은우시 2024. 3. 8.

글: 사로(思蘆)

중문매체에서 크게 띄워주고 있는 <중문타자기(Chinese Typewriter)>를 읽어보았는데, 비교적 실망스럽다. 이 책의 작자는 스탠포드대학의 교수인 Thomas Mullaney이다. 책에 학술있내용은 적고, 역사이야기가 많아, 가치가 높지 않다. 단순한 중문타자기의 역사일 뿐이고, 깊이있는 통찰이나 분석은 포함되어 있지 않았다. 작자는 정치정확의 평가에 머무르면서, 사회다윈주의라는 틀로 모든 반대주장을 공격했고, 문화우열이나 언어본질에 대한 평가를 거부했다. 서방의 일부학자들은 두 문화가 부딛치는 분야에서 양편 모두에 치우치지 않으면서, 교묘하게 양쪽을 모두 인정하는 방식으로 쓰기를 좋아한다.

다윈진화론의 핵심은 적자생존이다. 이 견해는 사회학에서 문화에도 우열이 있어, 낙후된 문화는 도태된다는 것으로 잘못된 것이 없다. 우리는 우생학과 인종말살에 반대하는 동시에 도태된 낙후한 문화를 보호해야한다는 것에도 반대한다. 그런데 작자는 "언어는 인류사상을 표현하는 능력에서 차이가 없다. 최소한 모든 언어는 그 사용자들이 표현하고자 하는 것을 표현할 능력 혹은 잠재력을 가지고 있다." 문화차이를 인정하지 않고, 상형문자와 알파벳문자의 차이도 인정하지 않는 것은 작자의 다원문화주의입장을 보여준다고 할 수 있다.

이 책은 하나의 모순된 심리상태를 반영한다. 중국과 세계가 만날 때, 세계가 중국에 적응해야 하는가의 문제이다. 중국이 세계체계에 적응하지 못할 때, 중국을 개조해야 하는가, 아니면 세계의 현존체계를 개조해야 할 것인가. 중국과 외부세계는 항상 들어맞지 않는다. 중국인은 영원히 세계에 편입될지, 자체체제를 유지할지의 모순 속에 처해 있다. 만일 중국이 적응하지 못하면, 그건 중국에 문제가 있는 것이 아니라, 세계의 현존체계에 문제가 있는 것이다. 즉 보편가치가 잘못된 것이다. 중국이 세계에 적응하지 못하면, 세계가 중국을 포위공격하기 때문이라고 말한다. 우리가 너희에게 융합되지 못하는 것은 너의 문제이다. 너는 내가 너희에게 융합하지 못하는 것에 대해 모든 책임을 져야 한다. 누가 너를 먼저 발전시키고 나를 늦게 발전시키도록 했단 말이냐...

컴퓨터가 발명되기 전에, 영문타자기와 효능이 같은 중문타자기를 발명하는 것은 불가능한 임무였다. 혹은 타자속도, 혹은 커버내용, 혹은 비용, 혹은 복잡성방면에서, 중문타자기는 영문타자기와 동등한 효과를 낼 수가 없었다. 이는 중문이 주로 표의문자이기 때문이다. 26개의 영문알파벳과 비교하여, 기본적으로 한자는 3,4천개에 이른다. 영문타자업무는 일반적으로 비서들이 겸직한다. 그러나 중문타자원은 모두 전문적이다. 왜냐하면 중문조작에는 아주 높은 기술이 필요하기 때문이다. 영문타자기는 보급이 쉽고 휴대하기 편하다. 그러나 중문타자기는 크고 무거워, 하층단위에는 거의 없다.

삽대(揷隊)시절, 북경공전국(供電局)은 우리 인민공사와 연결된 단위였다. 공전국의 뤼(呂)씨성의 중문타자원이 우리 촌에 파견되어 왔다. 현에서 임무를 주어, <역사상노동인민의 반공(反孔)투쟁>이라는 글을 쓰게 했는데, 2만자로 1주일내에 원고를 제출해야 했다. 글을 다 쓴 후, 타자를 쳐서 현에 올려야 한다. 공사에는 중문타자기가 없었다. 뤼선생은 나의 글을 가지고 단위(북경공전국)으로 돌아가서 타자를 친 후, 교정을 봐야했다. 나는 그래서 북경으로 돌아갔고, 전문 부근의 전력국초대소에 거처했다. 그건 내가 처음 중문타자기를 본 때였다. 방대하고 무거워서, 활자인쇄기기라고 할 수 있었다. 나는 오탈자를 수정한 후, 뤼선생이 납지(臘紙)에 수정한 글자를 다시 쳐야 했다. 그리고 상용한자 이외의 일부 글자는 인쇄기에서 수정해야 했다. 문혁때, 홍위병은 조직이 난립하고 있었으며 모두 선전을 해야 했다. 주요방식은 대자보와 수공으로 새겨서 찍은 전단이다. 중문타자기를 쓰는 경우는 아주 드물었다. 그때 단정하게 쓴 붓글씨나 펜글씨는 아주 잘 나갔었다.

한어(漢語)와 한자(漢字)는 다르다. 복합단어로 신단어를 만들어내고, 단어의 순서배치에 자유도가 높고, 어법이 간단하다는 등의 분야에서는 한어와 영어가 비슷하다. 모두 비교적 성숙하게 발전하였다. 여기에서 주로 비교하고자 하는 것은 서면한어와 알파벳이다. 중국언어학자인 주유광(周有光)은 문자에 3개 단계가 있다고 보았다: 원시(형의)시기, 고전(의음)시기와 알파벳(표음)시기. 한자는 고전시키에 처해 있다. 문자의 진화과정은 글자모양(符形)에서 도부(圖符), 자부(字符), 알파벳(字母)으로, 어단(語段)에서는 어사(語詞), 음절(音節), 음소(音素)로, 표현법은 표형(表形), 표의(表意), 표음(表音)으로 발전한다는 것이다. 한자는 당금세계에서 유일한 어소(語素)문자로 활화석이라 할 수 있다.

왜 중문은 병음문자로 전환하지 않았을까? 주요 원인은 다음과 같다: 첫째, 한자는 발전역사가 짧다. 한자는 설형문자보다 2천여년이 뒤졌다. 갑골문이 출현했을 때, 지중해는 이미 알파벳문자가 발전했다; 둘째, 진시황의 육국통일과 문자통일의 결과로 각종 구어를 쓰는 사람들이 문자를 통일하게 되었고, 그 결과 문자와 구어가 분리되었다는 것이다. 서로다른 문자의 교류와 상호학습할 환경이 사라지면서, 알파벳계통으로 발전할 기회를 놓치게 되었다. 셋째, 한자가 커버하는 방언이 너무 많다. 발음차이도 비교적 크다. 이는 표음문자로 발전하는데 큰 장애가 되었다. 넷째, 하층문맹이 많다. 문자는 단지 일부 유한계급에게 필요했다. 그래서 간략화하면서 발전할 동력이 없었다. 라틴어의 알파벳의 기원은 페니키아문자이고 이는 상인들이 발명한 것이다. 그들은 간략한 부호로 기장하고 무역할 필요가 있었다. 복잡한 설형문자를 배워서 할 수는 없었다. 다섯째, 고대한어에서 많은 우수한 문학작품이 나왔다. 이들 문자유산은 알파벳화의 부담이 되었다. 왜냐하면 알파벳화하게 되면 단층이 나타나기 떄문이다. 여섯째, 한어의 보통화는 410개음절, 1,300여개의 독음이 있다. 상용한자는 3,4천개이다. 이로 인하여 동음다자(同音多字)가 많아, 표음문자로 진화하기가 비교적 곤란했다.

중국의 구어와 서면어는 심각한 분열상태에 처해 있다. 이런 분열은 중국이 논리, 철학, 법률과 과학등 분야에서의 발전과 진보에 영향을 끼친다. 문학과 서예만 영향을 받지 않았다. 그리하여 기형적인 번영을 유지하게 되었다. 글을 쓰는 것이 힘들기 때문에 가능하면 간략하게 줄였다. 대다수의 알파벳문자와 비교하여, 중문은 강대한 정보량과 압축능력을 가지고 있다. 마찬가지의 내용을 한어는 영문보다 30%이상의 페이지를 줄일 수 있다. 동시에 한자의 수량은 방대하고, 필획이 복잡하고, 의음이 단열되고, 다음다의가 있고, 의미가 미묘하여 한어는 세계에서 가장 익히기 어려운 문자가 되었다. 지금까지도 편벽된 농촌에는 많은 문맹자가 있다. 많은 중국인들은 그저 기본한자들만 알아보고, 책을 읽거나 글을 쓸 수가 없다. 그리하여 반문맹상태에 처해 있다. 언어는 도구이다. 중국인은 성장과정에서, 도구를 장악하는 시간이 알파벳문자를 사용하는 사람들보다 훨씬 오래 걸린다. 그리하여 지식을 학습할 시간이 상대적으로 부족해진다.

병음이 아닌 한자는 지금까지도 중국의 방언이 많고, 차이가 큰 원인이다. 왜냐하면 알파벳문자는 독음과 구어가 일치한다. 알파벳문자는 방언을 통일하여 표준화하도록 이끌 수 있다. 그러므로 알파벳문자를 사용하는 민족과 국가는 구어가 기본적으로 통일되어 있다. 일본과 한국은 알파벳문자를 사용한 후, 구어가 기본적으로 통일되었다. 표음문자인 몽골문과 만주문은 중국북방구어가 북방관화를 통일시키도록 촉진했다. 그러나 한자를 쓰는 중국남방은 방언이 많고 차이가 크다.

비알파벳의 중문은 중국현대화과정에서 계속적인 도전을 받아왔다. 타자기의 곤경은 단지 하나일 뿐이다. 한자는 입력, 코드와 검색등 방면에서 효율이 알파벳문자에 비하여 낮다. 그리하여 교육과 정보화의 병목현상이 나타나게 된다. 다행히 나중에 컴퓨터와 한자입력방법이 나타나면서 중문을 구원을 받았다. 비록 아직 약간의 문제가 있기는 하지만, 중문은 기본적으로 첫번째 도전을 넘을 수 있게 되었다.

인공지능은 아마도 중문이 직면한 두번째 현대화도전이 될 것이다. 한어의 의미다양성과 어감에 대한 고도의존성은 컴퓨터언어식별과 이해에 있어서 알파벳문자에 비해 훨씬 곤란하게 된다. 중문은 대소문자가 없고, 단어간의 간격이 없다. 그리하여 영문처럼 단어, 전용명사와 약어를 구분하기가 쉽지 않다. 그리하여 의미가 다르게 읽힐 가능성이 크다. 예를 들어, "乒乓球拍卖完了"의 경우 도대체 "乒乓球拍"(탁구채)를 다 팔았다는 것인지, "乒乓球"(탁구)를 "拍卖"(경매)했다는 것인지 알 수가 없는 것이다. 바이두의 AI소프트웨어인 문심일언이 만든 그림을 보면 중문단어의 여러 의미를 이해햐지 못해서 엉뚱한 그림을 그리는 경우가 있음을 알 수 있다. 예를 들어, "수용두(水龍頭, 수도꼭지)"를 그리라고 하면 용의 머리를 그린다든지, "와와채(娃娃菜, 야채이름)"를 그리라고 하면 어린아이얼굴을 한 야채를 그린다든지. 당연히 이걸 해결하기는 아주 어렵지 않다. 아마도 해결가능할 것이다. 다만 더 많은 유사한 문제들이 있다. 영문에서는 문제가 아닌 문제가, 중문에서는 문제가 된다. 인공지능에 더욱 높고 더욱 어려운 문제를 던지게 되는 것이다.