닫기

문의





    검색

    닫기
    t mode
    s mode
    지금 읽고 계신 글

    한국어, 한글과 정보화

    컴퓨터를 위한 한글 입력 프로그램이 개발되면서 타자기 시대에 천덕꾸러기 취급을 받았던 한글은 다시 그 위용을 자랑하게 되었다.


    글. 이승재(국립국어원 학예연구관)

    발행일. 2012년 11월 20일

    한국어, 한글과 정보화

    전세계에서 쓰이고 있는 언어의 숫자는 수천 개에 이르지만 그 나라 언어를 표현할 수 있는 글자를 가진 언어는 단지 200여개에 불과하다고 한다. 한국 사람들은 ‘한글’ 덕분에 글자를 모르는 사람이 거의 없을 정도로 문맹률이 낮다. 세종대왕이 만든 ‘훈민정음’은 오늘날 우리로 하여금 24개의 자음과 모음을 익히고 이들을 조합할 수 있는 방법만 배우면 11,000여 자에 이르는 글자를 만들어 쓸 수 있도록 했다. 이처럼 적은 수의 자모를 가지고 많은 수의 글자를 만들어 내는 문자는 그 유례를 찾아보기 힘들기 때문에 유네스코에서도 해설서인 <훈민정음>을 세계적인 문화유산으로 지정하였다.

    한글, 그리고 컴퓨터

    우리나라에 타자기가 보급되기 시작하면서 한글은 천덕꾸러기 취급을 받게 되었다. 한글이 적은 수의 자모를 사용하여 많은 수의 음절글자를 만들어 내는 뛰어난 능력을 지니고는 있지만 이를 글자로 만들려면 초성, 중성, 종성을 갖추어 한 음절로 모아써야 했기 때문에 타자기가 들어오면서 이를 실현할 수 있는 방법이 절실히 필요했기 때문이다. 그러던 중 컴퓨터가 들어오면서 컴퓨터의 표현 방식과 컴퓨터에서 나타낼 수 있는 글자 수의 문제로 한글은 한 번 더 고초를 겪어야 했다. 초기에 만들어졌던 컴퓨터는 로마자를 기반으로 개발되었기 때문에 확장 가능성이 높은 한글을 처리하기가 쉽지 않았던 것이다.

    그러나 컴퓨터를 위한 한글 입력 프로그램이 개발되면서 타자기 시대에 천덕꾸러기 취급을 받았던 한글은 다시 그 위용을 자랑하게 되었다. 한글은 한 음절 단위로 글자가 만들어지되 초성, 중성, 종성의 순서로 만들어지기 때문에 이러한 순서를 지키지 않고 입력하면 컴퓨터에서 완성된 글자가 만들어지지 않아 오타를 사전에 발견할 수 있는 부가 기능이 생기게 되었고, 한 음절 단위로 글자를 만들어 입력해야 하므로 입력할 때 리듬감을 살릴 수 있어 효율성을 높일 수 있게 되었다. 또한 한글은 자소의 수가 20여 자에 지나지 않으므로 한자 등의 다른 문자들처럼 로마자나 타 문자의 도움을 받을 필요 없이 입력기 창에서 직접 자모를 선택하여 입력할 수 있는 강점을 지닌다. 더구나 앞에서도 살펴보았듯이 한글은 하나의 기본 자소를 만들고 여기에 획을 더하여 다른 자소를 만든 경우가 많기 때문에 기본 자소만 있어도 정보화 기기에서 입력이 가능하다. 예를 들어 ‘ㅂ, ㅍ’을 입력하기 위해서는 ‘ㅁ’을 누르고 여기에 한 획이나 두 획을 더하는 키만 누르면 가능하기 때문에 세 개의 자소를 만드는 데 하나의 키만 있으면 된다. 한글의 이러한 구성 원리는 휴대폰을 비롯한 모바일 기기와 같이 부피가 작은 정보화 기기에서 효과적으로 운용, 발전시킬 수 있게 한다.

    한국어와 한글, 그리고 정보화

    문자의 발명과 성경의 보급이 인간의 언어를 가치 있는 정보로 발전시켜 문명을 비약적으로 발전시켰듯이 21세기에는 컴퓨터라는 또 하나의 매체가 인간의 언어를 훨씬 정교하게 정보화하여 인간의 생활모습을 혁신적으로 바꾸어 놓았다. 인간의 모든 활동은 언어에 의하여 이루어지기 때문에 언어자료를 가치 있는 정보로 바꾸게 되면 생활 자체가 좀 더 효율적이고 질 높은 것으로 바뀌게 된다. 언어의 정보화는 그 나라 민족의 문화유산을 보존하는 동시에 그 나라 언어문화의 발전을 이끌어가는 중심축이라고 할 수 있으며, 따라서 21세기 지식정보사회에서는 언어의 정보화에 대한 깊이가 그 나라와 민족의 삶의 질을 좌우한다고 할 수 있다.

    언어를 정보화하는 작업은 크게 두 가지로 나누어 생각할 수 있다. 하나는 우리가 일상생활에서 사용하고 있는 언어자료를 체계적으로 정리하여 다양한 검색용 콘텐츠를 만드는 것이고 또 다른 하나는 컴퓨터가 인간의 언어를 무리 없이 이해할 수 있도록 컴퓨터용 사전과 문법을 만드는 것이다. 전자의 정보화 작업으로 그동안 한국어로 이루어진 많은 콘텐츠가 축적되었고 이를 효과적으로 검색, 연결시키기 위하여 후자의 작업이 활발하게 진행되고 있다. 지금까지의 컴퓨터 환경이 인간과 컴퓨터의 의사소통을 전제로 한 것이었다면 앞으로의 컴퓨터 환경은 컴퓨터와 컴퓨터 간의 의사소통을 전제로 한 것이 될 것이다.

    컴퓨터 간의 의사소통 기술을 발전시키기 위해서 미국이나 러시아, 영국 등 세계 여러 나라에서는 1960년대부터 컴퓨터로 인간의 언어를 처리하기 위한 기계 번역 작업을 시작하였고 이 과정에서 언어자료를 보다 정교하게 형식화하고 정보화하는 작업이 이루어지면서 다양한 형태의 자료 구축과 언어 분석 기법도 마련되기 시작하였다. 우리나라에서도 정보 기술 환경이 발달하기 시작한 1980년대부터 이러한 방면에 대한 연구가 전산학자를 중심으로 이루어졌다. 처음에는 과학기술부와 정보통신부의 사업을 통하여 기초 단계의 한국어 처리 기술이 개발되기 시작하였는데 1990년대 후반에 문화관광부의 ’21세기 세종계획’사업이 마련되면서 인문학자와 전산학자를 공동 작업의 장으로 끌어들였다. 이는 ’21세기 세종계획’ 사업이 가진 큰 의의이기도 하다.

    한국어 정보화, 그 수준은?

    1980년대 초에 우리나라에 컴퓨터가 보급되기 시작하면서 한국어, 한글로 된 많은 자료들이 전산화되기 시작하였다. 많은 연구 보고서와 기본 자료들이 컴퓨터 파일로 만들어지기 시작하였고 1980년대 후반에 이르러 연세대학교, 국립 국어원, 한국학중앙연구원(구 한국정신문화연구원) 등에서 시작한 대규모 국어사전 편찬 사업에서 사전 편찬 지원 시스템을 개발하고 이를 통하여 사전 편찬 작업을 진행하였다. 특히 이 시기에 국어사전의 용례자료를 확보하기 위하여 대량의 문헌자료들을 입력하는데 이것이 본격적으로 한국어 말뭉치를 대량으로 구축하는 계기가 되었다. 이후 한국어와 한글을 좀 더 체계적으로 정보화하려는 움직임이 나타나게 된다. 세종대왕이 훈민정음을 창제하여 국민생활을 획기적으로 변화시켰다면 21세기에는 컴퓨터를 활용한 언어자료 구축과 분석작업을 통해서 다시 한 번 한국어와 한글의 가치를 새롭게 만들어 나가자는 것이었고, 그 일환으로 1997년에 탄생한 것이 ’21세기 세종계획’이었다.

    ’21세기 세종계획’은 한국어 자료를 총체적으로 정리하여 문화유산으로서의 한국어를 보존해 나가는 동시에 컴퓨터의 언어 처리를 위한 새로운 자료들을 만들어 나감으로써 한국어 자료의 부가가치를 극대화하려는 데 그 목적이 있었다. 문화관광부 산하의 국립국어원(NIKL: The National Institute of the Korean language)에서 1998년부터 2007년까지 10년 계획을 세워 추진해온 사업으로, 언어자료를 체계적으로 정보화하기 위하여 가장 기본이 되는 말뭉치(corpus)를 구축하고 구축된 말뭉치를 활용하여 전자사전이나 전문용어 데이터베이스, 국어정보 검색 프로그램을 만드는 것을 내용으로 한다. 국립국어원에서는 이 계획을 7~8개의 세부 과제로 나누어 몇몇 대학이나 연구소와 함께 공동으로 추진해왔으며 그 주요 내용은 아래와 같다.

    ① 현대 국어 말뭉치 구축
    현대 국어 중심의 문헌 등을 입력한 원시 말뭉치, 원시 말뭉치를 형태 분석한 형태 분석 말뭉치, 원시 말뭉치를 구문 분석한 구문 분석 말뭉치를 구축하고 이들 말뭉치를 활용한 말뭉치 검색 프로그램과 형태 분석 프로그램, 구문 분석 프로그램을 만들었다.

    ② 특수 말뭉치 구축
    옛 문헌을 입력한 역사 자료 말뭉치, 다국어 자료를 대응시킨 한영, 한일 병렬 말뭉치, 북한 및 해외 한국어 말뭉치, 전문 용어 말뭉치를 각각 원시 말뭉치와 형태 분석 말뭉치로 만들어 그 자료들을 활용한 검색 프로그램을 만들었다.

    ③ 전자사전 개발
    형태 분석이나 구문 분석 프로그램 등 컴퓨터가 한국어를 분석해내기 위하여 필요한 형태의 전자사전을 만들었다.

    ④ 한민족 언어 정보화
    다양한 형태의 말뭉치 자료를 활용하여 한국어 어문 규정, 한국어 방언 자료, 남북한 사전, 한국어의 어휘 역사 자료 등을 검색할 수 있는 데이터베이스와 프로그램을 만들었다.

    ⑤ 전문용어 데이터베이스 구축
    과학 기술 용어를 중심으로 한 전문용어 3개국 대응 목록 및 조어 방법 분석 자료를 구축하였다.

    ⑥ 문자코드 연구센터 운영
    한글 및 한자의 국제 표준 코드와 관련된 기초 연구를 수행하였다.

    ⑦ 글꼴 개발 보급 센터 운영
    옛 문헌을 중심으로 새로운 한글 글자체를 만들 수 있는 기초 자료를 정리하였다.

    ⑧ 국어 정보화 아카데미의 운영
    한국어의 정보화 작업을 수행할 수 있는 연구 인력을 양성하기 위하여 국어 정보화 인력 양성 프로그램을 운영하였다.

    ⑨ 국어 정보 관리 센터의 운영
    ’21세기 세종계획’을 통하여 만들어진 자료를 다양하게 활용하고 보급하기 위하여 국어 정보 관리 센터를 운영하였다.

    ’21세기 세종계획’은 언어자원을 보존하는 동시에 언어정보산업에 응용할 수 있는 자원까지 만들어내기 위하여 세워졌기 때문에 그 결과물들은 한국어 교육, 한국어 사용 현황 조사, 한국어 정보처리 산업 분야에 광범위하게 활용될 수 있다. 더불어 국립국어원에서는 1998년부터 한국어와 한글 관련 자료를 널리 보급할 수 있는 ‘국어 정보 보급 관리 시스템’을 만들었는데, 이 시스템도 ‘한국어 통합 관리 시스템’으로 발전되어 표준국어대사전, 어문규정 용례, 국어순화, 신어, 말뭉치, 전자사전, 전문용어, 발음학습, 디지털 한글 박물관 등의 관련 분야는 물론 한국어나 한글에 관심 있는 많은 사람들에게 광범위한 자료를 제공하고 있다.

    한국어 정보화와 한글의 응용

    현대 한글은 일반적으로 가로로 쓴다. 그러나 한글이 처음 만들어졌을 때에는 글자를 세로로 써 나갔다. 이는 한글이 음절글자로 만들어질 때 정방형 모양으로 만들 수 있기 때문에 가능한 것이었다. 자모를 조합하되 한 음절 글자의 틀을 만들어 나가기 때문에 그 모양을 정방형으로 만들기가 쉬운 것이다. 그래서 한글은 세로로 쓰기 어려운 로마자와 달리 가로쓰기나 세로쓰기가 모두 가능하다. 또한 자모를 기본 단위로 하고 있기 때문에 이들을 자유롭게 배치하면 정방형만이 아닌 다양한 조형미를 갖는 글자를 만들어낼 수도 있다. 한글 글자체 중에는 이러한 한글의 속성을 이용해 정방형의 모양에서 탈피한 글자체들이 많이 있는데 이는 다른 정방형 문자들에서는 찾아보기 힘든 요소이다. 최근에는 인쇄매체가 아닌 각종 영상매체를 위한 시각적인 글자체들이 속속 만들어지고 있으며 이러한 글자들은 한글의 가독성과 조형미를 극대화할 수 있도록 다듬어지고 있는데 현대 사회의 주된 정보 전달이 인쇄 매체가 아닌 영상 매체를 통해서 이루어진다는 점을 생각하면 당연한 결과라고 할 것이다.

    21세기 정보화 사회에서는 컴퓨터를 이용한 다양한 서비스가 인간생활을 풍요롭게 할 것이라고 하는데 이를 위해서는 한글의 우수한 점을 컴퓨터 시대에 맞게 잘 다듬어야 할 것이다. 한국어를 정보화하는 것은 디지털 시대에 한국의 문화를 유지, 발전시키기 위한 필수적인 과정이다. 농경사회에서는 땅을 지배해야만 승자가 될 수 있었고 산업사회에서는 경제를 지배해야만 승자가 될 수 있었다. 하지만 정보화 사회에서는 정보를 지배해야만 승자가 될 수 있다. 한글을 중심으로 한 우수한 우리 문화유산들을 정보화 시대에 걸맞게 발전시키려면 이들을 끊임없이 디지털 자료로 만들고 이를 조직화, 체계화시켜 부가가치가 높은 정보로 만들어야 할 것이다.

    * 이 글은 2009년 1월 웹진 『온한글』에 게재된 기사를 재구성한 것입니다.

    Popular Review

    인기 리뷰

    New Review

    최신 리뷰