AI 기술을 활용한 고문헌 해독 시스템에 대해서는 인식률이나, 번역의 정확도에서 한계가 있다는 평가와 이용자층을 확보하기 어렵다는 견해도 존재한다. 그러나 고문헌의 대중화를 위해서 ‘한자’로 기술된 옛 자료들의 번역은 필수다. 고문헌의 디지털 이미지와 텍스트라도 확보가 된다면 관련 연구를 보다 활성화할 수 있다. 또한 한글 번역이 된 고문헌 자료는 대중이 편리하게 이용할 수 있다. 한문이라는 언어는 현대 우리의 일상적 언어와 다르기 때문에 이해하기 어렵다.
-01_“자동 번역의 후발주자 ” 중에서
한국국학진흥원은에서 보관 중인 국학자료 중 고문헌에 해당하는 고서와 고문서는 560,876점으로 전체 보관 유물 중 약 87.5%를 차지하고 있다. 한국국학진흥원에서는 첨단 기술을 이용하여 국학 자료를 디지털화하여 다양하게 활용할 수 있는 콘텐츠를 제공하고 있다.
-03_“한국의 고문헌 디지털화” 중에서
고문헌 문장 분절은 한문학 영역에서는 ‘표점’이라고 하여 한문 전문가나 그에 준하는 실력을 가진 전문 인력들이 수작업으로 진행한다. 인공지능을 이용한 (자동)문장 분절의 경우는 문장 분절이라고도 한다. 고문헌 자료를 독해하기 위해 표점이 필요한 이유는 한문 문장의 구조를 빠르게 파악할 수 있기 때문이다. 한문 문장의 구조와 의미를 파악하기 위해서는 먼저 백문 상태의 한문 원문에 구두를 떼어 끊어 읽을 수 있어야 하는데, 한문은 본래 문장 부호가 없기 때문에 어떻게 구두를 떼느냐에 따라 전혀 다른 의미의 문장이 될 수 있다. 이렇게 구두점마다 현대식 문장 부호를 붙이는 것을 표점이라고 한다.
-06_“한자 문화권 AI 활용” 중에서
왕조 중심에서 생활의 면밀함을 추구하는 소재로 변화는 당시 일상을 보여 주는 개인의 기록에 주목하기 시작했다. 이 기록물은 시간을 넘나들며 현재를 살아가는 우리에게 공감대를 선사한다. 이 공감대는 곧 우리나라뿐 아니라 해외 시장에서도 글로벌 공감대를 형성하는데, 이는 과거의 기록이 우리의 일상과도 같은 모습이기 때문이다. 옛 기록에서 찾아낸 Kᐨ콘텐츠의 가치는 바로 시대를 뛰어넘는 유대감이다.
-09_“고문헌, K-콘텐츠의 동력” 중에서