내 목소리가 어떻게? 음성합성기술 | 조회수 | 22957 |
---|---|---|
안녕하세요~ 그린컴입니다. 어제가 바로 중복이었는데 다들 맛있는 음식 든든하게 챙겨드셨나요? 점점 무르익어가는 더위 잘 이기시길 바라면서 오늘은 우리 실생활에서 쉽게 마주할 수 있는 기술 하나 소개해드리려고 합니다.
다들 음성 합성 기술이라고 들어보셨나요? 음성 합성은 말 그대로 기계가 사람의 음성을 자동으로 분석, 합성하여 다시 말소리를 인위적으로 만들어내는 기술인데요. 지하철과 버스에서 들려오는 안내 목소리가 대표적인 음성 합성 시스템이라고 할 수 있습니다. 이 외에도 광고, 오디오북, 게임 등 다양한 분야에서 음성 합성이 많이 사용되고 있는데, 저 많은 내용을 성우가 과연 하나하나 녹음했을까 하는 생각도 들게 하는 만큼 요즘은 합성된 음성이 굉장히 부드럽고 자연스러워졌습니다. 예전의 음성 합성은 사전 녹음된 단어들을 쪼개고 조합해 음성을 만들어내는 단순 조합에 가까웠는데요. 현재는 빅데이터와 AI 기술이 접목되면서 기계가 사람의 목소리를 학습하고 톤, 어조까지 따라해내는 수준으로까지 발전하였습니다. 딥러닝을 기반으로 녹음된 발음을 학습하고 문장 부호, 문장 맥락까지 이해해 녹음되지 않은 음성까지 생성해낸다고 하니 얼마 있지 않아 합성된 음성과 실제 음성에 차이를 느끼지 못하는 수준까지 될 것 같네요.
현재에는 단 몇분, 몇시간의 음성 샘플만 있으면 특정인의 목소리를 구현할 수 있는 음성 합성이 가능한데요. 그렇기 때문에 다양한 방면에서 이 기술이 활용, 개발되고 있습니다. 플리토에서는 유명 인사가 SNS에 글을 작성하면 그 당사자의 목소리로 게시글을 들을 수 있는 기술이 개발되고 있는데요. 재미는 물론이고, 본인이 작성한 언어가 아닌 외국어로 번역되어서도 구현이 가능하다고 하니 해외 유명 인사들과의 소통도 이제 어렵지 않을 것 같습니다. KT에서는 동화 서비스인 '내 목소리 동화'를 최근 출시하였는데요. 이용자가 일정 문장을 녹음하면 기계가 음성 합성 기술을 통해 이용자의 목소리로 동화를 낭독해줍니다. 일하느라 아이와 보낼 시간이 부족해 소통 걱정이 많을 부모들의 짐을 조금 덜어줄 수 있을 것 같네요. 네이버는 지난 해 연예인의 합성된 음성을 AI스피커에 적용하기도 하였는데요. 예전부터 장난처럼 말해왔던 '내가 좋아하는 연예인이 날씨를 알려줬으면 좋겠다', 'AI스피커에서 연예인 목소리가 나왔으면 좋겠다'와 같은 이야기가 이제는 허무맹랑하지 않게 되었습니다.
최근에는 뇌신경 손상으로 인해 말을 하지 못하는 사람들의 생각을 언어로 변환시키는 기술도 나왔다고 하는데요. 언어 관련 뇌파, 발성기관(턱, 입술, 혀 등)들의 움직임 분석 등을 통해 음성을 만들어낼 수 있다고 합니다. 쉬운 단어, 문장의 경우에는 69%의 정확성을 보인다고 하는데 이 정도면 멀지 않은 미래에 생각을 음성으로 완벽하게 구현할 수 있을 것 같네요.
모든 기술의 발전에는 문제점이 따라오듯이, 특정인의 음성이 완벽하게 구현된다면 악용될 가능성이 높지 않을까 하는 걱정도 많이 있는데요. 보이스피싱에서부터 고위인사들의 음성 사칭 등 우리를 위협할 부분들이 쉽게 발생할 수 있습니다. 이에 대해서는 목소리의 주인공이 지정한 단말에서만 음성 사용 가능, 오디오 워터마크 새기기 등과 같은 해결법이 나오고 있다고 하는데요. 범죄와 관련될 수 있는 만큼 이 부분에 대해서는 계속 개발하고 철저하게 대처해야할 것 같습니다. 지금까지 음성 합성 기술에 대해서 이야기해보았는데요. 우리의 삶에 편리함을 줄 뿐만 아니라 장애가 있는 분들에게는 자신의 생각을 자유롭게 표현할 수 있는 방안을 만들어 주는 음성 합성 기술! 앞으로가 더욱 기대됩니다~ |