음성녹음을 텍스트로, 네이버 클로바 AI를 활용한 클로바 노트

 네이버에서 운영 중인 클로바 AI를 기반으로 한 음성 기록 관리 서비스이다. 회의, 강연, 대화 등 다양한 환경에 맞춰 화자의 음성 데이터를 수집해 저장한 다음 이를 텍스트로 변환해준다. 지금까지는 음성 녹음 후 작업자가 직접 타이핑해야 했던 수고를 덜어주고 AI 분석을 바탕으로 키워드 추출과 내용 요약도 해준다.

 현재 클로바 노트는 베타 서비스 중으로 가입 후 300분의 사용 시간을 기본으로 제공하고 서비스 품질 향상을 위한 사용기록 데이터 제공에 동의하면 300분을 추가로 제공한다. 서비스를 지속적으로 사용해 일정 시간 이상 사용량을 기록할 때마다 100분의 추가시간도 제공하고 있다. 인식 가능한 언어는 한국어, 영어, 일본어, 중국어 총 4가지이며 모바일 기기 2대를 연결하여 관리할 수 있다. 네이버 계정을 통해 로그인할 수 있으며 동일 계정으로 PC 환경에서 녹음된 노트들을 관리할 수 있다.



 사용 방법은 간단하다. 애플리케이션 실행 후 하단의 '+' 버튼을 누르면 새 노트를 만들 수 있고 '음성 녹음'과 '파일 업로드' 둘 중 하나를 선택하면 된다. 음성 녹음의 즉각적인 현장의 음성을 녹음한 다음 노트로 변환해주며 파일 업로드는 기존 파일을 노트로 변환해준다. 노트로 변환할 때에는 별도의 조작 없이 AI가 자동으로 음성 데이터를 텍스트 데이터로 변환해주며 이 때, 참석자의 목소리를 인식하여 누구의 음성 데이터인지 구분해준다.




 생성된 노트의 화면을 보자. 먼저 제일 상단에는 순서대로 텍스트 편집, 검색, 점유율 분석, 공유 등의 기능을 제공한다. 다음으로 노트가 생성된 시간과 기록 시간, 노트의 제목을 확인할 수 있다. 노트의 제목은 사용자가 수정할 수 있다. 그 아래에는 AI 분석을 통한 주요 키워드를 확인할 수도 있다. 다음으로 '음성 기록'에서는 화자가 했던 말을 전부 텍스트로 살펴볼 수 있으며 텍스트 클릭 시 해당 구간 화자가 했던 말이 재생된다. 또한 길게 누르면 해당 구간에 메모, 북마크를 추가할 수 있으며 하이라이트 표시, 텍스트 수정과 같은 편집 기능을 사용할 수 있다. 텍스트 클릭 외에도 화면 하단에 있는 재생 컨트롤러를 통해 배속, 일시정지, 건너뛰기 등의 기능을 사용할 수 있다. 한편, 노트의 '메모'에서는 AI 핵심 내용 요약과 메모 기능이 있다. 핵심 요약 기능의 경우 AI 분석을 통해 중요 구간을 식별하고 해당 구간의 내용을 요약해준다. 

 이처럼 클로바 노트는 간단한 UI와 AI 기술을 바탕으로 사용자의 음성 기록에 큰 편리함을 주고 있지만 아직 정확성에 있어서는 발전이 필요할 것으로 보인다. 애플리케이션을 사용하다 보면 종종 볼 수 있는 문구가 '사용할수록 점점 더 똑똑해진다'는 말이다. 해당 문구의 함축적 의미는 결국 아직 충분한 지능을 갖추지 못했다는 것으로 실제 사용해보면 종종 변환된 텍스트에서 오류를 발견할 수 있다. 특히, 영어와 한글과 같이 두 개 이상의 언어를 혼합 사용할 때 제대로 인식하지 못하는 경우가 많았으며 영어 약자와 같은 전문 용어에 대한 인식에도 어려움이 있었다. 다만, 인공지능이 축적된 데이터를 바탕으로 꾸준한 학습을 통해 지능을 얻는 점에서 많은 사용자들이 지속적으로 사용하면 언젠가 높은 수준의 정확성을 보일 것으로 예상된다.

Comments

Popular posts from this blog

Machine Learning vs. Deep Learning: What’s the Real Difference?

Conquering the Bullwhip: How Information Sharing Transforms Supply Chains

저작권 문제 없는 무료 이미지 사이트, 'Pixabay'