본문 바로가기

그냥 블로그

영어 인터뷰 텍스트 변환 테스트 (otter, clovanote)

반응형

otter.ai는 영어권에서 꽤 잘 나가는 AI 기반 음성 텍스트 변환 도구입니다. 단순하게 텍스트 변환만 해주는 건 아니고 키워드를 추출해서 어떤 키워드에 집중해야 하는지 사용자가 알 수 있게 합니다.

 

하지만 영어권 도구들의 단점은 한국어 처리죠. 그래서 클로바노트가 국내에서는 주목받고 있죠. 클로바노트는 한국어뿐 아니라 영어, 일본어도 처리해주니깐~

https://otter.ai/

https://clovanote.naver.com/

 

무료로 사용할 경우 otter.ai나 클로바노트 모두 600분을 제공합니다. 클로바노트는 뭔가 베타 뭐 그런 게 있긴 한데 대충 한 달에 그 정도 쓸 수 있다고 보면 됩니다. otter.ai는 한 건당 30분만 처리할 수 있습니다. 클로바노트는 180분까지 지원해줍니다. 그래서 녹음 시간이 긴 경우 otter.ai는 잘라서 요청해야 합니다.

 

가장 중요한 건 텍스트를 얼마나 잘 처리해주는가니깐. 두 개를 비교해보죠.

음성 데이터는 팟캐스트를 녹음한 파일입니다. 아마도 전화 인터뷰인지 진행자 목소리는 또렷한데 상대방 목소리는 살짝 노이즈가 있고 작습니다.

https://www.outsystems.com/overlays/decoded-podcast/s3/episode12/

 

첫 번째는 진행자가 길게 에피소드를 소개합니다. 말이 끊어지지 않기 때문에 텍스트 변환 시에도 끊을 필요는 없습니다.

otter.ai: 적절하게 문장 기호를 사용하고 회사명을 정확하게 표기합니다.

 

클로바노트: 문장 기호를 사용하지 않고 줄 바꿈의 기준도 애매합니다. 회사명을 잘 이해하지 못합니다(이건 판단하는 데이터의 문제일지도). 적절한 시점에 알아서 줄 바꿈을 해주는 건 편할 수도 있겠네요. 하지만 아래처럼 기준이 없다면 가독성이 더 떨어집니다.

 

정확성은 둘 다 아주 정확하지는 않습니다. 

아래의 경우에는 클로바 노트가 비교적 정확하게 잡아냈습니다.

concentration이 아니라 content creation이 맞습니다.

 

애매한 텍스트는 수정하는 기능을 제공합니다. 

otter.ai는 편집 단축키를 다양하게 지원하고 편집 모드에서는 바로 마우스로 원하는 부분을 찍어서 편집할 수 있습니다.

클로바 노트도 편집 모드는 지원하지만 단축키 지원은 확인이 되지 않네요.

 

728x90