기록관리 AI ‘다글로’, 압도적 STT 성능으로 '위스퍼(Whisper)'와 격차 벌렸다!

인공지능신문2023-06-24
기사 원문 보기 >
article image

다른 음성변환 서비스와의 가장 큰 차별점은 멀티모달(Multi-modal) 지원이다. 대표적으로, 영상 파일을 업로드하거나 유튜브 링크를 붙여 넣으면, 바로 영상의 음성을 원고로 생성한다. 뿐만 아니라 크롬 확장 프로그램으로 다글로를 설치할 수 있어서, 유튜브 영상을 시청하면서 바로 다글로로 텍스트 변환을 시작 멀티모달 인공지능 스타트업 액션파워(공동대표 조홍식, 이지화)가 기록관리 AI 서비스 ‘다글로’의 성능을 크게 개선하며 최강자의 위용을 드러냈다. ‘음성기록 관리의 혁명’이라는 평가를 받으며 30만 이상의 회원에게 회의, 통화, 강의 영상을 텍스트로 변환하고 정리해주는 서비스를 제공해 온 다글로는 이번 모델 업그레이드를 통해 업계 최고 수준의 성능을 다시 한번 입증했다. 이번 성능 개선의 핵심은 크게 세 가지다. 우선, STT(Speech-to-Text) 모델 자체의 크기를 확대해서 음성인식 정확도 자체를 100%에 가깝게 개선했다. 또한, VAD(음성 감지) 기능을 크게 높여서 여러 사람의 대화에서도 목소리를 정확하게 분리해 낸다. 마지막으로, 숫자와 영어 발음까지 명확하게 표시하도록 함으로써 ‘거의 완벽한’ 텍스트 변환에 가독성까지 높인 결과를 도출하게 됐다. 이로써 다글로는, 한국어와 영어 음성변환이 모두 최고 수준인 동시에 정교한 화자 분리까지 지원한다는 점에서 오픈AI (OpenAI)의 음성 인식 시스템 위스퍼(Whisper)와 격차를 더욱 크게 벌릴 수 있을 것으로 보인다. 다글로가 지향하는 궁극적인 가치는 ‘사람이 손대지 않아도 대화와 영상, 음성 기록이 알아서 정리되는 것’이다. 이를 위해 지속적으로 다양한 기술을 적용하면서 사용성을 높이고 있다. 다른 음성변환 서비스와의 가장 큰 차별점은 멀티모달(Multi-modal) 지원이다. 대표적으로, 영상 파일을 업로드하거나 유튜브 링크를 붙여 넣으면, 바로 영상의 음성을 원고로 생성한다. 뿐만 아니라 크롬 확장 프로그램으로 다글로를 설치할 수 있어서, 유튜브 영상을 시청하면서 바로 다글로로 텍스트 변환을 시작할 수 있다. 긴 영상에서 빠르게 중요한 부분만 파악하고 싶거나 강의 영상을 원고로 함께 보기 원하는 사용자들에게 많은 사랑을 받고 있는 기능이다. 또한 변환 결과는 일반 문서 파일뿐 아니라 자막 파일로도 바로 다운로드할 수 있다. 상반기 마지막 업데이트 예정인 기능은 통화 내용을 바로 텍스트로 변환하고 보여주는 것이다. 이 많은 기능들은 AI의 가치에 대한 명확한 철학과 강력한 기술역량으로부터 나온다. 이지화 공동대표(CTO)는, “AI는 인간의 시간과 노력을 아껴준다는 점에서 가치가 있다. 신기하고 재미있는 유행이 아니라, 진짜로 사람에게 도움이 되는 기술에만 집중하고 있다"라며 "감당할 수 없이 많은 정보와 대화들이 오가는 이 세상에서 다글로가 제공하는 ‘정리’라는 가치는 그래서 중요하다”며 신념을 밝혔다. 액션파워의 초점은 개발 막바지 단계인 자체 LLM 상용화에 맞춰져 있다. 지금 다글로는 원고를 생성하고 키워드를 뽑아주고 요약을 해준다. 그리고 앞으로는 회의 후 실행할 일들과 다음 일정까지 정리해서 알려주고, 영상에서는 가장 많이 시청된 부분만 따로 뽑아서 요약해 줄 것이다. 다글로는 우리 모두의 일상을 위한 진짜 ‘AI assistant(조수)’로 성장하고 있다. 한편, 액션파워는 인공지능 지식관리 앱 ‘다글로’를 중심으로, 국내 최고 수준의 NLP, ASR 원천 기술 연구와 서비스 개발을 동시에 추구해 왔으며 최근 비전 분야로 영역을 넓히면서, 지난 4일부터 10일까지 그리스 로도스 섬에서 열렸던 IEEE 음향, 음성 및 신호 처리국제회의(ICASSP 2023)와 7월 9일부터 14일까지 캐나다 토론토에서 열리는 ACL 2023(컴퓨터언어학협회), 8월 20일부터 24일까지 아일랜드 더블린에서 개최되는 세계 최고 권위의 학회인 INTERSPEECH 2023(인스피치, 음성신호처리학회) 등 인공지능(AI) 분야 글로벌 최고학회에 연이어 채택, 인공지능 기술력을 확인했다. 아울러 우수한 AI 기술력 기반으로 국내 특허 21개, 해외 특허 2개를 보유하고 있으며, 출원중인 특허도 국내 18건, 해외 11건으로 기술 기업으로서의 핵심 경쟁력을 빠르게 강화하고 있다.

Editor박현진
actionpower logo