Your address will show here +12 34 56 78
news
[기사 원문 보기]




“회의가 끝나고 집에 갈 때 회의 내용이 자동으로 정리돼 메일함에 와 있으면 어떨까. 컴퓨터가 더 부지런히 일하고 그만큼 사람들은 더 여유를 가졌으면 하는 생각에서 출발했습니다.”

인공지능(AI) 기술개발회사 액션파워의 이지화 공동대표 겸 최고기술경영자(CTO)의 ‘다글로’ 출시 배경이다. 다글로는 AI 음성인식 받아쓰기 서비스다. 다글로 웹사이트에 녹음 파일을 업로드하면 AI 받아쓰기 모델이 음성을 텍스트로 자동 전환한다.

액션파워는 지난 2016년 설립 이후 2년 넘게 음성엔진 개발에 힘을 쏟았다. 이후 다글로 서비스를 내놨고 현재 영상회의 자동 받아쓰기 서비스 어텐드(Atend, https://atend.ai)를 개발, 론칭을 앞두고 있다.

다글로의 최대 장점은 정확도다. 음성인식 기술은 이미 대중화돼 있지만 전문 용어를 사용하는 현장에서 최종 문장 구현에 한계가 있었다.

다글로의 받아쓰기 정확도는 95% 수준에 달한다. 녹음 환경이 좋으면 정확도가 98%까지 올라간다. 또 받아쓰기 편집에 특화된 편집기를 제공해 세부적인 내용을 이용자가 스스로 보완해 완성할 수 있다. 편집기 내 수정을 거듭할수록 이용자의 단어 인식률이 높아지는 식이다.

이 대표는 “안타깝지만 아직은 AI가 사람을 뛰어넘지는 못한다. 100% 정확한 받아쓰기는 아니라는 의미”라며 “다글로 편집기를 활용하면 현재 재생 위치를 노래방처럼 파란색으로 표시해주고 단어마다 타임스탬프가 있어서 현재 편집 중인 위치를 즉시 재생해서 들어보는 동시에 수정할 수 있어 만족도가 높다”고 설명했다.

개발 과정이 순탄하지만은 않았다. 서비스 개발 속도를 내기 위해 외부 기술을 도입할지에 대한 고민도 깊었다. 그러나 외부 기술은 정확도가 낮고 운영 비용과 개발 유연성이 떨어지는 한계를 보였다.

이 대표는 “서비스 개발 속도가 늦어져 외부 기술을 도입한 적도 있다. 하지만 이용자 만족도가 낮았다. 조금 늦더라도 자체 기술을 개발해야겠다고 판단했다”면서 “이러한 결정을 잘했다고 생각하는 사례가 있는데 ‘음성인증’ 기술이 대표적”이라고 말했다.

음성인증은 받아쓰기할 때 화자분리 기술이 사용된다. 녹음 파일에서 누가 말한 것인지 분리해주는 기술인데 기반 기술을 확보하고 있어 이를 음성인증에도 유연하게 적용할 수 있었다. 현재 액션파워는 음성인증 기술 상용화를 위해 삼성금융그룹과 함께 개발을 진행하고 있다.

이 대표는 다글로 서비스를 시작으로 액션파워를 종합 AI 회사로 키울 생각이다. 다양한 환경에서 음성인식 정확도를 높이고 영상 분석까지도 AI 기술을 접목하기 위한 연구개발을 진행 중이다.

이 대표는 “동영상에서 음성이 가지는 정보 밀도가 매우 높아 음성인식 기술이 동영상 분석에도 큰 도움이 된다. 동영상을 빅데이터로 내용을 추출하고 검색할 수 있게 하는 연구를 진행하고 있다”며 “이러한 기술을 개량해 동영상 소셜 미디어에 공개된 모든 영상을 대상으로 텍스트화하고 빅데이터로 다뤄보고 싶다”고 전했다.

박효주기자 phj20@etnews.com
0

news
[기사 원문 보기]

[시사뉴스 홍은영 기자] 액션파워(조홍식, 이지화 공동대표)는 자체 개발한 인공지능 음성인식 엔진 ‘다글로’를 삼성물산 건설부문에 공급했다고 26일 밝혔다.

 

음성인식 엔진 다글로는 삼성물산에 특화되어 음성인식 받아쓰기의 정확도를 향상시켰다. 사내에서 자주 쓰이는 프로젝트 용어, 건설 용어, 약어 등의 특화 단어를 엔진에 반영하여 정확도를 높였고 임직원들은 원하는 부분의 음성을 들으며 편집할 수 있어 효율적으로 업무 내용을 정리할 수 있게 되었다. 이에 도입 초기부터 높은 만족도를 나타내고 있다.

 

 

액션파워 조홍식 공동대표는 “고객이 높은 만족도를 보인다는 것은 AI 음성인식 기술이 업무 효율을 높이는 것에 도움이 된다는 의미로 기술이 실제 업무에 활용할 수 있을 정도로 수준이 높아졌다는 것을 의미한다. 앞으로 더 많은 기업이 당사의 AI기술을 사용할 수 있도록 서비스 다각화 등의 노력을 할 것”이라고 말했다.

 

‘액션파워’는 인공지능 음성인식 자체기술을 개발한 딥테크 기업으로,  원천기술을 바탕으로 화자인증, 자연어처리 및 표정인식 등으로 영역을 넓히고 있다. 2019년 4월에 출시된 다글로는 국내 최초 AI 음성인식 B2C서비스로, 도메인별 음성인식 엔진 특화전략으로 높은 정확도를 달성함으로써 경쟁사와 차별화하고 있다. 

0

news

[기사 원문 보기]


액션파워 “들리는 모든 언어 다 글로 바꾼다”

AI 음성인식 받아쓰기 서비스 ‘다글로’ 서비스



코로나19로 재택근무와 온라인 수업 등 비대면 업무가 일상화되고 있다.

비대면 업무는 출퇴근 시간 등 불필요한 시간 낭비를 줄였지만, 달라진 업무공간 등으로 집중력이 저하되어 업무 효율이 감소할 수 있다는 단점도 지적되고 있다.

특히 화상회의, 온라인강의 등 영상과 음성 기반 활동 증가로 이를 텍스트로 전환하는 업무 부담이 증가하고 있다. 이러한 부담을 줄이고 업무 효율 향상을 위한 인공지능(AI) 기술을 도입하는 기업이 늘어나는 추세다.



조홍식 액션파워 대표는 재택근무 및 원격수업의 효율 향상을 위해 AI 음성인식 받아쓰기 서비스 ‘다글로’를 도입하는 사례가 급증하고 있다고 5일 밝혔다.

다글로는 액션파워가 음성인식 엔진을 기반으로 개발한 AI 음성인식 받아쓰기 서비스다.

화상회의, 원격 수업을 비롯해 스마트폰을 이용한 녹음 등 다양한 분야에서 음성을 활용한 업무가 늘고 있다. 이를 분석하거나 실무에 적용하기 위해 문서화하는 업무 부담이 높다는 점에서 착안했다.

조 대표는 “한 시간 이상 녹음 내용을 글로 받아쓰려면 1.5배 이상의 시간이 소요되며 이를 처리하는 담당자의 업무 부하도 상당하다”라며 “다글로는 음성 내용의 절반 정도만에 작업을 완료하며, 사람의 업무 부담도 최소화할 수 있다”라고 설명했다.

버트(BERT), GPT 등 주요 AI 언어모델과 자체 개발한 자동음성인식 기술을 바탕으로 화상회의, 전화통화, 강연, 뉴스, 법률강의, 인터뷰 등 도메인별 특화엔진과 학습을 통해 영상의 특성이나 주제를 빠르게 파악하고 정확성을 높였다.

조홍식 대표는 “많은 업무가 비대면으로 이뤄지면서 음성과 영상 기반으로 내용이 오간다”라며 “음성과 영상은 빠르고 쉽게 메시지를 전당할 수 있지만 관리나 데이터화가 어려워 텍스트전환이 필수적”이라고 설명했다.

이어서 그는 “하지만 음성을 텍스트로 전환하는 과정은 많은 시간을 소모하고, 업무량도 적지 않아 이를 개선할 방법이 필요했다”며 “이를 AI가 대신 처리하면 불필요한 업무를 개선할 수 있다”고 말했다.

액션파워는 국내 시장에 맞춰 한국어 관련 정보를 집중적으로 학습시켜 해외 AI서비스에 비해 국내 환경에서 더욱 높은 정확성을 보인다.

액션파워에서 공개한 바에 따르면 뉴스 영상을 분석했을 때 구글은 약 7.3%의 오류율을 기록한 반면, 다글로는 약 1.6% 수준에 그쳤다.

다글로는 단순히 음성을 텍스트로 전환하는 것을 넘어 띄어쓰기, 맞춤법검사, 문장 부호 생성까지 지원하며, 문장 및 문단의 긍정, 부정 등의 감정지수 산출, 유사도 및 키워드 추출 등 음성을 기반으로 한 분석 기능까지 함께 제공한다.

더불어 화상회의, 인터뷰, 상담 등 다수가 참여해 말이 오가는 상황에서도 누가 말을 했는지 분리해 텍스트를 정리할 수 있는 화자분리 기술이 적용됐다.

액션파워는 비대면 일상을 중심으로 확대되는 음성인식 시장 추세에 따라 다글로를 중심으로 사업을 확대할 계획이다. 이를 위해 블라블라이엔엠, 리틀송뮤직 등 음성 기반 콘텐츠 솔루션 기업과 협업을 진행 중이다.

액션파워 조흥식 CEO는 “연내에 음성을 비롯해 화상회의 전체 내용을 인식해 문서화하는 원스탑 서비스를 출시하려 한다”며 “앞으로 음성 인식 외에도 AI기술을 일상생활에 접목시켜 삶의 질 개선에 기여하고 싶다”라고 말했다.


남혁우 기자firstblood@zdnet.co.kr

0