Your address will show here +12 34 56 78
news

기사 원문보기

액션파워, 다글로 출시 1주년 기념 이벤트 실시
내달 전화통화 특화 엔진 출시 예정

액션파워가 인공지능 음성인식 받아쓰기 서비스 ‘다글로(Daglo)’의 서비스 1주년을 기념해 고객 감사 이벤트를 펼친다.

기존 가입고객 및 4월 말까지 다글로에 가입한 고객이 이용 후기를 작성하고, 지정 해시태그를 적어 공유하면 추첨을 통해 백화점 상품권, 음료 기프티콘, 다글로 무료포인트를 선물한다.

다글로는 지난 2019년 4월 출시 이후 사용자 수가 지속적으로 증가 추세를 보여왔다. 회사에 따르면 최근 코로나19 사태로 인해 업무용으로 비대면 회의가 증가하고, 주요 대학 및 초중고의 수업이 원격강의로 진행됨에 따라 회의록 작성, 강의 자막 제작 및 강의록 작성을 편리하게 하기 위해 다글로를 찾는 사용자가 가파르게 늘고 있다.

다글로는 자체 개발한 엔진을 통해 분야별로 특화시켜 음성 파일, 동영상 파일, 유튜브 링크의 음성을 텍스트로 바꿔주는 서비스이다. 특히 분야별 특화엔진을 개발함으로써 정확도를 개선했고, 다른 음성인식 업체와 차별화를 하고 있다. 현재 강연, 1:1 인터뷰 및 상담, 뉴스, 의회, 법률강의, 교회설교, 일반으로 총 7개의 특화엔진을 운영 중이다.

결과물은 자체 개발한 편집기를 이용해 쉽게 교정할 수 있으며 자막파일, 텍스트 파일 등 다양한 형식으로 다운로드해 사용할 수 있다.

특히 액션파워는 지속적으로 특화 분야를 확장할 방침이며, 5월 중에는 전화통화에 특화된 엔진을 출시할 예정이다.

0

news, Uncategorized

기사 원문보기

자연어처리 기술 스타트업 ‘액션파워’는 인공지능(AI) 음성인식 받아쓰기 서비스 ‘다글로’의 출시 1주년을 기념해 고객 감사 프로모션을 진행한다고 10일 밝혔다.
이날부터 오는 30일까지 기존 가입 고객 및 다글로에 새로 가입한 고객이 이용 후기를 작성하고, 지정 해시태그를 적어 공유하면 추첨을 통해 백화점 상품권, 음료 기프티콘, 다글로 무료포인트를 제공한다.

지난 2019년 4월 출시된 다글로(Daglo)는 AI가 음성을 인식해 알아서 텍스트로 바꿔주는 서비스다. 최근 코로나19 사태로 ‘언택트 경제’가 확산하면서 ‘AI 받아쓰기’를 찾는 수요가 증가하고 있다. 회사 측에 따르면 업무용으로 비대면 회의가 증가하고, 주요 대학 및 초중고의 수업이 원격강의로 진행됨에 따라 회의록 작성, 강의 자막 제작 및 강의록 작성을 편리하게 하기 위해 다글로를 찾는 사용자가 가파르게 늘고 있다.

액션파워는 음성 파일, 동영상 파일, 유튜브 링크 등 분야별 특화엔진을 자체 개발해 다글로 서비스의 정확도를 높였다. 현재 강연, 1:1 인터뷰 및 상담, 뉴스, 의회, 법률강의, 교회설교, 일반으로 총 7개의 특화엔진을 운영 중이다. 결과물은 자체 개발한 편집기를 이용해 쉽게 교정할 수 있으며 자막파일, 텍스트 파일 등 다양한 형식으로 다운로드해 사용할 수 있다.

액션파워 관계자는 “지속적으로 특화 분야를 확장할 것이며, 5월 중에는 전화통화에 특화된 엔진을 출시할 예정이다”라고 밝혔다.

0

news, Uncategorized

기사 원문보기

액션파워 서비스 다글로, 코로나19로 비대면 늘자 사용량 증가

코로나19로 인해 주요 기업들의 재택근무가 확산되고 학교 개학이 연기돼 온라인 강의로 대체됨에 따라 새로운 혁신 기술이 각광받고 있다.

업계에 따르면 재택근무자들은 화상이나 전화 등 비대면 회의로 대체하고 있으며, 회의록 작성에 인공지능(AI) 음성인식 기술을 이용하고 있다. 회의에 참석하지 못하는 경우에도 AI로 작성된 회의록을 통해 참석자와 논의 내용을 확인할 수 있고, 기업에서는 작업일지 등의 기록으로 대체하는 사례가 늘고 있다.

주요 대학들의 강의도 실시간 또는 비실시간 온라인으로 진행하고 있어, 강의 준비를 위한 자막 작업과 강의내용을 필기하는데 음성인식 기술이 사용되고 있다.

음성인식 기술은 그동안 낮은 인식률 등으로 적용되는 사례가 많지 않았다. 하지만 최근 머신러닝 등 최신 기술이 도입되면서 정확도가 급격히 개선되어 실제 사용사례가 늘어나고 있다.

실제로 액션파워가 제공하는 인공지능 받아쓰기 서비스 ‘다글로’의 경우 자체개발한 엔진을 통해 분야별 특화시킨 서비스를 개발함으로써 정확도를 개선시켰다. 현재 강연, 1:1상담 및 인터뷰, 교회설교, 뉴스, 법률강의, 의회로 특화된 받아쓰기 서비스를 제공하고 있으며 정부기관, 대학, 교회, 대기업 콜센터에서 활용 중이다.

다글로는 음성파일이나 동영상파일, 유튜브 영상 링크주소를 입력하면 글로 변환해 준다. 자체 개발한 편집기를 이용해 손쉽게 교정할 수 있다. 또 한글, 워드 및 자막파일 등 원하는 파일로 다운받을 수 있다.

0

news

기사 원문보기

인공지능 음성인식 및 자연어처리 스타트업 ‘액션파워(공동대표 이지화, 조홍식)’가 하나벤처스 ‘하나디지털트랜스포메이션펀드’로부터 첫번째 투자를 유치했다.

사회 전반적으로 스마트폰 녹음 기능이 보편화되면서 여러 상황에서 중요한 내용을 녹음하는 경우가 많아지고 있다. 또한, 비즈니스 회의는 물론 법률상담, 교회 설교, 방송뉴스에 이르기까지 사람들은 다양한 상황에서 녹음 기능을 사용하고 있는 경우가 더 이상 생소하지 않다. 하지만 현실은 1시간짜리 녹음 내용을 다시 듣기 위해선 또다시 1시간을 소모해야 하며, 이것을 한글(텍스트)로 다시 표기하려면 서너 번은 반복해서 듣고 옮겨 적어야 하여 1시간짜리 녹음 내용을 한글(텍스트)로 표기하려면 총 3∼4시간을 소비해야 한다. 더 나아가 단순히 표기뿐만 아니라 녹음된 파일은 검색을 할 수 없어 녹음 파일만으로는 데이터로써 가치 있게 활용하기가 어렵다.

음성을 실시간으로 인식, 답변하는 서비스 및 기기는 점차 대중화되고 있으며 네이버, 카카오를 비롯 SK텔레콤, KT, LG유플러스가 인공지능(AI) 스피커를 서비스 중에 있다. 작년부터 국내 이동통신사와 인터넷 기업들이 출시한 인공지능 스피커가 10종을 넘어섰지만, 제품 가짓수는 늘어나도 성능이 대동소이하고, 제품 디자인 외에는 크게 만족할 만한 기능이 없다는 소비자들의 불만이 커지고 있다. 이들 인공지능 스피커는 명령어를 제대로 알아듣지 못하거나, 때로는 기기를 부르지 않았는데도 인공지능 스피커가 응답한다.

인공지능 시장은 이렇게 부정확하고 불완전한 기기를 판매하는 수준이며, 상당 시간 분량의 한국어 음성파일을 한글(텍스트)로 변환시켜주는 인공지능 서비스는 찾기 힘들다. 액션파워는 바로 여기서 차별화를 만들고 있다.

2016년 설립된 액션파워는 인공지능 음성인식 기술과 자연어처리를 비롯한 인공지능기술을 자체 개발하는 기술 기반 스타트업으로, 인공지능 기술을 활용해서 다양한 서비스를 제공하고 실생활에 새로운 가치를 만들어내는 것을 목표로 하고 있다.

주요 연구진은 서울대학교 컴퓨터공학 석박사로 구성되어 있으며 자체적으로 음성인식 기술과 자연어 처리 기술을 개발하여 보유하고 있다. 음성인식 기술은 최신 머신러닝 기술 외에도 전처리, 후처리 등 매우 복잡하고 다양한 하위 기반기술을 필요로 하기 때문에 구글, 네이버 등 대기업을 제외하면 해당 기술을 자체적으로 보유한 국내 스타트업은 많지 않은 것으로 알려져 있다.

액션파워는 이런 국내 환경에서 2018년 1월 ‘리뷰와이저’(음성파일 자동 받아쓰기 웹 서비스)를 출시했으며, 2019년 4월 리뷰와이저를 업그레이드시킨 ‘다글로’ 서비스를 출시했다. 이 업그레이드된 서비스에는 키워드 검색 기능은 물론, 재생 중인 단어 표시, 재생 속도 조절, 현재 커서 위치를 재생해주는 단축키, 강조, 글 꾸미기, 화자 표시 기능 등 다양한 기능이 추가되었다. 현재 이렇게 자체 개발한 기술의 정확도는 최대 95%에 달하며 내부적으로 테스트해본 결과 구글이 지금까지 내놓은 음성인식 텍스트 변환 서비스는 60~70%대 수준에 머무르고 있다. 액션파워는 앞으로도 이 기술을 활용해 법률, 교육, 의료 등 다양한 분야별로 최적화된 음성인식 엔진을 개발/공급할 계획을 가지고 있다.

액션파워 투자를 주도한 최석원 하나벤처스 수석심사역은 “전 세계적으로 인공지능 관련한 개발 및 투자가 활발하게 이루어지고 있지만 한국은 정부의 육성정책에도 불구하고 아직도 관련 기술 인프라 및 전문가가 부족한 상황이다”며 “하지만 액션파워는 스타트업임에도 불구하고 한국어 음성인식 및 자연어처리 영역에서 대기업과 어깨를 나란히 할 수 있는 기술을 이미 자체 개발하였고 고객들의 지불도 이끌어내었다. 이런 실력과 경험을 바탕으로 액션파워는 앞으로 더 큰 전문영역을 구축할 수 있을 거로 본다”라고 밝혔다.

이지화, 조홍식 액션파워 공동대표는 “이번 투자를 통해 하나금융그룹과의 전략적 협업 관계를 모색하는 한편, 뛰어난 인재 영입에 더욱 힘을 쏟아 다소 정체되어있던 인공지능 음성인식 기술의 새로운 패러다임을 이끌어 내는 데 앞장설 것”이라고 전했다.

0

news

기사 원문보기

조홍식·이지화 액션파워 공동대표 인터뷰

음성파일 AI가 자동으로 바꾸는 ‘다글로’ 서비스
"다글로 시작으로 종합 AI 기업으로 만들겠다"

"인공지능(AI) 스피커라고 해도 날씨를 묻거나 음악을 트는 정도 외에는 사용도가 떨어지잖아요. 음성인식 정확도를 높이면 전문 영역에서도 쓰일 수 있겠다는 생각을 했죠."

AI 기술개발회사 ‘액션파워’의 조홍식(36)·이지화(34) 공동대표가 밝힌 음성인식 및 자연어처리 기반 AI 받아쓰기 서비스 ‘다글로’ 출시 배경이다. 이름에서 알 수 있듯 다글로는 음성 파일을 업로드하면 텍스트로 자동 전환하는 웹서비스.

다글로는 올해 4월 액션파워가 사실상 처음 내놓은 서비스 모델이다. 조 대표와 이 대표는 액션파워가 음성 AI의 핵심 알고리즘을 개발하고 연구하는 스타트업인 만큼 사람들이 실생활에서 편리하게 쓰는 데 초점을 맞추고 싶었다고 했다.

액션파워는 자체 음성인식 엔진을 보유하고 있는 탄탄한 스타트업이다. 지난 2016년 액션파워 첫 설립 이후 2년 넘게 음성엔진 개발에 힘 쏟았다. 사원 12명 가운데 10명이 음성인식 AI를 연구하는 개발자다.

처음에는 구글 등 잘 만들어진 음성엔진을 사용하는 방안도 생각해봤다. 이 대표는 "처음에는 이미 만들어진 음성 엔진을 써봤는데, 그걸 기반으로 테스트하면 아무도 만족하지 못할 것이란 결론을 내렸다"고 전했다.

액션파워는 대신 자체 개발 엔진으로 특화된 AI 받아쓰기 서비스인 다글로를 시작했다. △강연 △뉴스·시사 △교회·설교 △법률·강의 등에 적용할 수 있다. 다글로의 받아쓰기 정확도는 95% 수준에 달한다. 녹음 환경이 좋으면 정확도가 98%까지 올라간다.

이용자들 반응도 좋다. 조 대표는 "교회·설교 서비스를 사용한 이용자가 ‘다글로가 예수님 다음으로 좋다’고 극찬한 적도 있다"며 웃어보였다. "이제 서비스를 하나씩 만들어가는 단계에서 그런 피드백이 오니 너무 기분 좋았다"고도 했다.

액션파워에 근무하는 인공지능 연구개발진 모습/사진=액션파워

개발 과정이 순탄하지만은 않았다. 자금이 넉넉하지 않은 창업 초기 만났던 스마일게이트의 스타트업 창업지원센터 ‘오렌지 팜’이 큰 힘이 됐다. 조 대표는 "오렌지 팜은 친정 같은 곳이다. 제일 힘들고 아껴야 할 창업 초기 단계에서 선발돼 1년6개월가량의 입주기간 많은 도움을 받았다"고 귀띔했다.

액션파워는 지금도 자체 음성 AI 엔진 기술을 바탕으로 특화 서비스를 개발 중이다. 단 특화 서비스 외에 카페, 외부 등 일반적 음성파일 인식률이 저조한 부분은 풀어야 할 숙제다. 이 대표는 "외부 소음이 많은 음성파일에 대한 데이터 학습이 적어 생기는 문제다. 시간과 공을 들여 열심히 데이터를 쌓고 있어 극복할 수 있을 것"이라고 강조했다.

조 대표와 이 대표는 다글로 서비스를 시작으로 액션파워를 ‘종합 AI 회사’로 키울 생각이다. 현재 웹서비스 중인 다글로는 조만간 모바일 프리미엄 서비스도 내놓는다.

조 대표와 이 대표는 "계속 새로운 서비스를 준비하면서 고객들에게 이득을 줄 수 있는 회사, AI로 가치를 만들어내는 회사로 만들어가고 싶다"며 "우수 AI 개발 인력들이 자유롭게 모여 즐겁고 재밌게 일하면서 국가경쟁력에도 이바지할 수 있는 회사가 되길 희망한다"고 전했다.

0

news

기사 원문보기

녹음된 음성파일을 인공지능(AI)이 사람 대신 알아듣고 직접 텍스트로 적어주는 시대가 왔다.

AI 음성인식 및 자연어처리 기술 기반 스타트업 액션파워가 내놓은 AI 받아쓰기 서비스 ‘다글로’가 진화를 거듭하고 있다.

다글로는 크롬 브라우저에 최적화된 웹 기반 서비스다. 음성 파일을 업로드하면 자동으로 텍스트로 전환해 준다. 스마트폰 등의 발달로 녹음이 쉬워지면서 다양한 상황이 녹음되고 활용되는 일이 잦아졌지만 정작 이를 텍스트화 하는 일이 쉽지 않다는 점에 착안해 개발됐다.

가령, 60분 간의 상황이 녹음된 내용을 사람이 글로 받아쓰려면 그 이상의 시간이 소요된다. 다글로가 녹음 파일을 텍스트로 변환하는 시간은 음성 파일 길이의 절반 정도다. 한시간 분량의 녹음파일이라면 30분 만에 작업이 완료되는 것.

액션파워는 딥러닝 기술을 통해 각 도메인 별로 특화된 음성인식 엔진을 만드어 업무용으로 사용 가능할 정도의 정확도와 기술력을 다글로에 구축했다고 설명했다. 다글로의 음성인식 엔진 정확도는 좋은 조건의 녹음인 경우 최대 95%에 이른다.

액션파워는 최근 강연과 뉴스를 녹음한 음성파일을 글자로 받아적을 수 있는 확장 버전을 다글로에 적용했으며, 유튜브 링크 받아쓰기 기능도 탑재했다. 앞으로도 녹음 환경에 특화된 엔진을 지속적으로 출시하고, 모바일 프리미엄 서비스도 조만간 공개할 계획이다.

조홍식, 이지화 액션파워 공동대표는 "AI 기술이 다양한 방법과 목적으로 사용될 수 있도록 하겠다"며 "사람들의 삶에 가치를 더할 수 있는 AI 회사가 될 수 있게 노력하겠다"고 전했다.

0

news

기사 원문보기

7일 민간 전문가로 구성된 ‘AI·제조데이터 전략위원회’ 개최
김문겸 숭실대 교수, 홍태영 한국과학기술 정보연구원 센터장 등 포함
AI 분석모델 경연대회 등 세부 운영 방안 논의 예정

[이데일리 권오석 기자] “스마트공장 보급을 추진함에 있어 레벨 1·2·3를 거쳐 레벨 5에 이르는 과정을 어떻게 조직적으로 이끌지가 중요한 과제입니다”

7일 중소벤처기업부(이하 중기부)가 민간 전문가로 구성된 ‘AI·제조데이터 전략위원회(이하 전략위원회)’를 발족, 향후 제조 데이터센터 설립의 윤곽이 드러날 것으로 보인다. 이날 전략위원회 첫 회의를 개최한 박영선 중기부 장관은 “AI·데이터 기반 제조혁신을 위해 중소·벤처기업 전용 데이터 인프라를 구축할 필요가 있다”고 역설했다.

중기부에 따르면, 제조데이터는 제품의 기획에서 설계·제조·유통 및 마케팅에 이르는 전 과정의 데이터를 말한다. 제품설계와 공정, 품질 최적화, 신제품 개발 등에 활용되는 미래 핵심 자원으로 이미 글로벌 기업을 중심으로 활용이 증가하고 있다. 그러나 자금과 인력이 부족한 중소기업은 스마트공장을 도입하고도 제조 데이터를 수집·분석하기 어려운 상황이다.

이에 중기부는 창업벤처혁신실장을 위원장으로 유관기관, 전문가, 기업인 등 20인 내외로 전략위원회를 구성했다. 여기에는 김문겸 숭실대 교수를 비롯해 노가희 액션파워 CPO, 홍태영 한국과학기술정보연구원 센터장 등이 포함됐다.

아울러 중기부는 △정책·거버넌스 △제도 △인프라 △서비스 분과 등 4개의 분과위원회(7인 내외)를 만들고 분과별로 수시 회의를 개최한다. 가령 정책·거버넌스 분과위는 제조 AI 활용 유관기관 협력체계 마련 및 정책방향 설정 프로젝트를 맡으며, 제도 분과위는 데이터 유통·거래·활용을 촉진하기 위한 제도기반 마련에 매진한다.

여기에 인프라 분과위는 공정·제품 생산과정을 획기적으로 개선할 수 있는 AI 클라우드 인프라 구축방안을 만들기로 했다. 서비스 분과위는 향후 AI 분석모델 경연대회 운영 방안 등 시장창출 및 생태계 활성화를 위한 대책을 고민한다.

이외에도 전략위원회는 제조 선도국(독일, 미국 등)과 기술교류 및 협력을 추진하며 데이터 제공기업에 대한 인센티브 제공, 제조데이터 유통·거래를 위한 가이드라인 설립 등 다양한 영역에서 활동을 개시한다. 이에 중기부는 내년 정부예산(안)에 중소·벤처기업 전용 제조 데이터 플랫폼·센터 구축, 가상물리시스템(CPS) 솔루션 개발 등 다수의 AI·빅데이터 관련 예산을 반영했다.

박 장관은 “우리나라는 세계 최초로 5G를 상용화하는 등 네트워크에는 강점이 있으나, AI·데이터 시장은 구글과 아마존 등 글로벌 기업들이 장악하고 있는 상황이다”며 “전문가들이 한자리에 모인 만큼 ‘세계 최강 DNA(Data·Network·AI) Korea’로 나아갈 수 있도록 현장의 목소리를 가감 없이 전달해달라”고 했다.

0

news
인공지능 받아쓰기 ‘다글로’…4차 산업혁명에 앞장 [국민일보]

기사 원문보기

21세기형 기업들은 기존의 ‘이윤 창출’에서 벗어나 새로운 ‘가치 창조’를 만들어내는 데 끊임없이 도전하고 있다. 이전에 존재하지 않던 새로운 상품과 서비스를 통해 고객들의 삶을 변화시키는 기업들만이 성공의 자리에 설 수 있다. 인공지능 받아쓰기 서비스를 제공하며 ‘행동하는 것이 힘이다’라는 모토로 새로운 가치 창조에 앞장서고 있는 액션파워 조홍식 공동대표를 지난 16일 서초동의 사무실에서 만났다.

-‘다글로’는 어떤 서비스인가요.

“다글로는 인공지능 받아쓰기 서비스라고 할 수 있습니다. 강연이나 콘퍼런스, 통화, 미팅 등 다양한 상황에서 음성을 녹음하는데, 녹음한 파일을 다시 사용하기란 쉽지 않은 작업입니다. 녹음 파일을 다시 듣기는커녕 계속 쌓여서 어디에 있는지도 모르는 경우가 허다하죠. 다글로는 이러한 어려움을 해결하기 위해 음성인식 기술을 적용하여 손쉽게 음성파일을 텍스트로 바꿀 수 있는 서비스입니다. 웹사이트에 접속하셔서 음성파일을 업로드하시면 인공지능 음성인식 엔진이 텍스트로 자동 변환해서 보여줍니다. 하지만 음성을 녹음하는 환경에 따라 정확도가 많이 달라지다 보니 웹상에서 편집기 기능을 제공하여 오타를 바로 편집할 수 있는 서비스도 제공하고 있습니다.”

-교회에서도 서비스에 대한 수요가 많다고 들었는데요.

“먼저 정확도에 대한 말씀을 드리자면 음성을 어떻게 녹음했느냐에 따라서도 큰 차이가 나지만 어느 분야에 대한 전문적인 내용을 이야기했느냐에 따라서도 달라집니다. 어려운 전문용어들이 많이 섞여 있으면 일반적인 음성인식 엔진으로는 인식을 못해 정확도가 많이 떨어지게 됩니다. 이것을 보완하기 위해 저희는 자체개발한 인공지능 음성인식 기술에 딥러닝 기술을 적용하여 교회 설교나 법률강의, 뉴스 등 도메인별로 조금 더 인식률이 높은 특화된 음성인식 엔진을 만들게 됐습니다. 설교 말씀 중에 신앙적 용어들이 많이 포함되어 있으므로 그런 용어들을 더 잘 알아들을 수 있게 특화된 엔진을 제공하여 정확도를 높이게 했습니다. 목사님의 설교 말씀을 녹음하여 텍스트로 이용할 수 있어 데이터베이스를 관리하는데도 쉽습니다. 설교 말씀도 일종의 강연이라고 할 수 있는데 인쇄물로 만들어 공유하고 쉽게 활용할 수 있기에 교회에서의 수요도 늘고 있습니다.”

-최근 출시된 유튜브 서비스와 앞으로 나올 서비스는요.

“음성인식 기술은 오래 연구개발 되어온 분야입니다. 집에 있는 AI 스피커나 스마트폰을 통해 다들 이용해 보셨을 겁니다. 음성인식 기술이라는 것이 매우 많은 잠재가치를 가지고 있는 기술인데 주변에서 접할 수 있는 서비스는 제한적이었죠. 이것을 전문영역이나 어떤 목적성을 가지고 접근했을 때 더욱 가치가 있을 것으로 생각하여 자체 음성인식 기술을 개발하게 됐고, 그 첫 번째 서비스가 다글로입니다. 서비스의 확장을 다글로로 시작해 다른 서비스를 계속 추가할 계획이고, 다글로 안에서도 고객님들의 필요에 따라 특화시킬 수 있는 분야들이 계속 나올 예정입니다. 최근에 나온 유튜브 URL 서비스 경우에는 고객들의 요청으로 만들어지게 됐습니다. 유튜브 URL을 복사해 넣는 거로도 해당 방송 내용을 텍스트로 쉽게 변환할 수 있어 영상에 자막을 만들어 사용하실 수 있고, 강의나 강연 등을 문서로 작성해 필요에 따라 사용하실 수 있습니다.”

-비전이나 목표에 대해 말씀해주세요.

“단기적으로는 국내에서 가장 훌륭한 음성인식과 자연어처리를 하는 인공지능 회사로 인정받는 것이 목표입니다. 음성인식과 자연어처리 기술을 높여 많은 분이 본인의 시간을 좀 더 풍요롭게 쓸 수 있는 데 이바지하고 싶습니다. 또 음성인식 기술을 자체 개발하는 과정에서 인공지능을 구현하는데 필요한 최신 알고리즘에 대한 이해와 응용력, 경험들이 쌓이게 됐습니다. 이것을 음성인식뿐 아니라 다른 산업에 적절히 적용했을 때 요즘 말하는 4차 산업혁명을 이뤄낼 수 있다고 보고 있습니다. 이러한 기술을 바탕으로 앞으로 해외에도 진출할 계획이며 장기적으로는 종합적인 인공지능 회사가 되는 것이 목표입니다.”
0

news


[아리랑TV Money Monster 73회 음성인식기술 편] 액션파워 “다글로” 서비스 소개

원본 영상 보러가기

(영상 10분 56초) 
이지화/공동대표 : 인공지능 받아쓰기 프로그램은 사람이 녹음해 온 녹음 파일들을 텍스트로 바꿔 주는 작업을 해 주는 프로그램입니다. 컴퓨터가 학습되지 않았던 새로운 어떤 녹음 파일을 만났을 때 ‘사람이라면 이렇게 했을 것이다’하는 것을 추론을 해서, 그 음성 파일을 자동으로 텍스트 파일로 문자화 해 주는 그런 원리로 동작을 하고 있습니다.

(영상 11분 53초)
이지화/공동대표 : 기술 개발에 그치지 않고, 그 기술을 잘 이용해서, 이를테면 회의를 한다거나 이렇게 인터뷰를 했을 때 인터뷰가 끝나고 회의가 끝나면 그 내용들이 바로 이제 텍스트로 바뀌어 있어 그것을 바로 직접 사람이 확인할 수 있는, 그렇게 생활에 녹아드는 그런 서비스를 함께 만들고 싶습니다.
0

news
액션파워, 인공지능 음성인식 ‘다글로’에 서비스 추가
“크리에이터, 영상 올리고 손쉽게 자막 추가 가능”

원문 기사보기

인공지능 음성인식 및 자연어처리 기술기반 스타트업 액션파워가 유튜브 동영상 URL만 입력하면 해당 동영상을 텍스트로 변환시켜주는 다글로의 새로운 서비스를 출시했다.

다글로는 누구나 사용할 수 있는 크롬 브라우저에 최적화된 웹 기반의 서비스로, 음성 녹음파일을 업로드하면 자동으로 텍스트로 전환해주는 인공지능 기술 기반 받아쓰기 서비스이다.

액션파워는 딥러닝 기술을 통해 각 도메인 별로 특화된 음성인식 엔진을 만들어 기존의 문제점을 극복하고, 음성인식 정확도를 업무용으로 사용 가능한 수준으로 높여 가고 있다.
 
고객들의 피드백을 바탕으로 기술개발이 이뤄지는데 그 일환으로 법률강의, 교회설교 및 뉴스 녹음에 특화된 음성인식 엔진을 운영하고 있으며 내달 추가 엔진을 출시할 계획이다.
 
한편 유튜브를 시청하고 목적에 맞게 이용하는 독자들이 많아짐에 따라 유튜브 동영상 받아쓰기에 대한 요구도 증가했다.

이에 따라 다글로는 고객들의 편리한 사용을 위해 파일을 업로드 하지 않고 유튜브 동영상 URL 만으로 사용할 수 있는 기능을 추가, 많은 크리에이터의 관심을 받고 있다.

이 서비스를 통해 크리에이터들은 손쉽게 자신이 제작한 영상에 대해 자막을 추가할 수 있게 됐으며 인터넷 강의, 강연 등을 문서로 작성할 수 있게됨에 따라 요약본 정리, 검색 등이 가능하게 됐다.
 
다글로의 사용법은 매우 간편하다. 다글로 홈페이지(http://daglo.ai)에 접속 후 로그인해 ‘사용하기’를 클릭한 뒤 녹음파일을 업로드하거나 유튜브 동영상 URL만 입력하고 ‘받아쓰기’를 클릭하면 텍스트로 전환된다.

액션파워 관계자는 “지속적으로 기술개발에 매진해 고객들에게 더 나은 서비스를 드리고자 노력하고 있다”면서 “다양한 서비스로 고객들의 만족을 극대화 하는 것을 회사의 성장 목표로 삼고 있다”고 밝혔다.

0

news

원문 기사보기


액션파워 조홍식 이지화 공동대표

음성 받아써주는 서비스 다글로 출시
자체 개발한 기술로 정확도 최대 95%까지

“기자님도 지금 인터뷰 다 받아쓰고 있는데, 힘들지 않나. 컴퓨터가 알아서 소리를 듣고 글자를 입력해주면 얼마나 좋겠나.”

가장 빠르고 쉽게 메시지를 전할 수 있는 방법은 음성이다. 그러나 음성은 보관하기 불편하다는 단점이 있다. 녹음을 할 수 있지만 10분 이상 대화가 이어질 경우, 다시 듣기 번거롭다. 1시간짜리 녹음을 문자로 입력하려면 적어도 2~3시간 걸린다. 법원·종교계·방송국 등에선 이 일을 전문으로 하는 인력을 두고있다. 음성을 빼놓지 않고 기록하는 일은 중노동에 속한다. 

액션파워 조홍식(36)·이지화(34) 공동대표는 이런 어려움을 해결하기 위해 나섰다. 음성을 텍스트로 변환해주는 인공지능 서비스 다글로를 지난 4월10일 출시했다. 30대 청년들이 용감하게 뛰어들 수 있었던 자신감은 액션파워가 지닌 기술력에서 나왔다. 총 8명의 팀원 중 6명이 서울대·연세대에서 컴퓨터공학을 전공한 고급 인력이다. 자체 개발한 AI음성인식 기술 정확도는 최대 95%에 달한다. 조홍식 대표는 “내부적으로 테스트해본 결과 구글이 지금까지 내놓은 음성인식 텍스트 변환 서비스는 60~70%대다”라고 했다.

왼쪽부터 조홍식·이지화 액션파워 대표. /jobsN


액션파워는 작년 아마존이 주최한 ‘AWS AI startup challenge’에서 우수상을 수상했다. 수천만원에 이르는 아마존 서버를 무상으로 이용할 수 있다는 의미다. 네이버 계열사 벤처캐피털인 스프링캠프에서 투자를 받았다. 팁스(TIPS)가 자금을 지원하는 창업기업 중 하나다. 팁스는 세계시장을 선도할 기술 아이템을 가진 스타트업을 민간이 주도해 선발하는 프로그램이다. 벤처캐피털·기술 대기업 등으로 구성한 엑셀러레이터와 정부로부터 최대 10억원까지 지원받을 수 있다. 액션파워는 벤처업계가 주시하는 유망 스타트업이다. 

-창업 이전에 무슨 일을 했나.

(조홍식 대표·이하 조) “어릴 때부터 창업을 꿈꿨다. 서울대학교 지구환경시스템공학과 02학번으로 입학했다. 하지만 사회와 산업을 더 관찰하고 싶었다. 경영·경제학을 공부해야겠다고 생각했다. 군 전역 후 경제학부로 전과했다. 졸업한 다음 증권사에 입사했다. 맥쿼리·메릴린치·HSBC에서 주식 애널리스트로 근무했다.”

(이지화 대표·이하 이) “컴퓨터를 좋아했다. 부모님께선 장학재단을 만들어 어려운 아이들을 도와주고 싶어하셨다. 마음껏 공부할 수 있도록 말이다. 그 영향을 받은 것 같다. 돈을 벌어 누구나 공부할 수 있도록 지원해주는 사람을 꿈꿨다. 서울대 전기공학부 학사·컴퓨터공학부 석박사 과정을 수료했다. 이후 스탠포드연구소(SRI·Stanford Research Institute)에 있었다. 2015년 한국에 들어와 조홍식 선배를 만나 사업을 논의했다. 대학 합창 동아리에서 만나 오랫동안 인연을 맺어왔다.”

-합창동아리였어서 음성인식 기술에 대한 관심이 많았나. 왜 이렇게 어려운 서비스를 사업 아이템으로 택했는지

(조) “음악에 관심이 많았던 것은 아니다. 다만 증권사 애널리스트로 일하며 알아서 내 말을 받아써주는 서비스가 있으면 좋겠다고 생각했다. 애널리스트는 시장정보를 분석해 투자 종목을 연구한다. 예를 들어 네이버 주가가 올라갈 것 같은 징후를 포착한다. 관련 업체들에게 전화를 걸고 미팅을 가진다. ‘이런 이벤트가 있을 것 같다, 투자 시 다음과 같은 리스크를 동반한다’ 등의 말을 한다. 문제는 이 같은 수고가 다 휘발성이라는 것이다. 미팅에서 나온 녹음자료를 듣고 보고서를 작성하는 일이 너무 힘들었다.”

(이) “음향기기에 관심이 많았다. 합창단 공연을 정기적으로 하다 보니 믹싱·마스터링을 할 수 있었다. 대학시절 프리랜서 음향 엔지니어로 일해 용돈을 벌었다. 조 대표와 사업 아이템을 논의할 때 진입장벽이 높은 서비스를 만들어보자는 게 공통적 의견이었다. 인공지능 스피커나 음악 검색 서비스는 이미 시장에 나와있었다. 일상적 영역 말고 사무영역에 특화한 받아쓰기 인공지능 서비스가 필요했다. 높은 기술력을 보유한 우리 팀이 도전해볼만한 분야였다.”

1시간 분량의 녹음파일을 올렸을 때 지불하는 비용은 7440포인트. 7000원대의 돈을 지불하면 음성을 텍스트로 변환해준다. 왼쪽은 다글로 서비스를 이용해 녹음파일을 문자로 변환한 자료. 정확도는 비교적 높으나 오역이 많은 것으로 드러났다. /jobsN
 

-구글·네이버같은 IT 대기업에서도 음성인식 기술을 개발하고 있지 않나.

(이) “대기업과 스타트업은 문제를 인식하는 방법과 시행착오를 얼마나 감내할 수 있는가가 다르다. 구글·네이버는 당장 소비자가 쓸 수 있는 서비스를 내놓는데 주력한다. 사람들이 써봤을 때 즉각적으로 결과를 보고 만족도를 느낄 수 있어야 한다. 구글의 인공지능 스피커나 네이버의 음악 검색 서비스가 그렇다. ‘음악 들려줘’, ‘날씨 알려줘’ 같은 짧은 명령 음성인식은 비교적 간단하다."

"일상과 사무영역의 경우 학습(머신러닝·딥러닝)을 위해 준비해야 하는 데이터의 종류가 다르다. 그리고 녹음환경도 차이가 있기 때문에 전처리 기술(주어진 데이터를 그대로 사용하는것이 아닌 원하는 형태로 변형하는 것)도 다르게 적용해야 한다. 서비스 영역을 일상으로만 좁혀 나가다 보니 사무영역같이 리스크가 큰 분야는 섣불리 출시하지 못하는 것이다."

"물론 구글 네이버에도 음성인식을 개발하는 연구팀이 있다. 다른 점은 액션파워는 분류한 데이터를 딥러닝·머신러닝에 활용한다. 음성언어를 전문적으로 문서화 작업을 하는 영역은 교회설교·법률·뉴스가 있다. 물론 국가기관이나 교육분야, 영상콘텐츠 등 필요한 곳이 수없이 많다. 여건상 우리가 지금까지 개발하고 집중한 분야는 3개다.” 

-분류 데이터를 머신러닝에 활용했을 때 장점이 무엇인가. 더 품이 많이 드는 건 아닌지.

(이) “분야를 세분화해 데이터를 학습시킬 때의 장점은 정확도가 올라간다는 점이다. 예를 들어 
법률 분야에서 나오는 단어는 한정적이다. 조사·어미·전치사 등도 구성이 비슷한 패턴으로 나타난다. 녹음 음질과 발음 상태별로 다르지만 최상의 조건에서 녹음한 파일일 때 음성인식 엔진의 정확도는 85~95%(CER·Character error rate·전체정답글자수 대비 틀린 글자 수 기준) 수준이다. 처음부터 끝까지 전부 받아쓰는 일보다 인공지능의 도움을 받아 미흡한 부분만 수정·보완하는 일이 훨씬 간단하다.”

액션파워의 임직원. /jobsN


-법원 속기사들이 써보고 싶다며 직접 사무실에 찾아왔다고 들었다. 혹시 서초동에 사무실을 잡은 것도 속기사들과 자주 접촉하기 위해서인가.


(조) “속기사를 대체하는 서비스 아니냐는 오해를 많이들 한다. 그러나 이런 오해는 그분들의 일을 너무 얕잡아보는 생각이다. 속기사가 하는 일은 빨리 받아치는 게 전부가 아니다. 이들은 전문 용어를 문맥에 맞게 가다듬고 정리한다. 사람의 인사이트가 필요한 일이다. 단어 하나의 오류가 발생해선 안된다. 인공지능은 앞뒤 문맥을 이해하면서 단어를 선정하는 데 한계가 있다. 물론 액션파워가 극복해야 할 지점이다.”

“속기사분들이 직접 찾아와 음성인식 기술이 발전하는 흐름을 거스를 순 없다고 말해주셨다. 다글로 서비스를 이용해 어떻게 일의 효율을 더할 것인지 고민해보겠다고 했다. 또 미래 기술을 갖고 선도적으로 속기사의 일을 더 개발해나가겠다고도 말했다. 이들은 액션파워의 주요 고객이다.”

-다글로 서비스의 경제적 가치는. 

(이) “우리 기술이 좀 더 정교해지면 영상 자체를 문자로 검색할 수도 있다. 예를 들면 유튜버가 영상에서 제품을 리뷰했다. 제목이나 태그를 따로 설정해놓지 않아 기존 방식으로는 검색에 걸리지 않았다고 해보자. 음성을 텍스트로 변환하는 인공지능 서비스는 이런 데이터들도 찾아낼 수 있다.”

-다른 기업에서 인수 제안을 해온 적이 있는지. 매출 규모는 어느 정도인가. 현재 어느 기관에서 사용하고 있나.

(조) “있나, 없나로만 묻는다면 있다. 당연히 거절했다. 액션파워는 세상을 바꾸는 서비스를 만든다는 사명감을 갖고 있다. 시간이 걸리더라도 결실을 꼭 만들어보고 싶다. 매출 규모는 현재로선 밝힐 수 없다. 우리 서비스를 사용하고 있는 기관도 보안상 말하기 어렵다.”

-회사 내부적인 이야기를 해보자. 팀원들이 다들 훌륭한 스펙을 갖고 있다. 액션파워의 장점은 무엇인지.

(조) “건강하고 즐거운 삶이 가장 중요하다. 우리가 일하는 목적이 거기에 있다고 본다. 회사의 성장과 더불어 개인의 성장도 함께 가야 한다. 어떤 방식으로 나타나냐면 직원에게 운동을 할 수 있는 지원비를 준다. 연간 60만원 정도다. 일하다  닭가슴살·건강간식 등을 준비해놨다. 팀원 개개인이 액션파워의 가장 소중한 자산이라 생각한다. 서로 존중하고 아껴주는 분위기다. 이 덕에 창업 초창기 수익적으로 어려움을 겪었던 시기에도 퇴사자 없이 버틸 수 있었다.”

[CCBB] “받아쓰기 인공지능 서비스 출시에 속기사들이 가장 먼저 달려온 이유는···”


-앞으로 채용할 계획이 있나. 인재상이 있다면.


(조) “올해 12~15명 정도로 인력을 늘릴 생각이다. 디자이너·머신러닝개발·웹개발 엔지니어를 찾고 있다. 신입 초봉은 스타트업계에서 최고수준이라고 자신한다. 상시채용이다. 인재상은 명확하다. 첫번째, 선한 인격일 것. 착한 사람이 좋다. 두번째, 적극적·능동적으로 문제 해결 방법을 가진 사람. 세번째로는 어려운 난관에 부딪혔을 때 창의적인 아이디어를 떠올릴 인재면 좋겠다.”

글 jobsN 김지아 
jobarajob@naver.com
잡스엔

0

news


40분 설교를 20분만에 문서로 [CTS 뉴스]

뉴스 바로가기


앵커 : 지금 우리가 살고 있는 시대를 4차 산업혁명 시대라고 말합니다. 인공 지능, 빅데이터, 모바일 등 첨단 정보통신기술이 경제와 사회 전반에 융합되어 혁신적인 변화가 가속화하고 있는데요. 

앵커 : 이에 발 맞춰 목회환경도 급변하고 있습니다. 최근 음성파일을 텍스트로 전환시켜주는 인공지능 받아쓰기 서비스를 이용하고 있는 교회들도 늘어나고 있는데요. 최대진 기자가 전합니다.

40분 분량의 음성파일을 업로드 해 텍스트로 전환하는데 걸리는 시간이 약 20분. 사람이 직접 타이핑을 한다면 2시간 가량이 소요됩니다. 2016년 서울대 출신의 컴퓨터공학 석박사들이 모여 음성인식 기술과 자연어 처리 기술을 개발해 만든 인공지능 받아쓰기 서비스 ‘다글로’. 한 스타트업 기업에서 2017년부터 인공지능 받아쓰기 서비스를 운영해 온 노하우와 높은 기술력을 바탕으로 대기업 계열사의 투자를 받아 최근 새롭게 출시했습니다.

이 기업은 법률상담, 뉴스 등 전문용어의 정확도를 높이기 위해 사용자의 피드백을 반영했고, 음성인식 엔진의 정확도는 85~95%에 이릅니다. 현재 한국어를 비롯해 영어, 일본어, 중국어, 스페인어, 프랑스어, 독일어 등 7가지 언어를 텍스트로 변환이 가능합니다. 최근에는 교회에서 이용도 증가하고 있습니다. 

액션파워 조홍식 공동대표는 “40분 분량의 설교말씀을 문서화하기 위해서는 2시간 이상의 고된 노동이 요구된다”며, “예상보다 많은 교회 관계자들이 음성인식 받아쓰기 서비스를 이용하고 있다”고 말했습니다. 

조 공동대표는 “사람이 자신의 노동력을 투여하거나 긴 시간이 요구됐던 작업을 컴퓨터에 맡겨 보다 창의적이고 가치있는 일에 몰두할 수 있다”며, “설교말씀을 텍스트로 바꾸거나 책으로 출판하는 것도 그 일환”이라고 설명했습니다.

좀 더 안전하고 편리하게 더 풍요로운 삶을 위해 다양한 산업에서 사용되고 있는 4차 산업혁명 기술들. 혁신기술과 함께 교회의 사역환경도 변하고 있습니다. cts뉴스 최대진입니다.
0

news

[머니투데이] ‘대한민국 모바일어워드 2019’ 5월의 모바일은?

기사 원문보기


“AI(인공지능)가 복잡하고 오래 걸리는 녹음 파일 받아쓰기 대신 해드립니다.”

‘대한민국 모바일 어워드 2019’ 5월의 모바일로 선정된 액션파워의 ‘다글로’는 AI 받아쓰기 서비스다. 크롬 브라우저에 최적화된 웹 기반으로 음성 파일을 업로드하면 자동으로 텍스트로 전환해준다. 액션파워는 지난달 10일 다글로 서비스를 출시했다. 지난해 1월부터 운영해 온 AI 받아쓰기 서비스 리뷰와이저 기능을 대폭 강화한 것. 리뷰와이저부터 1년여간 누적 사용자는 1만3000여명에 이른다. 

조홍식 액션파워 대표(사진)는 “스마트폰이나 기기 발달로 녹음은 편리해졌지만 녹음 파일을 데이터로 활용하기 위해 문서화하는 작업은 결코 만만치 않다”며 “음성인식 기술을 통해 이런 작업을 대신하면 사무·업무영역에서 더 큰 가치를 만들어 낼 수 있다”고 서비스 출시 배경을 밝혔다.

조 대표는 “음성인식을 텍스트로 변환하는 기술을 사무용에서 쓰지 않는 건 결국 정확도가 떨어지기 때문”이라며 “각 분야별로 사용하는 어휘, 용례 등을 빅데이터를 통해 학습시키면서 특정 분야에 정확도를 높일 수 있다고 보고 분야별 특화 엔진을 자체 개발하고 있다”고 말했다.

다글로는 딥러닝 기술을 통해 교회 설교, 법률 상담 및 뉴스에 특화된 음성인식 엔진을 추가했다. 그는 “녹음 환경이나 발음 등 녹음 상태가 좋은 경우에 새로 출시한 음성인식 엔진의 정확도는 85~95% 수준에 이른다”고 소개했다. A4 1쪽 분량의 문서로 봤을 때 오탈자가 10개 안팎이라는 얘기다. 다글로는 앞으로 국회, 의료 등에 특화된 음성인식 엔진을 추가해 나갈 계획이다. 

녹음 파일을 텍스트로 변환하는 시간은 음성 파일 길이의 절반 정도. 만약 한시간 분량의 녹음파일이면 30분 정도면 작업이 완료된다. 녹음 상태에 따라 최대치는 녹음 길이 만큼이다. 조 대표는 “텍스트 ‘요청하기’ 버튼을 눌러 완료되기까지 평균 0.5~1배수 시간이면 된다”며 “작업이 완료되면 한글,워드 등 파일 형태로 이메일로 발송되기 때문에 바로 활용할 수 있다”고 말했다.

이용자 편의성을 높이기 위한 기능도 갖추고 있다. 우선 사용자가 정확도를 미리 확인할 수 있도록 5분 미리보기 기능도 제공한다. 편집기에는 키워드 검색 기능은 물론, 재생 중인 단어 표시, 재생 속도 조절, 현재 커서 위치를 재생해주는 단축키, 강조, 글 꾸미기, 화자 표시 기능 등 다양한 기능이 추가됐다.

신기술 개발에도 주력하고 있다. 조 대표는 “여러명 화자가 동시에 대화할 때 화자를 구별하기 어렵다는 한계가 있다”며 “자연어 처리와 함께 화자 분리 등 고도의 기술을 개발 중이고 연내 개선된 서비스를 적용할 수 있을 것”이라고 말했다. 이 경우 회의록이나 재판과 같은 전문 업무용으로도 본격적으로 활용할 수 있을 것이라는 기대다.

조 대표는 “음성인식 기술은 지금보다 훨씬 깊숙하게 우리 생활과 업무에 활용될 수 있고 힘들고 어려운 일을 대신할 것”이라며 “기술 기반 서비스 개발에 더욱 박차를 가하겠다”고 말했다.

0

news

[머니투데이] AI음성인식 기술로 녹음파일 ‘받쓰’하세요

기사 원문보기

 

대한민국 모바일 어워드 이달의 우수 모바일 서비스로 ‘채티’, ‘찍검’, ‘다글로’가 선정됐다.

머니투데이와 과학기술정보통신부는 23일 서울 종로구 머니투데이 본사에서 ‘대한민국 모바일 어워드 2019’ 5월 시상식을 열고 △아이네블루메의 채팅형 콘텐츠 플랫폼 ‘채티’ △로켓뷰의 광학적 문자인식 기술 검색서비스 ‘찍검’ △액션파워의 인공지능 받아쓰기 서비스 ‘다글로’를 각각 선정·시상했다.

‘대한민국 모바일 어워드’는 머니투데이가 모바일 시장을 활성화하고 건전한 생태계를 조성하기 위해 2010년 3월부터 과기정통부와 함께 주최하는 국내 최고 권위의 모바일 시상이다.

이날 행사에는 김준형 머니투데이 편집국장, 이봉규 대한민국모바일어워드 심사위원장, 최동진 한국모바일산업연합회 본부장이 참석해 시상하고 수상자들을 격려했다.

김준형 편집국장은 “실생활에 유익하면서도 톡톡 튀는 아이디어가 돋보이는 서비스가 모바일어워드를 통해 많이 배출되고 있다”며 “이번 수상을 성장의 발판으로 삼아 사회·경제적 가치를 창출하고 모바일 생태계 혁신에 기여하길 바란다”고 당부했다.

한편, 이날 선정된 우수 서비스 개발사들은 연말 대한민국 모바일 어워드 대상 후보로 자동 등록된다. 자세한 내용 및 후보 신청은 머니투데이 모바일 어워드 사이트 ‘앱코리아’(appkorea.org)를 참조하면 된다.

0

news

[아이굿뉴스] 설교 음성을 문서로 바꿀 수 있는 최적의 ‘인공지능’

기사 원문보기

– 음성을 텍스트 변환시켜주는 인공지능 ‘다글로’
‘액션파워’ 청년들의 세상을 변화시키는 도전!


능력 있는 청년들이 의기투합해 2016년 설립한 스타트-업 ‘액션파워’(공동대표:조홍식, 이지화)는 지난 일년 동안 리뷰와이저(reviewiser)라고 하는 인공지능 받아쓰기 서비스를 운영했다. 

‘인공지능 받아쓰기 서비스’는 말 그대로 인공지능(Artificial Intelligence)을 온라인 환경에서 꾸준히 학습시켜 음성을 인식하게 만들고 그 내용을 텍스트로 바꾸어주는 것이다. 쉽게 말해 소리를 글자로 변환하는 서비스이다. 

아이디어와 기술력만을 가지고 승부수를 던진 액션파워의 주요 연구진은 서울대학교 컴퓨터공학 석박사로 구성돼 있다. 이들은 ‘액션이 힘이다’는 믿음을 안고 창업에 뛰어들어 음성인식 기술과 자연어처리 기술을 개발해 보유하고 있다.  

아직 사업은 걸음마 단계이지만, 지금의 기업환경을 보면 언제든 스타트-업이 글로벌 기업으로 성장하고 도약할 수 있다는 확신이 있다. ‘액션파워’ 20~30대 청년들은 기술 잠재력에 승부를 걸었다. 도전이다. 

“인공지능 받아쓰기, 주고객 상당수 목회자”

지난 일년 동안 ‘리뷰와이저’를 운영했던 액션파워는 지난 4월 10일 그동안 축적된 기술력과 고객들의 의견을 반영해 한층 업그레이드 된 인공지능 받아쓰기 ‘다글로’를 출시했다. 서비스 이름만 바뀐 것이 아니라 고객 요구에 맞춰 높은 정확도를 자랑하는 음성인식 엔진을 새롭게 추가했다. 

특히 액션파워는 다양한 고객들로부터 축적한 피드백을 확인하면서 흥미로운 사실을 하나 발견했다. 인공지능 받아쓰기를 유로로 이용한 고객 가운데 목회자들이 상당수였다는 사실이다. 

소리로 된 ‘예배 설교’를 글자로 변화하고자 하는 고객이 많았다는 사실을 확인한 ‘액션파워’로서는 또 하나의 가능성을 발견한 것이다. 어쩌면 현재 ‘액션파워’ 구성원 8명 중 4명이 크리스천이기 때문에 목회자의 활용 가치와 가능성을 쉽게 발견한 것은 아닐까. 

‘다글로’ 서비스를 이용해 본 결과, 녹음 환경과 발음 상태에 따라 음성인식 엔진의 정확도는 차이가 있다. 녹음 환경이 좋을 경우 85~95%에 이를 정도로 정확도는 높았다. 보통 설교의 경우 여타 잡음이 없고 음향 설비가 좋기 때문에 정확성을 더 담보할 수도 있다. 

활동도를 감안하면 교회와 목회자들 입장에서는 기다려온 서비스라고 할 수 있다.

실제 서비스를 이용해본 목회자들의 의견을 수렴했을 때, 목회자들은 설교내용을 텍스트 자료로 확보하기 위한 차원에서 활용하는 경우가 많았다. 

보통 원고를 준비한 설교라 하더라도 강단에서 전해지는 설교는 성령의 감동에 따라 그때그때마다 달라질 수밖에 없다. 그리고 목회자는 그 은혜와 감동을 고스란히 남기고 싶다. 설교실황을 녹음해 둔다면 ‘다글로’를 이용해 글자로 변환할 수 있고 교인들에게 자료로 제공하거나 훗날 책 출판을 위한 기초자료로도 활용할 수 있다. 

서울 서초동 액션파워 본사에서 만난 조홍식 공동대표(삼일교회)는 “장비가 발달하면서 쉽게 녹음을 많이들 하지만 실제 그 내용을 듣지 않고 넘어가는 경우가 많다. 교회에서도 녹음파일을 가치 있는 데이터로 만들기 위해 적지 않은 시간을 소모해야 한다”며 “다글로는 음성인식 기술을 이용해 이런 불편을 해결할 수 있다. 누구보다 먼저 목사님들이 우리의 기술력을 먼저 알아봐주신 것 같아 기쁘다”고 설명했다. 

‘다글로’의 인공지능 기술로 인해 속기사와 같은 전문가들의 일자리를 빼앗는 것은 아닐까 괜한 걱정도 해보았다. 조홍식 공동대표 역시 “처음에는 그 부분을 염려했지만, 오히려 속기사들이 먼저 알고 찾아올 정도로 높은 관심을 나타냈다”면서 “전문분야가 있는 속기사들은 ‘다글로’를 이용한다면 더 정확도 높은 업무가 가능할 것이라고 보고 있었다”고 전했다. 

특화된 인공지능 가능한 독보적 기술력

‘다글로’를 이용해 한 시간 녹음파일을 텍스트로 풀기 위해서는 일반적으로 30분 정도가 소요된다. 사람이 직접 녹취한다면 2~3시간은 쉽게 들 것이다. 반복청취 하며 놓치는 부분도 생긴다. 풀지 못한 채 녹음파일만 쌓여가다 결국은 지워버리는 경우가 허다하다. 

이런 번거로움을 생각하면 한 시간 분량의 음성을 변환하는 데 약 7,200원의 이용료는 저렴하다 할 수 있다. 전문 속기사무소에 의뢰했을 때 경제적 부담을 생각하면 더욱 그렇다.  

그러나 이 비용조차 합당하려면 정확도가 수준급이어야 한다. 사실 음성을 텍스트로 변환해주는 보편적 서비스는 이미 이 세상에 존재한다. 그렇지만 액션파워가 가진 ‘특정 직업군’에 대한 음성인식 기술을 제공할 수 있다는 점에 있어서 특화되어 있다. 설교를 하는 ‘목회자’, 소송이나 법률을 다루는 ‘법조인’, 뉴스를 생산하는 ‘언론인’ 등 다양한 직업이 사용하는 용어나 발음 등을 구체적으로 인공지능에게 학습시켜 정확도를 높인 기술이다. 

이번에 일반에 새로 공개한 ‘다글로’ 서비스에서도 이용자가 특화 엔진을 선택할 수 있도록 만들었다. 필요하다면 기업이나 단체, 개인에 대한 음성환경 등을 인공지능에게 딥 러닝을 시키고 실제 요구되는 엔진을 만들어줄 수 있기 때문에 다글로 기술의 확정성 또한 매력적이다. 

이러한 것이 가능하기 위해서는 머신러닝 외에도 전처리, 후처리 등 매우 복잡하고 다양한 하위 기반기술이 필요하다. 이 때문에 국내 스타트업 가운데서도 액션파워의 음성인식 기술은 독보적 우위를 차지하는 것으로 평가된다. 

이러한 기술력을 인정받아 ‘액션파워’는 이미 2018년 아마존이 주최한 ‘인공지능 스타트업 경진대회’(AWS AI Startup Challenge)에서 우수상을 수상했다. 네이버 계열의 벤처캐피탈 ‘스프링캠프’로부터 투자유치를 성공하기도 했다. 

편의성과 교회 활용 가능성 높아

액션파워 홈페이지(https://www.actionpower.kr)에서 다글로를 실제로 이용해 보았다. 핸드폰으로 녹음해둔 파일을 업로드하고 실행하면 자동으로 글자로 변환을 시작된다. 다른 업무를 보고 있으면 이미 완성된 내용이 미리 저장해둔 메일로 자동 송고된다. 컴퓨터에 익숙하지 않더라도 몇 번만 따라 해보면 익숙해질 정도로 방법은 매우 간편하다. 

특히 매력적인 것은 편집기이다. 변환된 텍스트 내용을 쉽게 수정할 수 있고, 검색기능을 물론 재생 중인 단어의 표시, 재생속도 조절, 강조, 글 꾸미기, 화자 표시기능 등을 한 번에 해결할 수 있다. 완성된 텍스트를 다양한 확장자로 저장할 수 있는 기능도 눈에 띈다. 

액션파워 노가희 공동창업자(영락교회)는 교회생활을 하면서 적극 느꼈던 바를 생각해서도 ‘다글로’의 활용 가치가 높다고 확신한다. 

그는 “목사님 설교를 집중해서 듣는 편이지만 다시 세상에서 살아가다 보면 은혜 받은 말씀을 잊어버리곤 한다. 설교내용에 대해 필기를 해보지만 오히려 설교에 집중하지 못하는 때가 많다”며 “음성을 글자로 바꾸어 교인들이 활용할 수 있도록 제공한다면 주중 언제나 성경공부를 위해 활용할 수 있고, 말씀을 생활 속에서 꼽씹어 볼 수 있다”고 장점을 언급했다. 

조홍식 공동대표는 “정보에 대한 불균형이 소득 격차에 따라 심각해지는 시대에서 우리의 기술이 장애를 가진 분들이나 경제적으로 힘겨운 분들을 돕는 데 활용될 수 있도록 더 노력하고 힘써가야겠다”고 각오를 전했다.  

액션파워의 전체 임직원은 현재는 8명에 불과하지만 세상을 바꿀 기술력으로 도약을 준비하고 있다. 여전히 해결해야 할 과제가 있고 더 높은 기술을 확보하기 위해 넘어야 할 난제도 있지만, 청년들은 기술로 세상을 아름답게 변화시킬 수 있다고 믿고 있다.

또 그 안에서 4명의 믿음의 청년들이 정기적으로 신우회로 모여 주님의 말씀으로 풍성한 이 땅을 위해 기도하고 있다. 세상 사람들이, 교회 공동체가 ‘다글로’의 기술로 인해 더 윤택해지길 그들은 소망하고 있다. 

0

news

[비즈人워치] 네이버·카카오 기술력 부럽잖은 스타트업 ‘액션파워’

기사 원문보기


인공지능 받아쓰기 서비스 ‘다글로’ 출시
음성인식기술 자체보유…정확도 95% 높여

음성을 실시간으로 인식, 답변하는 서비스는 대중화됐다. 네이버·카카오를 비롯 SK텔레콤·KT·LG유플러스가 인공지능(AI) 스피커를 서비스 중이다.

그러나 상당시간 분량의 한국어 음성파일을 한글(텍스트)로 변환 시켜주는 AI 서비스는 찾기 힘들다. 여기서 차별화가 드러난다.

AI 음성인식 및 자연어처리 기술 스타트업 ‘액션파워’ 이야기다.

스마트폰 녹음기능이 보편화되면서 여러 상황에서 중요한 내용을 녹음하는 경우가 많다. 비즈니스 회의는 물론 법률상담, 교회설교, 방송뉴스에 이르기 까지 다양하다.

다만 1시간 짜리 녹음 내용을 다시 듣기 위해선 또다시 1시간을 소모해야 한다. 이것을 한글로 표시해주려면 서너 번은 반복해서 듣고 옮겨 적어야 하니 3∼4시간을 소비하기 마련이다. 또 녹음된 파일은 검색할 수 없어, 녹음 파일만으로는 데이터로써 가치 있게 활용하기 어렵다.

액션파워의 인공지능 받아쓰기 서비스 ‘다글로(https://daglo.ai )’는 이 문제를 해결해준다. 누구나 사용할 수 있는 크롬 브라우저에 최적화된 웹 기반 서비스로, 음성 파일을 업로드하면 수 분만에 자동으로 한글(텍스트)로 전환해준다.

조홍식 액션파워 공동대표는 “네이버나 카카오 같은 대기업이 하고 있는 음성인식 서비스와 액션파워의 음성인식 서비스는 전략방향이 다르다”면서 “우린 조금더 복잡한 말이나 전문용어를 잘 이해하면서 학습능력을 높여왔다”고 설명했다.

대기업 AI 스피커가 음악재생, 날씨알림, TV채널변경 등 일상영역에 집중했다면 액션파워는 특정 사무영역에 집중했다는 뜻이다.

조 대표는 특히 “우리의 기술력은 대기업 부럽지 않을 정도”라면서 “자체적인 AI 음성인식 기술을 보유한 스타트업이 거의 없는데 직접 기술개발, 머신러닝까지 구현하고 있다”고 강조했다.

실제로 액션파워는 증권사 애널리스트 출신인 조 대표와 함께 공동대표를 맡고 있는 이지화 CTO(최고기술책임자) 등 음성인식, 인공지능, 머신러닝 분야 전공자들이 맴버를 이루고 있다.



◇ 서울대 선후배 뭉쳤다

맥쿼리, BoA 메릴린치, HSBC증권 애널리스트 경력자인 조홍식 대표와 미국 스탠포드연구소 출신의 엔지니어 이지화 대표.

이들의 표면적 공통분모는 서울대합창단 선후배 사이다. 조 대표는 서울대 경제학부, 이 대표는 서울대 전기공학부 출신이다. 졸업후 각자의 길을 걷던 중 우연히 생각이 통했을까.

조 대표는 “애널리스트 재직시 전화통화나 세미나, 회의를 많이 했는데 휘발성 강한 음성으로 하다보니 사라지는 데이터들이 많아 아쉬움이 많았다”면서 “이를 텍스트로 바꾸면 소중한 자산이 될 수 있겠다는 생각을 했다”고 말했다. 이 대표 역시 “합창단 시절 음향작업을 주로 담당하면서 음성인식 분야에 관심을 가져왔다”면서 “특성을 살려 AI와 음성인식의 융합 서비스를 창업 아이템으로 잡았다”고 설명했다.

이 대표는 “만약 저 혼자라면 창업을 결심하지 못했을텐데, 부족한 부분을 채워줄 수 있는 조 대표를 만나 창업할 수 있었다”면서 “이후 대학에서 실시간시스템 자율주행차 연구실에서 AI와 머신러닝을 연구중인 후배들을 영입해 맴버를 구성하게 됐다”고 밝혔다.

이렇게 해서 2016년 설립된 액션파워는 자체적으로 음성인식 기술과 자연어처리 기술을 개발해 보유하고 있다. 음성인식 기술은 최신 머신러닝 기술 외에도 전처리, 후처리 등 매우 복잡하고 다양한 하위 기반기술을 필요로 하기 때문에 구글, 네이버 등 대기업을 제외하면 해당 기술을 자체적으로 보유한 국내 스타트업은 많지 않다.

◇ 서비스 방향설정·재정문제 극복기

아무리 기술력 있는 스타트업 일지라도 재정문제를 극복하기란 쉽지 않다. 소비자에게 서비스가 각인되기 전까진 매출이 거의 없기 때문이다.

창업 4년차를 맞이한 액션파워는 이 문제를 어떻게 해결했을까.

액션파워는 지난해 아마존에서 주최한 ‘AWS AI startup challenge’에서 우수상을 받았다. 덕분에 부상으로 아마존 서버를 무상으로 이용할 수 있게 됐다. 통상 AI기업은 서버 비용부담이 크지만, 액션파워는 수 천 만원에 이르는 서버비용을 절감할 수 있었다.

또 네이버 계열사 벤처캐피탈인 스프링캠프로부터 투자유치를 받은 후, 팁스(TIPS)에 선정되면서 자금지원을 받았다. TIPS는 일종의 민간투자주도형 기술창업지원 프로그램이다. 세계시장을 선도할 기술아이템 보유 창업팀을 민간주도로 선발, 미래유망 창업기업을 육성하는 지원 프로그램이다.

조 대표는 “창업후 피버팅(기존 사업 아이템이나 모델을 바탕으로 사업의 방향을 전환하는 것)하는 과정이 제일 힘들었다”면서 “당시엔 회사를 접어야 하냐를 두고 고민까지 했었는데, 이 과정을 지나고나면서 오히려 창업맴버간 더 신뢰가 쌓였다”고 말했다. 이어 이 대표는 “이러한 과정을 거쳐 2017년 12월 리뷰와이저(다글로 이전 버전 서비스)를 내놨을 때 첫 번째 유료결제 고객이 가장 기억난다”면서, 힘들게 만들었던 서비스가 시장에서 인정받았던 첫 느낌을 회고했다.

◇ 정확도 85∼95%…’가치있는 성공’

액션파워는 이달 10일 리뷰와이저를 업그레이드 시킨 다글로 서비스를 내놨다.

리뷰와이저를 운영하면서 다양한 고객들로부터 축적한 피드백을 반영하고 기술력을 녹여낸 것. 특히 고객의 요구에 맞춰 교회설교, 법률상담, 뉴스녹음에 대해 높은 정확도를 자랑하는 음성인식 엔진을 새롭게 추가했다.

녹음 음질과 발음 상태에 따라 다르지만, 좋은 조건의 녹음인 경우 음성인식 엔진의 정확도는 85∼95%(CER 기준) 수준에 이른다.

일각에선 ‘95%의 정확도라도 미흡한 부분을 수정·보완하려면 어차피 녹음파일을 재생해야 하는 것 아니냐’고 반문할지 모른다.

그러나 95% 정확도의 텍스트가 갖춰진 문장을 수정·보완하는 일은 처음부터 음성파일을 텍스트로 변환하는 작업에 비하면 매우 쉽다. 특히 100% 정확도가 요구되는 상황은 공증과 같은 전문영역에서 이뤄지므로, 일상적 회의녹음을 텍스트로 전환하는데에는 효율적이라는 설명이다.

또 사용자가 좋은 녹음 상태인지 아닌지 판단하기 어려운 경우, 정확도를 미리 확인할 수 있도록 ‘5분 미리보기’ 기능도 제공한다.

더욱 정확한 받아쓰기가 필요한 고객의 피드백을 반영, 편집기 기능도 향상됐다. 키워드 검색 기능은 물론 재생 중인 단어 표시, 재생 속도 조절, 현재 커서 위치를 재생해주는 단축키 등 다양한 기능이 추가됐다.

조 대표는 “현재까지는 음성녹음환경을 갖춘 강연자, 1인방송 종사자들이 주로 텍스트 변환 서비스를 이용하고 있는 추세였는데 다글로 서비스 이후 교회설교, 법률상담 등 전문영역으로 서비스가 확산될 전망”이라면서 “앞으로는 콜센터, 방송국, 병원 등 음성을 텍스트로 전환하는 니즈의 B2B 영역도 도전할 계획이다”고 말했다. 또 “중국어의 경우 특성상 음성을 텍스트로 변환하는 작업이 어려운데, 중국어 학습도 진행하면서 중국시장도 도전할 예정이다”고 강조했다.

0

news
[벤처스퀘어] 다글로 출시 “음성 파일을 텍스트로 자동 전환”

기사 원문보기

액션파워가 음성인식과 자연어처리 기반 받아쓰기 서비스인 다글로를 출시했다.
다글로는 음성 파일을 업로드하면 텍스트로 자동 전환하는 웹서비스다.
앞선 버전인 리뷰와이저에 음성인식 엔진을 추가해 정확도를 크게 95%까지 높였으며 이를 먼저 확인할 수 있도록 5분 미리듣기도 지원한다.
또 키워드 검색, 재생중인 단어 표시, 재생속도 조절, 화자 표시를 비롯한 기능도 추가됐다.
조홍식 공동대표는 “앞으로도 고객 요구를 적극 반영해 AI 기술이 다양한 방법과 목적으로 사용될 수 있도록 서비스를 마련, 삶에 가치를 더하는 AI 기업으로 거듭나겠다”고 전했다.

한편 액션파워는 자체 음성인식, 자연어처리 기술을 개발해 지난해 AWS AI 스타트업 챌린지에서 우수상을 수상, 스프링캠프로부터 투자유치를 받은 다음 팁스 프로그램에 선정된 바 있다.
0

news
[Platum] 액션파워, 인공지능 받아쓰기 서비스 다글로 출시

기사 원문보기

디바이스의 발달로 다양한 상황에서 녹음이 이루어지지만, 그 내용을 다시 듣지 않는 경우가 다반사이다.
녹음한 내용을 다시 듣기 위해서는 그만큼의 시간을 소모해야 하고, 소리로는 검색이 용이치 않다. 녹음 파일이 데이터로써 활용되는게 쉽지 않은 셈이다.

AI 음성인식 및 자연어처리 기술 스타트업 액션파워가 인공지능 받아쓰기 서비스 ‘다글로’를 출시했다.
다글로는 크롬 브라우저에 최적화된 웹 기반의 서비스로, 음성 파일을 업로드하면 자동으로 텍스트로 전환해주는 AI기반 받아쓰기 서비스다.
액션파워는 앞서 동종 서비스인 리뷰와이저를 운영한 바 있다. 회사측은 기술을 고도화하는 한편 1년간 리뷰와이저를 서비스하며 축적된 사용자 피드백을 반영해 새로운 서비스로 내놓았다고 밝혔다.
기존 리뷰와이저 고객들은 재가입 절차 없이 기존에 쓰던 아이디와 포인트를 다글로에서 그대로 사용할 수 있다.
특히 고객의 요구에 맞추어 교회 설교, 법률 상담 및 뉴스 녹음에 대해 특히 높은 정확도를 자랑하는 음성인식 엔진을 새로이 추가하였다.
좋은 조건의 녹음인 경우 음성인식 엔진 정확도는 85~95% (CER기준) 수준에 이른다. 사용자 편의를 위해 정확도를 미리 확인할 수 있도록 5분 미리보기 기능도 제공한다. 또한, 편집기 기능도 대폭 향상됐다. 키워드 검색은 물론, 재생 중인 단어 표시, 재생 속도 조절, 현재 커서 위치를 재생해주는 단축키, 강조, 글 꾸미기, 화자 표시 기능 등 다양한 기능이 추가되었다.

액션파워는 앞으로도 다양한 분야에 특화 한 음성인식 엔진을 지속해서 추가해 나갈 계획이다.
한편, 액션파워는 2016년 설립된 기술 기반의 스타트업으로, 주요 연구진은 서울대학교 컴퓨터공학 석박사로 구성되어 있으며 자체적으로 음성인식 기술과 자연어처리 기술을 개발하여 보유하고 있다. 음성인식 기술은 최신 머신러닝 기술 외에도 전처리, 후처리 등 매우 복잡하고 다양한 하위 기반기술을 필요로 하기 때문에 구글, 네이버 등 대기업을 제외하면 해당 기술을 자체적으로 보유한 국내 스타트업은 많지 않은 것으로 알려져 있다.

액션파워는 2018년, 아마존에서 주최한 AWS AI startup challenge에서 우수상을 받았으며, 네이버 계열사 벤처캐피탈인 스프링캠프로부터 투자유치를 받은 후 TIPS에 선정된 바 있다.
액션파워의 조홍식, 이지화 공동대표는 “음성인식 및 자연어처리 기술을 선도하는 업체로서, 인공지능 기술이 다양한 방법과 목적으로 사용될 수 있도록 여러 가지 서비스를 제공하여 사람들의 삶에 가치를 더할 수 있는 인공지능 회사가 되는 것이 목표” 라고 포부를 밝혔다.
0

news
[디지털데일리] 액션파워 “녹음만 하세요, 텍스트로 바꿔드립니다”

기사 원문보기

국내 기술 스타트업이 실생활에 요긴하게 쓰일 수 있는 서비스를 출시해 눈길을 끈다.
인공지능(AI) 받아쓰기 서비스 ‘다글로’다.

이용자가 다글로 홈페이지에 녹음파일을 올려놓으면 텍스트(글자)로 자동 변환해준다. 1시간 녹음파일의 경우 텍스트 변환에 보통 30분이 걸린다.
이용자가 원하는 부분만 따로 발췌해 듣는 것도 가능하며 뉴스, 교회설교, 법률상담과 같은 특화 서비스도 제공한다.

10일 음성인식·자연어처리 기술 기업 액션파워(공동대표 조홍식, 이지화)가 인공지능 받아쓰기 서비스 ‘다글로’를 출시했다고 밝혔다.
다글로는 크롬 브라우저에 최적화된 웹 기반 서비스다.
회사에 따르면 녹음 음질과 발음 상태에 따라 다르지만 좋은 조건의 녹음인 경우에 새로 출시한 음성인식 엔진의 정확도는 85~95%(CER기준) 수준에 이른다. 화자와 녹음기 사이가 거리가 가까울수록 좋은 조건의 녹음으로 볼 수 있다. 최적 조건은 화자와 녹음기 간격이 10cm 이내다.

조홍식 액션파워 공동대표는 “조용한 회의실에선 핸드폰 마이크로 녹음해도 좋은 결과를 기대할 수 있다”며 “큰 강당에서 연사가 떨어져있는데 핸드폰 마이크로 녹음할 경우엔 정확도가 떨어져서 못 받아 적을 때도 있다”고 설명했다.
액션파워는 지난 1년여간 인공지능 받아쓰기 서비스 리뷰와이저(reviewiser)를 운영해왔다.
다글로는 그동안의 이용자 의견을 반영하고 회사의 기술력을 녹여낸 서비스다.
리뷰와이저 대비 기능이 대폭 강화된 것이 특징이다. 텍스트 변환 품질을 미리 확인할 수 있도록 5분 미리보기 기능도 제공한다. 정확한 받아쓰기가 필요한 고객을 위한 편집기 기능도 강화됐다. 키워드 검색 기능은 물론, 재생 중인 단어 표시, 재생 속도 조절, 현재 커서 위치를 재생해주는 단축키, 강조, 글 꾸미기, 화자 표시 기능 등 다양한 기능이 추가됐다.

회사는 특화 음성인식 엔진을 지속 추가해 나갈 계획이다.
조홍식, 이지화 액션파워 공동대표는 “음성인식 및 자연어처리 기술을 선도하는 업체로서 인공지능 기술이 다양한 방법과 목적으로 사용될 수 있도록 여러 가지 서비스를 제공하여 사람들의 삶에 가치를 더할 수 있는 인공지능 회사가 되는 것이 목표”라고 포부를 밝혔다.

한편 액션파워는 2016년 설립된 기술 기반 스타트업이다. 기술진 6명, 총 8명의 작은 회사이나 자체 음성인식 기술과 자연처리 기술을 보유한 흔치 않은 기술 기업이기도 하다. 주요 연구진은 서울대학교 컴퓨터공학 석박사로 구성돼 있다. 2018년, 아마존에서 주최한 AWS AI 스타트업 챌린지에서 우수상을 받았으며 네이버 계열사 벤처캐피탈인 스프링캠프로부터 투자유치를 받은 후 TIPS(민간투자주도형 기술창업지원) 프로그램에 선정된 바 있다.
0

news
[벤처스퀘어] 한국어 음성인식을 제일 잘합니다 ‘액션파워’

기사 원문보기

“우리가 가장 잘할 수 있는 걸 하자”

사업 아이템을 찾기 위해 시작한 회의. 아무리 좋은 내용이라도 입 밖으로 뱉는 순간 휘발돼 버렸다.
회의가 끝나면 자동으로 정리되는 서비스는 없을까. 음성인식 기술이 식상한 단어가 되어 버린지 오래였지만 막상 쓸 수 있는 서비스가 없었다.

조홍식 액션파워 공동대표도 충분히 공감하는 내용이었다. 애널리스트로 일하던 당시 필기는 일상이었다. 전화통화를 하거나 미팅을 할 때도 정보를 기록하는 건 필수였다. 녹음을 할 때도 있었지만 공중에 떠다니는 ‘말’들을 잡기엔 역부족이었다.
조 대표는 “듣고 싶은 만큼 소중하니까 녹음을 하는건데 막상 활용하지 못했다”며 “휘발되는 음성 데이터에 대한 갈증이 있었다”고 기억했다.
때마침 음성인식 기술 패러다임이 바뀌고 있었다. 통계모델을 이용하던 기존방식에서 딥러닝이나 머신러닝으로 옮겨갔다. 음성인식과 인공지능 분야는 팀원 모두에게 강점이 있는 분야였다.

이지화 액션파워 공동대표의 경우 서울대에서 컴퓨터 공학 전공 후 음향 엔지니어로도 활동하며 음향 일을 꾸준히 이어왔다.
최환석, 백상윤 개발자 또한 같은 학교 컴공과 출신으로 자동차 네비게이션에 활용되는 음성 인식을 연구하고 있었다. 전통 기반 위에 있으면서도 최신 기술을 활용할 수 있는 더할 나위 없이 좋은 팀 구성이었다. 가장 잘 할 수 있는 분야이자 스스로가 공감하고 문제도 찾았다.

액션파워는 ‘실행이 가장 큰 힘’이라는 모토로 인공지능 기반 음성인식 기술 개발에 돌입했다.

◇음성 파일을 올려놓기만 하면 문자로..‘리뷰와이저’=개발에 걸린 시간만 꼬박 1년, 액션파워는 올 1월 그들의 첫 번째 서비스를 선보였다.
긴 녹음파일을 텍스트로 변환해주는 인공지능 받아쓰기 서비스 리뷰와이저다. 조 대표는 “리뷰를 가능하게 하다라는 뜻으로 음성파일을 문자로 리뷰할 수 있다는 뜻을 담았다”고 소개했다.
review와 wise의 합성어로 음성 정보를 똑똑하게 활용하자는 뜻이기도 하다. 리뷰와이저에서 음성데이터가 문자로 변환되는 시간은 음성 재생시간의 3분의 1정도. 한 시간짜리 음성파일은 20-30분 내외로 문자화가 완료된다.
가격은 1초에 2원대다. 리뷰와이저 서비스내에서 편집은 물론 검색 또한 가능하다. 문자를 누르면 해당 영역부터 음성이 재생되기 때문에 적어도 녹취 파일을 풀다가 겪는 어려움은 한 번 흘러간 음성 위치를 찾는 번거로움은 없다. 정확성은 아나운서 발음 기준 99% 정도다. 현재까지 누적 등록자 수 7천 명을 돌파했다.

◇스타트업 최초, 한국어 음성인식 엔진 개발 = 리뷰와이저가 정확성과 속도 모두를 확보할 수 있었던 이유는 자체 개발한 한국어 음성인식 엔진 덕분.
이 대표는 “기존 서비스에서 음성인식 정확도가 낮은 이유는 분야별로 쓰이는 전문용어를 인식하지 못하기 때문”이라며 “액션파워는 자체 엔진에서 도메인별 학습을 통해 정확도를 높이고 있다”고 설명했다.
자체 엔진으로 서비스 확장가능성은 무궁무진하다. 예컨대 전문분야별 특화된 음성엔진 모듈을 통해 실제 전문 산업분야 활용이 가능해진다. 방송국에서는 자막을 일일이 타이핑 할 필요가 없어진다. 말과 글을 사용하는 분야에서는 어디든지 사용할 수 있다.

말을 글로 옮기는 측면에서 보면 일정 부분 속기사의 업무와 겹치기도 한다. 속기사 업계와의 충돌은 없었을까.
조 대표는 “현재 속기법인과 파트너쉽을 맺고 함께 할 방향을 찾고 있다”고 밝혔다. 속기사 측에서 먼저 손을 내밀었다.
조 대표는 “속기사분들은 단순히 말을 받아치는 것을 핵심 능력이라고 생각하지 않는다. 각 분야의 전문지식, 주제, 말하는 이에 따라 사용하는 언어가 달라진다”며 “속기사의 핵심 역량은 전문분야의 말을 텍스트로 만드는 것”이라고 설명했다.
그런 시각에서 봤을 때 액션파워의 기술은 사람을 대체하는 것보다 상생하는 것에 가깝다. 속기사 입장에서는 음성 파일을 있는 그대로 받아치는 일종의 초벌 작업 없이 본연의 업무에 충실할 수 있기 때문이다.

조 대표는 “인공지능이 발달해도 기술이 발전하는 속도가 100을 향해서 수렴하기까지는 오랜 시간이 걸릴 것”이라며 “우리의 업은 사람이 하기 어려운 일정 부분의 일은 인공지능을 통해서 가능하게 하고 사람은 100을 채우는 섬세하고 고도화된 일에 집중하도록 하는 것”이라고 밝혔다.
리뷰와이저 정확도 개선에 주력하는 것도 이러한 이유다. 사람이 하는 일에 완성도를 높여주는 일에 한 발자국 더 나아가기 위함이다. 사용자 성별과 연령 등 개인 특화 음성 인식 등 서비스 고도화도 이뤄질 예정이다. 서비스 고도화에 따라 전문 분야별로 활용할 수 있는 여지는 더 커진다.
이 대표는 전문분야별 특화된 음성엔진 모듈로 확장할 계획“이라며 ”실제 전문분야 사무 환경에서 활용할 수 있는 완성도를 선보일 것“이라고 말했다. “말로 휘발되어버리는 수많은 말 데이터를 모으고 비정형 데이터에서 의미 있는 데이터를 뽑아낼 수 있도록 도울 것. 공중에 날아다니는 음성데이터를 모아 사람들에게 의미 있는 데이터로 전하는 액션파워가 되면 좋겠다” 서비스 출시와 투자 유치로 상반기 목적을 달성한 액션파워는 하반기에 리뷰와이저를 알리는데 집중할 계획이다.
함께했을 때 더욱 시너지를 내는 B2B 파트너도 찾는다. 조 대표는 “인공지능이 자체로 사업이 될 수 있지만 기존 산업과 결합해 돌아갈 때 더 큰 힘을 발휘한다”며 “파트너를 잘 찾아서 첫 코를 잘 꿰는 것이 올해 남은 목표“라고 덧붙였다.
0