정보마당

헤이카카오받아쓰기

tosoony 2021. 7. 5. 22:24

대학 시절, 강의 수강 때 가장 큰 난제 중 하나는 실시간 노트 필기를 하지 못한다는 것이었습니다.
80년대말 선배들로부터 얻은 지식으로 녹음기를 이용하라는 조언을 듣고 모든 강의를 녹음하느라 어마어마한 녹음테이프와 건전지가 소모되었던 것 같습니다.
그럼에도 불구하고 집중하여 실시간으로 들리는 내용 중 요지를 파악해 정리하지 못한 채 저녁에 돌아와 다시 동일한 시간을 소비해가면서 강의녹음을 듣고 점자로 메모한다는 것이 얼마나 힘들고 비효율적이었는지는 해본 사람만 알 것입니다.

며칠전 헤이카카오 앱이 업데이트 되면서 새로운 서비스를 시작했습니다.
소위 받아쓰기 기능이라는 것인데요.
실시간 대화 내용을 휴대폰이 녹음하면서 동시에 해당 내용을 텍스트 문서 파일로 변환해주는 서비스입니다.
안그래도 최근 구글이 자사의 음성인식과 번역 자막 기술을 응용해 유투브에도 연결하고 청각장애인을 위한 속기 지원용 소프트웨어를 판매한다는 소식을 듣고
시각장애인을 위한 강의 입력이 있었으면 좋겠다 생각했었는데
카카오가 바로 이러한 요구를 수용한 셈이었습니다.

곧바로 실험에 들어 갔습니다.
헤이카카오 앱을 실행한 후에 헤이카카오라고 한 후 '받아쓰기 시작'이라고 명령을 내리면 녹음이 시작됩니다.
충분한 녹음을 한 후 화면 아래를 터치해 보면 녹음종료 버튼이 있고 저장하기 버튼이 차례로 나타나며 이를 터치합니다.
화면에 '받아쓰기1" 등의 파일명과 정보가 생성되며, 해당 녹음 파일명을 터치해 들어가면 문서 내용이 화면에 나타납니다.
해당 내용은 화자분석 사족제거 등의 명령을 통해 문서를 다듬을 수 있고 공유 메뉴를 클릭한 후 자신의 이메일이나 문자, 드랍박스 등으로 문서파일이나 녹음 원본 모두를 언제든지 옮길 수 있습니다.
아직은 서비스 초기라 큰 기대를 하진 않았습니다만 팟케스트 음성 파일과 실시간 제가 포함된 음성 대화 등 두 가지로 테스트를 해보았습니다.
그 결과 아직까지 갈 길이 멀다는 생각을 하게 되었습니다.
대화자의 목소리 크기와 발음 정도, 주변 소음, 폰과의 거리 등 변수가 다양하기에 명확한 판단을 할 수는 없었지만 중간 중간 오타가 있고 화자가 바뀌지 않았음에도 줄을 갈아 다른 화자라고 분리하는 등 개선할 점이 보였습니다.
그러나 제가 제 목소리로 폰 가까이에서 비교적 또박또박 말을 해 녹음하여 텍스트 파일을 추출한 결과 충분히 활용할 가치가 있다는 생각도 하게 되었습니다.

어쩌면 얼마 후 학교에서 수업 녹음이나 중요 음성 강의를 손쉽게 파일로 만들어 학습하는 시대가 곧 오지 않을까 하는 기대를 해 봅니다.
네이버 등 다른 회사 등에서도 속속 관련 서비스를 개발 보급중이니만큼 다른 분들도 좋은 정보 많이 활용하셨으면 합니다.

토순이.