Skip to forum content

E-HCS Support

온라인 서비스 지원센터에 오신걸 환영합니다.

Live News Feed

안녕하세요. EHCS 운영자입니다.

http://edu.e-hcs.com/ 에서 온라인 무료강의를 검색하실 수 있습니다.

감사합니다.

페이지 1

답변 작성

RSS 주제 피드

글 [ 1 ]

1

주제: Translate speech in the speaker's voice 음성까지 똑같아 지는 자동 번역기

source : https://ai.googleblog.com/2019/05/intro … o-end.html

https://o.aolcdn.com/images/dims?resize=2000%2C2000%2Cshrink&image_uri=https%3A%2F%2Fs.yimg.com%2Fos%2Fcreatr-uploaded-images%2F2019-05%2Ff99b2af0-7747-11e9-bfef-2f43050ad813&client=a1acac3e1b3290917d92&signature=4aa2563e2b03fb6c34db4c2f21f38fc3ab1b4511

Google is introducing Translatotron: An End-to-End Speech-to-Speech Translation Model that can directly convert speech from one language into another while maintaining a speaker's voice and cadence.

Translatotron uses a sequence-to-sequence network model that takes a voice input, processes it as a spectrogram -- a visual representation of frequencies -- and generates a new spectrogram in a target language.

위 2개의 동영상을 본 사람들은 이미 많이 있을것으로 예상된다. 

아무리 영상이 진짜 같다고 하더라도, 그리고 심지어 성대묘사를 정말 똑같이 하는 사람들이 있다고 하더라도 그것은 공인이나 유명한 사람에게 국한되었을뿐 일반인의 목소리나 어투를 따라하기 힘들기 때문에 걱정이 되지 않는 사람들이 많이 있을것으로 생각된다.

하지만 영화에서 나오는 것처럼 불특정한 사람의 목소리도 완벽하게 똑같이 재현 가능한 기술이 존재한다면 얘기는 달라진다.

구글 연구진들이 현재 개발중인 번역 시스템이 이 상상속의 기술을 현실화 시키려 하고 있다.

기술의 이름은 트렌스레토트론(Translatotron).  사용자의 음성 특색을 분석하고 새로 생성된 음성을 변조하여, 마치 사용자가 다른 나라의 말을 구사하는 듯한 음성을 만들어 내는 기술이다.

아래는 기술에 대한 강의 영상과 연구 보고서 링크이다.

View "Direct speech-to-speech translation with a sequence-to-sequence model"

인용 글 1 Share

글 [ 1 ]

페이지 1

답변 작성



PunBB.INFO - расширения и темы на заказ