TTS 라이브러리 MeloTTS로 한국어 음성 합성해보기

TTS( text-to-speech ) 라이브러리인 MeloTTS를 사용하여 한국어 음성을 합성해봤습니다.  깃허브 주소는 https://github.com/myshell-ai/MeloTTS 입니다. 



2024. 7. 14  최초작성



Linux와 macOS에서 사용가능한 방법입니다. 본 포스트에서는 Ubuntu 22.04에서 진행한 결과입니다. 



가급적이면 miniconda나 anaconda 환경에서 진행하세요. conda 환경 만드는 방법은 아래 링크를 참고하세요.

 

Visual Studio Code와 Miniconda를 사용한 Python 개발 환경 만들기( Windows, Ubuntu, WSL2)

https://webnautes.tistory.com/1842



다음 명령들을 차례로 실행해줍니다. 위 두 줄은 conda 환경을 사용할 경우에 필요한 명령어입니다.

 

$ conda create -n melotts python=3.10

$ conda activate melotts

$ git clone https://github.com/myshell-ai/MeloTTS.git

$ cd MeloTTS

$ pip3 install -e .

$ python3 -m unidic download



이제 예제코드를 실행해봅니다. 

출처 https://huggingface.co/myshell-ai/MeloTTS-Korean 

 

from melo.api import TTS

# Speed is adjustable
speed = 1.0
device = 'cpu' # or cuda:0

text = "안녕하세요! 오늘은 날씨가 정말 좋네요."
model = TTS(language='KR', device=device)
speaker_ids = model.hps.data.spk2id

output_path = 'kr.wav'
model.tts_to_file(text, speaker_ids['KR'], output_path, speed=speed)



모델 및 필요한 파일이 다운로드 된 후(처음에만 다운로드됩니다.), kr.wav 파일이 아래처럼 생성됩니다. 플레이해보면 코드안에 있는 "안녕하세요! 오늘은 날씨가 정말 좋네요." 말이 재생됩니다.  

 

kr.wav
0.42MB



 

두번째로 실행하여 다운로드 없이 실행해봤지만 실시간으로 사용하기에는 무리가 있어보입니다.







참고

[1] ​​https://github.com/myshell-ai/MeloTTS/blob/main/docs/install.md#linux-and-macos-install

 

[2] https://github.com/myshell-ai/MeloTTS/issues/126








시간날때마다 틈틈이 이것저것 해보며 블로그에 글을 남깁니다.

블로그의 문서는 종종 최신 버전으로 업데이트됩니다.
여유 시간이 날때 진행하는 거라 언제 진행될지는 알 수 없습니다.



영화,책, 생각등을 올리는 블로그도 운영하고 있습니다.
https://freewriting2024.tistory.com


제가 쓴 책도 한번 검토해보세요 ^^