任意の話し声を歌声に変換する音声変換「toSinging」を動かす

初めに

話している音声から歌声に変換する面白いものがあったので、動かしていきます。

github.com

依存関係が固定化されていなかったので、以下にuvで整理をしたものを作成しました

github.com

記事の内容はfork版とします。

開発環境

環境構築

モデルファイルもあるので、lfsを設定します

git lfs install
git clone https://github.com/akinori-ito/toSinging.git
cd toSinging

# Install dependencies
uv sync

実行

サンプル音声(話し音声)とMusicXML楽譜から歌っている感じに変換してみます




uv run python tosinging.py -i speech.wav -m song.musicxml -o singing.wav -bpm 120

制度としてはあまり高くない感じでしたが面白い内容です