yousanのメモ

2025-05-17から1日間の記事一覧

python-audio-separatorで歌声のボーカルを抽出する

AI Python

初めに開発環境環境構築使用できるモデルの取得 CLIからボーカルを抽出 Pythonから実行初めに以下で歌声の音源からボーカルを抽出していました ayousanz.hatenadiary.jp 改めて調査するとより多くのモデルと精度の高いモデルが選べるのものがあり、ロー…

k-washi/speaker-emb-ja-ecapa-tdnnを使って似ている歌声ボーカルを探す

AI Python

初めに開発環境環境構築音声データの取得 speaker-emb-ja-ecapa-tdnnを使って音声類似度比較を行う初めに以下の記事で Resemblyzerを使って似ている歌声を探してみました。今回は別のモデルを使ってみます ayousanz.hatenadiary.jp 開発環境 python 3.…

Resemblyzerを使って歌声ボーカルが近い音声を探す

AI Python

初めに開発環境歌声ボーカルデータの取得埋め込みモデルを使って指定した歌声から近いボーカスを取得初めにある声とある声がどのくらい似ているかを測るための方法はいくつかありますが、今回は Resemblyzer の埋め込みモデルを使ってみます開発環境 P…

Windowsでkokoro TTSを動かす

AI Python

初めに開発環境環境構築話者を指定して音声合成初めにモデルのサイズが軽量で動かせる kokoroがあります。こちらをpythonの環境で動かしていきますテストプロジェクトは以下で公開しています github.com 開発環境 Windows 11 Python 3.11 環境構築ま…