LJSpeechを使って英語のpiperの事前学習モデルを作成する

AI Python

Demo 開発環境環境の構築データセットの準備前処理・ログ用のフォルダの作成前処理の実行事前学習の開始モデルをonnxに変換学習したモデルから推論 Demo 学習したモデルは以下で公開しています huggingface.co 生成した音声は以下のようになります yo…

2025-05-24

PythonでXのLive Search APIを実行して検索してみる

Python

初めに開発環境セットアップ APIを実行する初めに先日 Live Search APIが使えるようになったので、こちらを動かしてみます Attention devs: the xAI API just got A LOT smarter.With Live Search, Grok can now search through realtime data from 𝕏, t…

2025-05-17

python-audio-separatorで歌声のボーカルを抽出する

AI Python

初めに開発環境環境構築使用できるモデルの取得 CLIからボーカルを抽出 Pythonから実行初めに以下で歌声の音源からボーカルを抽出していました ayousanz.hatenadiary.jp 改めて調査するとより多くのモデルと精度の高いモデルが選べるのものがあり、ロー…

2025-05-17

k-washi/speaker-emb-ja-ecapa-tdnnを使って似ている歌声ボーカルを探す

AI Python

初めに開発環境環境構築音声データの取得 speaker-emb-ja-ecapa-tdnnを使って音声類似度比較を行う初めに以下の記事で Resemblyzerを使って似ている歌声を探してみました。今回は別のモデルを使ってみます ayousanz.hatenadiary.jp 開発環境 python 3.…

2025-05-17

Resemblyzerを使って歌声ボーカルが近い音声を探す

AI Python

初めに開発環境歌声ボーカルデータの取得埋め込みモデルを使って指定した歌声から近いボーカスを取得初めにある声とある声がどのくらい似ているかを測るための方法はいくつかありますが、今回は Resemblyzer の埋め込みモデルを使ってみます開発環境 P…

2025-05-17

Windowsでkokoro TTSを動かす

AI Python

初めに開発環境環境構築話者を指定して音声合成初めにモデルのサイズが軽量で動かせる kokoroがあります。こちらをpythonの環境で動かしていきますテストプロジェクトは以下で公開しています github.com 開発環境 Windows 11 Python 3.11 環境構築ま…

2025-05-13

youtubeDataAPIでキーワードから関連する再生リストを取得する

Python

開発環境環境の作成 DataAPIを使った再生リストを取得開発環境 python 3.21 環境の作成 uvで環境を作成します uv venv -p 3.12 .venv\Scripts\activate 次に必要なライブラリをインストールします。 uv pip install --upgrade google-api-python-client Da…