2025-05-01から1ヶ月間の記事一覧
Demo 開発環境 環境の構築 データセットの準備 前処理・ログ用のフォルダの作成 前処理の実行 事前学習の開始 モデルをonnxに変換 学習したモデルから推論 Demo 学習したモデルは以下で公開しています huggingface.co 生成した音声は以下のようになります yo…
初めに 開発環境 セットアップ APIを実行する 初めに 先日 Live Search APIが使えるようになったので、こちらを動かしてみます Attention devs: the xAI API just got A LOT smarter.With Live Search, Grok can now search through realtime data from 𝕏, t…
初めに 開発環境 環境構築 使用できるモデルの取得 CLIからボーカルを抽出 Pythonから実行 初めに 以下で歌声の音源からボーカルを抽出していました ayousanz.hatenadiary.jp 改めて調査するとより多くのモデルと精度の高いモデルが選べるのものがあり、ロー…
初めに 開発環境 環境構築 音声データの取得 speaker-emb-ja-ecapa-tdnnを使って音声類似度比較を行う 初めに 以下の記事で Resemblyzerを使って似ている歌声を探してみました。今回は 別のモデルを使ってみます ayousanz.hatenadiary.jp 開発環境 python 3.…
初めに 開発環境 歌声ボーカルデータの取得 埋め込みモデルを使って指定した歌声から近いボーカスを取得 初めに ある声とある声がどのくらい似ているかを測るための方法はいくつかありますが、今回は Resemblyzer の埋め込みモデルを使ってみます 開発環境 P…
初めに 開発環境 環境構築 話者を指定して音声合成 初めに モデルのサイズが軽量で動かせる kokoroがあります。こちらをpythonの環境で動かしていきます テストプロジェクトは以下で公開しています github.com 開発環境 Windows 11 Python 3.11 環境構築 ま…
開発環境 環境の作成 DataAPIを使った再生リストを取得 開発環境 python 3.21 環境の作成 uvで環境を作成します uv venv -p 3.12 .venv\Scripts\activate 次に必要なライブラリをインストールします。 uv pip install --upgrade google-api-python-client Da…
初めに 環境 GitHubからWindows向けのインストーラーを使用 OpenSSHサーバーのインストール OpenSSHサーバーのサービスの開始と自動起動設定 ファイアウォールの設定 ssh configの変更 接続が失敗する場合 初めに 開発環境や学習環境にWindowsが用意されてい…
初めに 開発環境 ライブラリのインストール モデルのダウンロード Gemmaライブラリ用の設定ファイルの作成 スクリプトの作成と設定 備考 初めに 先日 Google がgemmaをゲーム領域で使っていく発表がありました。その中で以下のライブラリが公開されていたの…