Wespeaker/wespeaker-voxceleb-resnet34-LMで話者ダイアライゼーションを行う

AI

初めに開発環境セットアップ CLIから実行 Pythonのコードで実行備考初めに wespeakerで話者ダイアライゼーションを行ってみます。モデルは以下です huggingface.co 以下に記事の内容のRepositoryを公開しています github.com 開発環境 windows11 python…

2024-12-15

powerset_calibrationを使って話者ダイアライゼーションを行う

AI

初めに開発環境セットアップ話者ダイアライゼーションを実行初めに powerset_calibrationを使って音声内の話者ダイアライゼーションを行ってみます。論文によりデータセットには日本語が含まれていないため、日本語の音声に使う場合は自分で学習を行う必…

2024-12-15

nvidia/parakeet-tdt_ctc-0.6b-jaをWindowsで動かす際のAttributeError: module 'signal' has no attribute 'SIGKILL'. Did you mean: 'SIGILL'?の対応

AI

初めに開発環境原因対応方法備考初めに NVIDIAが公開している日本語音声向けの音声認識モデル nvidia/parakeet-tdt_ctc-0.6b-jaを Windowsで動かす際に以下のエラーが出た多ため、対応方法を記載します packages\nemo\collections\asr\models\configs\a…

2024-12-15

reazonspeech-k2-v2を動かす

AI

初めに開発環境セットアップ文字お越しの実行初めに reazon-researchが新しい音声認識モデルを公開されていたので触ってみます ReazonSpeech v2.1をリリースしました！v2.1で追加した新しい日本語ASRモデル、ReazonSpeech-k2-v2はONNXフォーマットで提供…

yousanのメモ

2024-12-15から1日間の記事一覧

Wespeaker/wespeaker-voxceleb-resnet34-LMで話者ダイアライゼーションを行う

powerset_calibrationを使って話者ダイアライゼーションを行う

nvidia/parakeet-tdt_ctc-0.6b-jaをWindowsで動かす際のAttributeError: module 'signal' has no attribute 'SIGKILL'. Did you mean: 'SIGILL'?の対応

reazonspeech-k2-v2を動かす