Python
初めに 環境 準備 実行 初めに 新しくttsのライブラリが出たので触ってみます ありがたいことに昨年度のlineサマーインターンの成果であるprompttts++のコードとデモを公開していただきました---paperhttps://t.co/2pZ7Vd057g demo (new)https://t.co/WnA5CC…
初めに 構成要素の概要 エンコーダー(Encoder) デコーダー(Decoder) ボコーダー(Vocoder) 特徴的な部分 Sway Sampling ConvNeXT トレーニングと推論 トレーニングデータ 非自己回帰型TTS 環境 準備 ライブラリのインストール 事前学習モデルの配置 実…
開発環境 詳細 開発環境 Windows python 3.10.11 uv 0.4.16 詳細 crcmod(==1.7)をインストールする際に以下のエラーが出ました。 error: Failed to prepare distributions Caused by: Failed to fetch wheel: crcmod==1.7 Caused by: Failed to run `C:\User…
初めに 開発環境 詳細 初めに 査読前の論文がアップロードされている arXivを気になったものを見ているものの気になるものを全て探すのは大変なので API経由で検索をしていきます 記事の内容のリポジトリは以下で公開しています github.com 開発環境 python …
参考 開発環境 内容 pythonのversionの固定 ライブラリをインストール 参考 (この記事はとても参考になっています) zenn.dev 開発環境 Windows 11 内容 requirements.txt を使って ライブラリをインストールするときのメモ pythonのversionの固定 以下で 特…
開発環境 ライブラリのインストール 動画および再生リストのダウンロード 開発環境 Windows 11 Python 3.11 ライブラリのインストール 以下でライブラリのインストールできます pip install yt-dlp 動画および再生リストのダウンロード まずは単体の動画のダ…
初めに 開発環境 ライブラリのインストール 実行 初めに 歌ってみたなどの音声ファイルからボーカルのみを抽出した場合、以下などのボーカル抽出ソフトなどで対応することができます。 github.com しかしこのソフトには、CLI版がないため CLIで動くものを探…
開発環境 コード 開発環境 Google Colob コード # ffmpegのインストール !apt-get install ffmpeg # チャンネル数の確認 !ffprobe -i file_name -show_streams -select_streams a:0 -loglevel error | grep channels 以下のように出力されます channels=1
開発環境 音の解析 特定の周波数のみの音にする 開発環境 Google Colob T4(Free) 音の解析 以下で sample.wav に対する周波数別の解析をします import numpy as np import matplotlib.pyplot as plt import japanize_matplotlib from scipy.io import wavfil…
初めに 開発環境 アプローチの方針 ライブラリのインストール k-means法 デモ コード DBSCAN法 デモ コード GMM法 デモ コード 初めに ある画像から近い色同士で色をまとめてほしい時があります。この際に使用できる画像処理やクラスタリングの手法を試して…
初めに 開発環境 エラー詳細 解決方法 参考記事 初めに AI周りの学習でtorchを使うことがありますが、cudannのエラーによって学習が始めらない問題にぶつかったので解決方法をメモしておきます 開発環境 GCP torch version : 2.3.0+cu121 cuda 12.1 Python 3…
開発環境 詳細 開発環境 Windows 11 Python 3.11.7 詳細 以下のコードで指定したディレクトリ内のwavファイルのパスを一覧にしたテキストファイルが出力されます # 指定したディレクトリ内のすべてのファイルのパスを再帰的に取得し、txtファイルに保存する…
初めに 環境 変換コード 実行 初めに TTSの学習データを作る際に 音声コーパスにはよく ITAコーパスが用いられることがあります。このコーパスは以下のフォーマットで作成されています. ファイル名:本文,ヨミ こちらを学習に使う際にヨミの部分は、必要がな…
初めに 環境 準備 対応音声ファイル 実行 初めに 音声処理をする際にフォルダ内に音声ファイルがあるかを確認したいと思う時があります。その際に使用できる簡単なスクリプトを作ります 環境 L4 GPU ubuntu22.04 準備 必要なライブラリを入れます sudo apt u…
初めに デモ 開発環境 準備 分析手順 データをダウンロード・ロード WAND-SNRを使って音声データの分析 分析結果をヒストグラムで表示 WADA-SNR値が100以上のデータ個数を取得 備考 Windowsでのプロセスエラー対応 並列処理対応 初めに reazon-research/reaz…
初めに デモ 開発環境 準備 実装 初めに WADA SNRを使って音声の評価ができるみたいなので、以下を使って実際に試してみます gist.github.com デモ 実行すると以下のようなログが表示されます Calculated SNR: 13.775574879980502 開発環境 Windows 11 Pytho…
初めに デモ 開発環境 準備 文字お越し及びファイル保存 エラー対応 CUDAがenabledになっていない場合 ReazonSpeech/pkg/nemo-asrのインストールが失敗する 参考サイト 初めに STTやTTSの学習等をする際に文字データが必要になるのですが、音声だけある場合…
初めに デモ 開発環境 実装 環境を作る モデルのロードと初期化 STTのAPIの作成 初めに 音声認識をしたい場合whisperを使うことが多いですが、より速くより使いやすくしたいと思ってたので実装をしてみました! DockerでCUDAのver管理やGPUも使えるようにし…
初めに 環境 準備 環境構築 Notion APIの取得 はてなブログの一覧を取得する Zennの記事一覧を取得する NotionのDBに記事を追加する それぞれのデータを取得して、日付ソートして書き込む GitHub Actionsを使って定期的に実行する 初めに 自分のポートフォリ…
初めに エラー 対応方法 初めに magic-animateを触る際にCUDAのver問題で困ったので、解決策のメモ github.com エラー RuntimeError: Detected that PyTorch and torchvision were compiled with different CUDA versions. PyTorch has CUDA Version=11.7 an…
はじめに 環境 準備 docker hubのTokenを作成 GitHub Secretの登録 Docker imageの作成 GitHub Actionsによる自動化 DockerHubにpush時にuploadをするActionの作成 uploadしたimageのデバッグ用のActionの作成 はじめに Dockerを使っていると自分でimageをカ…
環境 準備 ライブラリの準備 tokenの準備 実装 テキストを送信する ファイル(画像)を送信する 環境 Python3.10 準備 ライブラリの準備 slackが公式に slack-sdk というライブラリを公開しているので、こちらをインストールします pip install slack-sdk toke…
はじめに やりたいこと 環境 環境構築 Dockerfile docker-compose 実装 結果 参考サイトおよびChatGPTの返答内容 データセット引用元 参考サイト ChatGPT はじめに UnityのBarracudaでMLを使ったプロジェクトを作成したいので、準備としてデータを作成してい…
はじめに 完成物 やりたいこと 準備 Notionの インテグレーション(API)の作成と登録 DiscordのWebHookの作成 GitHub のpersonal tokenの作成 自動化内容と実装 1. Notionの特定のタスク状態が変更されたときに担当者及び確認者 Discordに通知を送る 2. 一日…
はじめに 成果物 実装簡易説明 Notion DB 取得時に query Filter GitHub Actionsから環境変数を読み込む Notionのpage Property(date) の更新 その他参考サイト はじめに 最近 Notionを使ってタスク管理を再度始めました(昔やっていたのですが、飽きてしまっ…
自分のやったタスクを記録しておきたいとおもい,前にEvernoteにTrelloのアーカイブを保存する記事を書きました. その後Notionを知りこちらのほうが便利だと思い乗り換えたのですが,アーカイブの保存のスクリプトの切り替えがやっと終わったのでメモです G…
最近Notionというものを教えてもらいました!!(今更ですが) TrelloとEvernoteから乗り換えるのにいろいろと連携したりGASとの連携とかもあるので,scriptの移行のためにNotionAPIを触っていきたいと思います <span style="color: #ff0000">NotionのAPIは2020/12現在 APIは非公式になって</span>…
メモついでに書いておきます(書き途中) MacでのQtDesigerのpath MacでのQtDesigerのpath Anacondaを使用して入れた場合以下のpathにあります /Users/user name/opt/anaconda3/envs/pyside2/bin/Designer.app
PySide2でリアルタイムで文字起こし,音声の録音をやってみたいと思います 実行結果 準備 音声を扱うためのライブラリ 録音をするためにライブラリ Code 参考サイト 実行結果 実行すると録音の音声ファイル recorded.wavとその録音音声内容のrecordedText.tx…
twitterの解析等で使いたく,GCE上で毎日決まった時間に実行されるようにしてみました GCEとは GCEのインスタンスを立ち上げる GCEにAnacondaを入れる GCEでcronの設定 修正 GCEとは qiita.com GCEのインスタンスを立ち上げる qiita.com qiita.com qiita.com…