Linuxで7zファイルをまとめて解凍する

開発環境ライブラリのインストール 7zファイルの解凍開発環境 Ubuntu 22.02 ライブラリのインストール以下で7zの解凍するためのライブラリを入れます sudo apt-get install p7zip-full 7zファイルの解凍以下でフォルダ内にある7zファイルを解凍します fo…

2024-06-25

Spatial Reality Display ELF-SR2のセットアップをする

初めに開発環境 SDKのインストール Unity プラグインのダウンロードディスプレイの設定初めに ELF-2を触らせていただく機会があったので、とりあえずセットアップ方法をまとめます開発環境 Windows 11 SDKのインストール以下から開発用のSDKをインスト…

2024-06-22

StableTTSでつくよみちゃんコーパスを使ってfine tuingをする

AI

初めに環境準備ライブラリのインストールモデルのアップロード音声ファイルのアップロードと学習用テキストの作成前処理 fine tuningの実行 fine tuingモデルで推論事前学習をする場合初めに以下の記事でStableTTSで推論をしてみました。今回はfine…

2024-06-22

StableTTSで音声合成を試す

AI

初めに環境ライブラリのインストールモデルのアップロード WebUI画面の起動音声合成推論時間の計測備考初めに拡散モデルのTTSで(一応)日本語対応されているライブラリの StableTTSを触っていきます github.com 環境 L4 GPU ubuntu22.04 ライブラリの…

2024-06-21

時系列基盤amazon chronos-t5をサンプルデータでfine tuningをする

AI

初めに環境ライブラリのインストールデータの取得と分析データ形式の変換推論モデルのロード推論実行及びグラフにプロット fine tuing ライブラリのインストール学習用のデータの変換参考サイト fine tuing 追加学習モデルを使った推論初めに過去…

2024-06-18

Google ColobでDeepPhonemizerを使ってテキストを音素への変換をする

AI

初めに開発環境モデルのダウンロードライブラリのインストールテキストから音素を取得初めに以下を使ってテキストから音素を取得してみます。モデルは日本語は対応していないみたいなので、英語で試します github.com 開発環境 Google Colob (Free) モ…

2024-06-18

GoogleColobで音声ファイルのチャンネル数を確認する

Python

開発環境コード開発環境 Google Colob コード # ffmpegのインストール !apt-get install ffmpeg # チャンネル数の確認 !ffprobe -i file_name -show_streams -select_streams a:0 -loglevel error | grep channels 以下のように出力されます channels=1

2024-06-16

高速フーリエ変換(FFT)を使って音の解析および特定の周波数の除く

Python

開発環境音の解析特定の周波数のみの音にする開発環境 Google Colob T4(Free) 音の解析以下で sample.wav に対する周波数別の解析をします import numpy as np import matplotlib.pyplot as plt import japanize_matplotlib from scipy.io import wavfil…