WADA SNRを使ってreazon-research/reazonspeechの音声を評価する

Python

初めにデモ開発環境準備実装初めに WADA SNRを使って音声の評価ができるみたいなので、以下を使って実際に試してみます gist.github.com デモ実行すると以下のようなログが表示されます Calculated SNR: 13.775574879980502 開発環境 Windows 11 Pytho…

2024-02-24

miipher非公式リポジトリで音声ファイルのノイズ除去を行う

AI

初めに環境準備実行初めに TTSのデータセットにはクリーンな音声が必要ですが、クリーンな音声を集めるためには労力がかなり大変になります。以下はGoogle が発表した劣化した音声を高品質に変換する音声復元(SR)技術です。今回はこちらの再現リポジト…

2024-02-24

reazonspeech-nemo-v2を使ってフォルダ内にある音声ファイルの文字起こしをしてCSVとJsonに保存する

AI Python

初めにデモ開発環境準備文字お越し及びファイル保存エラー対応 CUDAがenabledになっていない場合 ReazonSpeech/pkg/nemo-asrのインストールが失敗する参考サイト初めに STTやTTSの学習等をする際に文字データが必要になるのですが、音声だけある場合…

2024-02-24

Style-Bert-VITS2の事前学習モデルを独自データで作成する

AI

初めにわかっている人向けデモ開発環境環境の準備データセットの準備データの配置前処理の実行事前学習の開始 pthをsafetensorsに変換するマルチGPUで学習をする場合初めに Style-Bert-VITS2は、日本語におけるアクセントなどの改善によりTTSでは…

2024-02-22

huggingface経由でgoogle/gemma-7b-itを動かす

AI

初めに環境準備実行初めに以下を試してみます huggingface.co 環境 L4 GPU(Jupyter Notebook) ubuntu22.04 準備以下のライブラリを入れます !pip install transformers bitsandbytes accelerate モデルのダウンロードをします # pip install bitsandby…

2024-02-21

独自データを使用してQLoRAでfine turningする

AI

初めに開発環境データ準備 datasetsを使ったローカルのjsonのロード初めに以下のようにQLoRAを使ってfine turningを行いましたが、独自データを使いたい場合の適当方法についてやってみます ayousanz.hatenadiary.jp 開発環境 cuda:12.2.0-base-ubuntu22…

2024-02-16

pandasを使ってparquetの中身を確認する

AI

環境準備実行環境 python 3.11 準備以下のライブラリをインストールします pip install pyarrow pip install pandas 実行 import pandas as pd # 既にあるDataFrameをParquet形式で保存します。 file_path = "./data.parquet" # Parquetファイルを読み込…

2024-02-15

GoogleColobでreazonspeechのデータセットの音声とテキストをプレビューする

AI

初めに環境準備実行初めに 35,000時間のコーパスである「ReazonSpeech v2 コーパス」が公開されたので、実際にどのようなデータが入っているのかを確認したいと思います。 prtimes.jp 環境 Google Colob (CPU) 準備必要なライブラリを入れていきます !p…

2024-01-30

recruit-jp/japanese-clip-vit-b-32-roberta-baseを動かす

AI

初めに環境準備実行モデルのロードサンプル画像のCLIPテストつくよみちゃん画像のCLIPテスト雰囲気のテスト初めに日本語に対応しているCLIPモデルが新しく出てきたので、試してみます blog.recruit.co.jp 環境 L4 GPU ubuntu22.04 準備ライブラリ…

2024-01-26

faster-whisper+Dockerで音声からテキスト変換(STT)のAPIを実装する

AI Python

初めにデモ開発環境実装環境を作るモデルのロードと初期化 STTのAPIの作成初めに音声認識をしたい場合whisperを使うことが多いですが、より速くより使いやすくしたいと思ってたので実装をしてみました！ DockerでCUDAのver管理やGPUも使えるようにし…

2024-01-25

cyberagent/calm2-7b-chat-dpo-experimentalを動かす

AI

初めに環境準備実行モデルのロードサンプルプロンプトまどマギプロンプト初めに DPOを採用したチューニングでスコアが上がったとのことなので触ってみます CALM2をDirect Preference Optimization (DPO)でチューニングしたモデル calm2-7b-chat-dpo …

2024-01-23

GoogleColobで小規模言語モデル(0.15B)の事前学習モデルを作ってみる

AI

はじめに成果参考記事からの変更点環境環境設定データセットの構築トークナイザー準備事前学習学習用のパラメータの設定事前学習の実行推論モデルをhuggingfaceにアップグレードするライブラリのインストールとログインモデルのアップロードは…

2024-01-20

stabilityai/stablelm-2-zephyr-1_6bを動かす

AI

初めに環境準備実行サンプルプロンプトまどマギプロンプト初めに Stability AIから1.6Bでパフォーマンスがいいモデルが出たみたいなので、触ってみます Today, we’re releasing Stable LM 2 1.6B, a state-of-the-art 1.6 billion parameter small lan…

2024-01-17

stabilityai/stable-code-3bを動かす

AI

初めに環境準備実行モデルのロードサンプルプロンプト find cpu number fanction Unityのコード補正初めにコードの補正LLMが出たので、触っていきます Stable Code 3Bが登場！30億パラメータの大規模言語モデルで、コード補完が今までにないスピード…

2024-01-16

つくよみちゃんモデル(のほしお式)をUnityでロードしたときにピンクになる対応

Unity

環境問題解決方法環境 Unity 2023.2.4f1 VRM v0.117 つくよみちゃん 3Dモデルのほしお式 manifest.jsonに以下を追加済み "com.vrmc.vrmshaders": "https://github.com/vrm-c/UniVRM.git?path=/Assets/VRMShaders#v0.117.0", "com.vrmc.gltf": "https://g…

2024-01-15

Mergekitでcalm2-7b-chatとyouri-7b-instructionで日本語モデルMoEを作成する

AI

初めに環境準備 cloneとライブラリのインストール必要なフォルダの作成 config ファイルを作成 LLMのマージオプションモデルをhuggingfaceに公開モデルカードの作成モデルのアップロード初めに自分でもMoEが作れるみたいなので、実際にやってみます…

2024-01-14

HachiML/youri-2x7b_devを動かす

AI

初めに環境準備実行サンプルプロンプト(翻訳) まどマギプロンプト初めに日本語のモデルのMoEが出たので、触ってみます mergekitを使ってMoEモデルを作ってみました。・rinna/youri-7b-instruction・rinna/youri-7b-chatchatモデルとinstructionモデル…

2024-01-14

LLaMA-Factoryでphi-2をござるデータセットでfine-tuningする

AI

初めに環境開発環境モデル等の環境準備 WebUI実行学習の設定と実行学習結果評価 Chat結果備考初めに microsoft/phi-2はSLMで小さい言語モデルで、fine tuningをすればかなり使い勝手がいいということなので、実際にやってみます。以下のサイトを基…

2024-01-13

cyberagent/calm2-7bをQLoRAで語尾をござるにする

AI

環境参考サイト準備ライブラリのインストール qlora.pyの変更学習学習したモデルで推論備考 ValueError: Tokenizer class GPTNeoXTokenizer does not exist or is not currently imported.のエラー対応環境 L4 GPU ubuntu22.04 学習データ bbz662bbz/…

2024-01-13

ahxt/LiteLlama-460M-1Tを動かす

AI

初めに環境準備実行モデルのロードサンプルプロンプトまどマギまどマギQA 初めに With the recent release of #TinyLlama, SLMs have attracted a lot of attention. I re-released my previously trained SLM - LiteLlama under the MIT license, wh…

2024-01-11

mergekitを使って2つのLLMをマージしてマージモデルを作成する

AI

初めに環境準備マージ元のモデルの定義モデルのマージモデルをhuggingfaceにアップロードするマージしたモデルを動かすモデルのロード続きの推論まどマギテスト初めに LLMのマージがより簡単にできるライブラリが公開されたので触っていきます git…

2024-01-09

sudy-super/baku-13b-v2を動かす

AI

初めに環境準備推論モデルのロードサンプルプロンプトまどマギプロンプトまどマギで一番可愛いキャラはなんですか？初めに高校生の方がマージモデルを公開されたということなので、触っていきます calm2-7bの1~24層、8~32層をslerpマージしたbaku-1…

2024-01-08

GameCIを使ってUnityのCI/CD環境をGitHubActions上に構築する

Unity GitHubActions

はじめに Demo 環境ライセンス認証ビルドの自動化テストの自動化はじめに昔にGameCIを使ってGitHub Actions上でUnityのテストやビルドの自動化をする記事を書きました。しかし、UnityのLicense認証周りが変わったことで以下では動かなくなっていたため…

2024-01-05

huggingfaceにフォルダごとアップロードする

AI

huggingface_hub CLIをインストールリポジトリの作成 huggingfaceにlogin フォルダのアップロードデータセットのリポジトリにアップロードする場合参考 huggingface_hub CLIをインストール huggingface.co pip install -U "huggingface_hub[cli]" リポジ…

2024-01-04

ulimitで使用できるメモリの最大使用量を設定する

環境最大使用量を設定する設定を確認する環境 Linux(Ubuntu) 最大使用量を設定する以下のコマンドで最大使用量を設定できます。ただ数値はKBなので、GBの場合は、1024 × 1024をする必要があります (例) 20GB = 20 × 1024 × 1024 = 20971520 ulimit -m 最…

2024-01-04

transformers.jsでLLMをONNXに変換する

AI

初めに環境準備 ONNXに変換 bert-base-uncased rinna/japanese-gpt2-xsmall rinna/japanese-gpt-neox-3.6b-instruction-sft-v2 cyberagent/calm2-7b-chat モデルのサイズごとの使用メモリ量初めに Web(transformers.js)やunityでLLMを使う際にフォーマッ…

2024-01-04

upstage/SOLAR-10.7B-Instruct-v1.0を動かす

AI

初めに環境準備モデルのロード実行サンプルテストまどマギテスト初めに SOLAR-10.7B has remarkable performance. It outperforms models with up to 30B parameters, even surpassing the recent Mixtral 8X7B model. と書かれているので、どのくら…

2024-01-04

TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUFをllama.cppで動かす

AI

環境準備実行まどマギテスト富士山の高さは？ What American movies do you recommend that make you cry? 環境 Linux(ubuntu22.04) L4 GPU 準備 TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUFのtinyllama-1.1b-chat-v1.0.Q4_K_M.ggufをダウンロードします l…

2024-01-02

MacでAirLLMで動かす

AI

初めに環境準備コードの作成推論結果 tokens = 3の場合 tokens = 100の場合まとめ初めに MacでLLMで動くライブラリ「AirLLM」があると聞いたので、実際に試してみます github.com 参考サイト note.com 環境 CPU : M1Max Mac メモリ : 64GB モデル : e…

2024-01-01

Unityでllama.cpp(calm2)をサーバーAPIとしてチャット機能を作る

AI Unity

はじめに環境準備 cmakeの環境作成 llama.cppの環境作成モデルのダウンロード llama.cppの動作確認 llama.cppをサーバーとして実行 Unityに必要なライブラリの追加レスポンスのクラスの作成 Unityからllama.cppに対してAPIを叩く llama.cppのGPUオフロー…