huggingfaceのCacheパスを変更する

AI

開発環境詳細開発環境 Windows 11 詳細以下を参考に参照するパスを変更します。ターミナルを立ち上げるごとに設定する必要があります huggingface.co $env:HF_DATASETS_CACHE = "full path"

2024-03-30

日本語を含むZipファイルをコマンドから解凍する

初めに開発環境詳細インストール一つのファイルを解凍フォルダ内すべてを解凍初めに zipファイルを解凍するコマンドでは、日本語を含むzipファイルの場合文字化けをします。そこで違うコマンドを使用します開発環境 Mac 詳細インストール brew insta…

2024-03-26

ESPNet2を使った音声とテキストのアライメント処理

AI

開発環境ライブラリのインストールアライメント処理開発環境 Ubuntu 22.02 Python 3.10 ライブラリのインストール以下で必要なライブラリを入れます pip install soundfile espnet_model_zoo torch sudo pip install soundfile espnet_model_zoo torch …

2024-03-26

KenLMで日本語文章の品質の評価

AI

初めに開発環境環境構築評価コード結果 sentencepieceを使った場合参考サイト初めに以下でLLMを使って文章の評価をしていますが、速度が速いと言われるKenLMでも評価してみます ayousanz.hatenadiary.jp 開発環境 Ubuntu22.02 環境構築 sudo apt inst…

2024-03-26

複数のLLMのPerplexityの精度を比較して、文章の自然さを判定を試す

AI

初めに環境準備比較対象のモデル対象のデータ複数のモデルでPerplexityの値を取得結果初めに環境 L4 GPU ubuntu22.04 準備ライブラリをインストールします pip install torch transformers huggingface_hub 比較対象のモデル stabilityai/StableBel…

2024-03-25

cl-tohoku/bert-base-japaneseを使って文章の自然さを判定する

AI

開発環境ライブラリのインストールデータの準備文章の自然さの判定開発環境 Ubuntu 22.02 Python 3.10 ライブラリのインストール pip install torch transformers pip install fugashi ipadic データの準備以下のようなデータを準備しますそれと僕が材…

2024-03-25

文章の類似度にminineedleを使って類似度測定を行う

AI

初めに開発環境ライブラリのインストール minineedleで使用できるアルゴリズムについて複数の文章で実行初めに文章の類似度に minineedleを教えていただいたので触ってみます。ライブラリの内容を見る感じタンパク質配列間などを記載があるので、生物…

2024-03-22

espnet/yodasの音声データをmp3に変換してローカルに保存する

AI

開発環境ライブラリのインストール mp3に変換・保存開発環境 Ubunts 22.02 ライブラリのインストール pip install pydub sudo apt-get install ffmpeg pip install librosa soundfile mp3に変換・保存以下で.arrowで保存されているデータをmp3に変換して…

2024-03-20

Rustの形態素解析ライブラリのlinderaを動かす

初めにデモ開発環境環境構築プロジェクトの作成ビルドと実行初めに Rustで動く辞書サイズが小さくなった形態素解析ライブラリが出ているみたいなので触ってみます Rust製の多言語対応（日本語、中国語、韓国語）形態素解析器Linderaのv0.29.0をリリー…

2024-03-19

ChromeDBとBeluuuuuuga/Japanese-Instruction-Linux-Command-169を使って質問に対する適切なLinuxコマンドを探すRAGを構築する

AI

初めにデモ開発環境 Chromeとは RAGシステムの構築ライブラリの準備 DBの構築とデータの追加質問をして回答を取得初めに珍しい？データセットがあったので、こちらを使ってLinuxで操作したいことがあるけどコマンドがわからない場合に雑に質問ができる…

2024-03-17

マルチGPUででLLMの学習時をする際の「NCCL communicator and retrieving ncclUniqueId」のエラーの対応

AI

開発環境 nvidia-smi nvcc 詳細開発環境 NVIDIA RTX A5000 × 7(シングルノード) Ubuntu 22.04.4 LTS nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 550.54.14 Driver Version: 55…

2024-03-16

reazon-research/reazonspeech(tiny)の音声データをNISQAで音声品質と自然さの評価のデータ分析をする

AI

初めに環境分析処理の方向性 reazonspeechのデータフォーマット NISQAの実行方法について分析の方向性前処理 reazonspeechのデータをflacに変換 flacファイルをwavファイルに変換 NISQAでwavファイルを分析 CSVから分析初めに NISQAを使ってreazon-rese…

2024-03-16

ffmpegを使ってflacファイルをwavファイルにGNU Parallelを使って並列処理で変換をする

AI

初めに開発環境詳細初めに開発環境 cuda:12.2.0 ubuntu22.04 詳細以下のコードにて、指定したフォルダ内にあるflacファイルをwavファイルに変換します。このとき -j $(nproc) でCPUの最大コア数を指定しているのため、必要に応じて変更してください #!/…

2024-03-16

reazon-research/reazonspeech(tiny)のデータセットをflac及びwavファイルで個別に保存する

AI

環境準備実行 pythonでflacに変換 pythonでwavに変換変換したwavファイルの情報を確認 ffmpegでflacからwavに変換環境 L4 GPU ubuntu22.04 準備実行 pythonでflacに変換 from datasets import load_dataset import os # データセットをロード ds = load…

2024-03-15

reazon-research/reazonspeech(tiny)の音声データをSpeechMOSで音声の自然さのデータ分析をする

AI

初めに環境準備 SpeechMOSによるデータ分析初めに前回は、WADR-SNRで分析をしました。今回は SpeechMOSを使って音声の品質を分析していきます ayousanz.hatenadiary.jp 環境 Google Colob(CPU) 準備必要なライブラリを入れていきます !pip install data…

2024-03-14

GaLoreを使って0.01Bモデル(EN)を作ってみる(モデルが保存できない)

AI

初めに環境環境準備学習初めに LoRAよりもメモリ効率がよく学習ができる手法であるGaLoreで試してみます論文のabstractの日本語訳は以下です(claude 3 opus を使用) 大規模言語モデル（LLM）の学習では、重みと最適化器の状態のサイズが増大するため、…

2024-03-13

intfloat/e5-mistral-7b-instructを動かす

AI

初めに環境準備実行初めに日本語の埋め込みモデルでスコアが高い intfloat/e5-mistral-7b-instructを触ってみます参考(JapaneseEmbeddingEval) github.com 環境 L4 GPU ubuntu22.04 準備ライブラリの追加をします !pip install flash_attn -U !pip in…

2024-03-13

cl-nagoya/shioriha-large-ptを動かす

AI

初めに環境準備実行初めに公開されたので触っていきます東北大BERT-largeに対し、batch size 8192, 系列長 256で、日本語WikipediaやMMARCOといった弱教師データによる対照事前学習を行ったモデルであるshioriha-large-ptを公開しました。文埋め込みに…

2024-03-12

TripoSRを動かす

AI

初めに環境準備実行初めに text to 3DがStabilityAIから出たので触ってみます新リリース@tripoAI とのコラボレーションにより、TripoSR をリリースしました。TripoSR は、1秒以内に高品質なアウトプットを作成できる新しい image-to-3D モデルです。詳…

2024-03-10

MeloTTSを動かす

AI

初めに環境準備実行初めに新しいTTSのライブラリが出ていたので触っていきます。以下概要です MeloTTS is a high-quality multi-lingual text-to-speech library by MyShell.ai. Supported languages include: The Chinese speaker supports mixed Chi…

2024-03-09

フォルダ内の全てファイルの先頭に特定の文字を挿入するコマンド

開発環境内容開発環境 Mac 内容特定のフォルダ内のファイルに text という単語を入れたい場合は、以下のように実行します cd /path/to/target_folder && for file in *; do mv "$file" "text$file"; done これによって temp.text というファイルの場合は…

2024-03-09

ITAコーパスをファイル名と本文のみに変換するスクリプトを作成する

AI Python

初めに環境変換コード実行初めに TTSの学習データを作る際に音声コーパスにはよく ITAコーパスが用いられることがあります。このコーパスは以下のフォーマットで作成されています. ファイル名:本文,ヨミこちらを学習に使う際にヨミの部分は、必要がな…

2024-03-08

フォルダ内にある音声ファイルの合計を計算する

Python

初めに環境準備対応音声ファイル実行初めに音声処理をする際にフォルダ内に音声ファイルがあるかを確認したいと思う時があります。その際に使用できる簡単なスクリプトを作ります環境 L4 GPU ubuntu22.04 準備必要なライブラリを入れます sudo apt u…

2024-03-07

独自のデータセットで学習したLoRAモデルをllama.cppで動かす

AI

初めに環境 LoRAモデルの作成(一部割愛) llama.cppでの変換 LoRAのテスト初めに以前に独自のデータセットをQLoRAを使い fine tuningを行いました。ここで作られてたLoRAモデルをllama.cppでも使っていきたいと思います ayousanz.hatenadiary.jp 今回はつ…