bertモデルを使ってlivedoorニュースの分類をする

AI

初めに環境準備ライブラリのインストールデータの取得と整理モデルの学習モデルの評価モデルの保存とhuggingfaceへのアップロード追加学習をしたモデルを使って分類初めに色々LLMを触ってきて、ちゃんと?bertを触ったことがないので以下の記事を自…

2024-03-30

huggingfaceのCacheパスを変更する

AI

開発環境詳細開発環境 Windows 11 詳細以下を参考に参照するパスを変更します。ターミナルを立ち上げるごとに設定する必要があります huggingface.co $env:HF_DATASETS_CACHE = "full path"

2024-03-26

ESPNet2を使った音声とテキストのアライメント処理

AI

開発環境ライブラリのインストールアライメント処理開発環境 Ubuntu 22.02 Python 3.10 ライブラリのインストール以下で必要なライブラリを入れます pip install soundfile espnet_model_zoo torch sudo pip install soundfile espnet_model_zoo torch …

2024-03-26

KenLMで日本語文章の品質の評価

AI

初めに開発環境環境構築評価コード結果 sentencepieceを使った場合参考サイト初めに以下でLLMを使って文章の評価をしていますが、速度が速いと言われるKenLMでも評価してみます ayousanz.hatenadiary.jp 開発環境 Ubuntu22.02 環境構築 sudo apt inst…

2024-03-26

複数のLLMのPerplexityの精度を比較して、文章の自然さを判定を試す

AI

初めに環境準備比較対象のモデル対象のデータ複数のモデルでPerplexityの値を取得結果初めに環境 L4 GPU ubuntu22.04 準備ライブラリをインストールします pip install torch transformers huggingface_hub 比較対象のモデル stabilityai/StableBel…

2024-03-25

cl-tohoku/bert-base-japaneseを使って文章の自然さを判定する

AI

開発環境ライブラリのインストールデータの準備文章の自然さの判定開発環境 Ubuntu 22.02 Python 3.10 ライブラリのインストール pip install torch transformers pip install fugashi ipadic データの準備以下のようなデータを準備しますそれと僕が材…

2024-03-25

文章の類似度にminineedleを使って類似度測定を行う

AI

初めに開発環境ライブラリのインストール minineedleで使用できるアルゴリズムについて複数の文章で実行初めに文章の類似度に minineedleを教えていただいたので触ってみます。ライブラリの内容を見る感じタンパク質配列間などを記載があるので、生物…

2024-03-22

espnet/yodasの音声データをmp3に変換してローカルに保存する

AI

開発環境ライブラリのインストール mp3に変換・保存開発環境 Ubunts 22.02 ライブラリのインストール pip install pydub sudo apt-get install ffmpeg pip install librosa soundfile mp3に変換・保存以下で.arrowで保存されているデータをmp3に変換して…

2024-03-19

ChromeDBとBeluuuuuuga/Japanese-Instruction-Linux-Command-169を使って質問に対する適切なLinuxコマンドを探すRAGを構築する

AI

初めにデモ開発環境 Chromeとは RAGシステムの構築ライブラリの準備 DBの構築とデータの追加質問をして回答を取得初めに珍しい？データセットがあったので、こちらを使ってLinuxで操作したいことがあるけどコマンドがわからない場合に雑に質問ができる…

2024-03-17

マルチGPUででLLMの学習時をする際の「NCCL communicator and retrieving ncclUniqueId」のエラーの対応

AI

開発環境 nvidia-smi nvcc 詳細開発環境 NVIDIA RTX A5000 × 7(シングルノード) Ubuntu 22.04.4 LTS nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 550.54.14 Driver Version: 55…

2024-03-16

reazon-research/reazonspeech(tiny)の音声データをNISQAで音声品質と自然さの評価のデータ分析をする

AI

初めに環境分析処理の方向性 reazonspeechのデータフォーマット NISQAの実行方法について分析の方向性前処理 reazonspeechのデータをflacに変換 flacファイルをwavファイルに変換 NISQAでwavファイルを分析 CSVから分析初めに NISQAを使ってreazon-rese…

2024-03-16

ffmpegを使ってflacファイルをwavファイルにGNU Parallelを使って並列処理で変換をする

AI

初めに開発環境詳細初めに開発環境 cuda:12.2.0 ubuntu22.04 詳細以下のコードにて、指定したフォルダ内にあるflacファイルをwavファイルに変換します。このとき -j $(nproc) でCPUの最大コア数を指定しているのため、必要に応じて変更してください #!/…

2024-03-16

reazon-research/reazonspeech(tiny)のデータセットをflac及びwavファイルで個別に保存する

AI

環境準備実行 pythonでflacに変換 pythonでwavに変換変換したwavファイルの情報を確認 ffmpegでflacからwavに変換環境 L4 GPU ubuntu22.04 準備実行 pythonでflacに変換 from datasets import load_dataset import os # データセットをロード ds = load…

2024-03-15

reazon-research/reazonspeech(tiny)の音声データをSpeechMOSで音声の自然さのデータ分析をする

AI

初めに環境準備 SpeechMOSによるデータ分析初めに前回は、WADR-SNRで分析をしました。今回は SpeechMOSを使って音声の品質を分析していきます ayousanz.hatenadiary.jp 環境 Google Colob(CPU) 準備必要なライブラリを入れていきます !pip install data…

2024-03-14

GaLoreを使って0.01Bモデル(EN)を作ってみる(モデルが保存できない)

AI

初めに環境環境準備学習初めに LoRAよりもメモリ効率がよく学習ができる手法であるGaLoreで試してみます論文のabstractの日本語訳は以下です(claude 3 opus を使用) 大規模言語モデル（LLM）の学習では、重みと最適化器の状態のサイズが増大するため、…

2024-03-13

intfloat/e5-mistral-7b-instructを動かす

AI

初めに環境準備実行初めに日本語の埋め込みモデルでスコアが高い intfloat/e5-mistral-7b-instructを触ってみます参考(JapaneseEmbeddingEval) github.com 環境 L4 GPU ubuntu22.04 準備ライブラリの追加をします !pip install flash_attn -U !pip in…

2024-03-13

cl-nagoya/shioriha-large-ptを動かす

AI

初めに環境準備実行初めに公開されたので触っていきます東北大BERT-largeに対し、batch size 8192, 系列長 256で、日本語WikipediaやMMARCOといった弱教師データによる対照事前学習を行ったモデルであるshioriha-large-ptを公開しました。文埋め込みに…

2024-03-12

TripoSRを動かす

AI

初めに環境準備実行初めに text to 3DがStabilityAIから出たので触ってみます新リリース@tripoAI とのコラボレーションにより、TripoSR をリリースしました。TripoSR は、1秒以内に高品質なアウトプットを作成できる新しい image-to-3D モデルです。詳…

2024-03-10

MeloTTSを動かす

AI

初めに環境準備実行初めに新しいTTSのライブラリが出ていたので触っていきます。以下概要です MeloTTS is a high-quality multi-lingual text-to-speech library by MyShell.ai. Supported languages include: The Chinese speaker supports mixed Chi…

2024-03-09

ITAコーパスをファイル名と本文のみに変換するスクリプトを作成する

AI Python

初めに環境変換コード実行初めに TTSの学習データを作る際に音声コーパスにはよく ITAコーパスが用いられることがあります。このコーパスは以下のフォーマットで作成されています. ファイル名:本文,ヨミこちらを学習に使う際にヨミの部分は、必要がな…

2024-03-07

独自のデータセットで学習したLoRAモデルをllama.cppで動かす

AI

初めに環境 LoRAモデルの作成(一部割愛) llama.cppでの変換 LoRAのテスト初めに以前に独自のデータセットをQLoRAを使い fine tuningを行いました。ここで作られてたLoRAモデルをllama.cppでも使っていきたいと思います ayousanz.hatenadiary.jp 今回はつ…

2024-03-03

tokyotech-llm/Swallow-7b-plus-hfをGoogleColobで動かす

AI

初めに環境準備ライブラリの追加モデルのロード実行サンプルプロンプトまどマギプロンプト使用リソース初めに Swallow-7bよりも精度が高いモデルが出たみたいなので触ってみます huggingface.co まどマギプロンプトの場合は、以下のようになります …

2024-03-03

LayerDiffusionをGoogle Colobで動かす

AI

初めに環境準備実行備考初めに背景を透過できる画像生成ができるLayerDiffusionが出てきたので触っていきます。今回はColob版が公開されていたのでこちらでやっていきます LayerDiffusion 能用了！作者更新了 README ，Forge 版已优先支持了基础的图像…

2024-02-28

reazon-research/reazonspeech(small)の音声データをWADA-SNRで信号対雑音比のデータ分析をする

AI Python

初めにデモ開発環境準備分析手順データをダウンロード・ロード WAND-SNRを使って音声データの分析分析結果をヒストグラムで表示 WADA-SNR値が100以上のデータ個数を取得備考 Windowsでのプロセスエラー対応並列処理対応初めに reazon-research/reaz…

2024-02-24

miipher非公式リポジトリで音声ファイルのノイズ除去を行う

AI

初めに環境準備実行初めに TTSのデータセットにはクリーンな音声が必要ですが、クリーンな音声を集めるためには労力がかなり大変になります。以下はGoogle が発表した劣化した音声を高品質に変換する音声復元(SR)技術です。今回はこちらの再現リポジト…

2024-02-24

reazonspeech-nemo-v2を使ってフォルダ内にある音声ファイルの文字起こしをしてCSVとJsonに保存する

AI Python

初めにデモ開発環境準備文字お越し及びファイル保存エラー対応 CUDAがenabledになっていない場合 ReazonSpeech/pkg/nemo-asrのインストールが失敗する参考サイト初めに STTやTTSの学習等をする際に文字データが必要になるのですが、音声だけある場合…

2024-02-24

Style-Bert-VITS2の事前学習モデルを独自データで作成する

AI

初めにわかっている人向けデモ開発環境環境の準備データセットの準備データの配置前処理の実行事前学習の開始 pthをsafetensorsに変換するマルチGPUで学習をする場合初めに Style-Bert-VITS2は、日本語におけるアクセントなどの改善によりTTSでは…

2024-02-22

huggingface経由でgoogle/gemma-7b-itを動かす

AI

初めに環境準備実行初めに以下を試してみます huggingface.co 環境 L4 GPU(Jupyter Notebook) ubuntu22.04 準備以下のライブラリを入れます !pip install transformers bitsandbytes accelerate モデルのダウンロードをします # pip install bitsandby…

2024-02-21

独自データを使用してQLoRAでfine turningする

AI

初めに開発環境データ準備 datasetsを使ったローカルのjsonのロード初めに以下のようにQLoRAを使ってfine turningを行いましたが、独自データを使いたい場合の適当方法についてやってみます ayousanz.hatenadiary.jp 開発環境 cuda:12.2.0-base-ubuntu22…

2024-02-16

pandasを使ってparquetの中身を確認する

AI

環境準備実行環境 python 3.11 準備以下のライブラリをインストールします pip install pyarrow pip install pandas 実行 import pandas as pd # 既にあるDataFrameをParquet形式で保存します。 file_path = "./data.parquet" # Parquetファイルを読み込…