huggingface経由でgoogle/gemma-7b-itを動かす

AI

初めに環境準備実行初めに以下を試してみます huggingface.co 環境 L4 GPU(Jupyter Notebook) ubuntu22.04 準備以下のライブラリを入れます !pip install transformers bitsandbytes accelerate モデルのダウンロードをします # pip install bitsandby…

2024-02-21

独自データを使用してQLoRAでfine turningする

AI

初めに開発環境データ準備 datasetsを使ったローカルのjsonのロード初めに以下のようにQLoRAを使ってfine turningを行いましたが、独自データを使いたい場合の適当方法についてやってみます ayousanz.hatenadiary.jp 開発環境 cuda:12.2.0-base-ubuntu22…

2024-02-16

pandasを使ってparquetの中身を確認する

AI

環境準備実行環境 python 3.11 準備以下のライブラリをインストールします pip install pyarrow pip install pandas 実行 import pandas as pd # 既にあるDataFrameをParquet形式で保存します。 file_path = "./data.parquet" # Parquetファイルを読み込…

2024-02-15

GoogleColobでreazonspeechのデータセットの音声とテキストをプレビューする

AI

初めに環境準備実行初めに 35,000時間のコーパスである「ReazonSpeech v2 コーパス」が公開されたので、実際にどのようなデータが入っているのかを確認したいと思います。 prtimes.jp 環境 Google Colob (CPU) 準備必要なライブラリを入れていきます !p…

2024-01-30

recruit-jp/japanese-clip-vit-b-32-roberta-baseを動かす

AI

初めに環境準備実行モデルのロードサンプル画像のCLIPテストつくよみちゃん画像のCLIPテスト雰囲気のテスト初めに日本語に対応しているCLIPモデルが新しく出てきたので、試してみます blog.recruit.co.jp 環境 L4 GPU ubuntu22.04 準備ライブラリ…

2024-01-26

faster-whisper+Dockerで音声からテキスト変換(STT)のAPIを実装する

AI Python

初めにデモ開発環境実装環境を作るモデルのロードと初期化 STTのAPIの作成初めに音声認識をしたい場合whisperを使うことが多いですが、より速くより使いやすくしたいと思ってたので実装をしてみました！ DockerでCUDAのver管理やGPUも使えるようにし…

2024-01-25

cyberagent/calm2-7b-chat-dpo-experimentalを動かす

AI

初めに環境準備実行モデルのロードサンプルプロンプトまどマギプロンプト初めに DPOを採用したチューニングでスコアが上がったとのことなので触ってみます CALM2をDirect Preference Optimization (DPO)でチューニングしたモデル calm2-7b-chat-dpo …

2024-01-23

GoogleColobで小規模言語モデル(0.15B)の事前学習モデルを作ってみる

AI

はじめに成果参考記事からの変更点環境環境設定データセットの構築トークナイザー準備事前学習学習用のパラメータの設定事前学習の実行推論モデルをhuggingfaceにアップグレードするライブラリのインストールとログインモデルのアップロードは…

2024-01-20

stabilityai/stablelm-2-zephyr-1_6bを動かす

AI

初めに環境準備実行サンプルプロンプトまどマギプロンプト初めに Stability AIから1.6Bでパフォーマンスがいいモデルが出たみたいなので、触ってみます Today, we’re releasing Stable LM 2 1.6B, a state-of-the-art 1.6 billion parameter small lan…

2024-01-17

stabilityai/stable-code-3bを動かす

AI

初めに環境準備実行モデルのロードサンプルプロンプト find cpu number fanction Unityのコード補正初めにコードの補正LLMが出たので、触っていきます Stable Code 3Bが登場！30億パラメータの大規模言語モデルで、コード補完が今までにないスピード…

2024-01-15

Mergekitでcalm2-7b-chatとyouri-7b-instructionで日本語モデルMoEを作成する

AI

初めに環境準備 cloneとライブラリのインストール必要なフォルダの作成 config ファイルを作成 LLMのマージオプションモデルをhuggingfaceに公開モデルカードの作成モデルのアップロード初めに自分でもMoEが作れるみたいなので、実際にやってみます…

2024-01-14

HachiML/youri-2x7b_devを動かす

AI

初めに環境準備実行サンプルプロンプト(翻訳) まどマギプロンプト初めに日本語のモデルのMoEが出たので、触ってみます mergekitを使ってMoEモデルを作ってみました。・rinna/youri-7b-instruction・rinna/youri-7b-chatchatモデルとinstructionモデル…

2024-01-14

LLaMA-Factoryでphi-2をござるデータセットでfine-tuningする

AI

初めに環境開発環境モデル等の環境準備 WebUI実行学習の設定と実行学習結果評価 Chat結果備考初めに microsoft/phi-2はSLMで小さい言語モデルで、fine tuningをすればかなり使い勝手がいいということなので、実際にやってみます。以下のサイトを基…

2024-01-13

cyberagent/calm2-7bをQLoRAで語尾をござるにする

AI

環境参考サイト準備ライブラリのインストール qlora.pyの変更学習学習したモデルで推論備考 ValueError: Tokenizer class GPTNeoXTokenizer does not exist or is not currently imported.のエラー対応環境 L4 GPU ubuntu22.04 学習データ bbz662bbz/…

2024-01-13

ahxt/LiteLlama-460M-1Tを動かす

AI

初めに環境準備実行モデルのロードサンプルプロンプトまどマギまどマギQA 初めに With the recent release of #TinyLlama, SLMs have attracted a lot of attention. I re-released my previously trained SLM - LiteLlama under the MIT license, wh…

2024-01-11

mergekitを使って2つのLLMをマージしてマージモデルを作成する

AI

初めに環境準備マージ元のモデルの定義モデルのマージモデルをhuggingfaceにアップロードするマージしたモデルを動かすモデルのロード続きの推論まどマギテスト初めに LLMのマージがより簡単にできるライブラリが公開されたので触っていきます git…

2024-01-09

sudy-super/baku-13b-v2を動かす

AI

初めに環境準備推論モデルのロードサンプルプロンプトまどマギプロンプトまどマギで一番可愛いキャラはなんですか？初めに高校生の方がマージモデルを公開されたということなので、触っていきます calm2-7bの1~24層、8~32層をslerpマージしたbaku-1…

2024-01-05

huggingfaceにフォルダごとアップロードする

AI

huggingface_hub CLIをインストールリポジトリの作成 huggingfaceにlogin フォルダのアップロードデータセットのリポジトリにアップロードする場合参考 huggingface_hub CLIをインストール huggingface.co pip install -U "huggingface_hub[cli]" リポジ…

2024-01-04

transformers.jsでLLMをONNXに変換する

AI

初めに環境準備 ONNXに変換 bert-base-uncased rinna/japanese-gpt2-xsmall rinna/japanese-gpt-neox-3.6b-instruction-sft-v2 cyberagent/calm2-7b-chat モデルのサイズごとの使用メモリ量初めに Web(transformers.js)やunityでLLMを使う際にフォーマッ…

2024-01-04

upstage/SOLAR-10.7B-Instruct-v1.0を動かす

AI

初めに環境準備モデルのロード実行サンプルテストまどマギテスト初めに SOLAR-10.7B has remarkable performance. It outperforms models with up to 30B parameters, even surpassing the recent Mixtral 8X7B model. と書かれているので、どのくら…

2024-01-04

TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUFをllama.cppで動かす

AI

環境準備実行まどマギテスト富士山の高さは？ What American movies do you recommend that make you cry? 環境 Linux(ubuntu22.04) L4 GPU 準備 TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUFのtinyllama-1.1b-chat-v1.0.Q4_K_M.ggufをダウンロードします l…

2024-01-02

MacでAirLLMで動かす

AI

初めに環境準備コードの作成推論結果 tokens = 3の場合 tokens = 100の場合まとめ初めに MacでLLMで動くライブラリ「AirLLM」があると聞いたので、実際に試してみます github.com 参考サイト note.com 環境 CPU : M1Max Mac メモリ : 64GB モデル : e…

2024-01-01

Unityでllama.cpp(calm2)をサーバーAPIとしてチャット機能を作る

AI Unity

はじめに環境準備 cmakeの環境作成 llama.cppの環境作成モデルのダウンロード llama.cppの動作確認 llama.cppをサーバーとして実行 Unityに必要なライブラリの追加レスポンスのクラスの作成 Unityからllama.cppに対してAPIを叩く llama.cppのGPUオフロー…

2023-12-30

VITA-Group/4DGenをGoogleColobで動かす

AI

環境準備学習動画およびポイントクラウドデータの作成使用リソース環境 Google Colob(ハイメモリ) 準備ライブラリのインストール等を行います。 %cd /content !git clone -b dev https://github.com/camenduru/4DGen %cd /content/4DGen !wget https:/…

2023-12-29

vLLMでlightblue/qarasu-14B-chat-plus-unleashedをGoogleColobで動かす

AI

はじめに環境準備推論モデルのロードサンプルプロンプトまどマギプロンプト使用リソースはじめに年末にして新しいモデルが出たので、触っていきます商用利用可能な日本語LLM「Karasu」「Qarasu」を公開しました。MTベンチで日本語公開モデルで最高…

2023-12-28

watashiha/watashiha-gpt-6bをGoogleColobで動かす

AI

準備推論モデルのロードサンプルプロンプト面白いセリフまどマギプロンプト改使用リソース準備以下をインストールします !pip install torch !pip install transformers !pip install sentencepiece 推論モデルのロードサンプルコード通りbf16でロ…

2023-12-27

elyza/ELYZA-japanese-Llama-2-13b-fast-instructを動かす

AI

初めに環境準備推論モデルのロードサンプルプロンプトまどマギテスト使用リソース初めに環境 L4 GPU OS : Ubunts 22.04 準備必要なライブラリを入れます !pip install accelerate !pip install torch !pip install transformers 推論モデルのロー…

2023-12-23

LLMのrinna/nekomata-14bをGGUFに変換して動かす

AI

はじめに環境開発環境構築 LLMをGGUFに変換 llama.cppの準備モデルのダウンロード GGUFに変換 GGUFを量子化 GGUF化したモデルを動かす llama.cppをGPUで動かす環境を構築 cmakeをインストール CUDA Toolkitをインストール cuBLASを使えるようにする cuBLA…

#llamacpp #nekomata #modal #LLM

2023-12-22

mmnga/rinna-nekomata-14b-instruction-ggufをGoogleColobで動かす

AI

はじめに環境準備推論翻訳まどマギはじめに ayousanz.hatenadiary.jp もうGGUFが出ていたので動かしていきます huggingface.co 環境 Google Colob (T4) 準備 llama.cppのダウンロードをします !git clone https://github.com/ggerganov/llama.cpp.git …

2023-12-21

rinna/nekomata-14b-instructionを動かす(4bit量子化を含む)

AI

はじめに環境準備推論モデルのロード翻訳プロンプトまどマギプロンプト使用リソース 4bit量子化版追加ライブラリモデルのロードの設定推論使用リソースはじめに公開されたので、触っていきます rinnaはQwen-7Bと14Bの日本語継続事前学習モデル…