mergekitを使って2つのLLMをマージしてマージモデルを作成する

AI

初めに環境準備マージ元のモデルの定義モデルのマージモデルをhuggingfaceにアップロードするマージしたモデルを動かすモデルのロード続きの推論まどマギテスト初めに LLMのマージがより簡単にできるライブラリが公開されたので触っていきます git…

2024-01-09

sudy-super/baku-13b-v2を動かす

AI

初めに環境準備推論モデルのロードサンプルプロンプトまどマギプロンプトまどマギで一番可愛いキャラはなんですか？初めに高校生の方がマージモデルを公開されたということなので、触っていきます calm2-7bの1~24層、8~32層をslerpマージしたbaku-1…

2024-01-08

GameCIを使ってUnityのCI/CD環境をGitHubActions上に構築する

Unity GitHubActions

はじめに Demo 環境ライセンス認証ビルドの自動化テストの自動化はじめに昔にGameCIを使ってGitHub Actions上でUnityのテストやビルドの自動化をする記事を書きました。しかし、UnityのLicense認証周りが変わったことで以下では動かなくなっていたため…

2024-01-05

huggingfaceにフォルダごとアップロードする

AI

huggingface_hub CLIをインストールリポジトリの作成 huggingfaceにlogin フォルダのアップロードデータセットのリポジトリにアップロードする場合参考 huggingface_hub CLIをインストール huggingface.co pip install -U "huggingface_hub[cli]" リポジ…

2024-01-04

ulimitで使用できるメモリの最大使用量を設定する

環境最大使用量を設定する設定を確認する環境 Linux(Ubuntu) 最大使用量を設定する以下のコマンドで最大使用量を設定できます。ただ数値はKBなので、GBの場合は、1024 × 1024をする必要があります (例) 20GB = 20 × 1024 × 1024 = 20971520 ulimit -m 最…

2024-01-04

transformers.jsでLLMをONNXに変換する

AI

初めに環境準備 ONNXに変換 bert-base-uncased rinna/japanese-gpt2-xsmall rinna/japanese-gpt-neox-3.6b-instruction-sft-v2 cyberagent/calm2-7b-chat モデルのサイズごとの使用メモリ量初めに Web(transformers.js)やunityでLLMを使う際にフォーマッ…

2024-01-04

upstage/SOLAR-10.7B-Instruct-v1.0を動かす

AI

初めに環境準備モデルのロード実行サンプルテストまどマギテスト初めに SOLAR-10.7B has remarkable performance. It outperforms models with up to 30B parameters, even surpassing the recent Mixtral 8X7B model. と書かれているので、どのくら…

2024-01-04

TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUFをllama.cppで動かす

AI

環境準備実行まどマギテスト富士山の高さは？ What American movies do you recommend that make you cry? 環境 Linux(ubuntu22.04) L4 GPU 準備 TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUFのtinyllama-1.1b-chat-v1.0.Q4_K_M.ggufをダウンロードします l…

2024-01-02

MacでAirLLMで動かす

AI

初めに環境準備コードの作成推論結果 tokens = 3の場合 tokens = 100の場合まとめ初めに MacでLLMで動くライブラリ「AirLLM」があると聞いたので、実際に試してみます github.com 参考サイト note.com 環境 CPU : M1Max Mac メモリ : 64GB モデル : e…

2024-01-01

Unityでllama.cpp(calm2)をサーバーAPIとしてチャット機能を作る

AI Unity

はじめに環境準備 cmakeの環境作成 llama.cppの環境作成モデルのダウンロード llama.cppの動作確認 llama.cppをサーバーとして実行 Unityに必要なライブラリの追加レスポンスのクラスの作成 Unityからllama.cppに対してAPIを叩く llama.cppのGPUオフロー…

yousanのメモ

2024-01-01から1年間の記事一覧

mergekitを使って2つのLLMをマージしてマージモデルを作成する

sudy-super/baku-13b-v2を動かす

GameCIを使ってUnityのCI/CD環境をGitHubActions上に構築する

huggingfaceにフォルダごとアップロードする

ulimitで使用できるメモリの最大使用量を設定する

transformers.jsでLLMをONNXに変換する

upstage/SOLAR-10.7B-Instruct-v1.0を動かす

TheBloke/TinyLlama-1.1B-Chat-v1.0-GGUFをllama.cppで動かす

MacでAirLLMで動かす

Unityでllama.cpp(calm2)をサーバーAPIとしてチャット機能を作る