2023-12-23から1日間の記事一覧

2023-12-23

LLMのrinna/nekomata-14bをGGUFに変換して動かす

はじめに環境開発環境構築 LLMをGGUFに変換 llama.cppの準備モデルのダウンロード GGUFに変換 GGUFを量子化 GGUF化したモデルを動かす llama.cppをGPUで動かす環境を構築 cmakeをインストール CUDA Toolkitをインストール cuBLASを使えるようにする cuBLA…

#llamacpp #nekomata #modal #LLM