2024-03-17から1日間の記事一覧

マルチGPUででLLMの学習時をする際の「NCCL communicator and retrieving ncclUniqueId」のエラーの対応

AI

開発環境 nvidia-smi nvcc 詳細 開発環境 NVIDIA RTX A5000 × 7(シングルノード) Ubuntu 22.04.4 LTS nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 550.54.14 Driver Version: 55…