開発環境
- python 3.9
- uv
セットアップ
ライブラリをインストールします
uv pip install datasets[audio] soundfile pydub
実行
以下でデータセットをダウンロードして、wav形式で保存します
from datasets import load_dataset import soundfile as sf # wavファイルの保存に使用 from pydub import AudioSegment # mp3ファイルの保存に使用 import os # 日本語のデータセットをロード ds = load_dataset("diarizers-community/callhome", "jpn", split='data') # 保存先のディレクトリを指定 output_dir = "callhome_japanese_audio" os.makedirs(output_dir, exist_ok=True) # 音声データをループして保存 for idx, example in enumerate(ds): # 音声データの取得 audio = example['audio'] array = audio['array'] sampling_rate = audio['sampling_rate'] # ファイル名を作成 filename_base = f"callhome_jpn_{idx}" # wavファイルとして保存 wav_path = os.path.join(output_dir, f"{filename_base}.wav") sf.write(wav_path, array, sampling_rate) print(f"Saved WAV file: {wav_path}")