yousanのメモ

talkbank/callhomeの日本語音声をwav形式で保存する

AI

開発環境
セットアップ
実行

開発環境

python 3.9
uv

セットアップ

ライブラリをインストールします

uv pip install datasets[audio] soundfile pydub

実行

以下でデータセットをダウンロードして、wav形式で保存します

from datasets import load_dataset
import soundfile as sf  # wavファイルの保存に使用
from pydub import AudioSegment  # mp3ファイルの保存に使用
import os

# 日本語のデータセットをロード
ds = load_dataset("diarizers-community/callhome", "jpn", split='data')

# 保存先のディレクトリを指定
output_dir = "callhome_japanese_audio"
os.makedirs(output_dir, exist_ok=True)

# 音声データをループして保存
for idx, example in enumerate(ds):
    # 音声データの取得
    audio = example['audio']
    array = audio['array']
    sampling_rate = audio['sampling_rate']

    # ファイル名を作成
    filename_base = f"callhome_jpn_{idx}"

    # wavファイルとして保存
    wav_path = os.path.join(output_dir, f"{filename_base}.wav")
    sf.write(wav_path, array, sampling_rate)
    print(f"Saved WAV file: {wav_path}")