2026-02-01から1ヶ月間の記事一覧

自己教師あり音声特徴量に対する線形回帰のみで音声変換を行うLinearVCを動かす

AI

初めに 開発環境 環境構築 データの準備 LibriSpeech dev-clean のダウンロード サブセットの作成 実行 パターン1: LibriSpeech 1272 → つくよみちゃん(英語男性 → 日本語女性) パターン2: つくよみちゃん → LibriSpeech 1272(日本語女性 → 英語男性) パ…

Roboflow の trackers ライブラリで YOLO + ByteTrack による動画マルチオブジェクト追跡をする

AI

初めに 結果 開発環境 環境構築 テスト用動画のダウンロード デモスクリプトの解説 引数 検出 追跡 可視化 ソースコード全文 実行 初めに trackers は、Roboflow が提供するマルチオブジェクト追跡(MOT)アルゴリズムのクリーンルーム実装ライブラリです。A…

JAXA Earth APIとGradioで衛星データの取得・可視化アプリを作る

初めに 開発環境 環境構築 JAXA Earth API の基本的な使い方 機能紹介 コレクション検索 衛星画像ビューア 時系列解析 差分解析 マスキング 実行 参考 初めに JAXA Earth API は、JAXAが保有するCOG/STAC形式の地球観測衛星データにPythonからアクセスできる…

MaAI(間合い)は、リアルタイム・軽量な非言語行動生成ソフトウェア「MaAI」を使って、日本語音声ファイルからターンテイキング予測・相槌予測・うなずき予測を行う

AI

初めに 開発環境 環境構築 実行 初めに MaAIはリアルタイム・連続的な非言語行動生成ソフトウェアです。音声対話システムやロボット向けに、ターンテイキング予測・相槌予測・うなずき予測・VADされている. github.com 開発環境 Windows 10/11 Python 3.10以…