yt-dlpを使ってyoutubeの動画(音声)をダウンロードする

Python

開発環境ライブラリのインストール動画および再生リストのダウンロード開発環境 Windows 11 Python 3.11 ライブラリのインストール以下でライブラリのインストールできます pip install yt-dlp 動画および再生リストのダウンロードまずは単体の動画のダ…

2024-07-16

ボーカル音声ファイルからボーカルのみをultimatevocalremoverguiのCLI版を使って抽出する

AI Python

初めに開発環境ライブラリのインストール実行初めに歌ってみたなどの音声ファイルからボーカルのみを抽出した場合、以下などのボーカル抽出ソフトなどで対応することができます。 github.com しかしこのソフトには、CLI版がないため CLIで動くものを探…

2024-06-18

GoogleColobで音声ファイルのチャンネル数を確認する

Python

開発環境コード開発環境 Google Colob コード # ffmpegのインストール !apt-get install ffmpeg # チャンネル数の確認 !ffprobe -i file_name -show_streams -select_streams a:0 -loglevel error | grep channels 以下のように出力されます channels=1

2024-06-16

高速フーリエ変換(FFT)を使って音の解析および特定の周波数の除く

Python

開発環境音の解析特定の周波数のみの音にする開発環境 Google Colob T4(Free) 音の解析以下で sample.wav に対する周波数別の解析をします import numpy as np import matplotlib.pyplot as plt import japanize_matplotlib from scipy.io import wavfil…

2024-05-19

画像処理・クラスタリングを用いて画像内の色を単色化する

Python

初めに開発環境アプローチの方針ライブラリのインストール k-means法デモコード DBSCAN法デモコード GMM法デモコード初めにある画像から近い色同士で色をまとめてほしい時があります。この際に使用できる画像処理やクラスタリングの手法を試して…

2024-05-12

GCP-GPUでのCould not load library libcudnn_cnn_train.so.8.のエラー対応

Python

初めに開発環境エラー詳細解決方法参考記事初めに AI周りの学習でtorchを使うことがありますが、cudannのエラーによって学習が始めらない問題にぶつかったので解決方法をメモしておきます開発環境 GCP torch version : 2.3.0+cu121 cuda 12.1 Python 3…

2024-05-11

指定したディレクトリ内のすべてのwavファイルのパスを再帰的に取得してtxtファイルに保存する

Python

開発環境詳細開発環境 Windows 11 Python 3.11.7 詳細以下のコードで指定したディレクトリ内のwavファイルのパスを一覧にしたテキストファイルが出力されます # 指定したディレクトリ内のすべてのファイルのパスを再帰的に取得し、txtファイルに保存する…

2024-03-09

ITAコーパスをファイル名と本文のみに変換するスクリプトを作成する

AI Python

初めに環境変換コード実行初めに TTSの学習データを作る際に音声コーパスにはよく ITAコーパスが用いられることがあります。このコーパスは以下のフォーマットで作成されています. ファイル名:本文,ヨミこちらを学習に使う際にヨミの部分は、必要がな…

2024-03-08

フォルダ内にある音声ファイルの合計を計算する

Python

初めに環境準備対応音声ファイル実行初めに音声処理をする際にフォルダ内に音声ファイルがあるかを確認したいと思う時があります。その際に使用できる簡単なスクリプトを作ります環境 L4 GPU ubuntu22.04 準備必要なライブラリを入れます sudo apt u…

2024-02-28

reazon-research/reazonspeech(small)の音声データをWADA-SNRで信号対雑音比のデータ分析をする

AI Python

初めにデモ開発環境準備分析手順データをダウンロード・ロード WAND-SNRを使って音声データの分析分析結果をヒストグラムで表示 WADA-SNR値が100以上のデータ個数を取得備考 Windowsでのプロセスエラー対応並列処理対応初めに reazon-research/reaz…

2024-02-27

WADA SNRを使ってreazon-research/reazonspeechの音声を評価する

Python

初めにデモ開発環境準備実装初めに WADA SNRを使って音声の評価ができるみたいなので、以下を使って実際に試してみます gist.github.com デモ実行すると以下のようなログが表示されます Calculated SNR: 13.775574879980502 開発環境 Windows 11 Pytho…

2024-02-24

reazonspeech-nemo-v2を使ってフォルダ内にある音声ファイルの文字起こしをしてCSVとJsonに保存する

AI Python

初めにデモ開発環境準備文字お越し及びファイル保存エラー対応 CUDAがenabledになっていない場合 ReazonSpeech/pkg/nemo-asrのインストールが失敗する参考サイト初めに STTやTTSの学習等をする際に文字データが必要になるのですが、音声だけある場合…

2024-01-26

faster-whisper+Dockerで音声からテキスト変換(STT)のAPIを実装する

AI Python

初めにデモ開発環境実装環境を作るモデルのロードと初期化 STTのAPIの作成初めに音声認識をしたい場合whisperを使うことが多いですが、より速くより使いやすくしたいと思ってたので実装をしてみました！ DockerでCUDAのver管理やGPUも使えるようにし…

2023-12-28

はてなブログとZennの投稿記事一覧をNotionのDatabaseにGitHubActionsを使って自動でまとめる

Python Notion GitHubActions

初めに環境準備環境構築 Notion APIの取得はてなブログの一覧を取得する Zennの記事一覧を取得する NotionのDBに記事を追加するそれぞれのデータを取得して、日付ソートして書き込む GitHub Actionsを使って定期的に実行する初めに自分のポートフォリ…

2023-12-05

CUDA Toolkit 11.7をインストールする

Python

初めにエラー対応方法初めに magic-animateを触る際にCUDAのver問題で困ったので、解決策のメモ github.com エラー RuntimeError: Detected that PyTorch and torchvision were compiled with different CUDA versions. PyTorch has CUDA Version=11.7 an…

2023-12-02

独自のDockerImageを作成して、GitHub ActionsからDocker Hubにpushする【Docker】【GitHubActions】

Python

はじめに環境準備 docker hubのTokenを作成 GitHub Secretの登録 Docker imageの作成 GitHub Actionsによる自動化 DockerHubにpush時にuploadをするActionの作成 uploadしたimageのデバッグ用のActionの作成はじめに Dockerを使っていると自分でimageをカ…

#Docker #GitHubActions

2023-11-17

PythonでSlackにテキストや画像を送信する【SlackAPI】

Python

環境準備ライブラリの準備 tokenの準備実装テキストを送信するファイル(画像)を送信する環境 Python3.10 準備ライブラリの準備 slackが公式に slack-sdk というライブラリを公開しているので、こちらをインストールします pip install slack-sdk toke…

#Python #Slack API

2023-01-16

EMNISTのデータを学習してONNXを出力する【Python】【ML】

Python

はじめにやりたいこと環境環境構築 Dockerfile docker-compose 実装結果参考サイトおよびChatGPTの返答内容データセット引用元参考サイト ChatGPT はじめに UnityのBarracudaでMLを使ったプロジェクトを作成したいので、準備としてデータを作成してい…

#Docker #Python #EMNIST

2022-05-16

Notionのタスクのステータス変更をDiscordでメッセージを送る【Discord.py,Notion API,GitHub Actions,cron-job】

Notion Python GitHubActions

はじめに完成物やりたいこと準備 Notionのインテグレーション(API)の作成と登録 DiscordのWebHookの作成 GitHub のpersonal tokenの作成自動化内容と実装 1. Notionの特定のタスク状態が変更されたときに担当者及び確認者 Discordに通知を送る 2. 一日…

#discord.py #Python #Notion API #GitHub #GitHub Actions #cron-job

2022-05-04

Notionのタスク一覧でタスクがDoneになったときに完了日付を自動入力する【Notion,Python,GitHub Actions】

Python Notion GitHubActions

はじめに成果物実装簡易説明 Notion DB 取得時に query Filter GitHub Actionsから環境変数を読み込む Notionのpage Property(date) の更新その他参考サイトはじめに最近 Notionを使ってタスク管理を再度始めました(昔やっていたのですが、飽きてしまっ…

#Notion #githubaction #Python

2021-03-07

NotionにTrelloのアーカイブを毎日記録する【Trello,Notion,Python,GCE】

Python Notion

自分のやったタスクを記録しておきたいとおもい，前にEvernoteにTrelloのアーカイブを保存する記事を書きました．その後Notionを知りこちらのほうが便利だと思い乗り換えたのですが，アーカイブの保存のスクリプトの切り替えがやっと終わったのでメモです G…

#Notion #Python #Trello

2020-12-12

NotionAPI(Python)を触ってみる【Notion,Python】

Python Notion

最近Notionというものを教えてもらいました！！(今更ですが) TrelloとEvernoteから乗り換えるのにいろいろと連携したりGASとの連携とかもあるので，scriptの移行のためにNotionAPIを触っていきたいと思います <span style="color: #ff0000">NotionのAPIは2020/12現在 APIは非公式になって</span>…

#Notion #Notion活用法 #Python

2020-09-04

PySide2とQtDesigerでGUIのアプリの作成Memo【PySide2,QtDesiger,Python】

Python

メモついでに書いておきます(書き途中) MacでのQtDesigerのpath MacでのQtDesigerのpath Anacondaを使用して入れた場合以下のpathにあります /Users/user name/opt/anaconda3/envs/pyside2/bin/Designer.app

2020-09-04

PySide2で音声を録音・文字起こしをする【PySide2,Python】

Python

PySide2でリアルタイムで文字起こし，音声の録音をやってみたいと思います実行結果準備音声を扱うためのライブラリ録音をするためにライブラリ Code 参考サイト実行結果実行すると録音の音声ファイル recorded.wavとその録音音声内容のrecordedText.tx…

2020-04-02

GCEでpythonを毎日cronで実行する【Python,GCP,GCE】

Python

twitterの解析等で使いたく，GCE上で毎日決まった時間に実行されるようにしてみました GCEとは GCEのインスタンスを立ち上げる GCEにAnacondaを入れる GCEでcronの設定修正 GCEとは qiita.com GCEのインスタンスを立ち上げる qiita.com qiita.com qiita.com…