静止画像を3Dパララックス効果のある動画に変換するDepthFlowをWindowsでGraido経由で動かす

初めに

静止画像を3Dパララックス効果のある動画に変換するオープンソースツールがでたので触ってみます。特徴としては、GPU加速のGLSLシェーダーで高速処理(RTX 3060で8K@50fps)、AI深度推測で奥行情報を生成します。

github.com

開発環境

環境構築

プロジェクトをcloneします

git clone https://github.com/BrokenSource/DepthFlow.git

uv環境を作成します

uv venv --python 3.12
.venv\Scripts\activate

必要なライブラリ等を入れていきます

uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
uv pip install .

実行

以下でgradio版を起動します

depthflow gradio

起動すると以下のようなUIが立ち上がります

以下のような入力画像を入れます(nanobanana作)

実行すると以下のようなDepthの画像が途中に生成されます

これをもとに以下のような動画(ブログ用にGIFにしています)が生成されます