無料で簡単！Windows向けWhisperDesktopで動画をテキスト化

世界中で動画や音声コンテンツが豊富にある今、情報を活用するためには、これらを文字に起こすことが重要です。この文字起こしに役立つのがOpen AIのWhisperです。これまでは、Whisperを使うためには複雑な手順を踏む必要がありました。環境設定の変更や追加のインストール作業も必要でした。

しかし、今回はWindowsで簡単に使用できる「WhisperDesktop.exe」を紹介します。このツールを使えば、複雑な設定はほとんど必要ありません。

GitHubの以下のページの"Releases"セクションから、最新バージョンの「WhisperDesktop.exe」をダウンロードします。"Releases"セクションはページの右側にあります。

github.com
Hugging Faceの以下のページからモデルファイルをダウンロードします。中サイズの「ggml-medium.bin」が推奨されています。

huggingface.co

AMDのグラフィックスカードを使っている場合でも、特別な設定は必要ありません。私の環境（AMD Radeon RX 6600）で、28分38秒の動画を3分26秒で文字起こしすることができました。

今回は、下書きした文章をChatGPTを使って読みやすく直してみました。