forked from ykdojo/claude-code-tips
-
Notifications
You must be signed in to change notification settings - Fork 0
WSL2での音声入力によるClaude Code操作の構築 #2
Copy link
Copy link
Open
Description
概要
WSL2上のClaude Codeに音声で指示を出せる仕組みを構築する。別ウィンドウで作業中でもバックグラウンドで音声認識が動作し、自動的にClaude Codeに入力される。
背景
- Tip 2ではMac向けの音声入力ツール(superwhisper、MacWhisper、Super Voice Assistant)を紹介している
- Windows/WSL2環境向けの方法がない
- 並列作業しながら音声でClaude Codeを操作したい
技術調査結果
WSLgのマイク入力
WSL2ではWSLgを通じてWindowsのマイクにアクセス可能:
# オーディオソースの確認
pactl list sources short
# RDPSource が表示される
# 録音テスト
timeout 4 parecord --device=RDPSource --file-format=wav --rate=44100 --channels=1 /tmp/test.wav
# 再生確認
paplay /tmp/test.wav必要なWindows設定
設定 → プライバシーとセキュリティ → マイク:
- 「マイクへのアクセス」→ オン
- 「デスクトップアプリがマイクにアクセスできるようにする」→ オン
実装案
アーキテクチャ
[バックグラウンドデーモン(WSL2)]
↓ RDPSourceからマイク常時監視(または音声検出時)
↓ whisper.cppで文字起こし
↓ tmux send-keys で Claude Code セッションに入力
[別ウィンドウで作業中でもOK]
必要なコンポーネント
- 音声認識: whisper.cpp(ローカル)またはWhisper API(クラウド)
- 入力制御: tmux send-keys でClaude Codeセッションに送信
- トリガー方式:
- 常時リッスン(音声検出で自動開始)
- または ホットキー(押している間だけ録音)
参考: Windows向け既存ツール
- WhisperWriter - オープンソース
- OpenWhispr - クロスプラットフォーム
- Handy - Tauri製、完全オフライン
タスク
- WSLgマイク入力の動作確認
- whisper.cppのインストールと設定
- 音声認識デーモンスクリプトの作成
- tmux連携の実装
- Tipとして文書化
関連
- Tip 2: Talk to Claude Code with your voice
- Tip 45: Execute PowerShell commands from WSL2
- Tip 46: Use Claude in Chrome from WSL2
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels