Skip to content

WSL2での音声入力によるClaude Code操作の構築 #2

@kenimo49

Description

@kenimo49

概要

WSL2上のClaude Codeに音声で指示を出せる仕組みを構築する。別ウィンドウで作業中でもバックグラウンドで音声認識が動作し、自動的にClaude Codeに入力される。

背景

  • Tip 2ではMac向けの音声入力ツール(superwhisper、MacWhisper、Super Voice Assistant)を紹介している
  • Windows/WSL2環境向けの方法がない
  • 並列作業しながら音声でClaude Codeを操作したい

技術調査結果

WSLgのマイク入力

WSL2ではWSLgを通じてWindowsのマイクにアクセス可能:

# オーディオソースの確認
pactl list sources short
# RDPSource が表示される

# 録音テスト
timeout 4 parecord --device=RDPSource --file-format=wav --rate=44100 --channels=1 /tmp/test.wav

# 再生確認
paplay /tmp/test.wav

必要なWindows設定

設定 → プライバシーとセキュリティ → マイク:

  • 「マイクへのアクセス」→ オン
  • 「デスクトップアプリがマイクにアクセスできるようにする」→ オン

実装案

アーキテクチャ

[バックグラウンドデーモン(WSL2)]
    ↓ RDPSourceからマイク常時監視(または音声検出時)
    ↓ whisper.cppで文字起こし
    ↓ tmux send-keys で Claude Code セッションに入力
[別ウィンドウで作業中でもOK]

必要なコンポーネント

  1. 音声認識: whisper.cpp(ローカル)またはWhisper API(クラウド)
  2. 入力制御: tmux send-keys でClaude Codeセッションに送信
  3. トリガー方式:
    • 常時リッスン(音声検出で自動開始)
    • または ホットキー(押している間だけ録音)

参考: Windows向け既存ツール

タスク

  • WSLgマイク入力の動作確認
  • whisper.cppのインストールと設定
  • 音声認識デーモンスクリプトの作成
  • tmux連携の実装
  • Tipとして文書化

関連

  • Tip 2: Talk to Claude Code with your voice
  • Tip 45: Execute PowerShell commands from WSL2
  • Tip 46: Use Claude in Chrome from WSL2

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions