KoEmo の使い方

インストールから音声入力まで、ステップバイステップで。

01

インストール

ダウンロードしたファイルをダブルクリックして実行
installer file
セットアップ画面が表示されたら「次へ」で進める(デフォルトのままでOK)
installer screen
インストール完了後、KoEmoを起動
動作環境: Windows 10/11 + NVIDIA GPU(CUDA対応)が必要です。
02

起動する

タスクトレイのKoEmoアイコン

> KoEmoを起動すると、画面右下のタスクトレイにアイコンが出現します。

> 設定画面が自動で開きます。このアイコンが見えていれば準備完了。

KoEmo設定画面(初期状態)

初期設定のまますぐ使えます。何も変えなくて大丈夫。

注意: 初回起動時は約2GBの音声認識モデルをメモリにロードするため、20秒前後かかる場合があります。
03

音声入力

🎤
マイク
🧠
認識エンジン
📝
テキスト出力
入力したいアプリ(メモ帳、ブラウザ等)をクリックしてフォーカス
KoEmoの「開始」ボタンを押す
マイクに向かって話す
話し終わると自動でテキストがペーストされる
実行中の設定画面

「開始」を押すと赤い「停止」ボタンに変化

音声認識中のオーバーレイ

話すとオーバーレイがリアルタイムで表示

04

ダイレクト入力

> Step 03 ではダイレクト入力 ON(デフォルト)の動作を説明しました。OFFにすると、認識結果を確認してから確定できます。

ダイレクト入力 ON(デフォルト)

話し終わると自動ペースト。キーボード操作は不要。

話す 自動ペースト 完了
ダイレクト入力 OFF

結果を目で確認してから確定。正確さ重視。

話す 結果確認 キーで確定
ダイレクト入力OFF時の設定画面

ダイレクト入力のチェックを外すと「確認キー」「確認待ち」の設定が出現

ダイレクト入力 OFF 時のキーボード操作

OFFにした場合、以下のキーで認識結果を操作します。

Shift
確定認識中にテキストを即ペースト
Esc
取消いつでもキャンセル
音声認識中

認識中: Shift で即確定 / Esc で取消

認識結果の確認待ち

確認待ち: Shift で確定 / Esc で取消

TIP: 困ったら Esc でいつでもキャンセルできます。ON/OFFどちらのモードでも使えます。
05

設定の調整

> 「うまく認識されない」「途中で切れる」と感じたら、この2つの設定を調整してみてください。

VAD 閾値

デフォルト: 0.60

Voice Activity Detection(声の検出)の感度です。
KoEmoは常にマイクの音を聞いていますが、この値を基準に「今、人が話しているか」を判定しています。

0.1 敏感
小声でも反応する
雑音も拾いやすい
0.9 鈍感
はっきり話す必要あり
雑音に強い
目安: 静かな部屋なら 0.3〜0.5、周囲が騒がしいなら 0.6〜0.8

無音判定

デフォルト: 0.8秒

話し終わったかどうかを判定する沈黙の長さです。
この秒数だけ無音が続くと「話し終わった」と判断し、認識結果を確定します。

0.3秒 即反応
少しの間でも区切られる
2.0秒 ゆったり
考えながら話せる
目安: 途中で切れるなら 1.0〜1.5秒 に上げる。テンポよく入力したいなら 0.5秒 前後
06

トレイメニュー

> 設定画面を閉じてもバックグラウンドで動き続けます

> 普段はタスクトレイのアイコンを右クリックして操作するのがスマート。

トレイメニュー(停止中)

停止中 — 「音声認識を開始」で起動

トレイメニュー(稼働中)

稼働中 — 「音声認識を停止」で止める

$ troubleshoot

  • 「オーディオデバイス」で正しいマイクを選択してください
  • VAD閾値(マイク感度)を下げると、小さな声でも反応します
  • Windowsの「サウンド設定」でマイクが有効か確認してください
  • 「無音判定」の秒数を長くすると、間を置いても途切れにくくなります
  • マイクとの距離が離れすぎていないか確認してください
  • 話し始める前に入力先のアプリをクリックしてフォーカスしてください
  • KoEmoは「話し始めた瞬間」にフォーカスされていたアプリにペーストします
  • 確認モード(ダイレクト入力OFF)にすると、候補から選択できます
  • 短い文で区切って話すと精度が上がります
  • 静かな環境で使用すると認識精度が向上します