KoEmo の使い方
インストールから音声入力まで、ステップバイステップで。
01
インストール
②
ダウンロードしたファイルをダブルクリックして実行
③
セットアップ画面が表示されたら「次へ」で進める(デフォルトのままでOK)
④
インストール完了後、KoEmoを起動
動作環境: Windows 10/11 + NVIDIA GPU(CUDA対応)が必要です。
02
起動する
> KoEmoを起動すると、画面右下のタスクトレイにアイコンが出現します。
> 設定画面が自動で開きます。このアイコンが見えていれば準備完了。
初期設定のまますぐ使えます。何も変えなくて大丈夫。
注意: 初回起動時は約2GBの音声認識モデルをメモリにロードするため、20秒前後かかる場合があります。
03
音声入力
マイク
認識エンジン
テキスト出力
①
入力したいアプリ(メモ帳、ブラウザ等)をクリックしてフォーカス
②
KoEmoの「開始」ボタンを押す
③
マイクに向かって話す
④
話し終わると自動でテキストがペーストされる
「開始」を押すと赤い「停止」ボタンに変化
話すとオーバーレイがリアルタイムで表示
04
ダイレクト入力
> Step 03 ではダイレクト入力 ON(デフォルト)の動作を説明しました。OFFにすると、認識結果を確認してから確定できます。
ダイレクト入力 ON(デフォルト)
話し終わると自動ペースト。キーボード操作は不要。
話す → 自動ペースト → 完了
ダイレクト入力 OFF
結果を目で確認してから確定。正確さ重視。
話す → 結果確認 → キーで確定
ダイレクト入力のチェックを外すと「確認キー」「確認待ち」の設定が出現
ダイレクト入力 OFF 時のキーボード操作
OFFにした場合、以下のキーで認識結果を操作します。
Shift
確定認識中にテキストを即ペースト
Esc
取消いつでもキャンセル
認識中: Shift で即確定 / Esc で取消
確認待ち: Shift で確定 / Esc で取消
TIP: 困ったら Esc でいつでもキャンセルできます。ON/OFFどちらのモードでも使えます。
05
設定の調整
> 「うまく認識されない」「途中で切れる」と感じたら、この2つの設定を調整してみてください。
VAD 閾値
デフォルト: 0.60 Voice Activity Detection(声の検出)の感度です。
KoEmoは常にマイクの音を聞いていますが、この値を基準に「今、人が話しているか」を判定しています。
目安: 静かな部屋なら 0.3〜0.5、周囲が騒がしいなら 0.6〜0.8
無音判定
デフォルト: 0.8秒 話し終わったかどうかを判定する沈黙の長さです。
この秒数だけ無音が続くと「話し終わった」と判断し、認識結果を確定します。
目安: 途中で切れるなら 1.0〜1.5秒 に上げる。テンポよく入力したいなら 0.5秒 前後
06
トレイメニュー
> 設定画面を閉じてもバックグラウンドで動き続けます。
> 普段はタスクトレイのアイコンを右クリックして操作するのがスマート。
停止中 — 「音声認識を開始」で起動
稼働中 — 「音声認識を停止」で止める
$ troubleshoot
- › 「オーディオデバイス」で正しいマイクを選択してください
- › VAD閾値(マイク感度)を下げると、小さな声でも反応します
- › Windowsの「サウンド設定」でマイクが有効か確認してください
- › 「無音判定」の秒数を長くすると、間を置いても途切れにくくなります
- › マイクとの距離が離れすぎていないか確認してください
- › 話し始める前に入力先のアプリをクリックしてフォーカスしてください
- › KoEmoは「話し始めた瞬間」にフォーカスされていたアプリにペーストします
- › 確認モード(ダイレクト入力OFF)にすると、候補から選択できます
- › 短い文で区切って話すと精度が上がります
- › 静かな環境で使用すると認識精度が向上します