音声操作への反応 (HTML)

[ この記事は、Windows ランタイム アプリを作成する Windows 8.x および Windows Phone 8.x 開発者を対象としています。Windows 10 向けの開発を行っている場合は、「最新のドキュメント」をご覧ください]

Cortana 音声コマンド、音声認識、および音声合成を使って、アプリに音声を組み込みます。

ヒント  このトピックの情報は、JavaScript を使った Windows ストア アプリにのみ適用されます。C++、C#、Visual Basic を使った Windows ストア アプリについては、「音声操作への反応 (XAML)」をご覧ください。

 

Cortana 音声コマンド:

外部アプリケーションの 1 つの動作を起動して実行する音声コマンドで、Cortana の基本機能を拡張します。

アプリは、操作のレベルと複雑さに応じて、フォアグラウンド (アプリがフォーカスを取得します) またはバックグラウンド (Cortana がフォーカスを維持しますが、アプリからの結果を表示します) で起動できます。たとえば、追加のコンテキストやユーザー入力が必要な音声コマンドはフォアグラウンドで処理するのが最適ですが、基本的なコマンドはバックグラウンドで処理できます。

詳しくは、「Cortana の操作」をご覧ください。

音声認識:

音声認識使って音声をテキストに変換し、アプリ内からの音声コマンドで入力、テキストのディクテーション、タスクを実行します。

この機能は、フリーテキストのディクテーションと Web 検索に対する定義済みの文法をサポートし、Speech Recognition Grammar Specification (SRGS) Version 1.0 を使って作られるカスタム文法もサポートしています。

クイック スタート: 音声認識」と「Windows.Media.SpeechRecognition」をご覧ください。

音声合成 (TTS):

TTS (音声合成) を使ってテキストをアプリからの音声に変換します。

TTS により、基本的なテキスト文字列や、Speech Synthesis Markup Language (SSML) で宣言されている複雑なテキスト文字列をアプリで読み上げることができます。SSML は、発音、音量、ピッチ、速度、強調などの音声出力の特性を制御する標準的な方法を提供しています。

Windows.Media.SpeechSynthesis」をご覧ください。

このセクションの内容

トピック 説明

クイック スタート: 音声認識

ユニバーサル Windows アプリ内で音声認識機能を使って、データを入力し、操作やコマンドを指定して、作業を完了します。

音声認識エンジンの言語を指定する方法

音声認識に使われるインストール済みの言語を選ぶ方法について説明します。

カスタム認識の制約を定義する方法

音声認識のカスタム制約を定義して使う方法について説明します。

継続的なディクテーションを有効にする方法

長い形式の継続的なディクテーション音声入力をキャプチャし、認識する方法について説明します。

音声入力の問題を管理する方法

オーディオ入力の品質と条件が原因で発生する音声認識の精度の問題を管理する方法について説明します。

音声認識のタイムアウトを設定する方法

音声認識エンジンが無音または認識できないサウンド (雑音) を無視し、音声入力を待機する時間の長さを設定します。

 

注釈

Windows 8 と Windows 8.1 では、Windows ストア アプリで音声コマンドと音声認識がサポートされません。

関連トピック

ユーザー操作への応答

デザイナー向け

音声認識の設計ガイドライン

Cortana の設計ガイドライン