Speech Studio を確認する

Azure AI 音声サービスは、音声をテキストに、テキストを可聴音声に変換します。 AI 音声を使用して、会議のメモを音声表記したり、インタビューの録音からテキストを生成したりできるアプリケーションを作成できます。

この演習では、Azure AI Speech Studio を使用して Azure AI 音声の機能を試します。

“Azure AI 音声” リソースを作成する**

音声サービスを使用するには、音声リソースまたは Azure AI サービス リソースを作成します。

この演習では、使用できるリソースが既にある場合を除き、AI 音声リソースを作成します。

  1. 別のブラウザー タブで Azure AI Speech Studio を開き、Microsoft アカウントでサインインします。

  2. [設定] を、次に [リソースの作成] を選択します。 これを以下の設定で構成します。
    • 新しいリソースの名前:一意の名前を入力します
    • [サブスクリプション]: お使いの Azure サブスクリプション
    • [リージョン]: [サポート対象リージョン] を選択します
    • 価格レベル: Fee F0 (使用可能な場合。それ以外の場合は Standard S0 を選択)。
    • [リソース グループ]: 一意の名前のリソース グループを選択するか、作成します
  3. [リソースの作成] を選択します。 リソースが作成されるまで待ってから、[リソースの使用] を選択します。 [音声の利用を始める] ページが表示されます。

Speech Studio で音声テキスト変換を確認する

  1. https://aka.ms/mslearn-speech-files を選択して speech.zip をダウンロードします。 フォルダーを開きます。

  2. [音声の利用を始める] ページの [音声テキスト変換] で、[リアルタイム音声テキスト変換] を見つけます。** **[Real-time speech to text](リアルタイム音声テキスト変換を試す) を選択します。

    音声の利用を始める

  3. [オーディオ ファイルを選択する] の下で [ファイルを参照する] を選び、ファイルを保存したフォルダーに移動します。 WhatAICanDo.m4a を、次に [開く] を選択します。

    Browse files

  4. 音声サービスは、テキストをリアルタイムで文字起こしして表示します。 コンピューターにオーディオがある場合は、テキストの文字起こし中に録音を聞くことができます。
  5. 出力を確認します。音声が正常に認識され、テキストに文字起こしされているはずです。

    エラー メッセージが表示された場合は、数分待ってからやり直してください。 音声リソースが最初に使用できるようになるには、少し時間がかかります。

この演習では、Speech Studio で AI Speech リソースを作成しました。 次に、リアルタイム音声テキスト変換サービスを使用して、オーディオ録音を文字起こししました。 オーディオ ファイルの再生中にテキスト文字起こしが生成されているのを確認できました。

クリーンアップ

これ以上の演習を行わない場合は、不要になったリソースを削除します。 これにより、不要なコストが発生することを防ぎます。

  1. Azure portal を開き、作成したリソースを含むリソース グループを選択します。
  2. リソースを選択し、[削除] を、次に [はい] を選択して確定します。 これでリソースが削除されます。

詳細情報

この演習では、音声サービスの一部の機能のみを示しました。 このサービスで実行できる操作の詳細については、音声のページを参照してください。