CA技研

#1 OpenAI Whisperを導入した音声駆動型トラブルシューティングソリューション

Audio-troubleshooting

音声駆動型トラブルシューティングの特徴

  1. 音声駆動型インターフェース

    キーボード操作が不要なため、手袋を着用していたり、両手がふさがっている状況でも簡単に操作できます。

  2. エッジコンピューティング

    音声認識処理をエッジ環境で実行します。ネットワーク接続は不要です。

  3. 高精度な音声認識

    OpenAI Whisperの学習済み音声認識モデルを導入しており、高い精度でテキスト変換可能です。

  4. 高速テキスト変換

    Whisper音声認識モデルのパフォーマンスチューニングを行っており、CAPCの高い性能を十全に引き出した高速テキスト変換を実現します。

  5. ドキュメント学習による問題分類

    BERTによる自然言語処理を用いて問題を適切なカテゴリーに分類します。カテゴリーは、事前にドキュメント学習を行うことでお客様の環境やツールに合わせたトラブルシューティングを提供します。

CAPCでのWhisperテキスト変換性能表

hyuki様のWhisperデモに使用されているサンプル用音声で性能検証します。

OpenAIのWhisperを用いて音声ファイル(mp3)をテキストファイルに変換するRubyスクリプト

検証機 ソフトウェアパッケージ 音声データ時間 テキスト変換時間(実測) 時間比
CAPC CAPC AI 335秒 156.8秒 0.468

Whisper音声認識モデルを用いた他の運用・ソフトウェア

CA技研では、お客様の目的に合わせたソフトウェア開発を承っております。

ご興味・ご相談がありましたら、一度 お問い合わせ ください。