#1 OpenAI Whisperを導入した音声駆動型トラブルシューティングソリューション
音声駆動型トラブルシューティングの特徴
-
音声駆動型インターフェース
キーボード操作が不要なため、手袋を着用していたり、両手がふさがっている状況でも簡単に操作できます。
-
エッジコンピューティング
音声認識処理をエッジ環境で実行します。ネットワーク接続は不要です。
-
高精度な音声認識
OpenAI Whisperの学習済み音声認識モデルを導入しており、高い精度でテキスト変換可能です。
-
高速テキスト変換
Whisper音声認識モデルのパフォーマンスチューニングを行っており、CAPCの高い性能を十全に引き出した高速テキスト変換を実現します。
-
ドキュメント学習による問題分類
BERTによる自然言語処理を用いて問題を適切なカテゴリーに分類します。カテゴリーは、事前にドキュメント学習を行うことでお客様の環境やツールに合わせたトラブルシューティングを提供します。
CAPCでのWhisperテキスト変換性能表
hyuki様のWhisperデモに使用されているサンプル用音声で性能検証します。
OpenAIのWhisperを用いて音声ファイル(mp3)をテキストファイルに変換するRubyスクリプト
検証機 | ソフトウェアパッケージ | 音声データ時間 | テキスト変換時間(実測) | 時間比 |
---|---|---|---|---|
CAPC | CAPC AI | 335秒 | 156.8秒 | 0.468 |
Whisper音声認識モデルを用いた他の運用・ソフトウェア
CA技研では、お客様の目的に合わせたソフトウェア開発を承っております。
ご興味・ご相談がありましたら、一度 お問い合わせ ください。