音声認識AI - CA技研

#1 OpenAI Whisperを導入した音声駆動型トラブルシューティングソリューション

Audio-troubleshooting

音声駆動型インターフェース

キーボード操作が不要なため、手袋を着用していたり、両手がふさがっている状況でも簡単に操作できます。
エッジコンピューティング

音声認識処理をエッジ環境で実行します。ネットワーク接続は不要です。
高精度な音声認識

OpenAI Whisperの学習済み音声認識モデルを導入しており、高い精度でテキスト変換可能です。
高速テキスト変換

Whisper音声認識モデルのパフォーマンスチューニングを行っており、CAPCの高い性能を十全に引き出した高速テキスト変換を実現します。
ドキュメント学習による問題分類

BERTによる自然言語処理を用いて問題を適切なカテゴリーに分類します。カテゴリーは、事前にドキュメント学習を行うことでお客様の環境やツールに合わせたトラブルシューティングを提供します。

hyuki様のWhisperデモに使用されているサンプル用音声で性能検証します。

検証機	ソフトウェアパッケージ	音声データ時間	テキスト変換時間(実測)	時間比
CAPC	CAPC AI	335秒	156.8秒	0.468

CA技研では、お客様の目的に合わせたソフトウェア開発を承っております。

ご興味・ご相談がありましたら、一度お問い合わせください。