ソフトを開発しようと思った動機、背景
「Voice Rep PRO」は、「第21回Vectorプロレジ大賞特別賞」を、また「Voice Rep PRO 2」は「第26回Vectorプロレジ大賞特別賞」をいただくなど、好評を得ております。今回の新バージョンは、これまでに「Voice Rep」をご利用いただきましたお客さまからの多くのご意見・ご要望にお応えする形で開発いたしました。開発中に苦労した点
お客さまのご要望は使いやすさの向上がほとんどでした。これらにお応えするための新技術開発と改善対応に苦労しました。
(1)リアルタイム転送
本ソフトでは、音声認識をGoogle Chrome上で行います。Chrome上で認識されたテキストは、本ソフトに転送することで認識結果を得ることができるのですが、転送できるようにするにはいくつかのChromeの設定を行う必要がありました。
「Voice Rep PRO 3」では、これらのChromeの設定をお客さまに設定していただかなくても転送できるように改善するとともに、Chrome上で認識したテキストは、転送操作を行なわなくても、認識のつど、自動でリアルタイムに転送されるように、新技術を開発して導入しました。この新技術の導入により、Chrome上で認識したテキスト全体が不意なネット障害や誤操作などによりロストしてしまうことがなくなりました。
(2)タイムラインの自動付与
音声認識は、精度の高いGoogleの音声認識エンジンで文字化を行いますが、100%の精度ではございません。そのため認識したテキストはあとで見直して、間違って認識された部分を校正する必要が生じます。録音音声の文字化では、文章量が多いと、認識したテキストが音声ファイルのどの部分を文字化したものかを探すのが大変です。
「Voice Rep PRO 3」では、文字化を行うとき、音声ファイルのどの部分を文字化したかを示すタイムラインを同時に出力できるようにしました。この機能により、校正しないといけない部分の再生位置がすぐに特定できるので、格段に校正作業が容易になりました。さらに、校正が完了すればタイムラインは不要となりますので、ワンクリックでタイムラインを除去できる機能も組み入れました。
(3)タイムライン情報(音声ファイル・テキスト)の連動
本ソフトの再生プレイヤーを使用すると、音声ファイルのカウンター位置とテキストのタイムライン情報を連動できます。対応したタイムラインの場所に順に移動できるほか、本文のテキストのタイムライン部分を選択してコンテキスト(右クリック)メニューからその再生位置に移動できるようになりました。
(4)録音音声文字化操作の自動化
お客さまのご要望の多い録音音声の文字化では、シンプルな操作で文字化できるように自動化機能を設けました。操作は音声ファイルを選択して音声認識を開始するだけです。Chromeが自動で起動し、Chromeが起動すると自動で音声の再生がはじまって、再生のつど認識を行って、メイン画面に認識結果が転送されます。再生が終了すると、Chromeが自動で終了して文字化は完了します。
お勧めのご利用方法
新バージョンの「マイクでの音声認識」を体験できるサイト(無料)を公開しています。
- https://voicetechno-jp.secure-web.jp/VoiceRepPro3/TrialG.html
こちらでぜひ、お試しください。今後のバージョンアップ予定
今後もさらなる音声認識の精度の向上と、シンプルな使いやすさの追及をしてゆきます。
(ボイステクノ)