2008年03月18日

日本コトバの会の音声認識ソフト研究会の計画

 今、日本コトバの会では新しい部会を考えている。パソコンの音声入力ソフトを使用して、音声言語と文字言語との関係を研究する部会である。仮称として「音声言語認識研究会」を考えている。

 そろそろパソコンの音声認識ソフトが実用に近づいてきている。わたしの使用するドラゴンスピーチAmiVoice Es 2008の二つは、だれにも推奨できるソフトである。(ドラゴンスピーチ紹介)ただし、ソフトを買った人が、使い方を工夫したり、育てていかないと、なかなか満足の行く利用ができないもの確かである。

 また、音声認識ソフトの使い方のノーハウも、ユーザーたちが交換しないと、理解の行かないところもある。残念ながら、まだまだパソコンの音声入力のソフトのユーザーも少ないようである。それは日本の言語文化の問題がある。コトバを話すこと、口述で文章を書くようなことは少ないのである。

 4月のスタートを予定しているが、まずは、わたしがパソコンを持参して、ドラゴンスピーチとAmiVoice Es 2008とのデモンストレーションをして、このくらいの能力があるというところを見てもらうことから始める。ソフトを持ち、パソコンを持参できる人には、「ソフトの育て方」についての実践的な助言もできるだろう。

 上の二つの音声認識のソフトを比較しながら、使用法の検討をすることはもちろん、最大の目標である音声言語と文字言語との関係の研究である。それは、実践的な目的として、話す力と書く力との関係、音声認識ソフトの使用によって、話す力や書く力がどのように向上するかという問題にもつながる。声が文字化されることで、発音や発声についても意識的になる。文のかたちで話すことも意識化される。

 わたし自身、数年間の使用で、発音・発声や文章の口述ということについての向上を感じている。これをできるだけ多くの人に広めたいと思っている。また、メーカーのソフトそのものの質の向上についても、さまざまな提案をしたいと思う。(関心在る方はお知らせください)
posted by 渡辺知明 at 07:55| Comment(9) | TrackBack(0) | 音声認識ソフト | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
講演会や会議の音声起こしをしている者です。話者数人の会議の文字起こしににAmiVoice Es 2008が使用できるかを知りたいのですが、AmiVoiceを使用しての感想についてほとんど検索できません。そこで教えていただきたいのですが、事前のエンロールなしで使用できるという利点は理解できていますが、複数の話者の聞き分けや、複数人の発言の起こしがこのソフトで果たしてできるのか、教えていただけませんか? 現在購入検討中ですが、買っても使用できないと無駄ですので、よろしくお願いまします。
Posted by テープ起こし屋 at 2008年04月16日 12:15
わたしも複数の話者についての実践を開始するところです。ただし、会議の自然録音のようなものは、たいていダメでしょう。一人ひとりがマイクを回して録音でもしないと聞き分けというわけにいきません。それを試してみようとしています。4月から開始する日本コトバの会の第4土曜日の例会です。
Posted by 渡辺知明 at 2008年04月25日 09:46
返信ありがとうございました。発売元に一応問い合わせました。
サイトに記されている条件、@口元とマイクの距離が5cm以内で録音した音声で、かつ、はっきりとした音声であること等の条件をクリアした音声であるという条件のもとに、

■1つの音声ファイルにAさんとBさん2名の声が入っている場合、

「1つのファイルとして文字化されるだけでAさんの発言・Bさんの発言と個別に認識はできません。
つまり、話者の聞き分け(話者の特定)という点についは、AmiVoice Es 2008にその機能ない」そうです。現段階ではそれは無理として、複数の発言者の音声をどの程度認識できるのか、興味あるところです。
後日、その例会での結果をお知らせいただければ幸いです。

Posted by テープ起こし屋 at 2008年04月28日 19:45
4月26日(土)の勉強会で参加者が次つぎに交替して入力をしてみました。人が変わっても変換状況は変わりありませんでした。問題は一人ひとりの発音のようです。交替で入力するという使い方もできそうです。ただ、問題はソフトの立ち上がりどきに、雑音に反応して、もたもたして、妄想のような変換をすることがあるのです。これは五、六回に一回くらいの割で頻繁に起こります。
Posted by 渡辺知明 at 2008年04月28日 20:18
渡辺様
ご報告ありがとうございました。不特定の話者数人でも、変換は可能ということですね。
ただ、発言の間の雑音を拾って、誤変換がかなりの頻度で発生するという状況でしょうか。イメージとしては、マイクでの発言の度にマイクのスイッチのオン・オフを切り替えるなど、入力時に工夫をすれば、多少は対処できるのではないかと思われます。購入時の参考にさせていただきます。ありがとうございました。
Posted by at 2008年04月28日 22:54
渡辺様

音声認識ソフトに関して、貴重な情報提供ありがとうございます。大変参考になりました。
とりあえずAmiVoice Es 2008を購入し、ドラゴンスピーチは2008か2009が出るまで我慢しようと考えております。

ところで、AmiVoice Es 2008の特徴として、状況に応じて4種類の辞書を使い分けられるというものがありますが、これは有用なものなのでしょうか。渡辺さんは記事の文章などはどの辞書をお使いでしょうか。
Posted by 柴田 at 2008年05月03日 15:26
私も現在 AmiVoice を使っています。
私は、音声認識ソフトを使うのは、初めてなので、様々な試行錯誤を繰り返しています。
確かに、このソフトは、とても便利なですが、
非常に使いやすい点と、使いにくい点があります。従って、いかに使用方法を工夫するかだと、思います。.まず、ヘッドセットマイクはとても便利なですが、長時間これを使っていると、とてもうっとうしいです。だから、私は、オリンパスの PCM レコーダ-のLS−10をマイクとして、使ってXP につないで使っています。集音能力がとても高くヘッドセットマイク無しても、AmiVoice で、音声認識をすることができます。AmiVoice には、様々な欠点や、利点があり、それは、これから順番を追って書いていきますが、問題点は AmiVoice を使っている人が、あまりにも少ないので情報交換をすることができないというところにあります。。私もこれから自分なりに工夫した件も書いていきますが、 AmiVoice を使うにあたって、皆様が工夫されている点等につきまして教えていただければ、幸いです。よろしくお願いします。
Posted by グイン at 2008年06月25日 22:37
拝啓
 渡辺様、初めてお便り差し上げます。
アミボイスを最近購入して使っております。
私の感想ではマニュアルが不親切で非常にわかりにくいです。ネット上で色々調べていたところ、渡辺先生のHPにたどり着きました。
音声言語認識研究会に入会したのですが、手続きをどうすればよろしいでしょうか?
また、例会はどちらで行われているのでしょうか?
お返事いただければ幸いです。
                  敬具
Posted by 鎌田 賢介 at 2010年05月03日 09:08
鎌田賢介さま、お問い合わせありがとうございます。右上のプロフィールの最下行に「メール」のリンクがありますので、そこからもう一度、お問い合わせください。折り返しメールで返信いたします。
Posted by 渡辺知明 at 2010年05月03日 20:50
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。