大和大学 大志を、まとえ。

検索したいワードをいれて検索してください

またはサイトマップもご覧ください

音声認識技術を駆使し、
障がい者や高齢者のコミュニケーションを支援

小林 彰夫教授


情報学部 情報学科
研究テーマ

誰もがコミュニケーションをとりやすい
社会を実現する音声認識技術

小林教授が注目しているのは、視聴覚障がい者や高齢者のコミュニケーションを支援する技術です。聴覚障がい者向けの音声認識技術や、視覚障がい者向けの音声をダイレクトに点字に変換する技術について研究。視聴覚障がい者や高齢者の方々がより暮らしやすい社会を目指し、最先端技術を駆使した研究開発に挑んでいます。

すべての人がスムーズに
コミュニケーションをとれる世の中へ

小林教授の研究室では、視聴覚障がい者や高齢者のコミュニケーションをサポートする技術の研究を手がけています。具体的には、発話が不明瞭な方でも利用できる音声認識技術の開発に注力。また、点字を読む視覚障がい者向けに、音声をダイレクトに点字に変換する技術の研究も行っています。
「聴覚障がい者の言葉は一般的に聞き取りにくいため、最近のスマートフォンに搭載されている音声認識アプリの恩恵を受けることができません。また、高齢者のなかには歳を重ねるうちに発話が不明瞭になる方がいるのですが、そういった方も同様。障がいの有無や年齢にかかわらず、すべての人がストレスを感じることなくコミュニケーションできる技術を開発することが、研究のゴールだと考えています」

小林教授がこの研究に興味を抱いたきっかけは、前職の放送局時代。1997年頃から、音声認識技術を使って番組にリアルタイムで字幕をつける研究に携わっていたそうです。そして2000年に、日本初となる音声認識技術を使った生字幕放送を実現させました。
「アナウンサーの言葉に合わせて、リアルタイムに字幕が表示されるというもの。音声情報を文字にして画面に表示することで、聴覚障がい者の方々がテレビ番組の内容を理解しやすくなりました」

テレビの字幕は、一方的に情報を聴覚障がい者の方々に示すためだけのものです。字幕の研究を進めるうちに、彼らのコミュニケーション全般をサポートできる技術を開発したい、という気持ちが芽生えてきたといいます。
「音声を自動で点字に変換する視覚障がい者向けの技術も含め、放送局ではやりたい研究や開発ができなかったので退社して大学の研究職へ。技術的に可能かどうか未知数でしたが、思いきって第二のキャリアをスタートさせました」

成功のカギは、効率よく視覚障がい者の
音声サンプルを収集すること

小林教授がテレビ番組にリアルタイムで字幕をつける研究をしていた25年以上前と違い、音声認識技術そのものは大きく進歩しています。そのようななか、研究を進めていくうえで重要度を増していったのは、効率よく視覚障がい者の音声サンプルをたくさん収集することでした。
「音声認識技術の精度を高めるうえで重要なのは、より多くの音声サンプルを収集し、機械学習でコンピュータに学ばせること。そのためには、たくさんの聴覚障がい者の音声データが必要となるのです」

「あいうえお」という発声ひとつとっても、発話する人ごとにさまざまな音が混ざっており、どの音がどの言葉にリンクしているのかというパターンをコンピュータに覚えさせていく地道な作業。ただ、最先端の研究ではあるものの、やっていることは非常にシンプルだといいます。
「一言で言えば、インプットした情報を文字や点字など、別のかたちに変換するということ。音声認識技術や機械学習を用いて、情報の表現方法を変える研究だと言えるでしょう」

コロナ禍に突入してからは、対面ではなくオンラインで、聴覚障がい者の音声データを収集する機会が増えたという小林教授。そのようななか、通信環境の影響で音が乱れたり、途切れたりするという、新たな課題が生まれてきました。
「オンラインで音声データを収集することによる弊害は、正直想定外でした。ただ、オンラインだと対面の場合と違って、聴覚障がい者の方もコミュニケーションがとりづらいという新たな発見が得られたのは大きなメリット。この気づきのおかげで、聴覚障がい者の方が、画面の向こうにいる方とスムーズに意思疎通を図るための研究もスタートさせました

最先端技術を学べると同時に
コミュニケーションスキルも磨ける

小林教授の研究のミッションは、視聴覚障がい者や高齢者のコミュニケーションを支援する技術の開発。研究者が少ないこともあり、この分野に関連した人工知能の技術はまだまだ発展途上のようです。
「つまり、『障がい×人工知能』に関する新しい研究をスタートすれば、誰もが第一人者になれる可能性があります。また、世の中に大きなインパクトを与えられるチャンスも大きいでしょう」

この研究には、それ以外にも多くのメリットがあります。例えば、視聴覚障がい者を対象とした研究を通して、私たちが普段の生活では気づきにくい、文字や音声によるコミュニケーションへの理解が深まるでしょう。
「また、視聴覚障がい者や高齢者の方々と接することで、コミュニケーションの幅を広げることができます。言葉が上手く通じないときに、『わかりやすい言葉に言い換える』『身振り手振りをプラスする』など、フレキシブルに対応できるようになるはず。これらのスキルは、就職活動時や社会人になってからもきっと役立つと思います」

また、大和大学では「データサイエンスステーション」を設け、学生たちがハイスペックコンピュータを自由に使える環境を用意。音声認識をはじめとする最先端の技術に、気軽に触れることができます。
「ゲーム好きの方ならわかると思うのですが、『データサイエンスステーション』のパソコンにはグラフィックカードが搭載されており、その気になれば人工知能プログラムを作成することも可能。しかも、各分野に精通した先生方からサポートも受けられます。大和大学の情報学部でなら、きっと自分の可能性を大きく広げていけるでしょう」

プロフィール

小林 彰夫 教授

情報学部 情報学科

早稲田大学理工学部電気工学科卒業後、1991年に日本放送協会に入局。岡山や広島の放送局に勤務し、1996年からは日本放送協会放送技術研究所で、音声認識技術を使った字幕の研究に携わる。その後、筑波技術大学産業技術学部を経て、2023年4月に大和大学へ。

HOME > 研究・教育 > 研究探求 @ 大和大学 > 音声認識技術を駆使し、障がい者や高齢者のコミュニケーションを支援 〜 小林彰夫 教授