神戸大学附属図書館デジタルアーカイブ
入力補助
English
カテゴリ
学内刊行物
ランキング
アクセスランキング
ダウンロードランキング
https://doi.org/10.24546/0100490305
このアイテムのアクセス数:
146
件
(
2025-05-25
14:36 集計
)
閲覧可能ファイル
ファイル
フォーマット
サイズ
閲覧回数
説明
28_02 (fulltext)
pdf
414 KB
182
メタデータ
ファイル出力
メタデータID
0100490305
アクセス権
open access
出版タイプ
Version of Record
タイトル
脳性麻痺音声認識のための日本語および英語障害者音声を用いた音響モデルの学習
その他のタイトル
Acoustic model training using Japanese and English dysarthric speech for speech recognition of a person with cerebral palsy
著者
土師, 梧刀 ; 高島, 遼一 ; 滝口, 哲也
著者名
土師, 梧刀
著者名
高島, 遼一
著者ID
A1279
研究者ID
1000040397815
ORCID
0000-0001-5005-7679
KUID
https://kuid-rm-web.ofc.kobe-u.ac.jp/search/detail.html?systemId=b3ec2a1710d8267b520e17560c007669
著者名
滝口, 哲也
タキグチ, テツヤ
Takiguchi, Tetsuya
所属機関名
都市安全研究センター
言語
Japanese (日本語)
収録物名
神戸大学都市安全研究センター研究報告
巻(号)
28
ページ
13-18
出版者
神戸大学都市安全研究センター
刊行日
2024-03
抄録
本研究では構音障害者、特に脳性麻痺者のための音声認識技術の開発を目的とする。脳性麻痺者は手足の動作が不自由である場合が多いため、ハンズフリーで操作できる音声認識デバイスは魅力的である。しかし、脳性麻痺者の発話スタイルは健常者と大きく異なっており、既存のモデルでは音声認識が困難である場合が多い。そのため、本研究ではOpenAI社が公開している多言語音声認識モデルWhisperに着目する。Whisperは日本語音声に対して高い認識性能を示しているが、構音障害者音声に対する認識精度は低下する課題がある。本研究ではWhisperを日本人の構音障害者音声でFine tuningすることによって認識率の向上を目指した。その結果、学習前と比べて認識率が大幅に上昇することが確認された。また、構音障害者は発話の際の心身への負担から音声を大量に収録することが難しいという課題があり、それに対処するため、英語の構音障害者音声も学習させる実験も行った。その結果、日本語障害者音声のみを学習した場合と比べて、さらに1%程度誤り率が改善した。
キーワード
構音障害
脳性麻痺
音声認識
Fine tuning
カテゴリ
都市安全研究センター
神戸大学都市安全研究センター研究報告
>
28号(2024-03)
紀要論文
詳細を表示
資源タイプ
departmental bulletin paper
ISSN
1342-9167
OPACで所蔵を検索
CiNiiで学外所蔵を検索
NCID
AA11142997
OPACで所蔵を検索
CiNiiで表示
ホームへ戻る