number of downloads : ?
File
language
jpn
Title Transcription
オンイン ケンサ ノ タメノ ヒゴ ノ オンセイ ニンシキ ニ ユウコウ ナ トクビリョウ ノ ケントウ
Title Alternative (English)
Study on Effective Combination of Features for Non-word Speech Recognition of Phonological Examination
Author
Tadano, Toshiharu IZUMO COLLEGE OF MEDICAL NURSE, Izumo, Shimane 693–0001, Japan
Sako, Shinji Nagoya Institute Technology, Nagoya, Aichi 466–8555, Japan
Description
発達性ディスレクシアは学習障害の主要な症状の1つであり,早期発見は介入および読みの療育をするにあたって非常に重要である.PCを用いた簡易なスクリーニングテストが提案されており,テキストの読み上げの正確さ,単語の逆読み,文字の削除の能力についての評価データおよび回答潜時が自動的に記録される.しかし,正誤判定はテストの実施者によって行わなければならず,自動化が望まれている.正誤判定の部分を自動化するためには,検査の課題語にある意味を持たない言葉である非語に対応した音声認識技術が必要であるが,従来の音声認識では,非語に対する認識精度は低いのが現状である.そこで従来の音声認識の機能を補強しつつ,非語に対する正解率(accuracy)を音韻検査に実用できるレベルまで向上させなければならない.本研究では,ソースコードが無料で公開されており,自由に改造が可能な音声認識エンジンJuliusに非語の正誤を判別する機構を組み込むことにより,非語に対するaccuracyの向上を試みた.また,音声の特徴量に7つの候補をあげ,その組合せによるaccuracyの動向を検討した.その結果,対象の非語によっては75.0%から95.0%,全体の平均値は87.5%のaccuracyを得た.
Description Alternative
Developmental dyslexia is a main element of learning disability and its early detection is very important for intervention and reading treatment. A convenient screening test using PC has been published and the answer times in text reading, reversed reading of word and mora skip of word are automatically recorded in the test. However, the correctness determination must be done by tester. In order to automate those test, a speech recognition technology corresponding to a non-word that are non-meaningful words used in an examination is necessary, but in conventional speech recognition, recognition precision for non-words is low. Therefore, while reinforcing the function of conventional speech recognition, the accuracy for non-words to be improved to a level that can be practically used for phoneme examination. In this study, we have tried to improve the accuracy for non-words by incorporating a mechanism to determine non-word correctness into Julius, which is in the public domain and can be modified freely. In addition, six candidates are given as feature quantities of speech, and the trend of the accuracy by the combination is examined. As a result, depending on the target non-word, the accuracy was 75.0% to 95.0%, and the overall average value was 87.5%.
Subject
音声認識
非語
機械学習
音韻検査
speech recognition
non-word
machine learning
phonological examination
Journal Title
情報処理学会論文誌
Volume
61
Issue
10
Start Page
1647
End Page
1657
ISSN
1882-7764
Published Date
2020-10-15
DOI
Publisher
情報処理学会
Publisher Transcription
ジョウホウ ショリ ガッカイ
Publisher Aalternative
Information Processing Society of Japan
NII Type
Journal Article
Format
PDF
Relation
Text Version
出版社版
Gyoseki ID
39495
OAI-PMH Set
Faculty of Science and Engineering
Remark
<ここに掲載した著作物の利用に関する注意>本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」(https://www.ipsj.or.jp/ipsjcode.html)に従うことをお願いいたします。