タイトルヨミ | リヨウシャ カラ ミタ OCR ゴニン トクセイ
|
日本語以外のタイトル | Error Properties in Character Recogmtion of OCR in Utilization
|
ファイル | |
言語 |
日本語
|
著者 |
佐藤 匡正
岸本 頼紀
|
内容記述(抄録等) | The character recognition through OCR(optical character reader)is possib1e to include severaI errors. The errors are remarkable in recognizing such sentence as include various font types,along with errors being due to stain or winkle. To wittily OCR it is important to hold the factors of recognition errors. This paper presents OCR recognition error(trends by analyzing experimental data in recognizing some kinds of manuscripts. The manuscripts to be read contain low quality dot-matrix prints and book pages with regular types,with program codes and mathematical formula, and with both regular and ruby(tiny)types. In the analysis errors are classified into three types to clarify that the recognition error trends both in each type and being due to ruby types.
OCRによる文字認識は,誤認の可能性がある. 誤認は,資料の皺や汚れなどによるものもあるが,異なる寸法の字体が混在する文では特に顕著である.OCRを利用する場合,こうした誤認がどのような状況で生ずるかを把握することが大切である. そこで,誤認の性質を把握することを目的として様々な資料における誤認の状況を調べる. 資料としては,印字品質の低いドットプリソタで出力された文,数式やコードを含む文,縦書きの文,ルビをもつ文の4種類を使用した.この調査では,誤認を3種類に分類し,それぞれの分類における誤認の傾向,ルビ文字に起因すると推測される誤認の傾向について分析した. |
掲載誌名 |
島根大学総合理工学部紀要. シリーズA
|
巻 | 33
|
開始ページ | 51
|
終了ページ | 62
|
ISSN | 13427113
|
発行日 | 1999-12-24
|
NCID | AA11157087
|
出版者 | 島根大学総合理工学部
|
出版者別表記 | Interdisciplinary Faculty of Science and Engineering, Shimane University
|
資料タイプ |
紀要論文
|
部局 |
(旧組織)大学院総合理工学研究科
|
備考 | 30-41+ / 1997-2007
|
他の一覧 |