ダウンロード数 : ?
タイトルヨミ
リヨウシャ カラ ミタ OCR ゴニン トクセイ
日本語以外のタイトル
Error Properties in Character Recogmtion of OCR in Utilization
ファイル
言語
日本語
著者
佐藤 匡正
岸本 頼紀
内容記述(抄録等)
The character recognition through OCR(optical character reader)is possib1e to include severaI errors. The errors are remarkable in recognizing such sentence as include various font types,along with errors being due to stain or winkle. To wittily OCR it is important to hold the factors of recognition errors. This paper presents OCR recognition error(trends by analyzing experimental data in recognizing some kinds of manuscripts. The manuscripts to be read contain low quality dot-matrix prints and book pages with regular types,with program codes and mathematical formula, and with both regular and ruby(tiny)types. In the analysis errors are classified into three types to clarify that the recognition error trends both in each type and being due to ruby types.

 OCRによる文字認識は,誤認の可能性がある. 誤認は,資料の皺や汚れなどによるものもあるが,異なる寸法の字体が混在する文では特に顕著である.OCRを利用する場合,こうした誤認がどのような状況で生ずるかを把握することが大切である. そこで,誤認の性質を把握することを目的として様々な資料における誤認の状況を調べる. 資料としては,印字品質の低いドットプリソタで出力された文,数式やコードを含む文,縦書きの文,ルビをもつ文の4種類を使用した.この調査では,誤認を3種類に分類し,それぞれの分類における誤認の傾向,ルビ文字に起因すると推測される誤認の傾向について分析した.
掲載誌名
島根大学総合理工学部紀要. シリーズA
33
開始ページ
51
終了ページ
62
ISSN
13427113
発行日
1999-12-24
NCID
AA11157087
出版者
島根大学総合理工学部
出版者別表記
Interdisciplinary Faculty of Science and Engineering, Shimane University
資料タイプ
紀要論文
部局
(旧組織)大学院総合理工学研究科
備考
30-41+ / 1997-2007
他の一覧