ファイル情報(添付) | |
タイトル |
利用者から見たOCR誤認特性
|
タイトル |
Error Properties in Character Recogmtion of OCR in Utilization
|
タイトル 読み |
リヨウシャ カラ ミタ OCR ゴニン トクセイ
|
著者 |
岸本 頼紀
|
収録物名 |
島根大学総合理工学部紀要. シリーズA
|
巻 | 33 |
開始ページ | 51 |
終了ページ | 62 |
収録物識別子 |
ISSN 13427113
|
内容記述 |
その他
The character recognition through OCR(optical character reader)is possib1e to include severaI errors. The errors are remarkable in recognizing such sentence as include various font types,along with errors being due to stain or winkle. To wittily OCR it is important to hold the factors of recognition errors. This paper presents OCR recognition error(trends by analyzing experimental data in recognizing some kinds of manuscripts. The manuscripts to be read contain low quality dot-matrix prints and book pages with regular types,with program codes and mathematical formula, and with both regular and ruby(tiny)types. In the analysis errors are classified into three types to clarify that the recognition error trends both in each type and being due to ruby types.
OCRによる文字認識は,誤認の可能性がある. 誤認は,資料の皺や汚れなどによるものもあるが,異なる寸法の字体が混在する文では特に顕著である.OCRを利用する場合,こうした誤認がどのような状況で生ずるかを把握することが大切である. そこで,誤認の性質を把握することを目的として様々な資料における誤認の状況を調べる. 資料としては,印字品質の低いドットプリソタで出力された文,数式やコードを含む文,縦書きの文,ルビをもつ文の4種類を使用した.この調査では,誤認を3種類に分類し,それぞれの分類における誤認の傾向,ルビ文字に起因すると推測される誤認の傾向について分析した. |
言語 |
日本語
|
資源タイプ | 紀要論文 |
出版者 |
島根大学総合理工学部
Interdisciplinary Faculty of Science and Engineering, Shimane University
|
発行日 | 1999-12-24 |
アクセス権 | オープンアクセス |
関連情報 |
[NCID] AA11157087
|
備考 | 30-41+ / 1997-2007 |