Memoirs of the Graduate School of Science and Engineering Shimane University. Series A

number of downloads : ?
Memoirs of the Graduate School of Science and Engineering Shimane University. Series A 33
1999-12-24 発行

利用者から見たOCR誤認特性

Error Properties in Character Recogmtion of OCR in Utilization
Satou, Tadamasa
Kishimoto, Yorinori
File
Description
The character recognition through OCR(optical character reader)is possib1e to include severaI errors. The errors are remarkable in recognizing such sentence as include various font types,along with errors being due to stain or winkle. To wittily OCR it is important to hold the factors of recognition errors. This paper presents OCR recognition error(trends by analyzing experimental data in recognizing some kinds of manuscripts. The manuscripts to be read contain low quality dot-matrix prints and book pages with regular types,with program codes and mathematical formula, and with both regular and ruby(tiny)types. In the analysis errors are classified into three types to clarify that the recognition error trends both in each type and being due to ruby types.

 OCRによる文字認識は,誤認の可能性がある. 誤認は,資料の皺や汚れなどによるものもあるが,異なる寸法の字体が混在する文では特に顕著である.OCRを利用する場合,こうした誤認がどのような状況で生ずるかを把握することが大切である. そこで,誤認の性質を把握することを目的として様々な資料における誤認の状況を調べる. 資料としては,印字品質の低いドットプリソタで出力された文,数式やコードを含む文,縦書きの文,ルビをもつ文の4種類を使用した.この調査では,誤認を3種類に分類し,それぞれの分類における誤認の傾向,ルビ文字に起因すると推測される誤認の傾向について分析した.