利用者から見たOCR誤認特性

アクセス数 : 1174
ダウンロード数 : 636

今月のアクセス数 : 8
今月のダウンロード数 : 2
File
c0040033r004.pdf 939 KB エンバーゴ : 2002-05-18
Title
利用者から見たOCR誤認特性
Title
Error Properties in Character Recogmtion of OCR in Utilization
Title Transcription
リヨウシャ カラ ミタ OCR ゴニン トクセイ
Creator
Kishimoto Yorinori
Source Title
島根大学総合理工学部紀要. シリーズA
Volume 33
Start Page 51
End Page 62
Journal Identifire
ISSN 13427113
Descriptions
The character recognition through OCR(optical character reader)is possib1e to include severaI errors. The errors are remarkable in recognizing such sentence as include various font types,along with errors being due to stain or winkle. To wittily OCR it is important to hold the factors of recognition errors. This paper presents OCR recognition error(trends by analyzing experimental data in recognizing some kinds of manuscripts. The manuscripts to be read contain low quality dot-matrix prints and book pages with regular types,with program codes and mathematical formula, and with both regular and ruby(tiny)types. In the analysis errors are classified into three types to clarify that the recognition error trends both in each type and being due to ruby types.

 OCRによる文字認識は,誤認の可能性がある. 誤認は,資料の皺や汚れなどによるものもあるが,異なる寸法の字体が混在する文では特に顕著である.OCRを利用する場合,こうした誤認がどのような状況で生ずるかを把握することが大切である. そこで,誤認の性質を把握することを目的として様々な資料における誤認の状況を調べる. 資料としては,印字品質の低いドットプリソタで出力された文,数式やコードを含む文,縦書きの文,ルビをもつ文の4種類を使用した.この調査では,誤認を3種類に分類し,それぞれの分類における誤認の傾向,ルビ文字に起因すると推測される誤認の傾向について分析した.
Language
jpn
Resource Type departmental bulletin paper
Publisher
島根大学総合理工学部
Interdisciplinary Faculty of Science and Engineering, Shimane University
Date of Issued 1999-12-24
Access Rights open access
Relation
[NCID] AA11157087
Remark 30-41+ / 1997-2007