理科

ocrとは何ですか?»その定義と意味

Anonim

OCRは、光学的文字認識のものであるか、スペイン語では光学的文字認識としても知られています。 OCRは、テキスト認識を可能にし、その画像を生成して一連の文字に変換し、それらのテキスト編集プログラムで使用できる特定の形式で保存することを可能にするソフトウェアです。つまり、この新しいテクノロジーのおかげで、PDFファイル、スキャンした紙、さらにはデジタルカメラから取得した画像など、あらゆる種類のテキストやドキュメントをデータに変換して、編集できるようにすることができます

このソフトウェアは次のように機能します。最初に、問題のドキュメントの画像の各部分を分析します。表、画像、テキストブロックなどの断片にページを配布します。その後、行は後で文字になるために単語で分散されます。文字はすでに示されているので、ソフトウェアはパターンの画像のグループと比較します。これ各キャラクターが何であるかについての一連の仮説に従って進みます。そして、これらの仮説に基づいて、線を単語に、単語を文字に分割するさまざまなバリエーションを分析します。そして、仮説の多数の分析と処理の後、プログラムは最終的に、すでに認識され、新しい形式で変換されたテキストを提示します。。

今日、OmniPage、Abbyy Fine Reader、READirisなど、OCRに基づいてコンピューター市場が提供するプログラムがいくつかあることに注意してください。 YYは、テキスト自体を分析および認識するだけでなく、形式とスタイルも認識する機能を備えていますが、特定の制限があるため、分析後にテキストを編集して、次のような調整を行う必要があります。必要とする。