OCRを複合機に導入してペーパーレス化を推進しよう

ペーパーレス化は、いつでもどこでも必要とする人が、必要な時に容易に情報にアクセス出来る事で、業務効率向上に繋がります。

しかし社内にある情報の多くは、紙のファイルにある会社も多いのが現実です。
その膨大なデータの全てを、いちいちキーボードから入力してデジタル化していては、終わりのない迷路に迷い込む様なものです。

この単純作業を劇的に改善するのに、OCRの導入があります。
専用の機器など新たな投資をしなくても、多くの複合機にはOCR機能が搭載されていたり、オプションで利用出来る様になっていたりします。

今回は複合機のOCR利用について解説します。

目次

OCRとは

「OCR」は、Optical Character Recognition/Readerを略した物です。
読みはオーシーアールで、直訳すると「光学的文字認識」になります。

まずスキャナーなどを使って、手書きの書類や印刷されている文字を読み取ります。
これだけでは写真と同じで、書類としてデジタル化したわけではありません。
人間が見れば文字を読むことが出来ますが、コンピュータは文字の認識が出来ずに、写真としてしか捉えられません。たとえば、書いてある内容が出てくる事を期待して検索をかけても引っかからない状態にあります。

ここからOCRが登場します。
OCRは、この写真データから文字を認識して、デジタルの文字コードに変換する技術です。

一見簡単に見えますが高度な技術で、その進化は日進月歩です。
たとえば、新聞を読み取る作業を具体的に考えた場合、単純に文字が同じ並び方で羅列されている事はありません。段組等やグラフ・写真や表題文字などが混在しています。その中から配置を解析して、文字領域を認識して一文字ずつに分解処理を行います。
解析した文字が日本語として正しいか?見つけた特徴を元に文章として並べ直します。
全ての認識が完了した後に、フォーマット変換を行いデジタルの文字データが完成します。

人間は簡単に認識できる事でも、コンピュータにとっては困難な事が多くあります。
特に他の言語と比較して、日本語の難易度はかなり高いと言えます。
たとえば、「営業力」という単語を見れば人間なら「エイギョウリョク」と即座に認識出来ますが、コンピュータにとってはカタカナの「カ」なのか?漢字の「力」なのか?営業力という単語のデーターベースを持っていなければ判断できません。文脈を読み取って判断することも、人間に比較すれば、まだまだ苦手です。

複合機にOCRを導入する意味

このOCRを複合機に導入する事は、極めて合理的です。
複合機がネットワーク環境に組み込まれている事が前提です。

ペーパーレス化に最適

OCR搭載の複合機を利用する事で、新たな機器を購入する投資が必要ありません。
スキャンしてOCRによってデジタル化したデータが、LANを通じてサーバーに保管されることで、ペーパーレス化の生産性が大幅に上がります。
コピーをとる感覚で、見積書や他社から送られてきた書面、必要な新聞記事などがデジタルデータ化されます。

書類を検索しての利用が可能に

紙での書類をファイリングして保管する状態では、後日必要になった場合には、その都度探す必要が有りますが、OCR搭載の複合機を使ってデータ化する事を習慣にしておくことで、デジタル化されたデータはLAN上で、どのパソコンからも閲覧検索が可能になります。

再利用も合理的に出来る

紙データや通常のスキャンを行うだけでは画像でしかなく、新たな資料への部分的再利用をする場合、手打ちで見ながら入力していく必要が有りますが、複合機のOCRを利用してデータ保管しておけば、必要な時に閲覧だけでなく、データの再利用も可能になり業務効率向上が期待出来ます。

スペースの有効利用

OCR搭載の複合機を利用してデータの保管をしておけば、公的な証書など紙書類自体を保管する必要が有るものを除けば、多くの書類を紙データで保管しておく必要が無くなります。

ペーパーレス化により書類で保管しておく必要も無くなり、オフィススペースも有効に使えます。
書庫スペースが小さく出来る事で、コスト削減にも繋がります。

利用方法の流れと注意

複合機にはOCR機能搭載が無い機種もある

大型複合機コピー機では、OCRが標準搭載されていないものも有ります。
キャノンの複合機は、OCR機能が標準搭載されていません。
スキャンソリューション機能拡張キットをオプション導入する事で、OCR機能が利用出来る様になります。

複合機でOCRを利用する流れ

機種によって、具体的な作業手順は異なります。

富士フィルムビジネスイノベーション製の複合機は、「DocuWorks」でスキャン後にOCRを行います。

シャープ製の複合機では、「シンプルモード」機能の中に、OCR機能が利用出来る様になっています。

細かい手順は機種によって違っても、「保存先・送信先を指定する」-「保存ファイル形式を指定する」-「解像度や原稿読取りサイズなどを指定する」-「モノクロ・カラーを指定する」-「原稿の両面読み取や拡大縮小を設定する」-「スキャンする」という内容は、機種によって順番や詳細は異なりますが基本的に同じです。

一般的な出力ファイル形式としては、PDF・Word・Excel・PowerPoint等があります。
普段多く利用するファイル形式で保存しても良いのですが、汎用性が高く利用しやすいPDF形式での保存がオススメです。

OCRで認識しにくい文字は?

OCRは日進月歩で読取り精度は高くなっています。
人工知能(AI)も導入されていて、手書き文字まで認識出来るタイプが登場していて、以前と比較すれば読み取ったデータの手直しをする作業の頻度は減少していますが、残念ながら完全とは言えません。

OCRでは認識しにくいケースをあらかじめ認識しておけば、普段の書類作成時に意識する事で、認識率を上げることが出来ます。

読みにくい代表的なものとして、「文字同士が接近していて間隔が狭い」「黒以外のカラー印刷文字」「小さなサイズの文字」「網掛けがされている文字」「汚れている原稿」「擦れている文字」「横書きと縦書きが混在している」「色々な言語が一つの原稿に使われている」「コントラストが低い」等が挙げられます。

特定の機種やアプリケーションなどに依存する、機種依存文字は読み取る事が出来ません。

手書き文字を認識させる場合は、達筆すぎる文字や崩しすぎている文字、根本的に汚い文字については、やはり認識率は大幅に低下することが避けられません。

認識率を上げるには?

読み取る原稿が、正しくセットされている事が大前提です。斜めになっている場合は、正しく読み取る事が出来ません。

背景との明度差が低い文字が原稿に入っている場合は、白黒モードでスキャン指定した方が、背景との明度差を付けることが出来ます。

雑誌や新聞など薄い紙に印刷された原稿では、裏写りがし易く正しく原稿が読み取れません。
黒い紙などを原稿の上に置いてスキャンする事で、認識率は向上します。

OCR対応機種を導入しよう

今はペーパーレス化が進んでいなくても、将来的にペーパーレス化を推進する方向に舵を切る可能性は全ての企業にあります。

単に時代の流れというだけでなく、情報のデジタル化で一元管理するメリットは大きく、業務効率を大幅に上げるのに加えて省スペースも実現します。
だからこそ今後複合機を導入するなら、OCRに対応したタイプをオススメします。

OCR対応機種は、高額な大型複合機コピー機だけの機能ではありません。
コンパクトでデスク上に設置できる小型中型複合機にも、OCRに対応している機種があります。リースしているメインの大型複合機コピー機を入れ替えなくても、サブとして導入すれば業務効率の向上がペーパーレス化以外にも期待出来ます。

その場合、初期費用が掛からずに別途メンテナンス契約やカウンター料金も不要なレンタルプリンターの導入が合理的です。

たとえば、「プリント革命」では、BIJ-E25プランだとフルカラーの複合機で、カラーコピーやFAX・スキャンが可能でOCRの機能もあります。
月額料金は月に3,000枚まで可能なライトプランで月額16,000円です。
この3,000枚は印刷したり、コピーしたりしたプリントアウトが対象で、OCRは何枚データ化しても別途料金はかかりません。

カラー印刷が必要無い場合は、ML-C15プランがあります。
モノクロ専用レーザー複合機ですが、スキャン機能はカラーも可能でOCR機能もあります。
月額料金は月に3,000枚まで可能なライトプランで月額10,000円です。

他にもニーズに合わせた魅力的なラインナップがあります。
お気軽に相談してください。

 

この記事を書いた人

名古屋在住のIT・通信・格安SIMライターです。

プリンターはDOS時代のドットプリンターから使い始めて
初期のインクジェット、モノクロレーザープリンター
カラーレーザープリンターを使ってきて
モノクロ複合機を経てカラーデジタル複合機リースに到達。

業務用テキスタイル熱転写プリンター
業務用テキスタイルインクジェットプリンター見学に
国内・海外工場に何度も足を運ぶマニアで
日夜情報収集に励んでいます。

目次