この記事では、AI(人工知能)を活用したOCR(光学文字認識)技術の仕組みやメリット、具体的な活用シーンについて、分かりやすく解説しています。
OCR技術を搭載した画像解析システムを開発したいと考えているSIer・AI事業者の皆様は、参考にしてみてください。
OCR(Optical Character Recognition)は、紙の書類や画像データに含まれる文字を読み取り、デジタルの文字データに変換する画像解析技術のひとつ。スキャナーで取り込んだ書類の文字をコンピューターで編集可能なテキストに変換する際に使用されます。
従来のOCR技術は、事前に設定されたレイアウトや文字の位置情報に基づいて文字を認識する仕組み。特定のフォーマットの書類や文字は高精度に変換できても、フォーマットが異なる書類やレイアウトが複雑な書類、手書き文字などは精度が低いという課題がありました。
こうした課題を解決するため、近年は、AI技術を取り入れたOCRのツールやサービスが増えています(以降、AI OCR)。
従来のOCR技術では読み取りが難しかった手書き文字や複雑なレイアウトの文書も、高精度に読み取ることが可能です。
神奈川県が実施したAI-OCRの実証実験では、フォーマットの異なる7様式・計280枚の手書き帳票の読み取りに挑戦。結果、平均93.4%という高い正読率を記録しました。(実施期間:2019年10月31日から2019年12月16日)。
AI OCRを利用することで、手作業で対応していたデータ入力を自動化。作業負担や人件費を削減し、対応できる業務量を増やすことができます。
横浜市の保育入所関連業務を自動化する実証実験では、保育園・幼稚園の給付認定申請書、利用申請書(手書き)のデジタル化にAI OCRを利用。年間約17,000件の申請処理を効率化し、全職員の業務時間を500時間削減することができました。
AI OCRは、用途や対応する書類の種類に応じて以下のように分類されます。
事前に設定されたフォーマットに基づいて読み取る方式です。対応できる書類の種類が多く、設定済みのフォーマットなら高い精度で情報を抽出することができます。
ただし、書類の種類ごとに手作業でフォーマットを設定しなくてはならず、一定の時間と手間がかかります。
書類の種類やレイアウトを問わずに対応できる、汎用性の高い読み取り方式です。AIが自動的に各書類の記載位置を学習・判定して情報を抽出するため、手作業でフォーマット設定をする必要がありません。
ただし、AIが新しいフォーマットを学習し、十分な精度を発揮するまでには時間がかかります。
特定の業務に特化した書類(請求書や納品書など)について、フォーマットを設定しなくても読み取ることが可能。特定業務の書類について事前学習したAIを取り入れているため、スムーズに利用できます。
仕訳データの抽出・生成を自動化して、外部システムと連携することも可能です。
さまざまな業界で活用されているAI OCR。ここでは具体的な活用シーンをいくつかご紹介します。
製造業では、多数の取引先から請求書が届きます。フォーマットは取引先によってバラバラで、手書きのケースもあるでしょう。AI OCRを活用すれば、請求書のデータを自動的に読み取りデジタル化することが可能です。
会計システムと連携することで、手作業による入力ミスを防ぎ、請求書処理の時間短縮も図れます。
法律事務所では、訴状や答弁書、各種契約書など、法律上のトラブル解決や訴訟手続きに必要な文書を多く取り扱います。税理士事務所や会計事務所も、企業の会計記録や決算処理、税務申告に関連する帳票が多く、処理作業が大変です。
AI OCRを活用すれば、これらの書類を迅速かつ正確にデジタル化することが可能。検索や管理がスムーズになります。
手書きの注文書や納品伝票が毎日沢山発生する小売業。紙で管理するのは大変ですし、手作業でデータ入力するのも手間でしょう。AI OCRを活用して、各書類のデータ入力を自動化することで、受発注作業を効率化することが可能。
在庫管理システムと連携すれば、発注ミスも起こりにくくなります。
印刷物や手書きの書類を自動的にデジタル化するAI OCRについて解説しました。AI OCRは、用途や読み取りたい書類に合ったものを選ぶことが大切です。
AI OCRツールを開発する場合は、事前学習を済ませた画像解析AIを活用するとよいでしょう。
また、当メディアではシステム開発の業界・目的別におすすめの画像解析AIを紹介しています。製造業、医業、金融業など、開発システムを活用する業界・目的によって、選ぶべき画像解析AIは変わってくるもの。自社の開発システムに合った画像解析AIを導入したいと考えているSIer・AI事業者の皆様は参考にしてみてください。
様々な画像解析AIのなかで、DX化実現のため大規模なシステム構築が求められる製造業、高度な解析精度が医療業界、セキュリティが重視される金融業界と3つの業界で目的に合うツールをピックアップしました。
Bind Vision
(キヤノンITソリューションズ)
Aivia
(ライカマイクロシステムズ)
Azure AI Vision
(日本マイクロソフト)