【2024年】AI-OCRとは?メリットとデメリット・成功事例を紹介
公開日:2024.11.18
目次
AI-OCRとは?
AI-OCRとは、AI(人工知能)を活用したOCR(光学文字認識)の一種で、従来のOCR技術にディープラーニングを導入し、手書き文字や非定型の書式にも対応可能な高精度な認識技術です。
通常のOCRはデジタル化した文書から文字をテキストデータへ変換しますが、AI-OCRはその過程で文字の識別能力が格段に向上しています。
手書きの文字や、フォーマットが統一されていない帳票でも高精度に解析でき、業務の効率化に大いに貢献します。
さらにAI-OCRは、単なる文字認識にとどまらず、レイアウト解析機能に優れておりディープラーニングを活用することで、帳票内の各項目がどの部分に記載されているかを自動で解析し、項目ごとにデータ化することも可能です。
AI-OCRは幅広い帳票形式に対応可能で、データ入力作業の負担を大きく削減します。
AI-OCRとの違い
従来のOCRとAI-OCRの違いは下記のとおりです。
項目 | 従来のOCR | AI-OCR |
構成 | スキャン機器とソフトウェアで構成 | 機械学習やAI技術を活用したソフトウェア |
書類レイアウト対応 | レイアウト(罫線等)に厳格で、読み取る文字項目を事前に定義する必要がある | 書類レイアウトからAIが自動的に文字を認識 |
ノイズ対応 | かすれやインク漏れがある文字は認識が難しい | ノイズ処理エンジンにより、取り消し線や網掛け文字なども読み取れる |
認識精度 | 誤認識が多く、手作業で修正する必要がある | 学習機能により、使用を繰り返すことで精度が向上 |
手書き文字の認識 | 対応が難しく、認識精度が低い | 手書き文字も学習を通じて認識精度が向上 |
適応力 | 定型フォーマットの書類には強いが、非定型帳票には対応しづらい | 多様なレイアウトや非定型帳票にも対応可能 |
処理速度 | 大量の帳票を処理する際は時間がかかる | AIによる自動化で処理速度が向上 |
設定作業の手間 | 読み取り項目の事前設定が必要 | 設定なしで自動的に認識できる |
保守・更新の必要性 | ソフトウェアのバージョンアップや設定変更が必要 | AIが継続的に学習し精度を保つ |
AI-OCRの種類
AI-OCRは大きく分けて下記の3種類に分けられます。
- 汎用・定型フォーマット型
- 汎用・非定型フォーマット型
- 業務特化・非定型フォーマット型
それぞれの種類は、特定の用途や帳票形式に適応したメリット・デメリットをを持ちます。
AI-OCRの種類ごとの特徴は下記のとおりです。
種類 | メリット | デメリット | 得意な書類 |
汎用・定型
フォーマット型 |
抽出精度が高い
定義されたフォーマットであれば幅広い帳票に対応可能 |
事前にフォーマット定義が必要
フォーマット外の帳票には対応できない |
アンケート 注文書 |
汎用・非定型
フォーマット型 |
手作業によるフォーマット定義が不要
幅広い帳票フォーマットに対応可能 |
高精度な抽出にはAIの事前学習が必須
学習不足の帳票は精度が低下する可能性がある |
納品書
請求書 |
業務特化×非定型フォーマット型 | 事前学習が不要
既存システムとの連携が可能で業務効率を向上 |
特定業務に特化しており、他の業務用帳票には適用が難しい | 自社業務で
利用する特定帳票 |
汎用型と定型フォーマット型
「汎用×定型フォーマット型」は、事前に「どの位置にどの情報が記載されているか」を指定することで、安定した精度で情報を抽出できます。帳票の種類に制限はありませんが、フォーマットの定義が必要です。
フォーマットが固定された「アンケート」や「注文書」などの帳票に適しており、特定の配置で項目が記載される場合に高精度の読み取りが期待できます。
ただし、対応できる帳票はあくまで定義された形式に限られるため、別の形式や変更が加えられた場合は再設定が必要です。
汎用×非定型フォーマット型
「汎用×非定型フォーマット型」は、事前の手作業によるフォーマット定義を省き、AIの事前学習により自動で帳票を認識します。帳票の種類やフォーマットにとらわれず、幅広い形式に対応できるAI-OCRといえます。
異なるフォーマットが多い「納品書」「請求書」のような帳票でも、記載内容の共通項を学習することで高い精度を発揮します。
精度向上にはAI学習が必要で、未学習の帳票フォーマットでは精度が低下する可能性があります。学習時間とAIの更新作業が必要な点が留意点です。
非定型フォーマット型と業務特化型
「業務特化×非定型フォーマット型」は、特定業務の帳票に特化したAI-OCRで、一般的にサービス提供企業が予め学習を完了させています。
自社側で新たな学習作業は不要で、既存システムとのスムーズな連携も可能です。自社業務で扱う帳票に対して自動で高精度な読み取りを実現し、業務効率の向上に貢献します。
ただし、特化した業務専用であるため、対応範囲が限られ、他の用途には利用が難しいことが留意点です。
AI-OCRのメリット
AI-OCRは従来のOCRと比べて格段に進化しており、文字の認識技術だけではなくさまざまなメリットがあります。
高精度な文字認識技術
AI-OCRは、従来型のOCRと比べて文字認識の精度が格段に向上しています。手書きの申込書では98%以上の認識率を実現し、作業時間を従来の3分の1に短縮したケースもあります。
特に効果を発揮するのが、手書き文字や歪んだ文字の読み取りで、従来は人手に頼っていた作業を自動化できます。
また、ディープラーニングによる学習機能により、読み取り精度は使用するほど向上します。保険会社では、申請書類の読み取り精度が導入後3ヶ月で95%から99%まで改善した事例があるほどです。
多様なフォーマット対応の能力
AI-OCRは、定型フォーマットに縛られず、様々な書類に対応できます。取引先ごとに異なる請求書フォーマットでも、必要な情報を正確に抽出し、自社の経理システムに取り込めます。
業界特有の専門用語や記号にも対応可能です。医療分野では、専門的な医療用語や処方箋特有の記号を90%以上の精度で認識できたケースがあります。
トレーニングデータを用いた学習により、各企業固有のフォーマットにも対応します。各社独自のフォーマットのしかるべき場所に転記が可能です。
業務システムとの連携強化
AI-OCRは、APIを通じて既存の業務システムと容易に連携可能です。たとえば、営業部門の顧客データベースと連携することで、名刺情報を自動的に顧客管理システムに登録できます。
クラウドサービスとして提供されるため、システム導入のハードルが低く、運用コストも抑えられるでしょう。また、RPAと組み合わせることで、データ入力から後続の処理まで完全自動化が実現します。経理部門では、請求書のスキャンから支払処理まで、人手を介さず完了できた活用例があります。
AI-OCRのデメリット
一方、AI-OCRにはメリットだけではなくデメリットも複数あります。
識字率は100%ではない
AI-OCRは高性能ながら、完璧な読み取りは保証されません。手書き文字の読み取り精度は一般的に正読率が97~98%にまで達していますが、崩し字や個性的な筆跡では90%以下まで低下することがあります。
読み取りでは「3」と「8」の誤認識が発生するというデータも挙げられています。医療現場の場合、数字の誤認識は投薬ミスにつながる危険性があるため、まだ人による確認作業が必要といえます。
保険業界での請求書処理では、金額や日付の誤読が月間で数%発生するため、手作業での修正が必要です。完全な文字の読み取りを目指す企業は、人手による確認プロセスの検討をすることが望ましいでしょう。
定型文書に限定している
AI-OCRは、一定のフォーマットに従った文書の処理に特化しているため、自由形式の議事録や手書きメモでは、重要な情報の抽出精度が低下することがあります。
レイアウトが複雑な文書や表やグラフが混在する報告書では、データの構造化が困難で、手作業での整理が必要です。
たとえば、建設現場での作業日報など、図面や写真が含まれる文書では、テキスト部分の抽出は可能でも、視覚情報の処理には対応できません。
コストが高い
非定型帳票AI-OCRの導入には高額なコストがかかります。初期費用では、ソフトウェアのライセンス料やサーバーなどのハードウェア費用が発生し、システム構築や運用のための人件費も無視できない要素です。
さらに、AIの精度を向上させるための学習データの準備や社内体制の整備にも費用がかかります。予算が限られた中小企業にはコスト負担が大きく、導入をためらう原因となりやすいです。
導入効果を最大化するには、短期的な費用対効果ではなく、長期的な投資と回収計画が重要です。
操作を慣れるまでの学習時間が長い
AI-OCRの操作習得には慣れるまで時間が必要です。特に、スキャン設定の最適化や読み取りエラーの修正など、高度な操作の習得には時間を要することもあります。
また、操作習得の遅れによる業務効率低下や、世代間での習熟度の差が新たな課題となっています。
読み取る時間が長い
AI-OCRの処理速度は、期待ほど速くありません。A4サイズの文書1枚の処理に、1枚あたり数秒〜数十秒というわずかな時間で完了しますが、画質が悪い場合はさらに時間がかかります。
大量処理時の速度低下も課題です。システムに負荷がかかるため、100枚以上の一括処理では、1枚あたりの処理時間が2倍以上に増加します。
リアルタイム処理の要望に応えられていないケースもあります。また、AIモデルの精度を高めるための学習プロセスも、処理時間に影響を与えます。
AI-OCRを導入する際は、処理速度の検証や実際の業務フローへの適合性を確認することが重要であり、処理速度の改善には、高性能なサーバーの導入が必要です。
独自のカスタマイズができない
パッケージ型のAI-OCRは、カスタマイズに制限があります。業界特有の専門用語や独自の帳票フォーマットへの対応には、追加開発が必要です。
システム改修に時間がかかることも留意点です。フォーマットの微修正でも、対応に時間がかかるため、急な業務変更に柔軟に対応できず、作業効率が低下するケースが報告されています。
特に中小企業では、開発リソースの制約から、必要なカスタマイズができずに導入を断念するケースがあります。
セキュリティの問題
AI-OCRの利用は、新たなセキュリティリスクをもたらします。クラウド型システムでは、AI-OCRを起因とした漏洩事故が報告されています。
特に、医療・金融機関での個人情報処理には注意が必要です。誤った設定により情報が流出してしまうリスクが発生します。対策には、専門家による月次監査や、従業員向けセキュリティ研修が推奨されます。データの暗号化やアクセス制限の実装も必要です。
AI-OCRを活用した成功事例
従来のAI-OCRにBPOサービスを加えて業務を補完した、COMITXの事例を紹介します。
COMITXの保険会社事例を紹介
大手生命保険会社では、AI-OCRとCOMITX BPMSの導入により、年間65,000通の公的照会業務を効率化しました。
導入前は複数システムの連携不足により、データ入力や契約内容の検索に時間を要していましたが、導入後は全体コストの11%削減を実現しています。
また、大手損害保険会社の事例では、年間15万件の契約計上業務のペーパーレス化を実現しました。
AI-OCRによる帳票仕分けとデータ入力の自動化により、オペレーター数を200名から150名に削減し、人件費を30%削減することに成功しています。
さらに情報の一元管理により、3拠点での分散処理が可能になりました。各拠点の進捗状況をリアルタイムで把握できるため、人員配置の最適化や業務効率の向上を実現しました。
また、繁忙期には拠点間で業務を融通し合うことで、待機時間のムダを解消し、人件費の削減にも成功しています。
人材会社の事例を追加
大手総合人材サービス会社では、年間21万件の伝票や申込書のデータエントリー業務にAI-OCRを導入し、業務効率を大幅に改善しました。
導入前は適切なAI-OCRエンジンの選定や運用に課題を抱えていましたが、専門家による分析で最適な組み合わせを実現しました。
帳票の種類(定型・非定型)や記載方法(手書き・印字)に応じて、複数のAI-OCRエンジンを使い分けています。
手書きの申込書には高精度重視のエンジンを割り当て、印字された伝票には処理速度重視のエンジンを自動で割り当てた結果、業務内容に応じて20%から最大50%のコスト削減を達成しました。
さらに、本番稼働後も識別精度の分析や仕様調整を継続的に行うことで、データ入力の品質と生産性を着実に向上させています。同時にチェックロジックやマスタ補正機能の導入により、入力ミスも大幅に減少しました。
AI-OCRの費用感
AI-OCRサービスの費用は、初期費用0円~200万円、月額料金は数千円~数万円と幅広い設定です。たとえば「DX Suite」や「SmartRead」は初期費用無料で月額3万円から利用でき、コストパフォーマンスの高い選択肢といえます。
一方、より高度なOCR機能を提供する「AnyFormOCR」は、初期費用が高額になる場合があります。
各サービスは手書き文字や印字の認識精度、クラウド型やオンプレミス対応など特化した強みを持っており、自社のニーズに応じた選定が重要です。
下記は主要AI-OCRサービスの費用一覧です。
サービス名 | 初期費用 | 月額料金 | 強み |
DX Suite | 0円~ | 30,000円~ | 高速処理の分散コンピューティング機能、AI OCR市場NO.1のシェア |
SmartRead | 0円~ | 月額30,000円相当
36万円/年~ |
高い文字認識制度
処理可能枚数1.2万枚前後 |
AIRead
(クラウド版) |
22万円~ | 13,200円~ | 高い文字認識精度
読取枚数 100枚/月~ |
CaptureBrain | 20万円 | 30,000円~ | 導入後の業務支援可能
処理可能枚数目安300枚/月 |
スマートOCR | 10万円~ | 30,000円~ | 読取枚数 300枚/月~ |
Eas | 要問合せ | 5万円 | 月間の利用件数(目安)
1,000件以下 |
DEEP READ
(クラウド版) |
0円 | 50,000円~ | クラウド型・オンプレミス型どちらにも対応 |
RICOH受領納品書サービス | 0円 | 15,000円~ | 処理可能枚数目安100枚/月 |
AIスキャンロボ | 要問合せ | 30,000円~ | テンプレート作成代行 |
書類チェッカー | 要問合せ | 要問合せ | 印字に特化 |
AnyFormOCR | 要問合せ | 1,200,000円/年~ | 専門知識がなくても帳票設計 |
LINE WORKS OCR | 0円 | 55,000円~ | 最短2営業日で導入が可能 |
AI-OCRの選び方と導入時の注意点
文字や画像の認識率・エラーの頻度・継続的の改善見込み
AI-OCRにおいて重要なのは、継続的な精度向上の仕組みです。AI-OCRの文字認識精度は、製品ごとに大きく異なります。最新の製品でも、手書き文字の認識率は96%~97%程度が限界とされ、100%の読み取り精度は理論上不可能です。
導入の際には定型・非定型帳票それぞれに最適なAIエンジンを選択し、認識モデルを随時アップデートしているサービスを検討しましょう。
また、エラー修正の効率も重要な選定ポイントです。誤認識があった場合、修正データを学習データとして活用し、同じ誤りを繰り返さない仕組みを持つ製品を選ぶべきです。
読み込む前の自動処理ができるか
従来のOCRでは、帳票ごとにテンプレートを作成し、読み取り位置を手動で指定する必要がありました。取引先からの請求書や納品書など、様々な形式の帳票に対して、一つ一つテンプレートを作る作業は大きな負担でした。
最新のAI-OCRでは、この前処理を自動化できます。帳票の種類を自動で判別し、適切なテンプレートを選択します。
さらに、非定型帳票でも読み取りたい項目を指定するだけで、位置を自動で特定できます。
これにより、多種多様な帳票を効率的に処理できます。実際の導入事例では、前処理の工数が従来の3分の1に削減された例もあります。
定めたフォーマットに認識結果を出力・確認の工数
AI-OCRは高度な文字認識技術を持っていますが、100%の認識精度を実現することは困難です。そのため、認識結果の確認作業を効率的に設計することが重要になります。AI-OCRの読み取り結果の確認に1日5~10時間かかることもあり、全件を人手で確認すると本来の導入効果が失われてしまいます。
AI-OCRの認識結果や御認識の課題に対して、最新のAI-OCRシステムでは「確信度スコア」という機能を実装しています。これは認識結果の信頼性を数値化したもので、確信度90%以上を「高」、70-89%を「中」、69%以下を「低」のように分類します。確信度「高」の場合は自動登録を適用し「低」の場合のみ人による確認を行うことで、確認作業の工数を大幅に削減できます。
さらに、AI-OCRでは桁数チェックや形式チェックなどのルールを組み合わせることで、認識精度を向上させることができます。実際の導入事例では、請求書の金額欄で確信度「高」の場合、過去の取引データと突合して異常値をチェックし、誤登録のリスクを最小限に抑えています。
COMITXのAI-OCRについて
COMITXのAI-OCRは、長年受託してきたバックオフィス業務によって得た深い業務理解から生まれた、業務特化型のAI-OCRです。深層学習に基づく文書形状復元技術により、高精度な認識を実現しています。業界専門ツールを上回る精度で文書認識を行うことができ、様々な業務での活用が期待されています。特に複雑な文書構造や歪みのある文書に対しても、安定した認識精度を維持することが強みの一つです。
COMITXのAI-OCRの特徴
COMITXのAI-OCRは、レイアウト構造認識を論理的な位置回帰問題としてモデル化し、高精度な解析を実現しています。入力画像からセルの中心点を検出し、視覚的特徴を抽出する仕組みを採用。さらに、キーポイントセグメンテーションネットワークを用いてテーブル構造を詳細に解析し、セルの四隅の座標をもとに認識を行うため、文書の傾斜や歪みにも対応可能です。また、基本回帰器とスタッキング回帰器を組み合わせた二段階アプローチで高い認識精度を確保しています。
COMITXのAI-OCRの技術的優位性
複雑なテーブル構造や歪みのあるレイアウトにも対応し、一貫した高精度を維持します。少量のトレーニングデータでも効率的な学習が可能で、推論も高速です。
また、NLPライブラリを活用して文脈に基づくテキストの誤認識修正を行い、特定のフォントや文書形式に合わせたカスタムトレーニングも可能です。総合的な損失関数により誤認識を減らし、安定した結果を提供します。
COMITXのAI-OCRの実用事例
医療分野では、カルテや診断書によく見られる専門用語や略語の誤認識を、文脈に基づいて適切に修正します。「RX」などの医療用語を正確に認識することで、医療記録の電子化を効率的に進めることができます。
また、請求書処理においても、数値や項目名の誤認識を文脈解析により修正します。たとえば「合針」を「合計」に自動修正するなど、データの一貫性を保ちながら処理することが可能です。
まとめ
AI-OCRの導入では、文字認識技術だけでなく、業務プロセスの最適化、データの一元管理、進捗の可視化など、総合的なアプローチが重要です。
COMITXのAI-OCRでは、多様な非定型帳票を正確に読み取り、内容や条件を瞬時に理解・判断する機能を備えています。整理されたデータを定められたフォーマットに転記することで、大幅な工数削減が可能で、従量課金制の導入や無償POCの提供など、企業のニーズに合わせた柔軟な対応をいたします。
また、COMITXは、国内大手損害保険会社に提供を開始している火災保険の家屋損害に加えて、自動車保険や少額短期保険、さらには生命保険の分野にも展開していきます。非定型帳票の多いこれらの分野においても、AIの力で保険金算定や請求業務の効率化を実現し、迅速な支払いを実現することで、お客様企業の業務負担を軽減します。
また、各保険分野に特化した機能を提供することで、より細かな業務プロセスに対応し、保険業界全体における業務効率化を推進します。
将来的には、商社における契約書や輸出入関連書類の自動化や、クレジットカード会社での審査業務の迅速化・不正利用の早期発見、リース会社での契約書の自動判別・スケジュール管理、さらには建設業界での工事進捗管理や見積書処理の最適化など、幅広い業種や業務に応用シーンを拡大してまいります。
業務に特化したAI-OCRの導入をお考えの企業様は、ぜひCOMITXのサービスをご検討ください。