■サイト内検索:
 

RPA Biz > OCR > AI-OCRの概要とベンダーの動向まとめ

AI-OCRの概要とベンダーの動向まとめ

2018.06.18

先日、東京ビッグサイトで行われた「AI・業務自動化 展【春】」に行ってきました。

 

「AI・業務自動化 展【春】」は、AI(人工知能)技術・製品や、業務自動化ソリューションが一堂に出展する専門展で、最新技術の動向を注目する人で賑わっていました。

 

そんな数ある自動化ソリューションの中で、私が特に注目したのがAI-OCR

今回のコラムでは、OCRの導入を検討されている方のために、AI-OCRの概要からOCRベンダー動向について紹介いたします。

 

OCRとは

OCR(Optical Character Recognition/Reader)とは、手書きや印字された文字(活字)を、コンピュータが利用できるデジタルの文字コードに変換する技術です。

 

簡単に言うと、紙やPDF等の文字情報を電子化する技術です。

 

OCRが文字の読み取り~データベースへの書き込みまで行うため、OCRを導入することによって今まで手間だった入力作業の手間が削減できる、といったメリットがあります。

 

 

また、業務効率化の観点から現在注目されているRPA(Robotic Process Automationとの親和性が高く、働き方改革の一環としての役割を担うことを大いに期待されています。

 

 

AI技術を取り入れたOCRAI-OCR」が話題に

また、最近のOCRAI技術を取り入れたOCR、いわゆる「AI-OCR」が話題になっています。

ここでは、従来のOCRAI-OCRについてそれぞれ異なる点を紹介します。

 

 

  • 設定の容易さ

OCRを導入した際、従来のOCRでは「請求金額」や「住所」等のような帳票上の項目ごとに手動で認識させたい文字の位置(座標)を設定する必要があります。

 

一方、AI-OCRの場合、そのような面倒な設定は必要なく、認識させたい項目に関するキーワードを登録することで簡単に使用を開始することができるため、

比較的導入のハードルが低いと言えます(ベンダーによっては初期設定としてAIの自動学習を導入前に行うことにより識字率を担保するところもあります)。

 

 

  • 帳票の特定

従来のOCRは非定型のフォーマットには対応していないことが多く、OCRで帳票上の文字を認識させる前にあらかじめどのフォーマットで認識させるか指定する必要があります。

そのため、様々なフォーマットをOCRで認識させたい場合、その都度設定が必要になるため、非常に手間がかかります。

 

一方、AI-OCRAI技術によって自動でフォーマットの特定が可能です。

特に多店舗展開している企業等は請求書ひとつとってもフォーマットがサプライヤーによって異なるため、

自動でフォーマット認識させることはOCRの導入を検討する際の必須条件であると言えるでしょう。

 

 

  • 誤字の学習

残念ながら、OCRは帳票の画質等にかなり影響されやすく、完璧に文字を認識させることは出来ません。

これは従来のOCRでもAI-OCRでも同じです。

そのため、誤って認識した文字については、結果を出力する前に手入力で訂正する必要があります。

 

従来のOCRでは、訂正した文字を手動で辞書登録することにより、次回以降同じ形の文字を認識させる際のインプットになります。

AI-OCRでは、文字の訂正自体は手動で行いますが、その後の学習の部分はAIが自動で行います。

 

 

  • その他

上記の通り、従来のOCRと比較すると、AI-OCRは機能面で優れていることがわかっていただけたかと思いますが、

導入を検討するにあたって価格やトライアルの有無についても考慮する必要があります。

 

AI-OCRはそれなりにコストがかかる一方、フォーマットや文字種(手書き文字や活字等)によっても認識結果が大きく異なる為、

導入の検討材料としてトライアルの申込をお勧めします。

 

トライアルの実施に当たっては、相当数のサンプルが必要なため、一度ベンダーに相談してみると良いでしょう。

 

 

AI-OCRのベンダー動向

最後に、ここでAI-OCRを開発・提供している主要OCRベンダーをご紹介します。

 

 

  • コージェントラボ

コージェントラボは東京の代官山に本社を置く、最先端の人工知能の研究・開発と関連ソリューションサービスを提供するAIベンチャー企業です。

 

AIの知見を持つエンジニアの確保が難しい現在でも、世界中からAIを専門とするメンバーが集結し、

高度な技術力とビジネス力でAIに関する製品を開発しています。

 

そんなコージェントラボが開発したOCRTegaki」は、その名の通り手書き文字の認識に特化しています。

 

手書き文字は、活字文字に比べOCRでの自動認識が特に難しいのですが、データを処理・学習する独自のAI技術によって99.22%という高い精度で帳票上の文字のデータ化ができます。

 

野村総研やトッパン・フォームズ等の大手企業への導入実績があり、メディアにも多く掲載され現在注目を集めています。

 

また、今年の1月にはソフトバンクとRPA分野における業務提携契約を締結し、

国内企業の膨大な書類処理業務の効率化を目指し、新たなソリューションの共同開発を目指しています。

 

Tegakiは平仮名、片仮名、漢字、数字、アルファベット、記号等さまざまな手書き文字を認識することができるほか、

要望に合わせて多言語や業界用語への拡張対応も可能のようです。

 

導入費用は公表されていないのですが、無料でトライアルも行っているため、

導入前にどの程度手書き文字を認識できるか試した後に見積りを依頼してみると良いでしょう。

 

 

  • シナモン

シナモンはシンガポールに本社を置き、

機械学習やディープラーニングを活用した人工知能に関連する製品やコンサルティングを提供しているスタートアップです。

 

東南アジアで AI 技術者を雇用するために、

ベトナムの大学トップ3校からポテンシャルの高い学生を集め、AI 技術者を養成しています。

 

今年の2月には、MTパートナーズ、マネックスグループのマネックスエジソン、ベクトル、RPAホールディングス、

および島田亨氏ら複数の個人投資家を引受先とした第三者割当増資を実施し、

1億5千万円の資金調達を行いました。

 

この資金調達を受けて、シナモンはより高度な技術ときめ細かいサービスを提供するための組織体制強化やAI製品の基盤技術の強化等を実施していくようです。

 

そんなシナモンが開発・提供するOCRFlax Scanner」は、

さまざまなビジネス文書から情報を抜き出してデータベース化するためのOCRツールで、

構造化されていない社内文書やEメール文等も、独自のAI技術で自動でデータ化することができます。

 

PDFWordファイル、印字・手書きの紙文書などさまざまなフォーマットに対応しており、

手書き文字の読み取りに関しては、ニューラルネットワークと呼ばれるAI技術を用い、

マシンにディープラーニングをさせる事によって最終的には99%以上の精度で正確な読み取りを実現しています。

 

Flax Scannerは、現在金融や保険業界を中心に導入されておりますが、導入社数は「数社」程度とのことです。

 

Flax Scannerの導入費用は400万円~で、ランニングコストは月額10万円~とのこと。トライアルは30万円~可能です(要問合せ)。

 

 

  • AI Inside

AI Insideは、東京に本社を置くソフトウェア開発・人工知能事業を行う企業です。

今年4月には、BPR(※1)に関するコンサルティングのノウハウを持つパソナと販売パートナーシップ契約を締結し、

業務改⾰に取り組む企業に更なる付加価値を提供することを目指しています。

 

 

AI Insideが開発・提供するOCRDX Suite」は、独自のAI技術を導入しており、

様々なユーザーが記入する手書き文字を高精度でデジタルデータ化します。

 

帳票内の読み取りたい箇所をドラッグ&ドロップで指定することで、アウトプット形式を設定します。

一度こちらの設定を行う事で、同一帳票に対し、

読み取り位置ズレなどを自動で認識・修正することが可能です。

 

更に、DX Suiteは、認識したデータをそのままアウトプットするだけでなく、ドキュメントの設定に従って、人の目でチェックするための業務フローを設定できるシステムも完備しています。

 

導入費用は150万円から。導入までの期間は最短3日です。

 

(※1) ビジネスプロセス・リエンジニアリング(Business Process Re-engineeringBPR)とは、

企業活動の目標(売上、収益率など)を達成するために、既存の業務内容や業務フロー、組織構造、ビジネスルールを全面的に見直し、

再設計(リエンジニアリング)すること。

 

 

  • インフォディオ

インフォディオは、東京に本社を置く、生命保険に関するソフトウェアやアプリケーション開発等を主に行う企業です。

 

インフォディオが開発・提供する「スマートOCR」は、独自のディープラーニングOCRエンジンにより、

請求書や診断書などの非定型の文書のデータ化を実現します。

 

AIの画像復元学習技術を使用して、帳票上のノイズ除去、網掛け文字処理、反転文字処理、塗りつぶし文字処理、

罫線・点線処理といったOCR変換の前処理を行います。

 

ホームページには導入費用に関する情報がなく、一度見積が必要のようです。

導入前のサンプル検証があり、ここでOCRの精度を試すことができます。

 

 

  • ABBYY

ABBYYは、世界各国に拠点を置く、ドキュメント認識サービスを提供するリーダー企業です。

 

ABBYYは去年8月に、PwCコンサルティング合同会社と業務提携し、

AI-OCR分野でのコンサルティングおよびソリューションを共同で提供を開始。

 

そのほか、今年2月にトッパン・フォームズ株式会社と販売代理店契約を結んだり、

4月には株式会社NSDAI-OCRに関する認定パートナー契約を締結したりと、

積極的な動きを見せています。

 

そんなABBYYが提供するOCRFlexiCapture」は、

請求書、注文書、会計伝票、船荷証券等の、複雑なレイアウトの紙書類やPDFファイルであっても、

柔軟にテキスト変換する最先端テクノロジーを有します。

 

FlexiCaptureに内蔵しているエンジンは、文書を分離し文書の種類を自動で特定します。

また、ページが混ざった状態から1ページおよび複数ページの文書を組み立てることができるため、

複雑さにかかわらずレイアウトが変化する文書を自動分類できます。

 

また、導入費用に関しては、初期費用が160万円(年間6万ページ以下の場合)+年間保守費用:32万円(初期費用の20%)です。無料でトライアル版の使用ができます(要問合せ)。

 

 

  • アライズイノベーション

アライズイノベーションは、20167月に設立された、東京に本社を置く企業で、

人材不足やノウハウ継承の課題を解決させるための『企業向けAIサービス(Enterprise AI)』、

システム開発において高い生産性を実現するための『超高速開発』、

そしてそれらのサービスの基盤となる『クラウド』の三つを専業としています(企業Webサイトより)。

 

 

アライズイノベーションが有するOCRAIRead」は、FAXや書類等の文字をAIで文字認識するOCRソリューションで、

ビジネスや業務で発生する注文書や請求書等の文字(活字・手書き文字)の自動認識において、

AIによるディープラーニングの技術を取り入れており、

誤認識した文字を学習して認識精度を飛躍的に向上させることができます。

 

 

さらに、人が書く文字の癖や書類のレイアウトも併せて学習することが可能なため、

様々な利用シーンで企業が求める業務効率化や労働生産性の向上を実現します。

 

利用パターンは買取型と利用型の2種類あり、導入費用はそれぞれ異なります。

トライアルはありませんが、有料PoCで認識率を試すことが可能です(20万円+5万円/帳票種類)。

 

 

まとめ

いかがでしたでしょうか。

今回はOCRの概要から、AI-OCRの特徴、主要ベンダーの動向をご紹介させていただきました。

 

ここ最近AI-OCRが注目されていますが、文字認識の観点で言うと、

OCRはまだまだ発展途上と言えます。

 

引き続きOCRの技術動向に目を向け、最新情報をお届けしたいと思います。

 

OCRも含めたRPAソリューションについては、ぜひ弊社にお問い合わせください

 

 

topへ
© RPA.biz