■サイト内検索:
 

RPA Biz > OCR > OCRの実践 ~ AIはどこに使われるのか

OCRの実践 ~ AIはどこに使われるのか

2018.10.23

目次

  1. はじめに  ~ OCRとは
  2. OCRの利用用途とAIの適用領域
  3. まとめ

 

 

 

 

 

 

  1. はじめに   ~ OCRとは

本コラムでは、RPAの導入シーンにおいても話題が事欠かないOCRについての話をしたいと思います。

 

OCRとは、Optical Character Recognition/Readerの略で、

日本語で言うと「光学的文字認識」という意味になります。

 

これは、端的に言うと「画像から文字/数字を認識する技術」になります。

 

 

この「画像」ですが、通常のシーンでは紙上で印字・手書きされたものを

スキャンしたデータファイルを指すことになります。

 

よく「PDFOCRできるか」という問い合わせを受ける場合がありますが、

PDFの場合、全くの画像となっている場合もありますが、

テキスト情報を選択してコピー&ペーストできる状態のものも多いと思います。

 

 

参考:PDF上で文字/数字情報を選択できる例

 

 

上記の例のように、PDF上で文字や数字をしっかりと選択できる場合、

無理に「画像として認識」するのではなく、

そのPDFをエクセル化したりCSV変換することでOCRの技術を使わずともテキスト情報を抽出できます。

 

 

OCRの技術はどんなに進歩しても画像を認識する技術である以上、

精度は100%とならず、必ず人間のチェックが必要になります

 

 

従って、OCRを使わずとも文字抽出ができるのであればそちらに越したことはありません。

 

従って、まず業務効率化の取り組みをする会社様においては、

 

「紙のスキャン」ではなく「元々電子化された書類(PDF等)の使用を徹底する」こと

 

を第一優先として取り組むべきです。

 

 

 

この方面の取り組みは「ペーパーレス化」の活動と同一のものであり、

例えば経理業務系で言うと、近年では請求書発行業務を電子化する取り組みが挙げられます。

 

 

ただ、一方、自分たちが如何にペーパーレス化を声高に叫んでも、

ビジネスをする以上、

周りのサプライヤーやパートナー企業の協力がなければ完全に電子化することはできません

 

先述の請求書を例にとっても、自分たちが「発行する」請求書は電子化できたとしても、

「サプライヤーから自分たちに来る」請求書までは電子化できません。

 

 

特に取引先が多種多様にある業態の場合、

全てのサプライヤーに請求書の電子化をお願いするのは非現実的となってきます。

 

その場合、紙による請求書を処理する業務は、どうしても付いて回さざるをえません。

 

そのように現時点ではどうしようもなく紙でせざるを得ない業務のときに、

このコラムのテーマであるOCR技術の出番となる訳です。

 

 

 

 

 

  1. OCRの利用用途とAIの適用領域

一口にOCRといっても読み取りの対象となる紙帳票の種類は一つではありません。

 

そのOCRの利用用途を大別すると「手書き帳票」か「活字帳票」かに大きく大別されます。

 

何故このような分け方を敢えてするのかというと、

それによって得意となるOCRツールが変わってくるからです。

 

 

昨今の技術トレンドではこのOCRAI技術を付加し、

より高精度もしくは(人間の)負荷低減を狙ったソリューションが数多く出てきております。

 

ただ、一概に「AI」と言っても、

その技術が使われる用途は「手書き帳票」と「活字帳票」で分かれます。

 

 

このあたりの状況を簡単に下記にまとめました。

 

 

参考:OCRの利用用途とAIの適用領域

 

 

 

2-1. 手書き帳票

まず、これは圧倒的にB2Cビジネスを行っている企業、

つまり不特定多数の消費者様を相手とする銀行や保険などの金融機関、

スマホ等の通信事業、不動産、そして自治体等が対象となります。

 

 

特に各種手続きに押印が必要である金融業では、店頭での申し込みが主流となり、

結果、申し込みをする消費者様は自身の個人情報を手書きで申請書に書くことになります。

 

もともとRPA + OCRのトレンドはこの金融業における契約受付業務から

火がついて盛り上がったという経緯もあり、OCRをする上での一大分野となっています。

 

 

また、事例としては「お客様からの申請書」よりも少ないですが、

「社員からの申請書」も対象となるケースがあります。

 

通常、この社内の書類関係は真っ先にペーパーレス化を図る対象であり、

紙による申請というものは随分と減りました。

 

ただ、やはり一部残っているものがあり、その場合「手書き」であるケースが多いようです。

 

例えば、雇用保険などの入社・退社のタイミングで行われる労務系の帳票であったり、

定期的に必要な年末調整系の書類、そして入社前に提出される履歴書類

 

これらは全て手書きという訳ではありませんが、

筆者の経験上、大手企業であってもまだ手書き文化が残りがちな分野です。

 

 

第一、通勤や住居などの手当や勤怠情報の報告・申請、そして経費類の申請は既に電子化されているケースが多く、

このあたりはOCRを使わずとも電子データを取り出せます。

 

 

このような「手書き帳票」においてAIの技術進展は目覚ましく、

多くの新聞・雑誌で耳目を集めるのもこの手書き分野でのAI適用です。

 

今までのAI前のOCRの場合、

この個人によって筆跡が異なる文字を認識する術が無くお手上げ状態だったものが、劇的に変わりました。

 

 

特に日本語は、漢字もあればひらがな、カタカナもあり、住所等ではアルファベットも使われます。

 

英語圏の帳票よりも圧倒的に文字の種類が多く、その分誤読の可能性が高く難易度は更に跳ね上がります。

 

さらに漢字等は人によって省略した書き方をする場合もあり、

楷書体の知識だけでは読み取りができません。

 

このような、高難易度の「日本語」を読み取るのにAIが使われるのです。

 

 

 

具体的には何千~何万という手書きのサンプルデータをAIに読み込ませ、

そこで文字認識の学習を行わせることで、読み取り精度の向上を図ります。

 

 

企業で言うと、コージェントラボやAI Inside、シナモンといった会社が先駆的な開発を進めており、

大手金融機関との提携でニュースとなっています。

 

 

 

このような「手書き帳票」にAIを使う場合、消費者からの申し込み等、

同じ帳票フォーマットでかつ大量処理枚数」であるものが望ましいとされます。

 

これは、この手のAIソリューションが「手書き文字の認識」に特化しており、

後述する「活字帳票」型AIとは違って、複数の帳票種からフィットするものを選んだり、

キーワードから該当する項目を自動抽出する機能は不得手だからです。

 

 

決められた場所にある文字を高精度に読み取る」、これが手書き帳票型のAI技術の特徴と言えます。

 

 

2-2. 活字帳票

次に「活字帳票」についてですが、

こちらの利用シーンは、対取引先・パートナー企業で発生します。

 

具体的に言うとやはり多いのは、見積書・請求書などの経理関係の帳票です。

 

また、社員個人の経費申請などではタクシー等の領収書も含まれるかもしれません。

 

 

いずれにせよ、これらの特徴として「活字ではあるが、フォーマットがバラバラ

であるのが特徴と言えます。

 

 

この活字分野においては、OCR技術はAI台頭前から随分と取り組みはなされていました。

 

ただ、これは実際に取り組まれたことのある企業様は頷かれると思いますが、

実務での適用という観点からすると

一部の利用に留まるか、もしくは企業によっては全く使われず放置されていたりします。

 

これは過去のOCR製品の識字率が低いことも一因ですが、

AI導入前のOCRでは、帳票ごとに読み取り場所を設定する事前準備の手間と、

この帳票はどの設定フォーマットに該当するかの判断を人間がしなければいけないことも起因しています。

 

 

通常のOCRでは、例えば請求書であればA社からの請求書、B社からの請求書、、、というように

帳票の種類ごとにOCRがどこを読み取るのか「座標」と呼ばれる場所特定をしなければなりません。

 

 

これがかなり面倒で手間のかかる作業であり、精度を上げるためにはその場所ごとに数字が入るのか、

カナカナも入るのか、などと細かな設定をしていく必要があります。

 

 

また、スキャンした画像帳票に対して、

それがどの設定フォーマットに対応するかの判断は人間が行っており、

それこそ帳票種類が膨大になるとその「割付け」の手間だけで人間の時間を奪います。

 

これらの課題の解決に加え、

手書き同様にテキスト認識の学習機能を付加したのが「活字帳票」型AIの特徴と言えます。

 

 

 

 (a)帳票種の特定

これは、この帳票はどの設定フォーマットに該当するかをAIのほうで自動識別する機能です。

 

この機能があることで、

人間のほうでスキャンした画像ごとにOCRフォーマットを割り付ける作業が無くなります。

 

 

(b)キーワードからの座標特定

これは、さらにそもそも帳票ごとに読み取り場所を設定する手間を省くための機能です。

 

帳票によっては、例えば金額情報がいつも特定の座標にあるわけではありません。

 

細目や内訳の情報で該当単価だけを抜き出す場合、

その場所は同じサプライヤーからであっても変わってきます。

 

このような時に例えば「●●単価」というキーワードを設定することで、

AIのほうでその記述がある場所の横を選んで単価情報を拾ってくることができます。

 

これは設定の手間を省くという使い方もありますが、

何よりもこれができる事によって必要情報が必ずしも定位置にない帳票についても情報取得が可能になります。

 

 

(c)テキスト認識(誤読学習)

活字情報であっても、先述した通り日本語は非常に文字種類が多く、OCR泣かせの言語であります。

誤読があった場合、人間の方で訂正をすることになるのですが、

AIの技術を使うことでOCRに学習させていき、精度をあげていくことが望めます

 

特に住所や名前といった情報は、実は人間が読む場合も頭の中で

ある程度人名・地名として有りそうな文字を想定しながら読み解いていると思います。

 

誤読→訂正を繰り返すことで、

人間が行っているような「想定」をOCRツールもできるようになります。

 

 

 

 

  1. まとめ

以上でOCRを使用する上での実務上のポイントと、

AIが使われる領域について大まかな概略を述べさせていただきました。

 

この技術自体は、まさに日進月歩の世界であり、

去年までは精度がイマイチだったツールが翌年は飛躍的に精度向上するケースもしばしば存在します。

 

我々のような業務改善コンサルティングやRPA導入支援を行っている会社としては、

まさにこのような技術の進展を日々ウォッチして、

クライアントの現状に合ったツールを選び、提案していくことが求められます。

 

 

 

 

 

topへ
© RPA.biz