■サイト内検索:
RPA.biz
RPA Biz > 画像認識

OCRの実践 ~ AIはどこに使われるのか

2018.10.23

目次

  1. はじめに  ~ OCRとは
  2. OCRの利用用途とAIの適用領域
  3. まとめ

 

 

 

 

 

 

  1. はじめに   ~ OCRとは

本コラムでは、RPAの導入シーンにおいても話題が事欠かないOCRについての話をしたいと思います。

 

OCRとは、Optical Character Recognition/Readerの略で、

日本語で言うと「光学的文字認識」という意味になります。

 

これは、端的に言うと「画像から文字/数字を認識する技術」になります。

 

 

この「画像」ですが、通常のシーンでは紙上で印字・手書きされたものを

スキャンしたデータファイルを指すことになります。

 

よく「PDFOCRできるか」という問い合わせを受ける場合がありますが、

PDFの場合、全くの画像となっている場合もありますが、

テキスト情報を選択してコピー&ペーストできる状態のものも多いと思います。

 

 

参考:PDF上で文字/数字情報を選択できる例

 

 

上記の例のように、PDF上で文字や数字をしっかりと選択できる場合、

無理に「画像として認識」するのではなく、

そのPDFをエクセル化したりCSV変換することでOCRの技術を使わずともテキスト情報を抽出できます。

 

 

OCRの技術はどんなに進歩しても画像を認識する技術である以上、

精度は100%とならず、必ず人間のチェックが必要になります

 

 

従って、OCRを使わずとも文字抽出ができるのであればそちらに越したことはありません。

 

従って、まず業務効率化の取り組みをする会社様においては、

 

「紙のスキャン」ではなく「元々電子化された書類(PDF等)の使用を徹底する」こと

 

を第一優先として取り組むべきです。

 

 

 

この方面の取り組みは「ペーパーレス化」の活動と同一のものであり、

例えば経理業務系で言うと、近年では請求書発行業務を電子化する取り組みが挙げられます。

 

 

ただ、一方、自分たちが如何にペーパーレス化を声高に叫んでも、

ビジネスをする以上、

周りのサプライヤーやパートナー企業の協力がなければ完全に電子化することはできません

 

先述の請求書を例にとっても、自分たちが「発行する」請求書は電子化できたとしても、

「サプライヤーから自分たちに来る」請求書までは電子化できません。

 

 

特に取引先が多種多様にある業態の場合、

全てのサプライヤーに請求書の電子化をお願いするのは非現実的となってきます。

 

その場合、紙による請求書を処理する業務は、どうしても付いて回さざるをえません。

 

そのように現時点ではどうしようもなく紙でせざるを得ない業務のときに、

このコラムのテーマであるOCR技術の出番となる訳です。

 

 

 

 

 

  1. OCRの利用用途とAIの適用領域

一口にOCRといっても読み取りの対象となる紙帳票の種類は一つではありません。

 

そのOCRの利用用途を大別すると「手書き帳票」か「活字帳票」かに大きく大別されます。

 

何故このような分け方を敢えてするのかというと、

それによって得意となるOCRツールが変わってくるからです。

 

 

昨今の技術トレンドではこのOCRAI技術を付加し、

より高精度もしくは(人間の)負荷低減を狙ったソリューションが数多く出てきております。

 

ただ、一概に「AI」と言っても、

その技術が使われる用途は「手書き帳票」と「活字帳票」で分かれます。

 

 

このあたりの状況を簡単に下記にまとめました。

 

 

参考:OCRの利用用途とAIの適用領域

 

 

 

2-1. 手書き帳票

まず、これは圧倒的にB2Cビジネスを行っている企業、

つまり不特定多数の消費者様を相手とする銀行や保険などの金融機関、

スマホ等の通信事業、不動産、そして自治体等が対象となります。

 

 

特に各種手続きに押印が必要である金融業では、店頭での申し込みが主流となり、

結果、申し込みをする消費者様は自身の個人情報を手書きで申請書に書くことになります。

 

もともとRPA + OCRのトレンドはこの金融業における契約受付業務から

火がついて盛り上がったという経緯もあり、OCRをする上での一大分野となっています。

 

 

また、事例としては「お客様からの申請書」よりも少ないですが、

「社員からの申請書」も対象となるケースがあります。

 

通常、この社内の書類関係は真っ先にペーパーレス化を図る対象であり、

紙による申請というものは随分と減りました。

 

ただ、やはり一部残っているものがあり、その場合「手書き」であるケースが多いようです。

 

例えば、雇用保険などの入社・退社のタイミングで行われる労務系の帳票であったり、

定期的に必要な年末調整系の書類、そして入社前に提出される履歴書類

 

これらは全て手書きという訳ではありませんが、

筆者の経験上、大手企業であってもまだ手書き文化が残りがちな分野です。

 

 

第一、通勤や住居などの手当や勤怠情報の報告・申請、そして経費類の申請は既に電子化されているケースが多く、

このあたりはOCRを使わずとも電子データを取り出せます。

 

 

このような「手書き帳票」においてAIの技術進展は目覚ましく、

多くの新聞・雑誌で耳目を集めるのもこの手書き分野でのAI適用です。

 

今までのAI前のOCRの場合、

この個人によって筆跡が異なる文字を認識する術が無くお手上げ状態だったものが、劇的に変わりました。

 

 

特に日本語は、漢字もあればひらがな、カタカナもあり、住所等ではアルファベットも使われます。

 

英語圏の帳票よりも圧倒的に文字の種類が多く、その分誤読の可能性が高く難易度は更に跳ね上がります。

 

さらに漢字等は人によって省略した書き方をする場合もあり、

楷書体の知識だけでは読み取りができません。

 

このような、高難易度の「日本語」を読み取るのにAIが使われるのです。

 

 

 

具体的には何千~何万という手書きのサンプルデータをAIに読み込ませ、

そこで文字認識の学習を行わせることで、読み取り精度の向上を図ります。

 

 

企業で言うと、コージェントラボやAI Inside、シナモンといった会社が先駆的な開発を進めており、

大手金融機関との提携でニュースとなっています。

 

 

 

このような「手書き帳票」にAIを使う場合、消費者からの申し込み等、

同じ帳票フォーマットでかつ大量処理枚数」であるものが望ましいとされます。

 

これは、この手のAIソリューションが「手書き文字の認識」に特化しており、

後述する「活字帳票」型AIとは違って、複数の帳票種からフィットするものを選んだり、

キーワードから該当する項目を自動抽出する機能は不得手だからです。

 

 

決められた場所にある文字を高精度に読み取る」、これが手書き帳票型のAI技術の特徴と言えます。

 

 

2-2. 活字帳票

次に「活字帳票」についてですが、

こちらの利用シーンは、対取引先・パートナー企業で発生します。

 

具体的に言うとやはり多いのは、見積書・請求書などの経理関係の帳票です。

 

また、社員個人の経費申請などではタクシー等の領収書も含まれるかもしれません。

 

 

いずれにせよ、これらの特徴として「活字ではあるが、フォーマットがバラバラ

であるのが特徴と言えます。

 

 

この活字分野においては、OCR技術はAI台頭前から随分と取り組みはなされていました。

 

ただ、これは実際に取り組まれたことのある企業様は頷かれると思いますが、

実務での適用という観点からすると

一部の利用に留まるか、もしくは企業によっては全く使われず放置されていたりします。

 

これは過去のOCR製品の識字率が低いことも一因ですが、

AI導入前のOCRでは、帳票ごとに読み取り場所を設定する事前準備の手間と、

この帳票はどの設定フォーマットに該当するかの判断を人間がしなければいけないことも起因しています。

 

 

通常のOCRでは、例えば請求書であればA社からの請求書、B社からの請求書、、、というように

帳票の種類ごとにOCRがどこを読み取るのか「座標」と呼ばれる場所特定をしなければなりません。

 

 

これがかなり面倒で手間のかかる作業であり、精度を上げるためにはその場所ごとに数字が入るのか、

カナカナも入るのか、などと細かな設定をしていく必要があります。

 

 

また、スキャンした画像帳票に対して、

それがどの設定フォーマットに対応するかの判断は人間が行っており、

それこそ帳票種類が膨大になるとその「割付け」の手間だけで人間の時間を奪います。

 

これらの課題の解決に加え、

手書き同様にテキスト認識の学習機能を付加したのが「活字帳票」型AIの特徴と言えます。

 

 

 

 (a)帳票種の特定

これは、この帳票はどの設定フォーマットに該当するかをAIのほうで自動識別する機能です。

 

この機能があることで、

人間のほうでスキャンした画像ごとにOCRフォーマットを割り付ける作業が無くなります。

 

 

(b)キーワードからの座標特定

これは、さらにそもそも帳票ごとに読み取り場所を設定する手間を省くための機能です。

 

帳票によっては、例えば金額情報がいつも特定の座標にあるわけではありません。

 

細目や内訳の情報で該当単価だけを抜き出す場合、

その場所は同じサプライヤーからであっても変わってきます。

 

このような時に例えば「●●単価」というキーワードを設定することで、

AIのほうでその記述がある場所の横を選んで単価情報を拾ってくることができます。

 

これは設定の手間を省くという使い方もありますが、

何よりもこれができる事によって必要情報が必ずしも定位置にない帳票についても情報取得が可能になります。

 

 

(c)テキスト認識(誤読学習)

活字情報であっても、先述した通り日本語は非常に文字種類が多く、OCR泣かせの言語であります。

誤読があった場合、人間の方で訂正をすることになるのですが、

AIの技術を使うことでOCRに学習させていき、精度をあげていくことが望めます

 

特に住所や名前といった情報は、実は人間が読む場合も頭の中で

ある程度人名・地名として有りそうな文字を想定しながら読み解いていると思います。

 

誤読→訂正を繰り返すことで、

人間が行っているような「想定」をOCRツールもできるようになります。

 

 

 

 

  1. まとめ

以上でOCRを使用する上での実務上のポイントと、

AIが使われる領域について大まかな概略を述べさせていただきました。

 

この技術自体は、まさに日進月歩の世界であり、

去年までは精度がイマイチだったツールが翌年は飛躍的に精度向上するケースもしばしば存在します。

 

我々のような業務改善コンサルティングやRPA導入支援を行っている会社としては、

まさにこのような技術の進展を日々ウォッチして、

クライアントの現状に合ったツールを選び、提案していくことが求められます。

 

 

 

 

 

オフィスワークにおけるAI導入: メール/文書分析

2018.09.26

 

今回のブログでは、オフィスで行われる事務作業について

既にAIの技術が開発され導入していっている事例をご紹介したいと思います。

 

 

 

昨今の電子化の流れを受け、ビジネス上の様々な情報が電子データとして扱えるようになってきました。

 

これは即ち、AIにとって「教師データ」となるソースが質量ともに高まったことを意味し、

ビジネスシーンにおけるAIの活躍の場を押し広げる事に繋がりました。

 

 

教師データ」というのは、AIが学習する上で必要不可欠な参考データのことですが、

これは端的に言えば、今まで人間様が行っていた判断・意思決定の記録を意味します。

 

 

 

例えば、今まで社員が夜を徹して行っていた文書やメール文などの

チェック業務のレコードを「教師データ」としてAIに学習させれば、

 

次からはAIが自動で今までの判断基準を参考に人間の代わりにチェックを行ってくれるようになります。

 

 

 

今回のブログでは、AIを使ったユニークなビジネスソリューションを展開している、

FRONTEO社の取り組みをご紹介したいと思います。

 

 

FRONTEO社は2003年に設立、現在マザーズに上場しています。

 

KIBITとという独自の人工知能モデルを活用し、

法律事務所や医療機関、官公庁や民間企業へのサービス展開を行っている企業になります。

 

 

特に実績として名高いのは、

法律関係での「ディスカバリ」とよばれる

訴訟案件における証拠の収集や特定、提出にいたるプロセスと、

 

フォレンジック」という

情報漏えい、談合・カルテル、横領、労務問題、ハラスメント問題、セキュリティ事案

をはじめとするさまざまな不正調査プロセスへのAI適用です。

 

 

これらいずれの業務も、本来人間(調査員)が行う場合は、

膨大な量の文書や電子メールでのやりとりのチェックが発生します。

 

 

この膨大な調査業務をAIで効率化するというのが、サービスのコンセプトになります。

 

 

参考: FRONTEO ホームページ(http://www.fronteo.com/

 

 

 

 

少ない教師データでも学習効果を高められる独自人工知能技術「KIBIT」

 

 

FRONTEO社では、Landscapingと行動情報科学を併せた同時の人工知能術を開発しており、

 

特徴としては少量の教師データで、パターン解析・学習をすることができることを謳っています。

 

 

この「教師データ」というものは、AIを実務で活用しようとするときに必ず直面する厄介な問題です。

 

AIの精度をそれなりのものにするためには、まず実際に人間が行った

評価・判断・意思決定に付随するデータをAIに「喰わせる」必要がありますが、

 

実際にそのファクトとなるデータがなかなか集まらず

結果、AIの学習が滞り、「頭の悪いAIしか育たないケースが散見されます。

 

 

 

これは、AIの一大分野である「画像認識」の技術でも言えることです。

 

 

よくIoTとの絡みで、工場内の検品業務にAIを導入するような取り組みが

新聞雑誌で取りざたされることがありますが、

 

この場合も事前に人間が判別した「不良品」の画像データを相当数AIに喰わせる必要がありますが、

そもそもそれほど不良品率が低い工場だと、教師データ自体が集まりません。

 

これを改善する方法として「不良品」ではなく「良品」のほうを教師データとしてAIに入れ、

その基準から外れたとAIが判断したものを「不良品」と一次判定するような取り組みが挙げられていたりします。

 

 

いずれにせよ、この工場の検品という領域ではまだ大ロット少品種の大量生産品が対象であり、

ジュエリーなどの小ロット多品種のケースではまだまだAIの導入の壁は高い印象です。

 

 

この「教師データ」の問題を、FRONTEOが得意とするフォレンジックの領域に当てはめると、

 

例えばそれは社内の社員の不正の証拠となる電子メールの数々が「教師データ」となります。

 

 

FRONTEOでは、おそらく膨大な数のクライアントにおける不正事例をもっており、

それをAIにインプットし学習させているのだと推測されます。

 

この社員のメール文面から不正示唆を判別する能力ですが、しっかりと学習されたAIであれば、

普通の一般的では見過ごしているような点まで気づいてくれるようになります。

 

例えば、一見、サプライヤーの担当者と親睦を深めるために飲みに誘うだけにしか見えない

メールであっても、わずかなニュアンスの違いを検知し、

談合の可能性を示唆してくれるようになります。

 

 

 

 

 

様々なビジネスシーンへの適用可能性

 

 

このような文書やメール文を解析し示唆をだすAI技術ですが、

この効能の潜在的価値はビジネス上で計り知れません。

 

 

そう、それは何も法律関係に事象にとどまらず、かなり広範囲に適用できる武器となりえます。

 

例えば、以下のようなシーンでの活用が見込めます。

 

 

  • 人事部: 退職リスクの事前検知
    • 全社員のメールをAIに定期的に読み込ませることで、退職する可能性のある社員(モチベーションが下がってそうな社員)をいち早く発見
    • 人事部は、いちはやくそのような社員にフォローを手掛けることで、離職率の減少に貢献できる
  • 人事部: パワハラ・セクハラの防止
    • 上司のメールや、社員の愚痴メールなどをAIが検知
    • パワハラ・セクハラの兆候をいち早く検知し、人事部側で防止策をとれる
  • 営業部: 失注リスクの事前検知
    • 既存顧客との担当営業のメールや日報等をモニタリングし、失注リスクをいち早く検知
    • 営業マネージャーは、失注リスクのある顧客に対していち早くフォローを講じれる
  • コールセンター: 潜在的営業機会の検知
    • 顧客からの問い合わせメールやコールセンターでの録音データをテキスト化したものから、潜在的な営業機会を検知
    • 営業としては、受注確度の高い問い合わせを優先的に開拓することができるようになる
    • さらに発展系として、顧客の問い合わせメールを、クレーム、改善要望、感謝といったようなカテゴリに分類し、それぞれの関係部署に転送することも考えられうる

 

 

ここで挙げた事例は、ほんの一部にしかすぎず、

アイデア次第では様々な用途にこの技術が使われうることは皆さん用意に想像できるかと思います。

 

 

要するにこの技術は、

「テキストデータ群から、ある傾向をもつものを自動で抽出する技術」

に他なりません。

 

 

我々の日常業務は常にドキュメントやメールといったテキストデータに囲まれています。

 

 

 

また、最近では音声データの自動テキスト化技術も急速に発展していっています。

 

これは即ち、

コールセンターでの応答や、入社面接での面談応答、会議の討議内容といったことまで自動でテキスト化され、

AIの恩恵に与れるようになるということです。

 

 

今まで熟練社員でしか見つけられなかった「気づき」のノウハウを、

入社1日目の新入社員でも享受できるようになる時代が到来しようとしています。

 

 

 

 

RPAとの関係

 

 

最後に、このKIBITのようなAI技術とRPAの関係について述べたいと思います。

 

RPAは他のコラムでもご紹介している通り、現在市場で実装されているものは「考える」力は持たず、

手を動かす」方を中心に自動化するのが主流でした。

 

つまり、判断や示唆出しといったものではなく、

その後の定型操作・作業の自動化のみに特化しているということです。

 

一方、AIの技術というものは、まさに今回のコラムでご紹介したFRONTEO社の技術のように、

まさしく人間が「考える」とこであった判断・示唆出しを高度に自動化してくれます。

 

 

このAIRPAが融合できたときに、

考える」ことと「手を動かす」こと

が同一のPCもしくはサーバ上で行えるようになります。

 

これこそがロボットワーカーの最終形態とも呼べるものであります。

 

このAIRPAの融合というテーマは、昔から様々な識者が唱えている事であり、

 

近い将来に実際の巷間のオフィスで実現化される可能性が高いと言えます。

 

そのような世界が到来した時、RPAの活用はさらにもう一段広がることは確実であり、

人間である社員側は今とはまた違う働き方を求められる世界がやってくることになります。

 

 

 

 

topへ
© RPA.biz