名称

R&D用インクジェット装置

サイズ

横幅910mm×奥行900mm×高さ1860mm

プリントヘッド

PrecisionCore

主な機能

インク滴の飛行観察機能、インク滴の着弾観察機能、
100mm角ステージへの高精度描画機能

販売開始時期

2020年3月予定

　NECは、従来の半分程度の学習データ量でも高い識別精度を維持できるディープラーニング技術を新たに開発した。

　識別精度の向上には、識別が難しい学習データをより多く学習することが有効だが、学習に適した質の良いデータを十分に確保することが重要。同技術は、ニューラルネットワーク(注1)の中間層で得られる特徴量を意図的に変化させることで、識別が難しい学習データを集中的に人工生成します。これにより、少ない学習データ量でも識別精度を大きく向上させ、ディープラーニングを適用したシステムの開発期間短縮に貢献する。

　具体的には、ディープラーニング技術の適用に必要な学習データ量を半分程度に削減する。また同技術は、データの種類を問わず汎用的に適用可能であることから、専門家による調整が不要になる。これにより従来、学習データ収集時間やコストの高さが阻害要因となっていた製品の外観検査やインフラ保全など、さまざまなシステムの早期立ち上げを可能にする。

　近年、ディープラーニング技術は画像・音声認識を主体に飛躍的な発展を遂げ、セーフティ、ものづくり、インフラ保全など幅広い分野での活用が広がっている。例えばものづくりの分野では、製品の外観検査において、人材確保が難しい熟練検査員をカメラによる画像認識で代用したいという要望がある。外観検査をディープラーニングで行うには不良品データを学習する必要があるが、発生頻度の低い不良品は大量に得ることが難しいため、不良品データの収集や不良品を模擬したデータ作成に多大な時間とコストを要していた。

　このような問題に対し、従来はデータ拡張(注2)と呼ばれる、学習データを意図的に加工・変形させることでデータ量を人工的に増やす手法が用いられていたが、識別精度を高める効果的な学習データの生成までには至っていなかった。さらに、対象のデータ種類に応じて専門家がデータの増やし方を調整する必要があるため、様々な種類のデータに短期間に適用することは困難だった。

　同技術の特長

必要となる学習データを従来技術に比べ半分に削減
識別精度の向上には、識別が難しい「苦手な学習データ」をより多く学習することが有効であると広く知られている。データ拡張と呼ばれる従来技術では、ニューラルネットワークに入力する前にデータを意図的に加工・変形させ、学習データ量を人工的に増やしていた(例えば画像に対しては、回転や拡大・縮小、ノイズの付加など)。しかし、このような増やし方では、「苦手な学習データ」の量が不十分で、かつ識別精度向上に寄与しないデータも多く生成され、十分な学習効果が得られなかった。
同技術は、ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別が失敗しやすい「苦手な学習データ」を集中的に人工生成し識別精度を高める。同技術を公開データベース(手書き数字認識：MNIST、物体認識：CIFAR-10(注3))にて評価し、学習データ量が半分でも従来技術と精度が変わらないことを確認した。
データの種類の違いによる専門家の調整が不要
従来のデータ拡張では、データの種類毎にデータの生成方法を変える必要があった。例えば、画像では大きさや回転角度など、音声では声の高さや話す速さなどを変えることでデータを人工的に増やしていた。さらに、専門家がデータ生成方法を慎重に選び、学習に悪影響を及ぼすデータが発生しないよう調整する必要があった。
同技術は、ニューラルネットワーク内部の数値に基づいて自動的に学習データを生成するため、多様なデータに対して汎用的かつ効率良く適用することができ、専門家による調整を不要にする。

　なお、今回の成果に関してニューラルネットワークの国際会議「International Joint Conference on Neural Networks」(IJCNN2019、期間：2019年7月14日(日)~19日(金)、場所：ハンガリー・ブダペスト)において、7月15日(月)に発表している。(https://www.ijcnn.org/)

(注1)

ニューラルネットワーク:人間の脳の仕組みを模したモデリング手法。
ニューラルネットワークにデータを入力すると、そのデータが中間層を伝わり、出力層から認識結果として出力される

。

(注2) データ拡張:データを加工・変形することで擬似的なデータを生成する手法。例えば、画像認識では、入力画像の大きさや回転角度を変えることでデータを生成する。 (注3) MNIST：0から9までの10種類の手書き数字画像からなるデータセット。
CIFAR-10：飛行機、鳥、犬など10種類の画像からなるデータセット。
いずれも機械学習の精度評価に標準的に用いられる公開データセットである。

　NEC は、熟練者の過去の行動履歴データから、その卓越した認知・判断に基づく意図を意思決定モデルとして学習し、高度なスキルが要求される業務を大幅に効率化するAI技術を開発した。本技術を、属人的な業務の意思決定プロセスに適用することにより、業務負荷を大幅に軽減することができ、業務スピードの大幅な向上が可能となる。

　本技術は、逆強化学習(注1)のフレームワークをNEC独自のアルゴリズムで拡張し、従来、技術者が行っていた意思決定モデルの構築を自動化する。人手では定式化が困難な意思決定問題に対して、熟練者の過去の行動履歴データから意思決定モデルを作成することで、熟練者と同等の判断を迅速かつ自律的に導き出す。本技術は、主に以下の領域に対して適用が可能。

　1) RPA(Robotic Process Automation)を適用できない複雑な意思決定を必要とする業務領域(例：営業活動やプラント運転など)

　2) 人の判断・動作を物理的に再現する領域(例：自動運転やロボット制御など)

　また、今回開発した技術をTV放送局の広告スケジューリング業務(注2)に適用し、実データを使った性能評価を実施した。本業務は、各CMにおける要件・制限事項と、放送枠の活用方法など放送局側の要件の両方を考慮しなければならず、高度なスキルやノウハウが要求される。この業務に本技術を活用した結果、経験豊富な熟練者と同等レベルの意思決定を10倍以上のスピードで実現できることを確認した。今後、熟練者への負荷が高い様々な業務への適用を進め、人のパートナーとなりうるAIの開発に取り組む。

　背景

　近年のディープラーニングに代表されるAIの発展に伴い、商品の検品検査や需要予測、顧客の嗜好分析などの領域で、AIの活用が増えている。
　しかし、意思決定問題など、高度なスキルが要求される分野への適用においては、利用可能な品質になるまでに繰り返しのヒアリングや熟練者の無意識行動の反映等を含め、膨大な試行錯誤が必要となっていた。また、導き出される結果と熟練者の判断レベルに乖離があり、この分野での適用が困難だった。

　本技術は、NEC独自の機械学習アルゴリズムにより、熟練者が行っている高度な業務の意思決定を再現することができ、これまで以上に幅広い領域で業務効率の向上を可能にする。

TV放送局の広告スケジューリング業務での適用内容

　本技術の特長

　1．複雑な意思決定を複数の意図に分解して学習

　従来の逆強化学習では熟練者の一連の行動を単一の意思決定モデルとして学習するため、状況に応じた複雑なモデルを構築することは困難だった。本技術では、NECの最先端AI技術群「NEC the WISE」(注3)の1つである異種混合学習(注4)を拡張して、行動履歴データから複数の意思決定モデルとそれらの切り替えルールを学習する。
　これにより、熟練者が時と場合より柔軟に使い分ける判断基準を、非熟練者でも理解しやすいロジックで説明でき、熟練者と同等レベルの意思決定を行うことができる。例えば、営業販売に適用した場合、成約率の高い営業の行動履歴を学習し、顧客(見込み客、常連客など)ごとに異なる最適な対処を学習し、経験の浅い営業に活動指針を出すことが可能となる。

　2．意思決定モデルと制約を同時に学習

　本技術では、熟練者の過去の行動履歴から、意思決定モデルだけでなく制約も同時に学習する。熟練者と同等レベルの意思決定をするためには、大きなリスクを避け、効果を最大化にする施策を選択する必要がある。本技術では、熟練者が選択しない行動はリスクがあるため避ける制約、常に行っている行動は守るべき制約と見なし、熟練者が考慮し最適化しているモデルと組み合わせて同時に学習する。このように意思決定モデルと制約を同時に学習することで、熟練者が無意識に行っている安全で信頼性の高い判断と同等の意思決定が可能となる。

　3. 学習環境の簡略化

　一般に、逆強化学習を実行するためは、行動履歴データ、行動により最適化対象の状態がどう変化するかを模擬する状態遷移モデル、学習した結果の正誤を確認するための実験機やシミュレータが必要になるが、現実世界を精巧に模擬できる状態遷移モデルの作成は困難。本技術では、熟練者・非熟練者の行動履歴データからのサンプリングにより意思決定モデルを評価できるモデルフリー方式(注5)を新たに開発した。本方式を採用することで、コストのかかる精緻な状態遷移モデルの準備が不要となり、学習環境を大幅に簡略化することが可能になる。また、学習途中の意思決定モデル評価をシミュレータ等で実行する必要もないため、学習が既存逆強化学習の100倍の効率で実現できる。

　これらの技術により、自動運転やロボット制御などの物理・人工システムだけでなく、営業活動やプラント運転などの状態遷移が不確定なシステムで人が意思決定を下す属人的な業務にまで適用先を広げることが可能となり、幅広い領域でAIによる業務効率化が可能になる。

　なお、性能評価の成果の一部は、人工知能の国際会議である「KDD2019(ACM SIGKDD CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING)」(会期：8/4(日)～8(木)、会場：Anchorage convention centers, Alaska, USA)において発表する。

(注1) 逆強化学習：報酬を基に最適行動を導きだす強化学習に対して、最適行動から報酬を推定するため逆強化学習と呼ばれる
(注2) 広告スケジューリング業務:広告宣伝の効果やスポンサーの好みを考慮しながら、複数のTVコマーシャルを限られた番組時間枠に最適に割当をする業務
(注3) 「NEC the WISE」(エヌイーシーザワイズ)は、NECの最先端AI技術群の名称です。"The WISE"には「賢者たち」という意味があり、複雑化・高度化する社会課題に対し、人とAIが協調しながら高度な叡智で解決していくという想いを込めている。
(注4) 異種混合学習技術：ビッグデータに混在するデータ同士の関連性から、多数の規則性を自動で発見し、分析するデータに応じて参照する規則を自動で切り替える技術。これにより、単一の規則性のみを発見し参照する従来の機械学習では分析が困難な、状況に応じて規則性が変化するデータでも、高精度な予測や異常検出が可能。
(注5) 環境のダイナミクス(状態遷移モデル)が既知でない場合でも、強化学習・逆強化学習が適用できる方式