発想と実装の間をつなぐ AI:人工知能特化型メディア

誰でもAI開発できる時代の到来。SONY Neural Network Console誕生秘話

8月にSONYが発表した『Neural Network Console』、GUIで誰でもAI開発ができてしまうその手軽さがとても話題になりました。

今回はそんなSONYに

  • SONYが、このタイミングでAI開発ツールを出した目的・意図は?
  • 本当にビジネスの現場や、製品に使えるの?
  • ほかのライブラリとの比較は?
  • なぜWindowsだけなの?

などを伺ってきました。

今回、お話してくださるのは、

  • ソニー株式会社 R&Dプラットフォーム システム研究開発本部 AIコア技術開発部 シニアマシーンラーニングリサーチャー 小林由幸さま
  • ソニー株式会社 R&Dプラットフォーム システム研究開発本部 AIコア技術開発部 マシンラーニングリサーチエンジニア 成平拓也さま
  • ソニーネットワークコミュニケーションズ株式会社 IoT事業部門 事業推進部 原山直樹さま

の3名。

AIを製品として落とし込むということを世界に先駆け、とっくに実現していました。

15年以上におよぶ、研究開発のノウハウをつめこんだ

―Neural Network Consoleはすごい反響でしたね。開発に至った経緯を教えていただけますでしょうか?

―小林
『Neural Network Console』『Neural Network Libraries』はもともと、社内で開発していたものです。
SONYでは、ディープラーニングの研究開発を約7年前の2010年ぐらいからやっていたのですが、当時はオープンソースのライブラリなども普及していませんでした。なので、自社たちでライブラリを開発したのがキッカケですね。

2010年当時だと、まだディープラーニングライブラリCaffeすら登場していなったそう。

そこで社内でのAIの開発効率を上げるため、開発しはじめたのがNeural Network Libraries。SONY社内ではWindowsが主流であること、またSONYのPCといえばVAIO、といった背景もありWindows向けでのリリースになったとのこと。

2011年頃からは初代コアライブラリを開発し、2013年から第二世代を、そして2016年から開発した第三世代が、現在のNeural Network Librariesになるわけですね。

SONYの機械学習〜ディープラーニングに対する研究の取り組み (報道用資料より抜粋)

何度も再開発がされているようですが、何か理由あるのでしょうか?

―成平
第二世代の2013年頃には、ほかのディープラーニングのライブラリも登場しはじめたので、それらを意識した開発をはじめました。さらに数年前からその競争も激化してきたため、第三世代の開発をはじめた形になります。

特徴として、第三世代のNeural Network Librariesはほかのライブラリにくらべて後発であるため、ほかのライブラリの良いところを参考に、最先端のトレンド・機能をもりこんでいます。
その流れも受け2015年には、いままで多かったAI開発のわずらわしさを取り払うためにNeural Network Consoleの開発に着手しました。

なるほど。Neural Network Libraries/Neural Network Consoleはそれほどの長い歴史とノウハウがあったからこその賜物というわけなんですね。それこそNeural Network Consoleの自動モデル探索は、AI開発に携わるすべての人間が求めていた機能といっても過言ではありません。

※ AI開発では、AIを学習させる前にハイパーパラメータと呼ばれるさまざまな変数を、人間が決める必要があります。ただハイパーパラメータの数が非常に多く、その組み合わせの数は、人間が手動でおこなうのには限界があり大変なものでした。Neural Network Consoleではなんとそれを自動で行ってくれます。

AIをいかに現場ではやく開発できるかがカギ。“ディープラーニング・ネイティブ”の時代がやってくる

―─すでに社内での活用事例があれば教えていただけますでしょうか?

―原山
はい、もちろんあります。
活用シーンは、ビジネスの現場だったり、製品の機能としてだったりと、幅が広いですね。

主な事例・活用用途をまとめると、下記のとおり。

ソニー不動産:
「のべ床面積」「間取り」「駅からの距離」といった変数から、不動産価格を予測

Xperia Ear:
ユーザーの「首を縦に振る・横に振る」といった動作を、センサー情報から判別

電子ペーパーDPT-RP1:
ペンで書いた手書き記号「*」を判別


スマートプロダクト Xperia Ear

電子ペーパー DPT-RP1

お話を伺うと、じつはもっと事例はあるのだそう。ディープラーニングの活用例というと一般的によく聞くのは画像判別ですが、ここまで現場や製品に対してうまく落とし込んだ例をみるのは初めてかもしれません。改めて、ディープラーニングの汎用性の高さを感じました。

―原山
そうですね。汎用性の高さゆえに、さまざまなシーンでの活用が増えていくと思います。
経済に与える影響も大きいという調査もありますし、AI活用は確実に当たり前になってくるでしょう。

そうなったとき、“いかにはやくAIを開発できるか”は、今後非常に重要なポイントになってきます。

そんな近い未来、AI開発現場の主役になってくるのが Neural Network Console というわけですね。

筆者も「AIを学習させて精度検証して、じゃあ次はこうしてみよう……」というサイクルを回していますが、AIでやりたかったことが実運用の段階になるまで、かなり時間がかかりました。AIがよりビジネスの現場に出てきて、よりスピードも求められるようになれば、Neural Network Consoleを使わない手はないですよね。

Neural Network ConsoleのようなツールでAI開発が簡単になることで、それこそ“ディープラーニング・ネイティブ”なる存在が出てくることは必至だ、というお話も。そうした人材とどう付き合うか・現場でどう扱うのか、いまから考えておかないといけないかもしれませんね。

メーカーだからこその“エッジ大前提”の開発ツール

―ところで近年、AIのエッジ・コンピューティングが非常に盛り上がりを見せていますよね。Neural Network Libraries/Neural Network Consoleは、そういった用途には対応しているのでしょうか?

―小林
はい、Neural Network Libraries/Neural Network Consoleはエッジに対応しています。というのも、もともと我々が製品メーカーなので、そういった組み込みについては大前提なんです。

なんと! AIの省力化については、いろんなビッグネームの企業ですら奮闘している段階。それがSONYのNeural Network Libraries/NCCではとっくに考慮済みだったとは……

エッジ・コンピューティングの概要や必要性・トレンドについては下記記事をご覧ください。
>> 御社、まだクラウドAIだけですか? Microsoft, NVIDIAも注力してる“エッジAIコンピューティング”まとめ
また、上記記事公開後もIntelのLoihiプロジェクトや、HuaweiのKirin970などの例がぞくぞくと出てきています。

―原山

実際の例でいうと、Xperia Ear、電子ペーパー、アプリ『AR Effect』がエッジ側で処理をしています。
Xperia Earは接続しているスマホ側で処理していますが、DPT-RP1に関しては完全に端末側ですね。

はじめに事例を見せていただいたときは、てっきりどれもクラウド処理かと思っていましたが、すでにエッジ処理だったとは。驚きです!



画像や動画に対して、3Dエフェクトを追加できるXperia専用アプリ『AR Effect』
(引用元: Xpearia公式サイト)

―成平
さらにNeural Network Consoleでは、モデルを作成した際に“どれぐらいの容量になるのか・どれぐらいのメモリ消費量になるのか”という推定値も一緒に出てきます。

なので、この値をもとに「このモデルはあのデバイスには載らないから、精度が一定以上でパフォーマンスが良いモデルを採用しよう」という選択ができますね。

そこまで至れり尽くせりだとは……
ソフトウェアだけでなくハードウェアも手がけている企業ならではの強みですね。

さらにお話を伺うと、AIの組み込みには、2000年付近に発売した家庭用ロボット『AIBO(アイボ)』『QRIO(キュリオ)』なおの製品開発で得た長年のノウハウも活きているのこと。

こちらの記事でも述べているとおり、今後AIのエッジ・コンピューティングは重要性を強めてきます。そんななか日本のSONYが世界に先駆け、すでにエッジ向けのAI開発ツールを提供しているというのは、日本人として思わず目頭が熱くなるストーリーです。

オープンソース化によって世界に挑む、対話する。

―最後に、オープンソース・無償公開した理由を教えてください

―原山
一言でいうなら「SONYもAIをやっているんだ」という世界へのアピールですね。
世界の研究のトレンドに参加したり、各方面から意見をもらうためにオープンソース化・無償公開をしました。いつまでも非公開のままでは世界に置いてかれてしまうだけなので。

たとえば現在、海外ではAIの脳である“学習モデル”形式について標準化しようといった動きがありますが、オープン化したことによって、今後そういったトレンドにも関与できるだろうと思っています。

なるほど。それがオープンソース化・無償公開の理由だったのですね! 現在、「AIで覇権を握るのはどの企業か?」という議論は多いですが、まさか日本からSONYというダークホースが動き出していたとは。

今後ますます重要性が増してくるであろう、AIのエッジ処理やAI開発のスピードですが、SONYはメーカーだからこそのノウハウと長年の研究によって、GoogleやAppleにも引けを取らない強みをSONYは築きあげていたんですね。
小林さん・成平さん・原山さん、お忙しいなか誠にありがとうございました!

今回のインタビューを振り返って全体的に感じたのは、研究部門と製品部門の連携が非常に強いということ。大きな企業の場合ふつう、そういった部署間の連携って弱いことが多いのですが、このような素晴らしいツール・事例を生み出せた理由には、SONYの組織力もあるようです。今後もSONYのAI戦略に目が離せません。

岡田 孟典 by
AIのリアルを追う、“やってみた”ライター兼エンジニア。過去には、海外向けにチャットボットをリリースした実績もある。エンジニアとしての成長も目指して日々奮闘中。