【最新AI技術】Deep Mindが二次元データから三次元データを生成する技術を開発【GQN】

time 2018/06/18

folder 04_ニュース・トレンド

【最新AI技術】Deep Mindが二次元データから三次元データを生成する技術を開発【GQN】

こんにちは。

この度、ビッグデータマガジン副編集長に就任致しました谷内です。

Deep Mindが発表したGQN(Generative Query Network)と言われる衝撃的な技術が界隈を賑わしています。

Deep Mindによると、わずか数枚の画像から、画像には映っていない三次元表現をAIが推測できるようになったというのです。

私たちが何か物を見るとき、通常私たちが思っているよりも、多くの情報を得ています。

ここに、弊社の机を写した画像があります。

この画像を見たとき、あなたはこの画像に写っていること以上の情報を得ています。

たとえば、あなたは上の写真を見ただけで、この机を後ろから見たとき、どのように見えるか想像できるはずです。

これは先ほどの机を、斜め後ろから写した写真ですが、あなたはこの写真を見ても何も違和感はないですよね？

人は前から見た写真だけで、机の大きさや距離感など、おおよその情報を感じ取ることができるためです。

しかし、AIは違います。

今までのAIの技術では、三次元空間を二次元の写真から理解することはできませんでした。

上の写真を見ただけでは、AIは空間を三次元で捉えることができなかったのです。

しかし、Deep Mind がこのような常識を打ち破りました。

GQNという技術を使用することで、ほんの数枚の写真から三次元の情報が推測できるようになりました。

仕組みとしては、表現ネットワーク(The representation network)と呼ばれる層で、二次元の画像から三次元の情報を把握します。

そして生成ネットワーク(The generation network)と呼ばれる層でその特徴を元に、物体を三次元空間に出力します。

具体的に解説した動画がこちらです。

Deep Mindのブログに掲載されていた動画なので、英語の解説しかないですが、流れはよくわかると思います。

まだ、実際の写真で応用には至っておらず、仮想的な三次元空間の限られた利用に留まるとはいえ、GQNが非常に優れた技術であることは間違いありません。

GQNは複数の視点の画像だけから、対象の三次元世界を符号化し異なる視点からの視界を復元する。空間モデルを潜在変数とする潜在モデルで最適化する。Structure from MotionをNNで直接解いたものであり、この1~2年内の最大の進歩と言っていいと思う https://t.co/JLnATeQB99 https://t.co/h8b48prcft
— Daisuke Okanohara / 岡野原大輔 (@hillbig) June 15, 2018

GQNすごすぎ。3次元空間を特徴ベクトルで表現できているのがヤバい。普通は表現に大量の情報量を必要とする3次元以上の空間を何らかの疎な表現に落としこめているとなると、学習の効率も汎化性能も適用可能な分野も格段に広くなる。 https://t.co/Dqn2H8XMFB
— いもす (@imos) June 15, 2018

GQN、色んな人の研究を終わらせて、新しい研究始めさせる何か感凄いんですけど
— トウ (@NASNETou) June 15, 2018

すでに実装を始めている猛者もいます。

musyokuさんのGQN実装だ。。(Chainer版)　https://t.co/w67zczBa9n
— ワクワクさん (@mosko_mule) June 23, 2018

今、三次元のビッグデータを扱おうとすると、非常にラベル付けに手間とコストがかかります。

(三次元になると物体までの距離のデータや各方向からの写真など、入力するデータが二次元に比べ遥かに多くなるためです)

そのため、ラベル付けされたデータが足りないことがボトルネックになることも多いです。

この技術が実用化されれば、そのデータセット作成のコストを大きく削減することができます。

画像数枚からVR空間が生み出されると考えると、この技術がいかに大きな可能性を秘めているか想像できると思います！

今後としては、VRやロボティクスの分野で利用が期待されるのではないでしょうか？

当分先のことになりそうですが、自動運転や工業機械、VR、ARなど様々な分野での応用が今から楽しみですね。

原文記事

https://deepmind.com/blog/neural-scene-representation-and-rendering/

http://science.sciencemag.org/content/360/6394/1204.full

データセット

https://github.com/deepmind/gqn-datasets

【執筆者情報】

谷内　燦久（たにうちあきひさ）

ビッグデータマガジン副編集長

神戸大学経営学部卒業後、人工知能とビッグデータが世界を変えると確信し、チェンジに入社。

弊社ではビッグデータを扱うデータサイエンティスト育成の研修も行なっております。

AIやビッグデータについて興味がある方はこちらから

http://www.change-jp.com/service/iot/

　　　　

down
コメントするコメントをキャンセル

一緒に読まれている人気記事

この冬“Winter Sports”関連で話題になったつぶやきはこれだ！！～クチコミデータから“Winter Sports”を分析！～

twitter 3

facebook 0

hatenabookmark 3
データサイエンスの実務者が集うシンポジウムをデータサイエンティスト協会が11/13に開催（広告）

twitter 3

facebook 0

hatenabookmark 3
～ナビタイムがプローブデータを用いた道路交通分析システム「道路プロファイラー」の提供を開始～

twitter 1

facebook 0

hatenabookmark 0
小売業界（店舗販売）とビッグデータ〜ビッグデータ活用のための「やさしい業界解説」シリーズ〜

twitter 9

facebook 0

hatenabookmark 0
データサイエンティストへの登竜門がさらに身近に～データサイエンティスト養成コース（ベーシック）日程分割コース新設～

twitter 6

facebook 0

hatenabookmark 8
ソーシャルメディアで一番反響があった花火大会はどこ？

twitter 4

facebook 0

hatenabookmark 5

tag Deep Learning

tag 人工知能

tag 機械学習

tag 深層学習

folder 04_ニュース・トレンド

more

01_解説

【続編】TIBCO Spotfire7.9でデータ分析を効率化する

2017/07/06

【続編】TIBCO Spotfire7.9でデータ分析を効率化する

2016/10/11

第三回「機械学習における見せかけの相関」

2016/08/04

第二回　IoT×機械学習で異常検知

more

02_インタビュー

2018/10/26

IoTとビッグデータが作るコネクテッドワールドへ向けて【Horton works Japan記者会見記事】

コールセンター向け音声認識AIの導入事例【トランスコスモス社インタビュー記事】

2018/09/04

コールセンター向け音声認識AIの導入事例【トランスコスモス社インタビュー記事】

【米国ビッグデータ動向】大手メーカーのソーシャルリスニング最前線〜米国の最新動向に学ぶ、SNS投稿データの活用イメージ〜

2017/07/11

【米国ビッグデータ動向】大手メーカーのソーシャルリスニング最前線〜米国の最新動向に学ぶ、SNS投稿データの活用イメージ〜

more

03_事例

～ナビタイムが首都高小松川JCTにおけるビックデータを用いた開通効果分析を発表～

2019/12/17

～ナビタイムが首都高小松川JCTにおけるビックデータを用いた開通効果分析を発表～

～ナビタイムがプローブデータを用いた道路交通分析システム「道路プロファイラー」の提供を開始～

2017/11/24

～ナビタイムがプローブデータを用いた道路交通分析システム「道路プロファイラー」の提供を開始～

【実践ビッグデータ活用】東京五輪＆パラリンピックでビジネス企画！〜ビッグデータ、IoT、AI活用ビジネスを企画するヒント〜

2017/03/15

【実践ビッグデータ活用】東京五輪＆パラリンピックでビジネス企画！〜ビッグデータ、IoT、AI活用ビジネスを企画するヒント〜

more

04_ニュース・トレンド

～ナビタイムが首都高小松川JCTにおけるビックデータを用いた開通効果分析を発表～

2019/12/17

～ナビタイムが首都高小松川JCTにおけるビックデータを用いた開通効果分析を発表～

【Alteryx】同一プラットフォーム内で異部署間データ分析を容易に【インタビュー記事】

2018/08/17

【Alteryx】同一プラットフォーム内で異部署間データ分析を容易に【インタビュー記事】

【最新AI技術】Deep Mindが二次元データから三次元データを生成する技術を開発【GQN】

2018/06/18

【最新AI技術】Deep Mindが二次元データから三次元データを生成する技術を開発【GQN】

more

05_技術

【続編】TIBCO Spotfire7.9でデータ分析を効率化する

2017/07/06

【続編】TIBCO Spotfire7.9でデータ分析を効率化する

2016/10/03

地方自治体で広がるデータ活用・データ分析の取り組み［2016年11月26日（土）オープンガバメント推進協議会公開シンポジウム］

2016/09/13

ダイワボウ情報システム、ユーザー体験を重視したマルチベンダー対応ショールーム「Customer Experience Center & Executive Briefing Room」を開設

more

06_統計

主成分分析「使ってみたくなる統計」シリーズ第4回

2015/05/08

主成分分析「使ってみたくなる統計」シリーズ第4回

クラスター分析「使ってみたくなる統計」シリーズ第3回

2014/11/06

クラスター分析「使ってみたくなる統計」シリーズ第3回

書籍20選～効率よく目的別に統計分析を学ぶ～

2014/07/17

書籍20選～効率よく目的別に統計分析を学ぶ～

more

07_人材・キャリア

1分であなたのスキルレベルをチェック！～データサイエンティスト/ビッグデータ利活用人材レベルの強化に～

2014/12/29

1分であなたのスキルレベルをチェック！～データサイエンティスト/ビッグデータ利活用人材レベルの強化に～

2014/05/21

データサイエンティストに関する日本初のベンダーニュートラル資格を、株式会社チェンジが認定開始

2014/04/03

「日本ユニシス株式会社」～ユーザシナリオにあったビッグデータ導入を推進～ビッグデータマガジン・インタビュー

more

08_用語

2014/02/05

ビッグデータの3つのＡ～ビッグデータの価値を考える～

2013/09/11

5分でわかる！動画スライド「ビッグデータ利活用が注目される2つの背景」

more

09_AI・機械学習

2018/07/23

AI(人工知能)とは何か？

more

99_おしらせ

あなたのITスキル測定してみませんか？【第17回全国スキル調査 2018】

2018/07/04

あなたのITスキル測定してみませんか？【第17回全国スキル調査 2018】

BDMまとめ～2017年9月第４週～

2017/10/03

BDMまとめ～2017年9月第４週～

三重県におけるRESAS普及促進事業（松阪市の産業多様性の事例）

2017/03/30

三重県におけるRESAS普及促進事業（松阪市の産業多様性の事例）

more

連載

2016/12/20

【第２回】実践、AI（人工知能）をマーケティングに活かす！〜AIは「読者の心をつかむ画像」を選定できるのか？〜

2016/11/01

【第1回】実践、AI（人工知能）をマーケティングに活かす！〜AIでレコメンデーション・エンジンは賢くなるのか？〜

2016/10/11

第三回「機械学習における見せかけの相関」

フォローする

twitter

facebook

google

feed

line

副編集長のぼやき

人気のエントリー

主成分分析「使ってみたくなる統計」シリーズ第4回

時系列分析（前編）～「使ってみたくなる統計」シリーズ第5回～

クラスター分析「使ってみたくなる統計」シリーズ第3回

書籍20選～効率よく目的別に統計分析を学ぶ～

「使ってみたくなる統計」シリーズ　　第1回：相関分析

第2回：アソシエーション分析~「使ってみたくなる統計」シリーズ ~

BIツール４選～ユーザ視点のビッグデータ活用に向けたBIツール～

最近の投稿

カテゴリー

FACEBOOK

ビッグデータマガジン

月別アーカイブ

連携サイト

お問い合わせ

記事に関するお問合せ、
ビッグデータにまつわるお悩みやご相談等
お気軽にお問い合わせください

【お問合せフォームへ】