2017/07/06
日本IBM(以下、IBM)とHortonworksジャパン(以下、Hortonworks)がビッグデータ分野における協業、ならびに相互に製品の再販とサポートを開始することを発表した。
今回の取り組みはすでに米国で6月にスタートしており、今回、日本においても同サービスが展開されることとなった。
非構造化データなどのビッグデータ分析基盤を得意とするHortonworksとデータサイエンティスト向けソリューションを数多く展開するIBMの2社がそれぞれの製品のサポートと再販をすることで、業界にどのようなインパクトを与えるのかを探っていきたい。
もくじ
【データはますます多種多様になり、増え続ける】
一昔前と違い、今や企業が発掘できるデータは量・種類共に非常に多い。それはデータを収集/取得する技術革新による恩恵でもあるが、それらを連携させビジネスチャンスにつなげられているかと言われれば素直に首を縦に触れないのが現状ではないだろうか。
エクセルやCSV形式の構造化データはもちろん、企業によってはIoTなどのセンサーから送られてくるデータ、画像やビデオデータ、さらにはSNSや気象、地理情報などのいわゆる「非構造化データ」は、今後も形式やデータ量は増え続けることが予想されている。また米EMCとIDCの共同調査では、2013年の地球で生成されたデジタルデータ量は4.4ゼタバイトだったのが、2020年には10倍の44ゼタバイトにまで増えると言われている。【参照】
こうした増え続けるデータの量と種類に迅速に対応できる分析基盤を整備し、データを扱える人材の育成が企業にとって課題となっている。
【分析のIBM、基盤のHortonworks】
今回のIBMとHortonworksの協業は、先ほど述べた課題のハードルを少しでも下げる試みの一環だと評価できる。
今回の協業発表により、IBMはデータ分析基盤部分に関して自社製のApache™ Hadoop®、Apache Spark™ Distributionとして「IBM BigInsights」を採用していたが、今後はHortonworks Data Platform(以下、HDP®)を標準Distributionとして採用し提供していく。
この動きにはIBM社内からHDPの方が使い易いという現場の声を反映させた側面もあり、今後はよりデータサイエンティストに特化したソフトの開発に従事する方向に舵を切ったと言える。
またHDPと同時にストリーミングデータのリアルタイム分析基盤である「Hortonworks DataFlow(HDF™)」の提供も開始する。
一方、HortonworksからはHDPにIBMのデータサイエンティスト向けソリューションである「IBM Data Science Experience(以下、DSX)」がパッケージされて提供される。
DSXはデータサイエンティスト向けのプラットフォームで、GUIにより見やすく直感的な操作でアナリティクスに集中できるのが特徴だ。データの取得からクレンジング、モデルの構築、そして実行までを一貫して行えるのが特徴だ。(DSX Overviewへ)
また両社はHDPとDSX、「IBM Big SQL」を統合して新製品の開発も進めていくという。
【1+1=10】
当日の記者会見にはHortonworksジャパン執行役員社長の廣川裕司氏も登壇されていた。そこで何度も強調していたのがこの「1+1=10」というキーワードだ。
単純に2社が協業することによって「1+1=2」になる取り組みではなく、データサイエンティストやデータサイエンス業界において、敷いては企業やエンドユーザーにとって「それ以上の価値あるものになる」という意味からだ。
これはIBMとHortonworksが協業し、両者が相互に製品を再販サポートするということだけでなく、Apache Hadoopへのコードの寄与数も関係している。Hortonworksが圧倒的にコミットしているのはもちろん、IBMにも多数のコミッターが在籍している。
データサイエンス/機械学習領域における業界のリーダーポジションのこの協業が、今後どのように業界を導くのか楽しみである。