IBMとHortonworksが協業を発表～データサイエンス業界への追い風となるか～

time 2017/09/15

日本IBM(以下、IBM)とHortonworksジャパン（以下、Hortonworks）がビッグデータ分野における協業、ならびに相互に製品の再販とサポートを開始することを発表した。

今回の取り組みはすでに米国で6月にスタートしており、今回、日本においても同サービスが展開されることとなった。

非構造化データなどのビッグデータ分析基盤を得意とするHortonworksとデータサイエンティスト向けソリューションを数多く展開するIBMの2社がそれぞれの製品のサポートと再販をすることで、業界にどのようなインパクトを与えるのかを探っていきたい。

【データはますます多種多様になり、増え続ける】

　一昔前と違い、今や企業が発掘できるデータは量・種類共に非常に多い。それはデータを収集/取得する技術革新による恩恵でもあるが、それらを連携させビジネスチャンスにつなげられているかと言われれば素直に首を縦に触れないのが現状ではないだろうか。

エクセルやCSV形式の構造化データはもちろん、企業によってはIoTなどのセンサーから送られてくるデータ、画像やビデオデータ、さらにはSNSや気象、地理情報などのいわゆる「非構造化データ」は、今後も形式やデータ量は増え続けることが予想されている。また米EMCとIDCの共同調査では、2013年の地球で生成されたデジタルデータ量は4.4ゼタバイトだったのが、2020年には10倍の44ゼタバイトにまで増えると言われている。【参照】

こうした増え続けるデータの量と種類に迅速に対応できる分析基盤を整備し、データを扱える人材の育成が企業にとって課題となっている。

【分析のIBM、基盤のHortonworks】

　今回のIBMとHortonworksの協業は、先ほど述べた課題のハードルを少しでも下げる試みの一環だと評価できる。

今回の協業発表により、IBMはデータ分析基盤部分に関して自社製のApache™ Hadoop®、Apache Spark™ Distributionとして「IBM　BigInsights」を採用していたが、今後はHortonworks Data Platform（以下、HDP®）を標準Distributionとして採用し提供していく。

この動きにはIBM社内からHDPの方が使い易いという現場の声を反映させた側面もあり、今後はよりデータサイエンティストに特化したソフトの開発に従事する方向に舵を切ったと言える。

またHDPと同時にストリーミングデータのリアルタイム分析基盤である「Hortonworks DataFlow(HDF™)」の提供も開始する。

一方、HortonworksからはHDPにIBMのデータサイエンティスト向けソリューションである「IBM Data Science Experience（以下、DSX）」がパッケージされて提供される。

DSXはデータサイエンティスト向けのプラットフォームで、GUIにより見やすく直感的な操作でアナリティクスに集中できるのが特徴だ。データの取得からクレンジング、モデルの構築、そして実行までを一貫して行えるのが特徴だ。（DSX Overviewへ）

また両社はHDPとDSX、「IBM Big SQL」を統合して新製品の開発も進めていくという。