2017/07/06

今泉大輔
ITジャーナリスト
ビッグデータを活用した経営がどういうものであるのか?ものすごくシンプルな形で見せてくれているのが、米国の有料動画配信サービス最大手Netflixです。
Netflixは日本未進出なので存在感がいまひとつないですが、全米のネットトラフィック調査によると、全体の約3割を占めてダントツの1位となっています(Sandvine調べ。2位は19%のYoutube)。Netflixで映画・ドラマを見ることが、消費者の生活の中に溶け込んでいると見ていいでしょう。同社の概要は従業員2,000名、売上高46億ドル、ストリーミング会員4,400万名。米国以外にカナダ、南米、欧州など40カ国で営業。コンテンツの調達に年間20億ドルを投じており、純利益1億6,300万ドルとなっています。
Netflixは2012年頃に株価の底を経験しましたが、ビッグデータを徹底的に活用する戦略が効果を発揮して、現在では時価総額が5倍以上の290億ドルに達しています。現在の日本企業で言うと、三井物産、JR東海、ブリヂストン、新日鉄住金、キーエンスなどに等しい水準です。
この間、米国株式市場は右肩上がりで上げてきていますから、多少は割り引いて見る必要はあるとしても、2012年初頭から2年半で時価総額5倍というのは、やはりすごいと言わざるを得ません。同社のビッグデータ活用経営が市場からも評価されているということでしょう。
本稿では、多数の資料を読み込んで見えてきた同社のビッグデータ経営のポイントをまとめてみたいと思います。
■ポイント1 データを多く取れる業態にシフトする
ビッグデータの活用は米国でもまだまだ一部の企業にとどまっています。名著「イノベーションの普及」で知られているエベレット・ロジャーズの分類で言えば、全体の2.5%しかいないイノベーター層を一巡したぐらい、というところでしょうか。とは言うものの、自動車最大手のGMや、流通小売最大手のウォルマートなどがシリコンバレーにデータ分析の拠点を設ける動きがあり(資料 http://www.informationweek.com/strategic-cio/executive-insights-and-innovation/gms-randy-mott-what-i-believe/d/d-id/1141482 )、より広い層に浸透するまであと1〜2でしょう(ちなみに日本企業のIT動向は、米国企業より2〜3年遅れで形になりますね)。
まだまだ競合が少ないので、ビッグデータ活用に本気で取り組む企業は「その分野における1位」を狙える位置にいます(業種における1位というより、その手法で事業を行う企業群の1位)。現在は同業他社とドングリの背比べの状況にある企業であっても、背水の陣でビッグデータに取り組むなら、ダントツ1位になる可能性があると考えています。
それが実現するかどうかの境目が、経営資源としてのデータ、それも顧客の動きに関係するデータがリアルタイムでふんだんに取れる業態であるかどうかです。
考えてみましょう。
ビッグデータ経営を志向するものの、肝心のデータが外部のサードパーティのところにあって、データをその都度買わなければいけないとしたら、本格的なビッグデータ経営ができるでしょうか?また、顧客行動を知るのに、データ発生デバイス、ある種のセンサー、ログ発生源が自社のバリューチェーンの中にはほとんどなくて、取れるデータは購買結果だけということでしたら、ビッグデータ経営はできるでしょうか?
2010年頃までのNetflixも、ビッグデータを本格的に活用するにはほど遠いところにいました。当時のNetflixは、DVDレンタルが本業。ウェブサイトでDVDカタログを公開し、顧客は同社の会員となってウェブカタログでDVDを選び、送付を依頼します。月会費8ドル程度で何度でも借りられるというのが売り物でしたが、顧客のデータを取るという意味では、このオフライン業態には限りがあります。
映画やドラマのDVDを貸す事業では、もっとも重要なデータは、その顧客が借りたDVDを全部見たか、喜んでくれたか、全部見た上でネクストをレンタルしたか、といった「視聴行動」に関わるデータです。これがオフラインのDVDレンタルでは全然取れません。
かろうじて、顧客が事後的にウェブにアクセスして付ける5星の評価で満足度が知られる程度。データアイテムが少なすぎるので、本格的なビッグデータ活用にいたりません。
一方で、オンラインストリーミングで映画・ドラマを配信する業態では、非常にたくさんのデータが取れます。どの時間帯に見ているか、全編を一気に見終わったか、途中でやめたか、リピートして見た場面はあるか、などなど。自社サイトに来て、特定の俳優名で検索して、いろいろ迷った揚げ句、1本に絞り込んで、それを金曜の夜にぶっ通しで見た、といったデータが取れるのです。
このように顧客の一挙手一投足がデータとして取れるということは、データが最重要の経営資源であるビッグデータ経営では筆頭に挙げるべきポイントです。
そのことをよく理解したため、Netflixでは、2009年から2011年にかけて、DVDレンタル事業からオンラインストリーミング配信事業に業態をシフトさせました。同社にとっても他社にとっても前例のないことであり、経営上のまごつきはありましたが(株価下落となって出ました)、2012年以降は、ビッグデータの活用からもたらされる成果がはっきりと出てきて、上述の株価上昇につながっています。また、この間、同社の会員数は2,000万人(2010年度)から4,400万人(4,400万人)へと倍増しています。
有料動画配信ビジネスに限らず、データがより多く取れる業態へのシフトは、その業態で万年下位にある企業や、同業他社と同じ事をやっても成長が見込めないと自覚している企業では、考えてみるべき価値がある選択肢でしょう。リアル店舗を閉鎖してスマホでのビジネスに集中するとか、データが取りにくい顧客層は諦めて、すべての行動のデータが取れる顧客層・年代層にシフトするとか、いろいろなパターンがあると考えられます。起死回生策はビッグデータ活用しかないと直感的に理解している企業は、戦略的に考えてみてもよいでしょう。
■ポイント2 顧客のすべての行動データを取る
Netflixが取得している顧客行動のデータアイテムはたくさんあります。同社のビッグデータ活用を論じている記事や投稿はネット上に無数にありますが、その中でも、食いつき度という意味でかなりいい線を行っているのが以下の記事。Kissmetricsというデータ活用コンサルティング会社が書いています。
How Netflix Uses Analytics To Select Movies, Create Content, and Make Multimillion Dollar Decisions
http://blog.kissmetrics.com/how-netflix-uses-analytics/
この記事で挙げているNetflixの取得データアイテムは以下のように多岐にわたります。
– When you pause, rewind, or fast forward(いつポーズ、巻き戻し、早送りをしたか)
– What day you watch content (何曜日にコンテンツを楽しんでいるか)
– The date you watch(日付)
– What time you watch content(視聴し始めた時間、終わった時間)
– Where you watch (どこで見ているか、郵便番号やIPアドレスから)
– What device you use to watch (どのデバイスで見ているか、TVからゲーム端末、スマホまで対応端末は100種類にわたる。また子ども用コンテンツはiPadで見ているといったコンテキストも大事)
– When you pause and leave content (特定のコンテンツのどこでポーズをかけたか、視聴に戻ってきたか)
– The ratings given (視聴後に顧客が付ける星1つ〜5つまでのレーティング、1日40億星とのこと)
– Searches (顧客がサイト上で行うコンテンツ検索の内容。1日30億件)
– Browsing and scrolling behavior(サイトのページのブラウジング状況、スクローリング状況)
データ分析にあたる方が日本でも米国でもよく指摘していますが、「どう使えるかわからないデータでも、とりあえず取得しておいて、どう使うかは後々考える」という姿勢が大事なようです。これを地で行っているのがNetflixです。同社では従業員数2,000名のうち、800名がITスタッフ。日々データ活用アルゴリズムの改善に余念がないと言われています。
同社の会員数は世界で4,400万人。1カ月の総視聴時間が10億時間ということですから、1日に約3,300万時間の視聴。この1日分の視聴に対して、上記のデータアイテムが発生しているわけですから、1日に発生するデータ量は(それを明確に言っている資料が見つかりませんでしたが)、数テラバイトになることは間違いないでしょう。データを分析する場合には、過去1カ月、過去半年、過去1年といった形で、集積されたデータに分析をかけますから、その時のデータ総量は膨大なものになります。現在では、数十〜数百テラバイト程度であれば、リアルタイム・クエリをかけられるビッグデータ環境がありますから、データの量にひるむ必要はないわけですが。
このようにたくさんのデータを取って、詰まるところは何を行うのでしょうか?
一言で言えば、「顧客を知る」ために活用しています。具体的には、1人の顧客が、何曜日のどの時間帯に、どういう俳優が出ている、どういうジャンルの映画・ドラマを見るのが好きなのか。ながら見なのか集中して見ているのか(ポーズのかけ方)。ジャンルのすべてを制覇しようとしているのか、名作とB級との比率はどの程度か、などなど。実際にはマシンラーニングによってクラスタリングを施すので、人間の知性によるクラスタリングとは出てくる結果がかなり異なるはずですが、非常にキメの細かいクラスタリングが行われていることは確かです。
このクラスタリングを施す理由は、「同一クラスターの顧客は、同じような視聴行動を取る」という前提があるからです。クラスタリングが正確に行えれば、ある顧客が金曜の夜にどういう映画・ドラマを見るかが予測できます。同社では、1人ひとりの会員の総視聴時間をもっとも重要な指標とし、それを増やすように、非常にキメの細かい方策を繰り出しています。その会員が金曜の夜に見そうな作品が予測できれば、金曜夜にウェブにアクセスしてきた時に、リアルタイムでそれをレコメンドできます。高い確率でそれをクリックしてくれれば、同社のビジネスは安泰、あるいは成長軌道にあるわけです。
古典的な流通小売のモデルでも、1人の顧客が商店主の顔なじみであり、生活や購買行動のクセ、その人のライフイベントなどを知っていれば、ほどよいタイミングで、最適な商品をレコメンドできます。それと同じことをNetflixはより大規模に行っているのです。同社では、75%の視聴行動が、パーソナライズされたリアルタイムレコメンデーションから発生しています。
(資料 http://www.wired.com/2013/08/qq_netflix-algorithm/)
■ポイント3 すべての商品に顧客目線でタグをつける
顧客のクラスタリングができたとしても、それにマッチングさせる映画・ドラマはどうやって選んでいるのでしょうか?
映画やドラマは非常に感性的な商品であり、Aという顧客クラスターには、どういうジャンルやテイストの作品を勧めればいいのか、普通は悩みます。一般的には、特定のクラスターが過去に見た作品をレコメンドするわけですが、そのような機械的な方法でよいのでしょうか?
Netflixでは、映画・ドラマという感性的な商品をマシンリーダブル(コンピュータシステムで利用できる形態)にすることを目的に、保有しているすべての映画・ドラマコンテンツに、「手でタグ付け」(hand tagging)しました。すなわち、同社のスタッフが実際に視聴して、いくつかの基準によって、複数のタグを付けて行きました。これは大変に手間暇のかかる作業だったそうです。
タグは、「○○(年齢層)向けの、○○の主演による、○○を舞台とした、○○年代制作の、○○をテーマとした、○○というジャンルの作品」、という具合に、いくつかの分類基準を組み合わせた、人が読んでも意味のわかる構造(シンタックス)で成り立っています。同社が収蔵しているコンテンツは数万はあるでしょう。それらを、40人の映画に精通する外部契約スタッフにより、全部見てもらって、タグ付けしたそうです。タグ付けにあたっては、誰が行っても同じようなタグが付けられるように、数十ページに及ぶマニュアルを作成し、トレーニングを行った上で実施したとのことです。
(資料 http://m.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/ )
これにより、Aという顧客クラスターが好んで見る作品は「全世代向けの、米本国を舞台とした、90年代の、親子愛をテーマとした、アクション映画」という具合に記述することができ、合致する映画をすぐに抽出することができるようになります。このタグ付けにより、最終的には7万以上の映画ジャンルに分類されたそうです。
報道などによると、ここまでやっている同業他社はないようです。このように手間暇をかけたプロセスをやりきったことにより、同社のリアルタイムレコメンデーションの精度が著しく向上し、上述のように75%の視聴行動がレコメンデーションに基づくというところまで来たわけです。個人的には、この手間暇のかかるアナログな作業をやりきったことが、同社の競走優位の源泉になっているのだと考えています。
同社のこのやり方は、感性的な評価が購買のカギになる商品ジャンルすべてについて有効でしょう。アパレル、アクセサリー、食品、飲料、書籍、音楽など、商品アイテムが数千〜数万ある分野について、レコメンデーションの精度を上げるためには、訓練されたスタッフによる、人力のタグ付けが有効です。いったんタグが付いてしまえば、機械処理可能な商品になり、ビッグデータ活用が何倍にも生きてきます。また、後述するように、商品の仕入れや、新商品開発にも活用できるようになります。
続く後編では、以下の4つのポイントを説明します。
<後編(後日公開予定)>
■ポイント4 売上高・利益率を改善する指標を集中的に攻める
■ポイント5 データから仮説を作ってレコメンデーションの精度を日々改善する
■ポイント6 データで売れる商品を仕入れ、データで新製品を開発する
■ポイント7 クラウドを徹底的に活用する
【執筆者情報】
今泉大輔
ITジャーナリスト主にエンタープライズコンピューティングを担当。消費者向け書籍も複数(1996〜2013年)。大手銀行系シンクタンク・米系大手IT企業のリサーチャー(2003〜2010年)。インフラ案件形成コンサルティング(2011〜2014年)
ブログ:インフラ投資ジャーナル
(株)インフラコモンズ代表取締役