2017/07/06

ビッグデータマガジン編集部です。
今回は、ここ最近発表されたビッグデータ関連ニュースの中から、編集部が気になったものをまとめてご紹介します。
① TOKIOとミスチル、矢沢永吉と郷ひろみの意外な類似性 ~16万曲の歌詞を分析・可視化してみた~
データ分析手法は様々ありますが、テキストデータの分析方法の一つに「形態素解析」があります。
形態素とは、言語で意味を持つ最小単位のことです。形態素解析とは、その最小単位にテキストを分解する手法のことです。さらに、分解した形態素ごとに品詞の判別も行うことができます。例えば、「吾輩は猫である」は、「吾輩」(名詞)、「は」(助詞)、「猫」(名詞)、「で」(助動詞)、「ある」(助動詞)に分解されます。
Yahoo!JAPANは、そんな形態素解析を活用し、GYAO!の歌詞サービスと連携し歌詞の日本語処理分析とその結果のデータビジュアライズに取り組みました。
TOKIOとミスチル、矢沢永吉と郷ひろみの意外な類似性 ~16万曲の歌詞を分析・可視化してみた~
http://docs.yahoo.co.jp/info/bigdata/special/2016/05/
分析の結果、歌詞に登場しやすいワードが品詞別にランキングで分かりました。名詞1位は「君」、形容詞1位は「強い」、動詞1位は「見る」でした。また、アーティスト別の特徴語というものも独自のロジックで導き出しました。それによると、例えばTUBEの特徴語は「夏」となり、イメージ通りの結果が得られたといいます。
こうして、テキストデータを単語レベルの形態素に分解、分析することで、日常にある“音楽”というものを普段とは違う視点で見ることができるレポートが完成しました。
Aritst Clustering
http://docs.yahoo.co.jp/info/bigdata/special/2016/05/app/
この形態素解析という手法、他にもさまざまな応用が試みられています。
例えば、ライゾマティクスの真鍋大度氏が手掛けた「Love Song Generator」。こちらもYahoo!JAPANと同様、楽曲の歌詞を分析し、人が話した言葉を単語レベルに分解し、即興でラブソングを作成するというものです。
https://www.youtube.com/watch?v=HSpXPITSQSw
更には今後、小説やスピーチの原稿などにも応用が広がり、どの言葉をどれだけ入れればよい文章が完成するか、ということも分かるようになるかもしれません。
今後の活用・発展が期待されます。
② ドローンとビックデータで気象情報を把握…米国で研究進む
今年は関東では梅雨にあまり雨が降らず、ダム貯水量の減少も問題になっていましたが、夏になってからは打って変わり、相次ぐ台風によって降水量が増え、土砂災害などの局地的な被害も発生しました。
日本以外でも、世界的に干ばつやゲリラ豪雨などの異常気象が問題となっている中、米国ではハリケーンの被害を最小限にするため、新たな気象データの取得と活用が始まっています。NOAA(米海洋大気庁:National Oceanic and Atmospheric Administration)を中心とした、ハリケーンの進路や勢力を事前に予測する取り組みです。
ドローンとビックデータで気象情報を把握…米国で研究進む
https://roboteer-tokyo.com/archives/5708
記事で取り上げられているのは、「グローバルホーク」という無人探査機で、私たちがイメージするようなラジコンサイズのドローンではありません。「グローバルホーク」は、ハリケーンの中に直接飛び込んで観測を行います。観測データは、ハリケーンの広域データと、風速、湿度、気温等のデータです。これまでは、有人探査機が直接ハリケーンの中に飛び込んで観測しており、データ収集は非常に危険な作業でしたが、グローバルホークが投入されてからは、安全面が改善され、さらにデータ精度も高まったといいます。
このように、状況に応じた移動観測で高精度な気象データを収集することで、昨今の突発的な異常気象に対応しようという試みです。
日本では、まだアメダスなどでの定点観測に加え気象レーダーを用いるのが主流ですが、いずれはドローンの活用が広がり、詳細な被害予測が可能になってくるかもしれません。
③ AI「乱立」時代には、「非合理的な」意思決定が求められる
“AI”という言葉をニュースで見聞きしない日の方が少なくなってきました。これからは、分野に関わらず多くのものにAIが使用される時代になっていくでしょう。また、AIによって今後10~20年で47%の人が職を失う、などとも言われています。そんな時代だからこそ、よく考えておきたいのは、「人間の役割」です。その点について、一つ参考になる記事をご紹介します。
AI「乱立」時代には、「非合理的な」意思決定が求められる
http://www.sbbit.jp/article/cont1/32622
記事では、「定性データ」の分析がAIと人間を分かつカギになるかもしれないと説いています。これはつまり、収集したデータそれ自体に意味や感情はありませんが、それらを付け加えるのが人間だけにできる役割になる、ということです。例えば、GPSで人の移動経路はデータとして収集できます。しかし、それだけではその人がどんな目的で、何を思ってその経路を移動したのかは分かりません。そのようなことはあくまで人間が考えることになります。
その他、過去のデータから最適解を導き出すのはAIの得意分野ですが、あえてその最適解から解をずらし、ある種非合理な意思決定をすることができるのも、(今のところ)人間だけの能力だといいます。これは、特にクリエイティブな分野で重要になってきます。
そして、そのような能力を高めるには、より“総合的、分野横断的な”ものの見方と、“人間性への深い理解”が必要になってくるとも述べられています。それらは、専門知識をひたすら深化させていくことが得意なAIとは対極の能力です。
異なる知識の掛け合わせや、はっとさせるような意外性など、決まったレールから外れた発想をする力が、これからのAI時代には私たちにとって重要になってくるのかもしれません。
(星野 翔一)