注目を集める人流データのいま① 進化する推計手法
昨今コロナ禍の影響で、注目が集まっている人流データ。「先週に比べて、人出が20%増えました」といったニュースや記事などを目にすることが増えたのではないでしょうか。コロナ禍で人々の動きが変則的になり、感染拡大防止対策に向けて定常的に人流を把握する傾向が強まったことに加え、多種多様なデータや情報に基づいてビジネスを行う「データビジネス」の広がりによって、位置情報関連市場は今後ますます拡大していくと考えられています。
ビッグデータの一つとして期待される人流データですが、活用するデータによっては落とし穴もあります。それが“精度“の問題です。DXやデータドリブンな経営が浸透しつつある今、誤ったデータや精度の低いデータを知らずに活用すると、重要な経営判断を見誤る危険性があります。これを回避するために、データ活用の本質を見極めることが求められています。この記事では、人流データとして活用する位置情報の種類や、知っておくべき精度の問題、精度を高めるための先進的な取り組みについて解説します。
人流データの仕組み
現在、人流データの多くは、携帯電話の位置情報をサンプルとして収集して特定の場所・特定の時間の滞在人口を推計したものとなっています。ここでサンプルとして用いられる位置情報は、代表的なところで「GPSの位置情報」と「基地局に係る運用情報」(※運用情報とは、携帯電話が接続可能な状態を保つために必要なデータ)の2種類です。
「GPSの位置情報」に基づく人流データ
GPSはGlobal Positioning Systemの略で、人工衛星から発せられた電波信号を携帯電話端末が受信し、かかった時間を基に現在位置を特定する仕組みです。地図アプリや経路探索でよく使われています。
個人の位置をピンポイントに把握するのが得意であるため、数m単位といった高い解像度で人流を推計することが可能です。
一方で、人流の推計データの精度という面では課題が残ります。推計に用いる端末の位置情報は、携帯電話にインストールされたアプリから収集されるため、「アプリを起動」し、「位置情報取得の許諾をオンにしている」といった条件に合致した端末しかサンプルとして挙がってきません。さらに、昨今のOSの、アプリ立ち上げ時に都度ポップアップで許諾確認を入れるなどの制約でサンプルが取れにくくなっていたり、アプリを使う時間や場所に依存するため、連続的に信号を取得することが難しくなっています。結果として、連続性がない不均質なサンプルで推計を行うこととなります。
また、前述の通り、偶然条件に合致した端末しかサンプルにできないため、100人に1人分の位置情報が取れるか取れないかといったレベルになります。
このように質に偏りがあり、量が十分ではないサンプルでは、「人口」という集団を捉える上では正確なデータとしての活用が難しく、課題が残ります。
「基地局に係る運用情報」に基づく人流データ
基地局は、携帯電話が通信を行うために必要な無線通信装置で、日本国内に数十万局以上設置されています。電話やメール、インターネット利用といった通信がいつでもできる様に、各基地局はエリア内にある携帯電話を周期的に把握しており、この情報を元に端末の存在する基地局エリアがわかります。
携帯電話の電源がONとなっている全ての携帯端末がサンプル対象となるため、日本全国どのエリアにおいても、高い割合で位置情報を取得できるというメリットがあります。また、GPSのようにアプリの事情に左右されないので、24時間365日サンプルの連続性を担保でき、過去から現在まで同じ条件で属性の偏りもなくサンプルを安定的に取得することが可能です。
この結果、いつでもどこでも精度高く「人口」という集団を捉えることが可能となります。
ただし、解像度の高いGPSとは異なり、個人の現在位置をピンポイントで捉えることは難しいという課題があります。一方で、全国500m四方単位で安定した精度がでることも検証されています。
人流データの精度を高めるための取り組み
ここまで、GPSの位置情報と基地局に係る運用情報についてそれぞれの特長を解説してきました。それぞれ “解像度”、“精度”といった点で違いがあり、個人を捉える上ではGPS位置情報、統計データとして集団を捉える上では基地局運用情報、のように向き不向きがありました。
今、双方の強みを活かしつつ弱みを補完することで、統計的な精度も高く解像度も高い人口統計を作成するための取り組みが始まっています。
例として、基地局の運用情報を活用して人流データを推計するNTTドコモのモバイル空間統計®の取り組みを紹介します。
図表1はある地域のある時間における人口推計において、GPSの位置情報から推計可能なエリアと、GPSの位置情報を基にした推計人口(月次データ)とモバイル空間統計を掛け合わせて推計可能なエリアを比較したものです。モバイル空間統計の500mメッシュ人口をベースにGPS位置情報を基にした推計結果と掛け合わせることで、GPS位置情報のエリア毎の「サンプルの偏り」が緩和され、推計可能エリアが増えていることがわかります。
図表1
図表2は、図表1の推計可能エリアからP,Q,Rの3地点を選定し、それぞれの地点におけるある時間帯に存在した人口(滞在人口)の時間推移を比較した結果です。モバイル空間統計の大きなメッシュ人口をベースに掛け合わせることで、GPS位置情報の時間毎の「サンプルの偏り」が緩和され、安定的に解像度高く推計できることがわかります。
図表2
さらに、3地点の1日の滞在人口を比較した結果が図表3となります。大小関係が入れ替わってしまっており、掛け合わせることで精度が上がり、結果を見誤るリスクが低減されたことがわかります。
図表3
これがモバイル空間統計の統計的な精度を活用しつつ、GPSのより細かな解像度のデータで人口比を按分していくことで、GPS単独での人口推計と比べてより広いエリアで精度高く推計が可能になるという一例です。もちろん、少数の人数しかいないエリアなどは結果数値を秘匿化し、プライバシー保護も従来のモバイル空間統計同様、ガイドラインに基づき行っています。
このような取り組みを通して、それぞれ単体だけでは実現できないデータの価値を見出すことができ、今後より多くのシーンで人流データの活用が広がっていくことが期待されます。
この精度の高い人流データからどのようなマーケティング戦略が導き出されるのか、次回事例として解説します。
【モバイル空間統計®】
※モバイル空間統計®は、株式会社NTTドコモの登録商標です。
ドコモの携帯電話ネットワークのしくみ(基地局の運用情報)を使用して作成される人口の統計情報です。
集団の人数のみをあらわす人口統計情報であるため、お客様個人を特定することはできません。
インテージは「モバイル空間統計」の1次販売店です。
転載・引用について
◆本レポートの著作権は、株式会社インテージが保有します。
下記の禁止事項・注意点を確認の上、転載・引用の際は出典を明記ください 。
「出典:インテージ「知るギャラリー」●年●月●日公開記事」
◆禁止事項:
・内容の一部または全部の改変
・内容の一部または全部の販売・出版
・公序良俗に反する利用や違法行為につながる利用
・企業・商品・サービスの宣伝・販促を目的としたパネルデータ(*)の転載・引用
(*パネルデータ:「SRI+」「SCI」「SLI」「キッチンダイアリー」「Car-kit」「MAT-kit」「Media Gauge」「i-SSP」など)
◆その他注意点:
・本レポートを利用することにより生じたいかなるトラブル、損失、損害等について、当社は一切の責任を負いません
・この利用ルールは、著作権法上認められている引用などの利用について、制限するものではありません
◆転載・引用についてのお問い合わせはこちら