データ自体に十分な価値はない
データは財産だけど!
データは、数値、写真、マスタデータ、”つぶやき”など、まさにビッグデータとして増殖している。個々のデータは個人の夕食に食されたモノの写真であったり、POSレジでパートさんが無意識に叩いたキーから生まれる実績データであったり、日常の活動の途中でうまれている。
左の写真は筆者の生まれ故郷の神楽坂商店街の写真だ。読者の皆さんは神楽坂の写真から何を読み取るだろう。この写真データそのモノはJPEGの116KBのデータでしかない。しかし、ここに昭和33年当時の同じ場所の写真があるとどうなるだろう?
およそ50年前の同じ場所を写した写真データがあれば比較することで、様々なことが浮かび上がるだろう。単位面積当たりの通行人の数をカウントすると商店街の集客力を比較できるかもしれない。看板の内容を比較することで飲食店比率を推定できるかもしれない。ここに新宿区の人口統計データを準備して昭和33年の神楽坂5丁目人口と平成27年の同じ神楽坂人口を比較することで神楽坂の栄枯盛衰を推定できるかもしれない。
しかし、そこに実在していた”私”には私固有のメモリーがあり、そこから引き出される動画データには、『毘沙門天のおまつりは、”ソース焼きそば”と”あんず飴”が並び、終ることのない人通り』なのだ。その文脈において2014年の毘沙門天周辺の写真データは意味がある。複数のソースからデータを引き出すことで比較ができることが重要です。さらに重要なのは、比較するヒトのアタマに読み取る文脈があることです。
真の価値は、複数データセットの中から浮かび上がるストーリーにこそあります。価値の源泉は、そのデータの時間軸をズラして比較したり、データ自体を並び替え、平均値やバラツキを診たりして、”なぜ”そんなバラツキが起きているのか考察することによって得られるイマジネーションや洞察から生まれるストーリーを描くことにあります。
実際に「新宿区 住民基本台帳の町丁別世帯数及び男女別人口(日本人のみ)」というデータを過去と比較すると写真データには意味が付加されるのです。
ERPやExcelに切り離されたビジネスデータからは、部分的なストーリーしか得られません。ビッグデータの真の価値は、異なるデータセットにある法則性、関係性、共通グループの存在を見つけ出せるか否かにかかっています。
そうした法則性、関係性、共通グループの存在から、より大局観あるストーリーが得られ、より説得力が生まれることが多く、ビジネスにリアル・インパクトを与えることが可能になるのです。
Recent Posts
製造現場で発生する異常や不良は発生頻度が低く、異常データを学習させることが難しいというが・・ほんとう?
故障予知といっても1年に2回もおきない事故データを統計学習させるには数年待たないと実務にのらな...トポロジー最適化を考える
先だって、日経新聞の記事で「マツダ、車体平均3%軽量化 「電脳」味方に設計改革 限界突破の設計...Microsoft AzureがSAP_HANAを「どこでも開発やテスト」可能にする
Microsoft AzureがSAP HANA, express editionのコンセプト...SAP HANAとRインテグレーション
SAP_HANAは単なるインメモリーデータベースではない ”R”をデータサイエンス・演算エンジ...数理最適化の展望:都市基盤安全工学国際研センター・オープンレクチャー:Edward Rothberg氏 / Robert Bixby氏 講義
最適化エンジン:Groubi生みの親Robert Bixby氏とEdward Rothberg...