データリテラシーを資産にする6つの理解と3つの不明

データ主導のオペレーションループを支える全体の構造

これはなにか

「コピーされない競争優位の築き方」と題して2019年末に社内向けに公開した資料をベースに、コピーされない競争優位を作るために重要な3つの要素と、それが生まれるプロセスを図解したものである。

本テーマは下記のような3部構成となっており、今回のポストは前回に続く第三弾である。

  1. 競争優位の3源泉の説明とそれが生まれるプロセスについて
  2. 「良いオペレーション」を支える構成要素について
  3. 構成要素を作る上で最優先で取り組むべき点
第一弾の記事

これはなにか 「コピーされない競争優位の築き方」と題して2019年末に社内向けに公開した資料をベースに、コピーされない競争優位を作るために重要な3つの要素と、それが生まれるプロセスを図解したものである。 全体構造 プロセス全体の説明、[…]

第二弾の記事

これはなにか 「コピーされない競争優位の築き方」と題して2019年末に社内向けに公開した資料をベースに、コピーされない競争優位を作るために重要な3つの要素と、それが生まれるプロセスを図解したものである。 本テーマは下記のような3部構成と[…]

前回のポストでは「良いオペレーションを生む、データ主導のオペレーションループ」と題して、良いオペレーションが生み出されるフローと、その重要なポイントとして「行動のセンシング」と「データの整理」を挙げた。
今回のポストは、その「行動のセンシング」と「データの整理」を行う基礎となる、データ文化の浸透/データの扱いに関する組織的なリテラシーをテーマとする。

行動のセンシングとデータの整理を支えるもの

データ主導のオペレーションループが上手くいく前提として、行動のセンシングとデータの整理が重要であることは前回述べたとおりだが、これらを成立させる条件の全体像を整理すると以下の図のようになる。

データ主導のオペレーションループを支える全体の構造

このループを支える基盤が存在し、その基盤も2層構造になっている。
ハード面であるインフラ層と、ソフト面であるリテラシー層である。

インフラ層については、データアーキテクトやデータマネジャーといった専門職の方の説明のほうが正確なため本ポストでは扱わない。ここではリテラシーの浸透を取り上げる。

データリテラシーの浸透

データリテラシーの浸透というのは、データを読み書きできる能力や応用・活用・理解できる状態に組織全体がなっていることを指す。

このデータリテラシーの浸透はさらに下記のような2つの要素に分解できる。

  • データの扱いに関する組織的な共通理解(=カルチャー)
  • データを扱うスキル(=テクニック)

以降、詳述していく。

CULTURE: データの扱いに関する組織的な共通理解

データの扱いに関する組織的な共通理解として、下記の6要素が重要だと考えている。

データの扱いに関する重要な6つの理解
  1. 得意不得意の理解 
  2. 解釈の幅広さの理解
  3. 欠損の不可逆性への理解
  4. 管理の重要性への理解
  5. 難易度とコストの理解
  6. 利用目的の理解

1. 得意不得意の理解 

データはなんでもわかる魔法ではない。データの量・質によっては何もわからないことも多いし、定量的な分析に向かない事柄も存在する。

「データ分析でよろしく!」とか「機械学習でなんとか…!」といったプロジェクトが失敗するのはこのデータの得意不得意を理解していないからである。

2. 解釈の幅広さの理解

データには解釈の余地が幅広くあり、データを用いた分析等を行った場合でも人によって結論が異なってしまう。

データ(事実) ✕  解釈(主観) = 意味のある情報(意見・主張)

という式が成り立つためである。

主張とともにデータを出されたら「はい、ファクト」と短絡して考えてしまいがちだが、それは間違っている。データはファクトだが、ファクトベースの意見はファクトではない。

データそのものは「事実」なのでファクトだが、それをベースにして、解釈を通じて意味のある情報や主張に変換した時点で、主観を含む意見になるからだ。この意見は、解釈の仕方や立場・見方によって変わるので、ファクトではない。

データは解釈の仕方によって、人間の数だけ結論が分かれるという性質を持つ。

3. 欠損の不可逆性への理解

失われたデータは二度と返ってこない。

どこかで取得していた情報が一時的に消えてしまった場合などであれば、復元が可能かもしれないが、取得すべきタイミングで取得しそこなったデータを取り直すことはできない。

データの欠損は不可逆的な事象であることを理解しないと、気づいたときにはすでに多くの活動データが失われていたという悲劇が起こる。

4. 管理の重要性への理解

適切に管理されないデータは、使いにくいデータ構造となり、データの整理が実践されない。

適切にデータの管理がなされていないと、データへのアクセス、利用難易度が上がってしまい、結局利用されないということになる。また、利用されず価値がなくなるだけではなく、重複・欠損など低品質のデータによって結論が導かれるとミスリードにつながる。

5. 難易度とコストの理解

データは石油に例えられることが多いが、データから価値を抽出するのは時間も労力も必要である。

各現場から採掘されたデータはデータパイプラインを通って、クレンジングされ不純物が取り除かれた状態で、データベースに保存される。そこから利用用途に応じてデータを抽出し、加工して、意味ある情報として必要な人のもとに届けられる。

この全工程に必要なインフラに対して時間・労力面で初期投資とメンテナンスコストがかかる。

6. 利用目的の理解

データを意思決定の論拠に使うという共通理解のことを指す。

この理解が組織内で共有されていないと、データで論証された結果と逆の行動をしたり、意思決定のためにデータを見るという目的を見失う。

データ分析では分析を実行する前に仮説を立て、「Aという結果であればA´を実行、Bという結果であればB´を実行」というように事前にアクションを定めておくことが重要だが、意思決定のためにデータを見るという目的の共通理解がない組織では、結果による行動変容が計画されずに「とりあえず見てみたいから見る」といった分析を行う事が多い。

分析の話なので、データを扱うことに関する理解からは脇道にそれるが、分析は分析で下記のような理解が組織内にないと議論が混線することがある。

  • 仮説なく、探索的に分析をしてはいけない
  • 分析は理解し易さを上げるために正確性を捨てる行為である
  • 分析は「なんとなくそれっぽい」を「高い確度でそうだと言える」状態にする行為である

TECHNIQUE: データを扱うスキル

データを扱うスキルで解決すべき3つの不明

データを扱うスキルとは主にSQLの読み書きのことである。
レベル感でいうと、簡単なデータ出しは自分で出来るくらいのスキルがあると理想である。

高度な分析は専門のアナリストに任せ、自分で業務で使うちょっとしたデータくらいは自分で取れるようになることが大切である。

また、このスキルの前提には、わかりやすく安全にデータを取り出したり加工したりすることを試せるような、Data Warehouseの整備やデータ構造が必須となっている。

  • どこにどんなデータがあるのかわからない(場所の不明)
  • それぞれのデータの定義や意味がわからない(定義の不明)
  • データを破壊してしまう恐れがあって触れない(安全の不明)

このような3つの不明ががあると、スキルを身に着けたり試す事ができなくなってしまう。

カルチャーとテクニックがない組織はどうなるか

ここまで、述べてきた文化面、技術面での組織的データリテラシーが欠落するとどういったことになるのか。

データを扱うことへの理解がない場合

この場合、下記のような事象が発生する。

  • 適切なインフラ整備への時間的・人的・コスト的な投資がなされない
  • 設計と管理・運用がなされず、データの整理が行われない

その結果、センシングの基盤やデータパイプラインが整わず、センシングと整理の失敗につながる。

データを扱うスキルが各個人にない場合

一方、こちらのケースでは下記の事象が発生する。

  • データを使うのは一部の人間という空気が醸成され、一部の人間しかデータに触れない組織文化になる
  • 馴染みがないため、データをもとに意思決定することやデータに重きを置かないチームになる

データにまつわる物事の重要性が相対的に下がることで、センシングと整理の失敗につながってしまうため、組織に対してデータの理解を広めることが重要になる。

データリテラシーを涵養する『データの民主化』の取り組み

これらの組織におけるデータ理解を涵養し、組織的なデータリテラシーを高めるためにはどうすると良いのか。ここではトップダウンとボトムアップの両面のアプローチがあると考えている。

トップダウン・アプローチ

適切なインフラ投資には、リソースの配分設計が伴うため、トップダウンのアプローチが向いている。

例えば、データ専門のチームが存在しない組織で、片手間にアプリケーションの開発チームにデータインフラの整備をアサインしたところで、上手く行かない。
ゴールや目的がチームのメインのミッションと異なるからだ。

組織構造と各チームへのミッション配分を変化させる必要があるため、トップダウンでのアプローチが適している。

これらの組織構造や人事差配は組織へのメッセージとなるので、トップの理解と実行が重要性浸透のカギとなる。

ボトムアップ・アプローチ

一方、データを扱うスキルや、データ理解を広げていく活動はボトムアップが適している。

実際に現場の実務で役立つ取り組み、即業務に生きるスキル、足元の業務に関連するテーマでないと、学習が進まないからだ。
業務に忙殺されるなかで、机上の空論のような手触り感のないお勉強に割く時間はなかなか取れないだろう。

下記メルカリでの事例では、有志の勉強会を中心に各チーム内にデータに強いメンバーを育成し、そのメンバーが自分の所属するチーム内でエバンジェリストのような立ち位置で広めていく形式を取っている。

Web担当者Forum

「意思決定者と比較してアナリストの数が少ない」という課題をデータ分析民主化で解決する…

当社でも、元メルカリAnalystの@anbooが中心となり、SQLや分析について気軽に尋ねられるコミュニティの運用、各種データ基盤の整理を進めている。

一番の投資先は人と組織文化

第一弾のポストで、競争優位を生み出す3源泉と称してデータ、ブランド、ネットワーク効果を貯める必要があり、そのサイクルを回す中心になるのが、良いオペレーションの構築であると書いた。

続く第二弾のポストでは、良いオペレーションのカギを「行動のセンシング」と「データの整理」に求めた。

そしてそれらの成否は、組織的なデータを扱う文化資産の蓄積ができるかどうかによって分かれると考えている。

最終的には人とその人が作る組織文化によって規定される要素が大きい。また、組織文化は構成員の意思決定、言動の積み重ねの結果として生まれるものなので、最もコピーすることが難しい。

そういった点から考えても、競争優位を生む3源泉に加えて、組織文化の涵養が最も強力な競争優位の源泉かも知れない。

まとめ

  • 適切なセンシング・データの整理を行うにには、データを扱う組織的なリテラシーが重要
  • 組織的なリテラシーはトップダウンとボトムアップ両方のアプローチによって作られる
  • データ・ブランド・ネットワーク効果に加えて、組織文化の涵養が重要な競争優位の源泉

Twitterもやっています。よかったらフォローしてください!


一緒に働くメンバーを募集しています

株式会社ドクターズプライム

「救急車のたらい回しをゼロにする」というビジョンの実現に向けて、病院向けのSaaSプロダクトおよび、医師/病院間の最適なマッチングを提供するマッチングプラットフォームを展開する会社を経営しており、創業期のメンバーを募集しています。採用情報はこちらから。興味を持っていただけた方はフォームからでもTwitterからでもお気軽にご連絡ください!