1.マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(2/2)まとめ
・問題解決に関しては創造性を発揮し、新しい解決策を提案することを恐れない事
・モデルを構築したり分析を実行したりするときは、常にビジネスへの影響を念頭に置く事
・ビジネスに対する理解と洞察力を持ち良い仮説を立てる事が大事だが且つに固執しない
2.解決策を主導する事の重要性
以下、www.kdnuggets.comより「5 Lessons McKinsey Taught Me That Will Make You a Better Data Scientist」の意訳です。元記事は2021年7月、Tessa Xieさんによる投稿です。
アイキャッチ画像のクレジットはPhoto by Louis Vanleer on Unsplash
レッスン3)解決策を主導する事がNo1となる条件です
これはデータの才能に限定されません。
これは、会社のあらゆる職務/役割の人々にとって不可欠です。もちろん、問題を特定して懸念を提起できることは非常に価値がありますが、さらに評価されるのは、潜在的な解決策を提案できることです。部屋に解決策を主導する人がいなければ、議論はしばしば輪になって進み、前進する道を見つけようとするのではなく、問題に執着する可能性があります。
ほとんどのトップコンサルティング会社では、ソリューション主導タイプであることがNo1の法則であり、私の意見では、このアプローチはテクノロジーの世界にも移行する必要があります。
データサイエンティストとして働いていると、分析に関する知識が不足している人々からばかげたデータを要求されたときに、イライラする状況を頻繁に経験する可能性があります。
私は無数のデータサイエンティストがそういった状況を処理するやり方を知らず、絶え間なく否定論者のように行動して関係者間の調整に失敗するのを見てきました。そういった依頼をシャットダウンするのではなく、解決策主導で、データと分析ツールをよりよく理解することで、依頼を再定義し、必要なデータの範囲を狭める事を支援します。
ソリューション指向であることは、どんな依頼にもノーと言うことができない、または常に完璧なソリューションを作成しなければならないという意味ではありません。それはあなたが発言する全ての「いいえ」の後に「しかし、こうするのはどうでしょうか」と続ける選択肢を常に持っておくべきであることを意味します。
これを実践する方法
問題に遭遇したときは、チームまたはマネージャーの反応を探る前に、問題に対処できる可能性のある方法を考えてください。問題解決に関しては創造性を発揮し、新しい解決策を提案することを恐れないでください。また、仕事の本流から外れて、ビジネスや他のチームの作業について詳しく知ることも役立ちます。全体像を把握することは、通常、点を結び付け、創造的な解決策に導くのに役立ちます。
レッスン4)ビジネス現場におけるモデリングは、解釈可能性が精度よりも重要です
本当に解約の有無を予測したいと思っている人は誰もいません。誰もが解約を理解しようとしています。
現在、あらゆる企業が解約を予測するためのモデルを構築していますが、そもそも解約を予測したかった理由を自問自答するのは困難です。企業は解約を予測して、解約を防ぐための実用的な解決策を見つけたいと考えています。それなのに、あなたのモデルがCEOに「Web訪問数の立方根が解約数を予測する最も重要な特徴の1つです」と言った場合、彼はその情報で何ができるでしょうか。おそらく何もできません。
多くの皆さんと同じように、データサイエンティストとして、私はモデリングに関して成功の指標として精度のみに焦点を当てていました。しかし、説明のできない特徴を追加し、ハイパーパラメータを微調整することで精度を96%から98%に上げることは、ビジネスへの影響に結び付けることができなければ、ビジネスにとって何の意味もないことに徐々に気づきました。
(これもビジネスの世界で使用されるデータサイエンスのみに当てはまります。機械学習の特定の領域では、この精度の増加はおそらく非常に重要です)
モデルがブラックボックスの場合、経営陣から信頼を得ることも困難です。モデルは、1日の終わりにビジネス上の意思決定を導くためのツールであるため、その価値が主にその実用性と解釈可能性に基づいていることは驚くべきことではありません。
これを実践する方法
モデルを構築したり分析を実行したりするときは、常にビジネスへの影響を念頭に置いてください。
モデルを構築するときは、モデルにランダムに変更可能な特徴を与える事を避け、そのうちの1つを固定できないか考えてください。代わりに、モデルの構築を開始する前に、特徴エンジニアリングの段階で十分に検討してください。モデル/分析から得られるビジネス提案を書き留めることは、モデルを構築するときに行った設計の選択を再評価するのにも役立ちます。
レッスン5)仮説を立てていることを確認しますが、仮説と結婚していないことを確認します
特徴探索から探索的データ分析(EDA:Exploratory Data Analyses)まで、ほとんどの分析の開始点では仮説を立てることが重要です。仮説がなければ、EDAのデータをスライスおよびダイシングする方法や、最初にテストする特徴について方向性は見出せません。
仮説がなければ、ABテストを実行する意味さえありません(それが仮説テストと呼ばれる理由です)。
しかし、私は時々、明確な仮説なしにヘッドダウン分析の段階を掘り下げ、後でウサギの穴で迷子になるデータサイエンティストを観察します。または、さらに多くの場合、データサイエンティストは、仮説の構造化プロセスを完全にチームメンバーに任せ、データを可視化せず、後でそれらの仮説をテストするのに十分なデータがないことに気付きます。私の意見では、データサイエンティストが最初からこれらの仮説のブレインストーミングセッションに参加し、仮説を使用して後続の分析を導き、優先順位を付けることが最善のアプローチです。
仮説は重要ですが、終点ではなく、始点として機能する必要があります。多くのデータサイエンティスト(またはデータサイエンティストと一緒に働く人々)が矛盾を発見したにもかかわらず仮説に固執するのを何度も見ました。
最初の仮説に対するこの「忠誠心」は、特定の物語に合うようにデータを監視したりおよび改ざんにつながります。「シンプソンのパラドックス(Simpson’s paradox、合計したデータを分析する場合と、分割したデータを分析する場合で異なった解釈が出来てしまう事)」に精通していれば、「間違った話」を伝える際のデータの力を理解できます。優れたデータサイエンティストは、データの整合性を維持し、その逆ではなく、データに合わせて物語を転換できる必要があります。
これを実践する方法
良い仮説を立てるためには、ビジネスに対する理解と洞察力を持つことが重要です。データ探索中にあなたを導くためにあなたの心に仮説を置いてください、しかしデータがあなたにあなたの最初の「知識に基づいた推測」とは異なる物語を語っているときは認めるために心を開いてください。
優れたビジネスセンスを持つことは、途中で最初の理論を微調整し、データに従って物語を微調整するのにも役立ちます。
人々はビジネス指向の能力を、2つのタイプの能力に分けることができると考える傾向があります。
それぞれが対極に位置するかのような「分析的な能力」と「戦略的な能力」です。
さて、私はあなたに秘密を教えましょう。最高の「分析的の才能」は物事の戦略的/ビジネス的側面も理解し、ビジネスの利害関係者とコミュニケーションする方法を理解している人です。「戦略的な能力」の最高の才能は、分析とデータについてある程度の理解を持っている人です。
略歴
Tessa Xieは、現在AV業界のデータサイエンティストであり、元マッキンゼーのデータサイエンティストです。熱心な旅行者、ダイバー、画家です。
3.マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(2/2)関連リンク
1)www.kdnuggets.com
5 Lessons McKinsey Taught Me That Will Make You a Better Data Scientist