データサイエンティストの備忘録

外資系コンサルティングファームでデータサイエンティストとして働く筆者がコンサルティング関連の知見やデータ解析技術を活用するために学んだ内容の備忘録

【読書メモ】思考・論理・分析

読んだ目的

  1. 論理的思考はコンサルティングファームで働くコンサルタントとして必須の力であるが、レジェンドコンサルタントの著者の本で学び直したかったため
  2. 分析を生業とする中で、よりインパクトのある分析を行うため

得られた学び

本書には論理的思考と分析ステップが書かれている。構造的に整理されており、非常に示唆深い内容だったため、内容多めに活用したいことをメモしていく。

 

思考

定義:思考者が思考対象に関して何らかの意味合い(メッセージ)を得るために頭の中で情報と知識を加工すること

メッセージを得るには情報収集が必要になる。情報収集とは「思考者の頭の外に対して働きかけて、思考の材料となる情報を増大させる行為」である。

思考のメカニズムは、「情報と情報を突き合わせる」作業で成り立っている。突き合わせるとは比べることであり、比べることで同じ部分と違う部分を見極めている。つまり、思考とは究極的には同じと違うの認識作業である。思考対象の情報要素と思考者の持つ知識とを突き合わせて比べ、全ての各要素について「同じ」と「違う」に分け尽くすことができた状態にたどり着くことができた時に分かったとなる。逆に言うと、「正しく分かる=正しく分けられる」ということになる。正しく分けるためには、次の3つの要件がある。

  1. ディメンジョンの統一:比べる事象や要素が同一抽象水準上にあること
  2. クライテリアの設定:有効な分類基準を選択するために多様な選択肢を持つ
  3. MECE:適切なメッセージを導くために厳密ではなくてもMECE的な検証をする

 

思考成果

「分かる」ということは、「突き合わせて比べ、同じと違うを認識する」という思考のメカニズムそのものであり、その事象の様々な要素を他の事象と比べることによって、違う部分、すなわちその事象の特徴を把握し、その特徴的な部分を集積した認識のまとまりとして、その事象が何であるのかを理解することである。分かることができるのは元をただすと2つの種類の思考成果から成り立っている。

  1. 事象の識別(属性の理解を含む)
  2. 事象間の関係性の把握

識別とは「他のものと比較して、そのものらしさを形成する違いを認識すること」で、その事象の属性の理解も同時に得られる。どのような特徴を持っているかの属性認識には、突き合わせて比べるための属性に関する知識が必要で、体系化された知識を持っておく必要がある。

思考は比べることで「違い」を際立たせることメッセージを得ることであり、違いを明確にするために分類する必要がある。分類は違いで分けて、同じを括ることで考察対象の要素を複数の部分集合に分けることである。良い分類をするためには、体系化=構造化されていることと、正しく分けるための3要素が満たされている必要がある。

 

因果関係

特に重要なのは因果であり、基本的には「結果」である事象の前に生起した様々な事象を突き合わせて比べ、同じ結果が生じる前に必ず登場する事象を見つけて「原因」を特定すればよい。実際には因果関係はかなり複雑な構造をしていることが多い。因果関係を特定するには、まずは相関関係を見つけることだ第一歩で、その次にどちらか一方の事象が必ず他方を生じさせていることを特定する。相関関係が因果関係であることを見極めるための条件が2つある。

  1. 時間的序列:一方の事象が必ず先に起こり、原因としてもう一方が後から起こる
  2. 意味的連動性:経験的に納得して受け入れることが可能な関係性

意味的連動性は特定された原因の妥当性のチェック道具としても有用で、例えば多変量解析などで相関関係があるとしても、自分の知識と経験に基づく意味的連動性がない場合は排除する時に使える。ただ、判断が難しくいわゆるドメイン知識が必要になるケースも多い。

因果補足において下記3点の留意点がある。

  1. 直接的連動関係:ある結果を直接的に引き起こしている原因を見極める
  2. 第三ファクター:二つの事象に対して共通する原因事象が存在しないことに留意
  3. 因果の強さ:原因が結果に対して及ぼす原因的影響力の強さに留意

直接的連動関係は事故における関係はスピードの出し過ぎではなく、スピードの出し過ぎによるブレーキを踏むことが遅れたことが原因となる。スピードを規制すると、車の持つスピードという利点を失ってしまう。因果の強さは、雨と傘をさすは強い関係があるものの、日差しと傘をさすは因果関係が弱いようなケースである。

 

 

論理

定義:論理構造の中で根拠と主張をつなぐ思考プロセス

論理的であることは次の2つから構成される

  1. 形式性:論理構造が妥当かつ、根拠から主張を導く論理が妥当
  2. 納得性:主張の意味内容が現実的に妥当であるか

形式性だけでも論理的要件は満たしている一方で、聞き手が意味内容を自分の知識と付き合わせて納得できるかの判断を行うため、日常用法的要件では主張の現実的妥当性が必要となる。

 

論理展開

論理展開とは、論理的な思考を行う場合に頭の中で情報を加工して論理を形成・構築することであり、主張・結論を導き出す中心的頭脳作業である。論理展開を行い、主張/結論を導き出す思考行為を推論と呼ぶ。

推論とは思考によってある命題から次段階の命題を得ることである。推論の価値は次の2つで構成される。一般的に逆相関の関係にあり、

  • からしさ:どれぐらい正しいか
  • 距離:既呈命題の意味内容とどれぐらい離れているか

例えば、既呈命題「今年の夏はとても暑かった」から次の3つの例を推論してみる。

  1. 今年の7,8の平均気温は例年よりも高かった:確からしさは極めて高いが意味的には同義に近いため、距離は極めて小さく価値はない
  2. ビールがよく売れる:確からしさは気温とビールの関係を考えると問題なく、距離も大きいので価値がある
  3. 米が豊作であろう:ビールと同等に距離は大きいが、暑すぎると良くないケースも考えられるため、確からしさの観点では乱舞な推論になっている。

留意すべきは納得性の問題で、他者に理解してもらうために組み立てる論理構造の場合は、論理展開における命題間の距離が大きすぎると納得感が損なわれてしまう。

 

論理展開の方法論

正しく論理展開する方法は演繹法帰納法の2つある。

演繹法

既呈命題に対して大前提を設定することで次段階の命題の結論を得る。

  • 既呈命題:AはBである
  • 大前提:BはCである
  • 結論:AはCである

適切な大前提を設定することが重要であり、その要件は次の2つである。

  1. 意味内容的に既呈命題を包含していること:AはBに含まれていて、BはCに含まれている包含関係のため、AはCに含まれている
  2. 意味内容が普遍的妥当性を有していること:万人が正しいと認めるだけの妥当性を持つものでなければならない

 

帰納法

複数の観察事象の共通事項を抽出し、その共通事項を結論として一般命題化する論理展開である。帰納法の結論導出プロセスは2つある

  1. 観察事象のサンプリング:①複数の観察事象の全てに何らかの共通事項があって初めて結論が成立、②観察対象群全体を代表するサンプリングをする
  2. 共通事項の抽出:共通事項と非共通事項を括り出し、非共通事項の中の共通事項の括り方という「非共通事項の一般化」がポイントで、厳密性の追求は結論の納得性の観点からの判断に依る

帰納法の結論の正しさを論じる観点は「真か偽か」ではなく、「どれぐらい確からしいか」という基準であるべきである。

演繹法の方が論理性に優れていると思ってしまいがちだが、演繹法の大前提は帰納法によって成立しているため、演繹法帰納法は同程度の不確実性に晒されている。

 

 

分析

定義:収集した情報を要素に分けて整理し、目的に合致したメッセージを得ること

分析の最も基礎的な定義は「要素に分けること」である。要素に分けることとは、分析対象を構造化して理解することである。ある事象の構成要素と、それらの構成要素間の位相(繋がり方/関係性)を明らかにすることである。関係性が分かれば、事象の原因の特定や、因果関係に立脚した手段の立案を容易に行うことができる。

分析の本質は「要素に分けること」に加え、次の3つの要件から成る。

  1. 目的の存在:原因解明や手段の発見等の具体的な目的が存在
  2. 情報収集の必要性:情報=ファクトが存在しなければ、分析作業は成立しない
  3. 意味合いがアウトプット:目的に対して有意な意味合い=メッセージを得ること

 

分析作業

実際の分析作業は4つのステップで行われる。

  1. 分析プロセスの設計:情報収集と分析の作業手順を設計する
  2. 情報収集:分析の基盤となる情報を集める
  3. 情報分析:分析対象を構造化して理解する
  4. 意味合いの抽出:分析対象が持つ特性を読み取る

 

【1. 分析プロセス設計】

分析プロセスの設計要件は次の3つある。

  1. 制約条件:内在条件(時間・手間・費用)/外在条件(目的/期限)を確認する
  2. 作業計画:収集方法、情報分析・処理の手法、担当/時間/費用を決める
  3. アウトプットイメージ:分析成果の具体的イメージ(報告書、計画書の構成)

情報収集と情報分析の時間配分は50:50が理想的で、価値の高いメッセージを得るためには情報を集めるだけでなく、吟味する時間が必要である。

 

【2. 情報収集】

情報とは目的に対して不確定性を減ずるものである。意思決定に寄与しない不確定性を減じない情報はノイズである。情報の効用低減性があり、むやみに情報収集しすぎても不確定性は減じなくなってしまう。理想的な情報収集とは、ノイズを排除し、分析目的に対して寄与度の高い情報だけを最小限に集めることである。

 

【3. 情報分析】

情報分析ではグラフ化して意味合いを探すステップであり、最も重要なコアプロセスである。データ集積の中から定性的な意味合いを汲み取るためには、グラフ化することが有用である。

グラフ化の基本原則は二次元で描かれるグラフにすることである。基本的なグラフの種類は4種類で、これ以外の手法は基本的に使わない方が分かりやすい。

  1. 棒グラフ:2つの変数のグラフか、1つの変数の時系列
  2. 線グラフ:複数サンプルになった場合に、棒グラフより線グラフになる
  3. 点グラフ:二つの変数要素の関係性を表す(相関関係など)
  4. 円グラフ:(本書には記載があったが実際はなし)

 

【4. 意味合いの抽出】

グラフから読み取るべき意味合いは次の2つのパターンがある

  1. 規則性:時間変化による傾向や相関関係等のパターンの発見
  2. 変化:外れ値や変曲点といった規則性を破るポイントの発見

 

合理的分析手法

合理的分析の要件は2つある。

  1. 結論の合目的的性:分析目的を満たした結論が得られること
  2. 分析プロセスの効率性:効率的に分析が行えること

この2つを同時に満たすための手法としてイシューアナリシスが紹介されている。

イシューアナリシスとは、分析プロセスの早期の段階においてイシューを設定し、そのイシューに対して集中的な分析作業を実施し、合目的的な結論を効率的に得ようとする分析手法である。要するに「イシューから始めよ」である。

イシューアナリシスのプロセスは多くの他の本でも書かれている内容なので、詳細は割愛するが、3つのステップで進める。

  1. イシューの設定:フレームワークを使う、合目的的性のマグニチュード(その課題事項がどれだけ目的に合致した結論に寄与し得るか)で判断し、イシュー設定する
  2. イシューツリーの作成:サブイシューにMECEに分解してイシューを構造化
  3. 仮説の検証:設定したイシューに対してYes/Noの結論づけを行う

 

今後のToDo

  1. xx
  2. xx
  3. xx