住宅ローンのプリペイメントリスクマネジメント ③ブーステッド・ツリーモデル


■ 今回のポイント

  • ブーステッド・ツリーモデルは、実績データからプリペイメント有無という結果を説明する「決定木」を何百・何千通りも作り、機械学習と呼ばれる手法を用いて、金利や年収などの影響因子の効き目を調整していくモデル化手法です。
  • ブーステッド・ツリーモデルは、何百・何千もの「弱い決定木」を、機械学習を通じて統合していくことにより、「強い決定木」の問題点を克服しつつ比例ハザードモデルでは難しい、非線形的な現実を表現できます。

③ブーステッド・ツリーモデル

ブーステッド・ツリーはコンピューターの処理能力の飛躍的向上によって近年扱うことが可能となってきた「機械学習」*1と呼ばれるモデル化手法の一つです。

   *1機械学習とは、ある程度の規模のデータ集合ごとに解析を繰り返し、データ
    集合ごとに成立する規則や判断基準により定量化のアルゴリズムを多数生成・発展
    させていく手法で、膨大な計算量が必要なために、近年ようやく実務への適用が
    始められている手法です。

ブーステッド・ツリー手法では、保有データを分析用と検証用に大別した上で、分析用データからランダムにデータ抽出を行って何百通り、何千通りのデータ集合を生成します。

次に、それぞれのデータ集合ごとに、不純度や曖昧さを基準に尤もデータを上手く分割する影響因子と閾値を用いて、第1層、第2層程度までのノード(結節点:ここでは影響因子を指す)で決定木(Decision Tree)を作成するのです。(不純度や曖昧さにはエントロピー*2などを使いながら、下図のような決定木を何百、何千通りも生成します。その際、データ集合ごとの特徴に応じてノードの種類や閾値が異なります。)

   *2エントロピーとは、情報の不確実さの度合いのこと。任意のノード・閾値に
    おいて左右への分岐数が同等であれば1(最も不確実)、すべてのデータが
    左右いずれかに分岐する場合は0(最も確実)としてアルゴリズムを生成します。

弱い決定木(イメージ)
( )内の分母はサンプル数、分子は分岐該当数

上図の終節(グレーの箱)の( )内に着目すると、ノードが2階層程度では通常、分子=分母又は分子=0のいずれかに分岐し切らず終わっています。このような決定木を「弱い決定木」と云い、これを多数生成し分析結果を統合して最終的なシミュレーションを行うのです。またその過程では、先行分析した決定木の分析結果に応じて影響因子の重み付けを行う(これが機械学習と云われる所以です)ことで精度を上げていきます。

一方、最下層において観測結果が綺麗に分かれるよう影響因子のノードを第3層、第4層、・・・と深掘りする決定木も作れます。例えば下図に示すような木を「強い決定木」と云います。

強い決定木(イメージ)

強い決定木は、分析結果がYes,Noに完全分離されるまで(=エントロピーが0になるノードまで)階層を深めるので、観測結果とは一致しますが、以下の点で問題があります。
  ① オーバーフィッティングしやすい
  ② 異常値があるとそれに引きずられる
  ③ 不可逆的である
要は、ヒストリカルデータを使って将来予測をするという目的に照らしたとき、「強い決定木」は金融機関が保有するデータの属性に全て帰着させて(真の因果関係はさておき)解釈させ過ぎるということです。

「弱い決定木」の集合の場合、1本1本は説明力が弱いのですが、それぞれの木が様々な特徴を持っており、それが決定木の統合過程で機械学習を通じて精度を高めるため、「強い決定木」の問題点を低減させながら、モデル全体として複雑な特徴(=非線形的特徴)も表現できるのです。

なおかつ、ブーステッド・ツリー手法は最初に全体データを分析用と検証用に大別しており、モデルはあくまで分析用データだけで構築しているため、構築時には使用していない検証用データをモデルに投入してみることによって、モデルの精度を検証することができるのです。

注:本稿で紹介したグラフは、すべて筆者の経験に基づいて想定データを作成し、そのデータをグラフ化したものです。

この記事を評価してください!

現在のスコア: 5.0

コメントを残す

メールアドレスが公開されることはありません。

【コメント投稿規約】
記事に対するコメント欄へのコメント(以下、「投稿コメント」という)については、以下のとおり取り扱うものとします。
1.投稿コメントは、ホームページの改善やプロモーションに活用させていただくことを目的としています。当社の判断にて、投稿コメントをホームページ等に掲載し、公開する場合がございます。また、原則として、掲載した理由または掲載しなかった理由の説明等はいたしません。
2.投稿コメントに個人情報その他の公開に不適切と判断される情報があった場合は、当社の判断で一部削除・編集したうえで公開する場合があります。
3.投稿コメントの内容について、それぞれの記事に無関係な内容の投稿はご遠慮願います。
4.投稿コメントに対して、当社は回答する義務を負いません。記事やその他コンテンツに関するお問い合わせは、お問い合わせフォームをご利用願います。
5.投稿コメントの内容に関する一切の責任はコメントを投稿した利用者自身が負うものとし、当社は投稿コメントの内容に関して一切の責任を負いません。
6.投稿コメントの削除や変更の依頼が利用者からあった場合、当社は応じる義務を負いません。
7.投稿コメントに関連して利用者の間で発生する議論や紛争等については、当社は原則関与いたしません。
8.投稿コメント機能の利用について、利用者に保証する責任を当社は負いません。
9.投稿コメント機能の提供を当社は予告することなく中止することがあります。

まりおの住宅金融雑論
春日日和(かすがびより)
今日も、直球勝負!

ページの先頭へ戻る