ブートストラップの備忘録

ちょっと勉強したので核となる考え方あたりの備忘録。ちょっと古めの本だから最新の知見とかだとちがう見方してるかも?

導入

Xを確率分布Fに従う確率変数とする。Fに関する興味のある情報(各種モーメント、分位点など)を T(F)で表す。ここでT(F)Fに関する期待値E_Fの形で、すなわち

 \displaystyle T(F) = E_F [R(X) ]

と書けるとしておく。*1

さてこのT(F)だが分布T(F)が一次元の正規分布だとしても解析的に求めるのは結構めんどくさい。単純な平均でも素朴に計算すればガウス積分とかだるいし、分位点なんかお手上げ。

しかも実際には…

  • 正規分布よりももっと汚い形の分布だと本格的に積分計算ができない。
  • 多次元の分布だとさらに積分計算ができない。標本平均みたいに分布から複数サンプルを取り出して計算するやつの挙動を調べるのもアウト。
  • というか分布Fは基本的に未知。これをなんとかしてデータから推定するのがそもそもの問題。

ということで推定方法を考えないといけない。

経験分布で推定

いろんな方法が考えられるが今回は経験分布\hat F *2の情報 T(\hat F)を使って推定することを考える。 (ある意味このFじゃなく\hat Fに興味を移すという考え方が今回一番の肝かも)

経験分布なら既知だし期待値の解析的な計算も比較的しやすいしこれで解決…とはならない。 i.i.d.標本の挙動を調べたり、高次元の分布だったりすると計算量がエグいことになる。

例:標本平均

分布Fからn個の観測値(x_1, \cdots, x_n)を入手してそれぞれに確率1/nを割り当てた 経験分布\hat Fを作成した。この経験分布からのm個のi.i.d標本(X_1, \cdots, X_m)から作られる標本平均 \overline Xの挙動を知りたいとする。

例えば\overline Xの各種モーメントを求める際には(X_1, \cdots, X_m)の実現値を考えないといけない。 X_iの実現値はn通りあるので、(X_1, \cdots, X_m)の実現値は n^m通り。 解析的に解くにはこのパターン全部考えて和をとらないといけない。オワリ。解散。

ブートストラップ

はい、解析計算には限界があるので数値計算をしましょう。 ということで出てくるのがみんな大好きモンテカルロ法

 \displaystyle T(\hat F) = E_{\hat F} [R(X) ]

を計算するにあたっては経験分布\hat FからB個の標本を取ってきて

 \displaystyle \hat T(\hat F) = \frac{1}{B} \sum_{i=1}^B R(X_i)

とすれば大数の法則から一致推定ができる。 しかも経験分布からの乱数による標本抽出はクッッッッッソ楽*3なのでやったねって感じ。 こういう感じで経験分布の情報を数値計算する方法をブートストラップ法というらしい。

ちなみに例のような標本平均のモーメントを調べるには(m個の標本が)B = 50 \sim 200組くらい必要で、分位点を調べようとすると B = 1000 \sim 2000は必要らしい。

その他

効率的リサンプリング

乱数の取り出し方(リサンプリング)の効率性を高めるためにいろんな方法(重点リサンプリングとか)があるらしい。 わかりやすかったのは釣り合い型リサンプリング。n個の観測値をBセット持ってきた後にぐちゃぐちゃに組み替えることでnB個の乱数を作ると全体として偏りがなくていいらしい。

パラメトリックブートストラップ

今回紹介したのはノンパラ手法だったがパラメトリックな状況、すなわち

 \displaystyle F(\cdot \| \eta)

を仮定するときにも使える。パラメータ\etaを最尤法などで推定して\hat \etaを入手し、  \displaystyle F(\cdot \; | \hat \eta)から乱数を生成するような手法となる。 *4

解析的に解けるような分布、パラメータだとこんなんいらんけど、例えば二次元(多次元)正規分布からm個のi.i.d標本(\boldsymbol{X_1}, \cdots, \boldsymbol{X_m}) をとってきて標本相関係数の挙動を調べるときとかは使えるらしい。*5

まとめ

  • 分布 F の情報を調べたいよ。
  • 無理だから経験分布\hat F の情報を調べることにシフトするよ。
  • (主に多次元だと)結局解析計算無理だから乱数生成して数値的にモンテカルロ計算するよ。

追記

現代数理統計学の基礎読んだらブートストラップ推定量を使うことで高次のバイアスを消せるみたいなこと書いてあった。すごい。

参考文献

小西 貞則・越智 義道・大森 裕浩(2008)『計算統計学の方法―ブートストラップ,EMアルゴリズム,MCMC―』 朝倉書店

久保川 達也(2017)『現代数理統計学の基礎』 共立出版

*1:指示関数を使えば分布関数も復元できるので分布に関するすべての情報はこの形で記述できるといっても過言ではない……多分。

*2:観測した各データに確率1/nを割り当てた分布。

*3:離散一様分布から復元抽出すればOK

*4:分布関数の逆関数が分かれば一様乱数から乱数生成できる。わかんなくても正規分布ならボックスミュラー変換があるし、棄却サンプリング、重点サンプリング、MCMCなどとにかく分布が特定できていればいろいろ乱数生成のやりようはある。

*5:ちなみに解析解の近似を目指すアプローチとしてエッジワース展開というのがあるらしい。このエッジワースさんはミクロ経済学のエッジワースボックスの人と一緒っぽい。

金融論・金融経済・金融工学の参考書など

基本的に僕が読んだ(読んでいる)和書を取り上げます。

内容をすべて把握しているわけではない&金融工学はあくまで趣味&他にいい本もあると思うので参考程度に

 

金融論・金融経済

金融論 -- 市場と経済政策の有効性 新版 

学部時代の「金融」の授業の指定教科書。

現実の制度および経済学の理論分析の両方についてわかりやすく、かつ広く解説されていてすげえよかった。(ほかの入門書を知らないのはある。)

 

金融システムの経済学

一般書の皮をかぶった参考書。

これが読めるとマジで金融が面白くなって偉大に感じる名著(今年のノーベル経済学賞の内容もカバーされてる)

……なのだが想定読者のレベルが高い。経済学部上級どころか院生レベル。ちなみに大学院でこの教授の講義取ったらこの本の内容が展開されてた。

むずいけど読めるとマジでおもろい。難易度のネックはおそらく数学(自分が経済できるバイアスかも?)なので自信ある方はぜひ。

 

金融経済学

金融経済学の様々なトピック(投資行動、リスク下の行動、銀行の意義、資産価格など)が網羅されていて辞書的に使える超いい本。(今年のノーベル経済学賞の内容もカバーされてる)

数理的分析が主で現実の制度の紹介とかはほぼない。

経済学部上級向けか?(でも数学的にはそこまで高度じゃないはず)

買おうとするとクソ高い。

 

金融経済学入門

読んだことない(紹介するな)

でもさっきの本と著者一緒でより入門向けらしいのでいいんじゃないですかね?知らんけど。

 

金融工学(資産価格理論)

ファイナンスのための確率解析 I

学部2年の必修の「ファイナンス」で使った本

無裁定価格とかのファイナンスで必要になる知識を簡単なモデル(離散時間、離散(二項)状態)で勉強しようね~という趣旨の本。入門、初学者向け。

雰囲気をつかむにはめっちゃいいと思うが、状態が一々列挙されるので読み込むのにかえって気合が必要でもある。

これの下巻はガチの金融工学の本らしい(英語版を落としたけどそんな読んでない)

Springerあるある:やや高い

 

新・証券投資論

 

これを金融工学と言っていいのかはわからないが、資産価格の理論なので一応。

証券アナリストアクチュアリー試験の参考書でかなり実務向けの本。離散時間で株の価格とか評価する。

今見たら清水「金融経済学」の投資とか資産価格付けのところとやってることは近いかもね。知らんけど。

あとバカ高い。

 

資産価格の理論―株式・債券・デリバティブのプライシング 

前半で離散時間、後半で連続時間(確率微分方程式)をやる資産価格理論の有名な教科書らしい。

まだ離散時間のとこしかちゃんと読めてないけどいい本です。すげえいい本。

ただくそムズイ。今までの3冊との落差が激しい。第一章がまずミクロ経済学凸最適化の経済院レベルなんすよね…。後半も確率微分方程式だし。

あと「資産価格付けの基本定理」ステートメントwikipediaでちらっと見てから読みましょう。

 

確率微分方程式

言わずと知れたエクセンダールの確率微分方程式の本。(相対的な)読みやすさ、直感的な理解のしやすさに定評がある。

確率微分方程式ってバカむずいけど、資産価格を連続時間で分析するなら必須なので頑張りましょう。(前のダフィーの本もそう)

Springerあるある:やや高い

ちなみにこれ数学の本じゃないらしいっすよ。(実際全部が厳密ではないので一理ある。)

 

おまけ:数学

測度論

確率微分方程式やるなら基本いる。事前に集合と位相も勉強しときましょう。

測度・確率・ルベーグ積分 応用への最短コース (KS理工学専門書)

読んだことない(紹介するな)

なんかさらっと理解するにはいいらしい。

 

ルベーグ積分入門(新装版) (数学選書)

測度論・ルベーグ積分論の名著。

一周まわってこういうガチガチの本を真剣にやるのが早かったりする。

 

測度論的確率論

確率論 講座数学の考え方 (20) 

測度論的確率論のいい本。

特殊な測度空間である確率空間と付随する嬉しさについて学ぼう!測度論がわかれば読める。

やや高い。

 

確率微分方程式

最初はエクセンダールがいいと思うが他の本も著者・タイトルだけ紹介。

舟木「確率微分方程式」

長井「共立講座21世紀の数学 (27) 確率微分方程式」

どっちもむずくて勉強中です。

勉強とか記録(2021/12/18)

前置き

6日目。きょうはひるにおきてダラダラしてました。だからきょうの内容は、めちゃめちゃうすいです!

 

やったこと

きのうの本の続きをちょっと読んだ。昨日書いた「完全市場かどうかで、不意の支出に対応できるかどうかが変わってくる」現象をいい感じにモデル化して分析されており読んでいて面白かった。

 

あと今(夜の2時)はゼミ資料作ってる。こっちは構成考えながらTex打つだけなので割と無。

勉強とか記録(2021/12/17)

前置き

5日目。今のところいい感じに習慣化しているのではないだろうか。

 

今日は昼間に

  1. 同クラと大学の近くで昼飯
  2. 図書館で本借りる
  3. 秋葉で音ゲー
  4. ゲーセンで偶然出会った友人とサイゼ行く

ということをしており個人的に結構充実していた。

これらは別に進捗というわけではないが、このブログの目的は「睡眠や無意識に見るYouTubeTwitterより有意義なことをする」なのでせっかくなので残しておこうと思う。

f:id:basan1028:20211217205758j:plain

ボルテのガチャで引いた氷雪ちゃん。かわいいね。

f:id:basan1028:20211217205918j:plain

秋葉のアトレがごちうさとコラボ中だったので一枚
急いで撮ったら入りきらなかった(悲しい)

やったこと

今日は帰宅後に大学で借りた「流動性の経済学」という本をちょっと読んだ。せっかくなのでまとめもかねてごく簡単に解説を書く。

 

この流動性(liquidity)というのは「換金が容易かどうか」を示す性質のこと。例えば土地のように換金が難しい資産は「流動性が低い」などという。

一方「流動性」という語は「流動性が高い資産(主に現金)」という意味のモノを表す名詞としても使う。ややこしいね。

(例)「流動性が足りないよ~;  ;」→「現金が足りないよ~;  ;」

 

まあつまるところ、この「流動性の経済学」という本は「現金って何?その重要性は?私なりに調べてみました!」という本なのである。一見しょうもないように見えるかもしれないが(書き方に悪意があるせいもある)、これが意外と重要なのだ。

 

経済学では簡単化のため「(当然あとで返済するとして)任意のタイミングで好きなだけ資金を借りられる」と仮定をおいたりする。この仮定のもとでは資産の流動性が高いか低いかにはほぼ意味がない。「土地売って返すから現金貸して」という「流動性低→流動性高」の変換がいつでも通用するからだ。

でも実際のところ、この仮定は「借り手の情報が足りないから貸したくない」などの理由(摩擦)のせいで成り立たず、流動性の高低が意味を持つようになってくる。

この自由に借りられない制約のことを「流動性制約」と呼んだりするのだが、流動性制約のせいで支出に対して現金など流動性が高いものを持っておく必要があり、その分「投資とかできなくなって大変だねえ」といったことが起きる。

このほかにも流動性(現金)に対する需要」と「金利」の関係とか、流動性が低い資産に対して若干リターンが高くなる「流動性プレミアム」とか色んな話があったりするのだが、一旦ここまでにしておく。

 

物理で例えると(物理なんもわからんけど)摩擦とか空気抵抗のある世界を考えたら面白いもん出てきたし研究するわw」といった感じで、その「面白いもん」のうちの一つが経済学では流動性なのである。こう見ると「現金って何?その重要性は?私なりに調べてみました!」と聞いてもまあ納得ではないだろうか?

 

さて……

 

 

いかがでしたか?

 

ということで今日はこのあたりで締めさせてもらう。明日は論文読みたい。

勉強とか記録(2021/12/16)

前置き

今日で4日目。なんとか三日坊主は回避できた。

当初の目論見通りこのブログを書くために何か進捗を生もうという気持ちになっているのが非常に良い。今度経済学の課題で"dynamic inconsistency"(簡単に言うと「明日から本気出す→一生やらない」となる状況)を打破するための対策例を聞かれたら「ブログに記録をつける」というのを書こうかと思う。

 

全く関係ないがこのブログの総PV数が1000を超えた。今書いている「勉強とか記録」シリーズはモチベ管理&備忘録なのであんまりPV数関係ない&前からちょくちょくネットの海に記事を放流しているので特段多いわけでなくごく妥当な数字だと思うが、それはそれとしてキリのいい数字なのでちょっと嬉しい。

 

やったこと

今日はゲーム理論の課題(昨日の続き)に加え、ゼミの課題を主にやっていた。

といっても昼まで寝てたのと、ゼミの課題が思ったより難しかったため、ゲーム理論の課題が完全には終わりきらなかった。ぴえん。

 

明日以降は14日みたいにゼミの発表資料を作ったり論文を読んだりする予定。

でもマイクラ1.18やりたいからその日記になるかも。

勉強とか記録(2021/12/15)

前置き

とりあえず三日は達成できた。(といってもこれを書いてるのは日が回ったあとだが……)とりあえず4日を目指していきたい。

 

やったこと

今日はゲーム理論の課題をやっ…てはいるのだが昼間めちゃめちゃに寝てしまっており進捗は微妙。こんな体たらくで果たして将来的に社会に適応できるのか…。ここ数年間直面している悩みである。

 

ゲーム理論の課題自体は(今回の範囲は)そこまで難しいものではないのだが、英語で書かなくてはいけないのがひたすらに面倒。正確には提出自体は日本語でもいいのだが、授業内で語の定義や定理の説明が英語でされているのでそれを英語でまんま写した方が確実だという都合。

 

せっかくなのでゲーム理論についての僕なりの解説・所感(偏見)を添えておく。

そもそもゲーム理論とは人々が戦略的状況のもとで人々がどのような行動をとるかを数理的に分析する学問である。(決して「音ゲー上達理論(PDCAサイクルを回す)」とか「無を取得して体験版のうちにクリアする」とかではない。でも叙情やalmaで対戦勝とうとするのは部分的にそうかも。)

この☨戦略的状況☨とかいうやつだが、適用範囲がめちゃくちゃ広くて複数人(複数主体)が作用しあえばだいたい戦略的状況になる。エスカレータの右に乗るか左に乗るかとかも戦略的状況になる。広すぎ。

人々の行動についてはゲーム理論では「利得を最大化する(一番うれしくなる)」ように行動するとしている。ここで数学的な最適化理論を用いることによって、文章的にだけではなく数理的にも説得力のある結果を示してくれる。

だから「いろんな場面に適用できて」「人々の行動を数理的に説明してくれるゲーム理論というのは多種多様な学問に応用できる。そのなかでもミクロ経済学は後半部についてほとんど同じスピリットを持っているので、より適用範囲が広いゲーム理論を取り込んで発展しているのが現状といえる。

 

さてゲーム理論といえば囚人のジレンマといった単語を聞いたことがあるかもしれない。あれを見ると「ゲーム理論簡単じゃん!」と思うが、それは大きな間違いである。

先程も少し述べたが、ゲーム理論には最適化が深くかかわっている。そのため様々な最適化問題を解かなくてはいけない。さらには最適化する行動が相手の行動によって変わったり、ランダムな行動を考慮したり、動学的な最適化を考えたりなどなど…。

そうして得られた解(均衡)の中でも全部が現実をうまく説明できるわけではなく、例えば「安定的かどうか」とか「事前の信念とあっているか」といったように精緻化(現実にありそうな行動だけに絞る)する余地があったりする。

とにかく数理的に考えることが多いし、かつ(少なくとも文系には)高度だったりするのだ。

 

ということでなんとなくゲーム理論の専門家やゲーム理論のゼミに入っている人は賢そう」みたいな印象があるし実際そうなんだと思う。僕は授業に追いつくのが精いっぱい。

ちなみに友人から聞いた話によると、優秀だったのにゲーム理論(のゼミ)の難しさにボコボコにされて人生を狂わされた人がいるらしい。かわいそう。

 

というわけでポケット経済学エアプ大全~ゲーム理論編~みたいなのができたところで今日はこの辺りにしておく。