496の落書き帳

496がなんか思ったことを書いたり書かなかったりする場所です。

にっき「休息?」

うおー。進捗がない。しかし、ないからといって日記をやめてはいけない。こうなるために書こうと思ってるんだからな。

いちおう8時起床したんだっけ。午前は大いにだらだらごろごろしながら強化学習ゼミを聞いていた。主な議題は、変化する環境に合わせるために過去の経験に重みをつけて学習しようというお話だったか。まあ人間昔のことは直ちに忘れるわけで、もはや覚えている方が不自然である。そういう感じの、状態機械としてのプレイヤーを考えると思うと少し面白い。あとは、パラメタ調節が難しすぎると人々が嘆いていた。相変わらずそこが問題なんだよなあ。

午後は出勤して僅かに仕事をして、ほんの少し後輩の物理の勉強のお手伝いをした。なんかの管を流れる流体の速さは電流みたいに書くことができて、管の両端の圧力差=電圧,粘性=抵抗率,などと解釈が利くらしい。ただし流速は壁付近では遅く、中央にいくと速くなるので、ある意味抵抗率が半径の2乗に反比例する。まあ原理は大層違うわけなのだが、なんだか同型っぽいものを見ると気分が良くなるよね。

あと、ちょっぴりEMアルゴリズムの考察をしようとした。今まで何度か目にしたワードなわけだが、パラメタ推定問題で何かしら隠れ変数が有ればEMアルゴリズムの射程内だなあと思うと、これはとんでもなく広い。今講義で訳わからんになりかかっているEMアルゴリズムと今まで見たEMアルゴリズムを比べてみると、どうも推定したい隠れ変数が離散的か連続的かという違いがある。連続的関数の変分が難しいというかちょっと気持ち悪いわけだが、離散的な関数の変分ってもうただの多変数最適化なんだよなあ。なるほどなるほど?

うーん、残りの時間は全部ゲームに溶けた。そろそろ動かないとやばそうな予感がするなあ。現実に戻りて、計画、行動、取捨選択…!ぐええ。おわり。