AI

機械学習 #2

これは、完全に自分用のメモなのでこれだけを読んで理解するのは難しいです。

機械学習でもちいられる用語

m

訓練サンプルの数

x

入力変数、特徴値

(x,y)

訓練サンプル

xi

xの累乗のところは訓練サンプルのインデックスである。x2はxが2番目の訓練サンプルのx

h

仮説 h:x→y、 訓練サンプルを学習アルゴリズムに与えることによって仮説h_0(x)を得る。

y

推定値

どのように仮説h_0(x)を表現するか??

仮説とは何か

h_0(x)とは、いくつかの訓練サンプルから作られる。そして、あるxをh_0(x)に代入したら、yの値を予想してくれる関数のことである。例えば、h_0(x) = \theta_0 + \theta_1xなどである。

\theta_0\theta_1(パラメータ)の値をどのように決めるか??

全ての入力xに対してh_\theta(x) - y = 0になれば良い。つまり\sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2となる。

二乗誤差関数は(これは、xからの入力と実際の出力yからの仮説のすべての結果の平均差(実際には平均の手の込んだバージョン)を取ります。)一般的な回帰問題に使われる

さらにJ =\frac{1}{2m}\sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2を目的関数と定義します。この目的関数の値が0になることを目指していきます。目的関数の値が0になったときは、仮説と出力の値が完全に等しくなったことを表しています。