(a) 函數概念:奇偶函數、函數有理化、配方法、根與係數牛頓一次因式檢驗、 ... 再利用Hessian Matrix 判別極大極小或鞍點, 雙變數則直接套用判別式D ... ... <看更多>
鞍點 判別式 在 現代人工智慧名詞中英對照表 - Facebook 的推薦與評價
... Discriminative model,判別模型,判别模型; Discriminator,判別器,判别器 ... Saddle point,鞍點,鞍点; Saddle-free Newton method,無鞍牛頓法,无鞍牛顿法 ... ... <看更多>
鞍點 判別式 在 極值判別法則Part 1 - 看板trans_math - 批踢踢實業坊 的推薦與評價
※ 引述《midarmyman (midarmyman)》之銘言:
: 偏微分求極值時,判別式大於零之外,
: 還要看fxx如果>0就是極小,反之
: 請問為啥要看fxx不看fyy?
: 遇到一題變數不是x.y不知道該看哪個(不過都正)
[我先給 Part 1, 假使有必要後面還有 Part 2-5.]
以下將講多變數函數世界裡頭的極值判別法則,而單變數中的極值判別法則相對於多變數
中的極值判別法則來的簡單,故省略。
(引理) 命 f:S → |R, 其中 S is open in |R^n with a in S, 且 f 於 a 點有方向
導數。若 f(a) 為極值點,則
D_u f(a) = 0.
↓ kth component
特別地,選取 u = u_k = (0,...,1,...,0), 則 D_k f(a) = 0 for all
k = 1,2,...,n. 也就是說,此時 ▽f(a)=0.
因此,欲深究一內點 a 是否為極值點,我們就必須先假定 ▽f(a)=0. 再來回憶
f(a+k) = f(a) + ▽f(a).k + (1/2!) <Hk,k> + R_a,2(k),
其中 H = H(a), Hessian matrix of f at a.
NOTE. 只要談論到極值問題往往就會涉及到泰勒定理(具備餘項)。
(主定理)
假定 ▽f(a)=0, 即 a 點為 critical point, 且二階偏導數 D_i,j f(x) 存在於
B(a), 且連續於 a 點上。
(1) 若 < Hk,k> 恆正 for all k ≠ 0, 則 f(a) 為 local minimum.
(2) 若 < Hk,k> 恆負 for all k ≠ 0, 則 f(a) 為 local maximum.
(3) 若 < Hk,k> 有正有負,則 a 點為 saddle point (鞍點)。
(鞍點定義) 若 a 為 critical point 且對於任意的 B(a) 中有點 x, y 使得
f(x) > f(a) 且 f(y) < f(a)
則稱 a 點為鞍點。
由此可見,鞍點必定不是極值點。
Proof. 我們需要兩個 lemmas:
(lemma 1) 若 H>0,則必存在一正數 c, 使得< Hk,k> ≧ c|k|^2 for all k.
(lemma 2) |R_a,2(k)|/|k|^2 → 0 as k→ 0.
由上述兩引理,可證明此主定理。
NOTE.
(i) 由二階偏導數 D_i,j f(x) 存在於 B(a), 且連續於 a 點上, 可知 H 為對稱
矩陣,即 H^t = H.
(ii) 對一個對稱矩陣 H 而言,
當 < Hk,k> 恆正 for all k ≠ 0, 我們稱 H 為正定,且記為 H > 0.
當 < Hk,k> 恆負 for all k ≠ 0, 我們稱 H 為負定,且記為 H < 0.
(正定原文為 positive definite, 負定原文為 negative definite.)
因此根據上述主定理可知:
當 a 為 critical point 時,且 Hessian matrix H(a) > 0 表示
f(a) 有局部極小。
簡記為 {▽f(a) = 0} + {H(a) > 0} => f(a): local min.
當 a 為 critical point 時,且 Hessian matrix H(a) < 0 表示
f(a) 有局部極大。
簡記為 {▽f(a) = 0} + {H(a) < 0} => f(a): local max.
(iii)
╭ D_11 f(a) ... D_1n f(a) ╮╭ k_1 ╮ ╭ k_1 ╮
<Hk,k> = < │ ... ... ... ││ . │ │ . │>
╰ D_n1 f(a) ... D_nn f(a) ╯╰ k_n ╯ ,╰ k_n ╯
n n
= Σ Σ D_ij f(a) k_i k_j.
i=1 j=1
即 H:|R^n→|R by H(k):= <Hk,k>. 如此之 H 稱為二次型 (Quadratic form.)
(iv) 主定理告訴了我們一件重要的事情:在主定理的假設底下,餘項對我們來說一
點也不重要,也就是說餘項不會影響到函數本身的極值問題。即腦海要想著
f(a+k) ~ f(a) + (1/2!) <Hk,k> (因 ▽f(a) = 0)
這樣一來,f(a+k) - f(a) ~ (1/2!) <Hk,k>.
因此,f(a+k) - f(a) 的正負可由 <Hk,k> 決定之。
(v) 最後提到一點線性代數,他將用在 Part 2 裡頭的推論 1.
對一個對稱矩陣 H 而言:
H > 0 <=> H 的所有 eigenvalues 都必須恆正。
H < 0 <=> H 的所有 eigenvalues 都必須恆負。
--
Good taste, bad taste are fine, but you can't have no taste.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.133.4.14
... <看更多>