- ベストアンサー
Lagrangeの未定乗数法
例えば、これは熱力学のところで出てくる式ですが、 ΣδN_j[ln(V_j/N_j)-1]=0 (※) に対して、 δN=ΣδN_j=0 (※※) という制限をつけたときに(※※)に未定乗数λをかけて(※)に加えますよね。 だったら、別にλじゃなくてもなんらかの数字例えば3をかけて加えてもいいんじゃないかと思ってしまうんですが、そうするとあとあと他の条件 N=ΣN_j からλを決定する必要が無くなりλ=3に勝手に決まってしまいおかしなことになってしまいます。これなら最初に (※※)でかける数字によってλの値が一つに決められて何通りもの答えが出てきてしまいます。 教えて頂きたいのは数学的な部分で何故、(※※)に未定乗数をかけて加えてよくて、何故数字をかけて加えてはいけないのかという理由です。そんなの当たり前だと思われるかも知れませんがよく分からないのでお願いします。
- みんなの回答 (13)
- 専門家の回答
質問者が選んだベストアンサー
No.4のものです。 > これは分かりました。しかし、これがλの代わりに決まった数をかけて > はいけないという説明になっているというのが分からないのでよろしく > お願いします。 h=f-3gの極値を求めるにはどうしますか? ∂h/∂x=0 ∂h/∂y=0 ∂h/∂z=0 ・・・ としますよね。でもこれで決まるx、y、z・・・はh=f-3gの極値 を与えてもg=0を満たすとは限りませんね。 ですからこのやり方ではまずいです。 それともこういう意味でしょうか。 λ=3のとき、このやり方がまずいならλのままでもまずいのでは ということでしょうか。これはつまりこういうことです。 ∂h/∂x=0 ∂h/∂y=0 ∂h/∂z=0 ・・・ というやり方で、h=f-λgの極値を与えますが、このやり方で 出てくるx、y、z・・・(λの関数)がg=0を満たすように λを決めておけばいいですね。
その他の回答 (12)
- nubou
- ベストアンサー率22% (116/506)
f(x,y,z)がg(x,y,z)=0という条件付で(a,b,c)で極値をもつとき ∂f(a,b,c)/∂x=λ・∂g(a,b,c)/∂x ∂f(a,b,c)/∂y=λ・∂g(a,b,c)/∂y ∂f(a,b,c)/∂z=λ・∂g(a,b,c)/∂z である(ただし偏微分可能性等は暗黙の前提とする) の場合について説明する (a,b,c)から ∂g(a,b,c)/∂s=0・・・(1) を満たすように線分を引き線分の長さをsとし線分の先を (α(s),β(s),γ(s))とし p=dα(0)/ds,q=dβ(0)/ds,r=dγ(0)/ds とする f(x,y,z)がg(x,y,z)=0という条件付で(a,b,c)で極値を持つから ∂f(a,b,c)/∂s=0・・・(2) (1)より p・∂g(a,b,c)/∂x+q・∂g(a,b,c)/∂y+r・∂g(a,b,c)/∂z=0・・・(3) (2)より p・∂f(a,b,c)/∂x+q・∂f(a,b,c)/∂y+r・∂f(a,b,c)/∂z=0・・・(4) ∂g(a,b,c)/∂x=∂g(a,b,c)/∂y=∂g(a,b,c)/∂z=0 ならばp,q,rは任意に取れるから ∂f(a,b,c)/∂x=∂f(a,b,c)/∂y=∂f(a,b,c)/∂z=0 でなければならない ∂g(a,b,c)/∂x≠0ならば 任意のq,rにたいして(3)をみたすようなpが存在し (∂f(a,b,c)/∂x)/(∂g(a,b,c)/∂x)=λとすると (4)-(3)×λより (∂f(a,b,c)/∂y-λ・∂g(a,b,c)/∂y)・q+ (∂f(a,b,c)/∂z-λ・∂g(a,b,c)/∂z)・r=0 qとrは任意に設定できるから ∂f(a,b,c)/∂y-λ・∂g(a,b,c)/∂y=0 ∂f(a,b,c)/∂z-λ・∂g(a,b,c)/∂z=0 いずれにしても ∂f(a,b,c)/∂x-λ・∂g(a,b,c)/∂x=0 ∂f(a,b,c)/∂y-λ・∂g(a,b,c)/∂y=0 ∂f(a,b,c)/∂z-λ・∂g(a,b,c)/∂z=0 これはいずれも必要条件であって十分条件でない 極値の候補をすべて網羅できるが中には極値でないものもあるので 別の手段で検証しなければならない なお F(x,y,z)=f(x,y,z)-λ・g(x,y,z) とすると ∂f(a,b,c)/∂x-λ・∂g(a,b,c)/∂x=0 ∂f(a,b,c)/∂y-λ・∂g(a,b,c)/∂y=0 ∂f(a,b,c)/∂z-λ・∂g(a,b,c)/∂z=0 g(a,b,c)=0 は ∂F(a,b,c)/∂x=0 ∂F(a,b,c)/∂y=0 ∂F(a,b,c)/∂z=0 ∂F(a,b,c)/∂λ=0 とみなすことができる 多少煩雑になるが変数が4以上のとき条件式が2以上のときも上記から推察できる
お礼
ありがとうございます。 (1)よりp・∂g(a,b,c)/∂x+q・∂g(a,b,c)/∂y+r・∂g(a,b,c)/∂z=0・・・(3) と変形できるのがよく分からないです。
- spinflip
- ベストアンサー率53% (28/52)
f(x,y,z...)の極値を、制限g(x,y,z...)=0のもとで求める際に、 代わりに、f+λgという新しい関数を制限なしで、 極値を求めればOKというのがラグランジュの未定乗数法ですね。 この、新しい関数の極値を制限無しで求めるために偏微分すると、 (d/dx)f=-λ(d/dx)g (d/dy)f=-λ(d/dy)g (d/dz)f=-λ(d/dz)g : という一連の方程式が得られます。この左辺を ベクトルだと思うと、これはfのグラジエントです。 fのグラジエントとは、fをポテンシャルだと思えば、 そのポテンシャルの中におかれた質点に働く力になります。 特に変数が三つの場合は、∇fですから、力学で教わった通り、 ポテンシャルによる力です(但し方向は逆ですが)。 変数が三つ以外の場合でも多次元空間での仮想的な力と みなすことができます。 一方、右辺もベクトルだと思うと、これは、 曲線を表す方程式g=0の偏微分ですから、その曲線の 法線(曲線に直交する線)となります。(これはご存知ないかも 知れませんが、たとえば、x^2+y^2-1=0という曲線の 法線は、左辺を偏微分して並べたベクトル(2x,2y)になっています)。 すると、ラグランジュの未定定数法のビジュアルなイメージは、 猿が、ある曲線g=0にぶらさがって、すいすいとポテンシャルfの 中を動いている様子になります。ですから、猿が止まる点は、 猿に働く力が、曲線と直交する所、すなわち法線と平行に なる所、になります。 このように、二つのベクトルが平行になれば良い(一致しなく とも良い)のですから、その比例係数は「未定」なのです。
お礼
ありがとうございました。この一見無味乾燥そうな数式にこんな図形的なイメージを当てはめることが出来るんですね。
補足
>一方、右辺もベクトルだと思うと、これは、曲線を表す方程式g=0の偏微分ですから、その曲線の法線(曲線に直交する線)となります。(これはご存知ないかも知れませんが、たとえば、x^2+y^2-1=0という曲線の法線は、左辺を偏微分して並べたベクトル(2x,2y)になっています)。 こんな事初めて知りました!でもどうしてそうなるんですか?質問とはずれますが説明可能ならよろしくお願いします。
- 1
- 2
お礼
ありがとうございます。分かりました!!そういう意味の説明だったんですね! 微分積分を含む式では普通の代数式と違って単純に何かをかけて加えるとその数字によって式の表す内容が変わってくるんですね。 つまり、例えば x+y=1 (1) x+2y=3 (2) という連立方程式では(2)の式に例えば3をかけて加えてもxとyの数値に変化はないけれども、 このような微分を含む関数ではかける数字によって x,yの数値が変わってくるというような事ですね?