ベストアンサー

Lagrangeの未定乗数法

2002/10/31 23:51

例えば、これは熱力学のところで出てくる式ですが、　　　　　ΣδN_j[ln(V_j/N_j)-1]=0　(※) に対して、 δN=ΣδN_j=0 (※※) という制限をつけたときに(※※)に未定乗数λをかけて(※)に加えますよね。だったら、別にλじゃなくてもなんらかの数字例えば3をかけて加えてもいいんじゃないかと思ってしまうんですが、そうするとあとあと他の条件　　　　　　　　 N=ΣN_j からλを決定する必要が無くなりλ=3に勝手に決まってしまいおかしなことになってしまいます。これなら最初に (※※)でかける数字によってλの値が一つに決められて何通りもの答えが出てきてしまいます。　教えて頂きたいのは数学的な部分で何故、(※※)に未定乗数をかけて加えてよくて、何故数字をかけて加えてはいけないのかという理由です。そんなの当たり前だと思われるかも知れませんがよく分からないのでお願いします。

Rossana
お礼率96% (407/422)

物理学
回答数13
ありがとう数15

みんなの回答 （13）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

physicist_naka
ベストアンサー率63% (45/71)

2002/11/02 17:18 回答No.8

No.4のものです。 > これは分かりました。しかし、これがλの代わりに決まった数をかけて > はいけないという説明になっているというのが分からないのでよろしく > お願いします。ｈ＝ｆ－３ｇの極値を求めるにはどうしますか？　　∂ｈ／∂ｘ＝０　　∂ｈ／∂ｙ＝０　　∂ｈ／∂ｚ＝０　　・・・としますよね。でもこれで決まるｘ、ｙ、ｚ・・・はｈ＝ｆ－３ｇの極値を与えてもｇ＝０を満たすとは限りませんね。ですからこのやり方ではまずいです。それともこういう意味でしょうか。 λ＝３のとき、このやり方がまずいならλのままでもまずいのではということでしょうか。これはつまりこういうことです。　　∂ｈ／∂ｘ＝０　　∂ｈ／∂ｙ＝０　　∂ｈ／∂ｚ＝０　　・・・というやり方で、ｈ＝ｆ－λｇの極値を与えますが、このやり方で出てくるｘ、ｙ、ｚ・・・（λの関数）がｇ＝０を満たすように λを決めておけばいいですね。

質問者

お礼 2002/11/02 19:50

ありがとうございます。分かりました！！そういう意味の説明だったんですね！微分積分を含む式では普通の代数式と違って単純に何かをかけて加えるとその数字によって式の表す内容が変わってくるんですね。つまり、例えば x+y=1 (1) x+2y=3 (2) という連立方程式では(2)の式に例えば3をかけて加えてもxとyの数値に変化はないけれども、このような微分を含む関数ではかける数字によって x,yの数値が変わってくるというような事ですね？

その他の回答 (12)

nubou
ベストアンサー率22% (116/506)

2002/11/01 13:05 回答No.2

ｆ（ｘ，ｙ，ｚ）がｇ（ｘ，ｙ，ｚ）＝０という条件付で（ａ，ｂ，ｃ）で極値をもつとき ∂ｆ（ａ，ｂ，ｃ）／∂ｘ＝λ・∂ｇ（ａ，ｂ，ｃ）／∂ｘ ∂ｆ（ａ，ｂ，ｃ）／∂ｙ＝λ・∂ｇ（ａ，ｂ，ｃ）／∂ｙ ∂ｆ（ａ，ｂ，ｃ）／∂ｚ＝λ・∂ｇ（ａ，ｂ，ｃ）／∂ｚである（ただし偏微分可能性等は暗黙の前提とする）の場合について説明する（ａ，ｂ，ｃ）から ∂ｇ（ａ，ｂ，ｃ）／∂ｓ＝０・・・（１）を満たすように線分を引き線分の長さをｓとし線分の先を（α（ｓ），β（ｓ），γ（ｓ））としｐ＝ｄα（０）／ｄｓ，ｑ＝ｄβ（０）／ｄｓ，ｒ＝ｄγ（０）／ｄｓとするｆ（ｘ，ｙ，ｚ）がｇ（ｘ，ｙ，ｚ）＝０という条件付で（ａ，ｂ，ｃ）で極値を持つから ∂ｆ（ａ，ｂ，ｃ）／∂ｓ＝０・・・（２）（１）よりｐ・∂ｇ（ａ，ｂ，ｃ）／∂ｘ＋ｑ・∂ｇ（ａ，ｂ，ｃ）／∂ｙ＋ｒ・∂ｇ（ａ，ｂ，ｃ）／∂ｚ＝０・・・（３）（２）よりｐ・∂ｆ（ａ，ｂ，ｃ）／∂ｘ＋ｑ・∂ｆ（ａ，ｂ，ｃ）／∂ｙ＋ｒ・∂ｆ（ａ，ｂ，ｃ）／∂ｚ＝０・・・（４） ∂ｇ（ａ，ｂ，ｃ）／∂ｘ＝∂ｇ（ａ，ｂ，ｃ）／∂ｙ＝∂ｇ（ａ，ｂ，ｃ）／∂ｚ＝０ならばｐ，ｑ，ｒは任意に取れるから ∂ｆ（ａ，ｂ，ｃ）／∂ｘ＝∂ｆ（ａ，ｂ，ｃ）／∂ｙ＝∂ｆ（ａ，ｂ，ｃ）／∂ｚ＝０でなければならない ∂ｇ（ａ，ｂ，ｃ）／∂ｘ≠０ならば任意のｑ，ｒにたいして（３）をみたすようなｐが存在し（∂ｆ（ａ，ｂ，ｃ）／∂ｘ）／（∂ｇ（ａ，ｂ，ｃ）／∂ｘ）＝λとすると（４）－（３）×λより（∂ｆ（ａ，ｂ，ｃ）／∂ｙ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｙ）・ｑ＋（∂ｆ（ａ，ｂ，ｃ）／∂ｚ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｚ）・ｒ＝０ｑとｒは任意に設定できるから ∂ｆ（ａ，ｂ，ｃ）／∂ｙ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｙ＝０ ∂ｆ（ａ，ｂ，ｃ）／∂ｚ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｚ＝０いずれにしても ∂ｆ（ａ，ｂ，ｃ）／∂ｘ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｘ＝０ ∂ｆ（ａ，ｂ，ｃ）／∂ｙ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｙ＝０ ∂ｆ（ａ，ｂ，ｃ）／∂ｚ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｚ＝０これはいずれも必要条件であって十分条件でない極値の候補をすべて網羅できるが中には極値でないものもあるので別の手段で検証しなければならないなおＦ（ｘ，ｙ，ｚ）＝ｆ（ｘ，ｙ，ｚ）－λ・ｇ（ｘ，ｙ，ｚ）とすると ∂ｆ（ａ，ｂ，ｃ）／∂ｘ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｘ＝０ ∂ｆ（ａ，ｂ，ｃ）／∂ｙ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｙ＝０ ∂ｆ（ａ，ｂ，ｃ）／∂ｚ－λ・∂ｇ（ａ，ｂ，ｃ）／∂ｚ＝０ｇ（ａ，ｂ，ｃ）＝０は ∂Ｆ（ａ，ｂ，ｃ）／∂ｘ＝０ ∂Ｆ（ａ，ｂ，ｃ）／∂ｙ＝０ ∂Ｆ（ａ，ｂ，ｃ）／∂ｚ＝０ ∂Ｆ（ａ，ｂ，ｃ）／∂λ＝０とみなすことができる多少煩雑になるが変数が４以上のとき条件式が２以上のときも上記から推察できる

質問者

お礼 2002/11/02 16:02

ありがとうございます。 (１）よりｐ・∂ｇ（ａ，ｂ，ｃ）／∂ｘ＋ｑ・∂ｇ（ａ，ｂ，ｃ）／∂ｙ＋ｒ・∂ｇ（ａ，ｂ，ｃ）／∂ｚ＝０・・・（３）と変形できるのがよく分からないです。

spinflip
ベストアンサー率53% (28/52)

2002/11/01 01:04 回答No.1

f(x,y,z...)の極値を、制限g(x,y,z...)=0のもとで求める際に、代わりに、f+λgという新しい関数を制限なしで、極値を求めればOKというのがラグランジュの未定乗数法ですね。この、新しい関数の極値を制限無しで求めるために偏微分すると、 (d/dx)f=-λ(d/dx)g (d/dy)f=-λ(d/dy)g (d/dz)f=-λ(d/dz)g : という一連の方程式が得られます。この左辺をベクトルだと思うと、これはfのグラジエントです。 fのグラジエントとは、fをポテンシャルだと思えば、そのポテンシャルの中におかれた質点に働く力になります。特に変数が三つの場合は、∇fですから、力学で教わった通り、ポテンシャルによる力です(但し方向は逆ですが)。変数が三つ以外の場合でも多次元空間での仮想的な力とみなすことができます。一方、右辺もベクトルだと思うと、これは、曲線を表す方程式g=0の偏微分ですから、その曲線の法線(曲線に直交する線)となります。(これはご存知ないかも知れませんが、たとえば、x^2+y^2-1=0という曲線の法線は、左辺を偏微分して並べたベクトル(2x,2y)になっています)。すると、ラグランジュの未定定数法のビジュアルなイメージは、猿が、ある曲線g=0にぶらさがって、すいすいとポテンシャルfの中を動いている様子になります。ですから、猿が止まる点は、猿に働く力が、曲線と直交する所、すなわち法線と平行になる所、になります。このように、二つのベクトルが平行になれば良い(一致しなくとも良い)のですから、その比例係数は「未定」なのです。

質問者

お礼 2002/11/02 02:37

ありがとうございました。この一見無味乾燥そうな数式にこんな図形的なイメージを当てはめることが出来るんですね。

質問者

補足 2002/11/02 02:37

＞一方、右辺もベクトルだと思うと、これは、曲線を表す方程式g=0の偏微分ですから、その曲線の法線(曲線に直交する線)となります。(これはご存知ないかも知れませんが、たとえば、x^2+y^2-1=0という曲線の法線は、左辺を偏微分して並べたベクトル(2x,2y)になっています)。こんな事初めて知りました！でもどうしてそうなるんですか？質問とはずれますが説明可能ならよろしくお願いします。

Lagrangeの未定乗数法