全微分を連鎖させることで連鎖律が得られることを見ます。注意点としてオイラーの連鎖式を紹介します。
シリーズの記事です。
- 全微分
- 全微分と接線
- 連鎖律 ← この記事
- 積の微分
目次
連鎖律
$f$ が $x$ の関数で、$x$ が $t$ の関数だとします。
\begin{aligned}
f&=f(x) \\
x&=x(t)
\end{aligned}
※ 以後、このようなケースをまとめて $f=f(x(t))$ と表記します。
$f$ を全微分します。一変数関数のため係数は偏微分ではないのに注意します。
df=\frac{df}{dx}dx
一方、$dx$ は全微分できます。
dx=\frac{dx}{dt}dt
これを元の式に代入すれば、全微分で出て来た $dx$ が更に全微分できるという連鎖構造となります。
df=\frac{df}{dx}\frac{dx}{dt}dt
両辺を $dt$ で割った形は、$f$ は本質的には $t$ の関数のため、$f$ を $t$ で微分できることを示します。
\frac{df}{dt}=\frac{df}{dx}\frac{dx}{dt}
これはいわゆる合成微分の連鎖律そのものです!ラグランジュの記法に書き直せば見覚えがあるかもしれません。
\{f(x(t))\}'=f'(x)x'(t)
関数の定義と結果を見比べれば、外から中に向かって微分が進行していると解釈できます。
f=\underbrace f_\text{外}(\underbrace x_\text{中}(t))
df=\underbrace{\frac{df}{dx}}_{\text{外の
微分}}dx=\frac{df}{dx}\underbrace{\frac{dx}{dt}}_{\text{中の
微分}}dt
\frac{df}{dt}=\underbrace{\frac{df}{dx}}_{\text{外の
微分}}\underbrace{\frac{dx}{dt}}_{\text{中の
微分}}
二変数関数
$f$ が $x,y$ の二変数関数で、$x,y$ が $t$ の関数だとします。
f=f(x(t),y(t))
全微分を連鎖させます。
df=\frac{∂f}{∂x}\,dx+\frac{∂f}{∂y}\,dy=\left(\frac{∂f}{∂x}\frac{dx}{dt}+\frac{∂f}{∂y}\frac{dy}{dt}\right)dt
両辺を $dt$ で割れば、$f$ の $t$ による微分となります。
\frac{df}{dt}=\frac{∂f}{∂x}\frac{dx}{dt}+\frac{∂f}{∂y}\frac{dy}{dt}
このように、多変数関数の連鎖律は個別に変数を割り込ませて足し上げた形で現れます。
※ 微分 $dx$ と偏微分 $∂x$ を混ぜて約分できないとも解釈できます。
物理では時間 $t$ による微分が多用されます。$t$ による微分をドットで表記するニュートンの記法が使用されます。
\dot x:=\frac{dx}{dt}
ニュートンの記法を使用すれば、$t$ による微分が成分分解のように見えます。
\begin{aligned}
f&=f(x(t),y(t))\\
df&=f_x\,dx+f_y\,dy\\
\dot f&=f_x\dot x+f_y\dot y
\end{aligned}
三変数関数
物理でよく現れる例です。
$f$ が $x,y,t$ の三変数関数で、$x,y$ が独立ではなく $t$ の関数だとします。
f=f(x(t),y(t),t)
全微分を連鎖させます。
df=\frac{∂f}{∂x}dx+\frac{∂f}{∂y}dy+\frac{∂f}{∂t}dt=\left(\frac{∂f}{∂x}\frac{dx}{dt}+\frac{∂f}{∂y}\frac{dy}{dt}+\frac{∂f}{∂t}\right)dt
両辺を $dt$ で割れば、$f$ の $t$ による微分となります。
\frac{df}{dt}=\frac{∂f}{∂x}\frac{dx}{dt}+\frac{∂f}{∂y}\frac{dy}{dt}+\frac{∂f}{∂t}
$f(x(t),y(t))$ と比較すれば最後の項 $f_t$ が増えていることが分かります。
先ほどの例で $f_t$ が左辺に来るように移項して整理すれば、微分と偏微分は異なることがはっきりします。
\frac{∂f}{∂t}=\frac{df}{dt}-\frac{∂f}{∂x}\frac{dx}{dt}-\frac{∂f}{∂y}\frac{dy}{dt}
※ 後ろの2項がゼロとなるような特別の関係がある場合に限り、微分と偏微分が一致します。次でその例を見ます。
物理で重要なエネルギーの関数です。運動量 $p$ と位置 $q$ と時間 $t$ を引数とします。
H=H(p(t),q(t),t)
全微分を連鎖させます。
dH=H_p\,dp+H_q\,
dq+H_t\,dt=(H_p\dot p+H_q\dot q+H_t)dt
両辺を $dt$ で割れば、$f$ の $t$ による微分となります。
\dot H=H_p\dot p+H_q\dot q+H_t
ところでハミルトニアンには正準方程式と呼ばれる特別な関係があります。
\begin{cases}
\dot p=-H_q \\
\dot q=H_p
\end{cases}
※ 詳細は省略しますが、作用が最小となる条件を表します。
正準方程式を $\dot H$ に代入します。
\dot H=\underbrace{H_p(-H_q)+H_qH_p}_0+H_t=H_t
このようにハミルトニアンは $t$ による微分と偏微分が一致します。
\frac{dH}{dt}=\frac{∂H}{∂t}
連鎖律は約分として捉えられます。
\frac{dx}{dy}\frac{dy}{dz}=\frac{dx}{dz}
分子と分母が約分し合えば $1$ になります。
\frac{dx}{dy}\frac{dy}{dx}=1
式変形すれば逆関数の微分法と呼ばれる関係が得られます。
\frac{dx}{dy}=\frac{1}{\frac{dy}{dx}}
この関係は偏微分でも成り立ちます。
\frac{∂x}{∂y}\frac{∂y}{∂x}=1
\frac{∂x}{∂y}=\frac{1}{\frac{∂y}{∂x}}
偏微分の連鎖は単純に約分できないため注意が必要です。
次の関数を考えます。
f(x,y,z)=0
この場合、偏微分の連鎖は単純に約分できません。これをオイラーの連鎖式と呼びます。
\frac{∂x}{∂y}\frac{∂y}{∂z}\frac{∂z}{∂x}=-1
直観的に理解しにくいですが、約分の際に符号が反転することに由来します。
\frac{∂x}{∂y}\frac{∂y}{∂z}=-\frac{∂x}{∂z}
導出
※ 以下は Triple product rule の Alternative derivation を基にしています。
条件 $=0$ があるため自由度が1つ減り、$x,y,z$ のうち2つを決めれば残りの1つが決まります。
\begin{aligned}
x&=x(y,z)\\
y&=y(z,x)\\
z&=z(x,y)
\end{aligned}
$x,y$ を全微分します。
\begin{aligned}
dx&=\frac{∂x}{∂y}dy+\frac{∂x}{∂z}dz\\
dy&=\frac{∂y}{∂z}dz+\frac{∂y}{∂x}dx
\end{aligned}
$dx$ の右辺に $dy$ を代入します。途中、逆関数の微分法が出て来ます。
\begin{aligned}
dx
&=\frac{∂x}{∂y}\left(\frac{∂y}{∂z}dz+\frac{∂y}{∂x}dx\right)+\frac{∂x}{∂z}dz\\
&=\underbrace{\frac{∂x}{∂y}\frac{∂y}{∂x}}_{\text{
逆関数の
微分法}→1}dx+\left(\frac{∂x}{∂y}\frac{∂y}{∂z}+\frac{∂x}{∂z}\right)dz\\
&=dx+\left(\frac{∂x}{∂y}\frac{∂y}{∂z}+\frac{∂x}{∂z}\right)dz
\end{aligned}
\left(\frac{∂x}{∂y}\frac{∂y}{∂z}+\frac{∂x}{∂z}\right)dz=0
任意の $dz$ で成り立つには係数が $0$ である必要があります。
\frac{∂x}{∂y}\frac{∂y}{∂z}+\frac{∂x}{∂z}=0
移項すれば、偏微分での約分の際に符号が反転することが分かります。
\frac{∂x}{∂y}\frac{∂y}{∂z}=-\frac{∂x}{∂z}
これによりオイラーの連鎖式が示されました。
\frac{∂x}{∂y}\frac{∂y}{∂z}\frac{∂z}{∂x}=-\frac{∂x}{∂z}\frac{∂z}{∂x}=-1