連鎖律(チェインルール)~多変数関数の合成関数の微分
更新
連鎖律(チェインルール)とは,高校数学で習う合成関数の微分公式を多変数関数に拡張した公式です。
例えば,2変数関数の場合,以下のようになります。
から が定まり, から が定まるとき となる。
この記事では,連鎖律の具体例・行列を使った表現・導出について解説します。
連鎖律は数学ではもちろん,物理でも頻繁に登場します。また,機械学習におけるニューラルネットワークの逆誤差伝搬法を理解するためにも必要な公式です。
偏微分が大量に登場します。偏微分については偏微分の意味と計算例・応用をどうぞ。
練習問題があります。こちらから解いてみてください。→連鎖律(chain rule)の練習問題
連鎖律
連鎖律
高校数学で合成関数の微分(→合成関数の微分公式と例題7問)を習いました。例えば の微分は と の合成関数だと思うことで と計算できます。
これを多変数関数に拡張したのが連鎖律(チェインルール)です。
2変数から1変数へ
2変数関数を1変数関数に置換する際の連鎖律から紹介します。
2変数関数 について, を の関数 と置換するとき, の による微分は
となる。
2変数から2変数へ
2変数関数を2変数関数に置換する際の連鎖律から紹介します。
2変数関数 について, を の関数 と置換するとき, の による偏微分は となる。
作り方
連鎖律は項が多くて間違えそうな方も多いでしょう。
簡単な公式の作り方を紹介します。
- 関数( など)と微分したい変数( など)をずらして書く:
- と の間にある変数( など)を1つ選んで,間に書き込む:
- 他にも間にある変数があれば,すべて足す:
例題
例題
連鎖律を使って偏微分を計算してみます。この記事では,全ての偏微分係数が存在するとき,という条件はいちいち書かないことにします。
に対して,偏導関数 を求めよ。
, とおくと, であり,
連鎖律と行列
連鎖律と行列
連鎖律を行列で表現してみます。
のヤコビ行列(偏導関数を並べたもの)を , のヤコビ行列を とします。→ヤコビ行列,ヤコビアンの定義
つまり,
です。このとき連鎖律は
のヤコビ行列
がヤコビ行列の積 となることを表しています。 つまり合成関数のヤコビ行列はヤコビ行列の合成になります。
より一般に,以下が成立します。
から が定まり, から が定まるとする。それぞれの変換のヤコビ行列を とする。
このとき, のヤコビ行列は
例えば のとき, という感じです。美しいですね!
連鎖律の導出
連鎖律の導出
厳密な証明ではありませんが,イメージはつかみやすいと思います。
を に微小変化させたときの の変化量
を に微小変化させたときの の変化量
以上2式より, を に微小変化させたときの の変化量
これは のヤコビ行列が であることを示している。
連鎖律のことを英語では chain rule(チェインルール)と言います。けっこうかっこいいですね。