連鎖律(多変数関数の合成関数の微分)
更新
連鎖律(チェインルール)とは,高校数学で習う合成関数の微分公式を多変数関数に拡張した公式です。例えば,2変数関数の場合,以下のようになります。
から が定まり, から が定まるとき,
この記事では,連鎖律の具体例,行列を使った表現,導出について解説します。
連鎖律について
連鎖律について
高校数学で習う合成関数の微分(→合成関数の微分公式と例題7問)を多変数関数に拡張したのが連鎖律です。
連鎖律は数学ではもちろん,物理でも頻繁に登場します。また,機械学習におけるニューラルネットワークの逆誤差伝搬法を理解するためにも必要な公式です。
偏微分が大量に登場します。偏微分については偏微分の意味と計算例・応用をどうぞ。
例題
例題
連鎖律を使って偏微分を計算してみます。この記事では,全ての偏微分係数が存在するとき,という条件はいちいち書かないことにします。
に対して,偏導関数 を求めよ。
, とおくと, であり,
連鎖律と行列
連鎖律と行列
連鎖律を行列で表現してみます。
のヤコビ行列(偏導関数を並べたもの)を , のヤコビ行列を とします。→ヤコビ行列,ヤコビアンの定義
つまり,
,
です。このとき連鎖律は
のヤコビ行列
がヤコビ行列の積 となることを表しています。
より一般に,以下が成立します。
から が定まり, から が定まるとする。それぞれの変換のヤコビ行列を とする。
このとき, のヤコビ行列は
例えば のとき, という感じです。美しいですね!
連鎖律の導出
連鎖律の導出
厳密な証明ではありませんが,イメージはつかみやすいと思います。
を に微小変化させたときの の変化量
を に微小変化させたときの の変化量
以上2式より, を に微小変化させたときの の変化量
これは のヤコビ行列が であることを示している。
連鎖律のことを英語では chain rule(チェインルール)と言います。けっこうかっこいいですね。