연쇄법칙

연쇄법칙(Chain Rule)은 합성함수도함수에 관한 법칙이다.

설명[편집 | 원본 편집]

두 미분가능한 함수 [math]\displaystyle{ f(x), g(x) }[/math]의 합성함수[math]\displaystyle{ (f \circ g)(x) = f(g(x)) }[/math]가 존재할 때 도함수를 구하는 법칙이다. 여기서 더 정확히 보면 함수 [math]\displaystyle{ g(x) }[/math][math]\displaystyle{ x=c_0 }[/math]에서 미분가능하고, 함수 [math]\displaystyle{ f(x) }[/math][math]\displaystyle{ x=g( x_0 ) }[/math]에서 미분가능하다고 할 때 합성함수의 도함수는 다음과 같이 유도할 수 있다.

[math]\displaystyle{ (f \circ g)'(x_0 ) = f'(g(x_0)) \cdot g'(x_0) }[/math]

여기서 [math]\displaystyle{ y = f(u) , u =g(x) }[/math]일 때 라이프니츠 표기법을 이용해서 표시하면 다음과 같이 정의할 수 있다.

[math]\displaystyle{ \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} }[/math]

다변수 함수에서 정의[편집 | 원본 편집]

다변수 집합 [math]\displaystyle{ X = (x_1 , x_2 , \cdots , x_n), U = (u_1 , u_2 , \cdots , u_r ) , Y = (y_1, y_2, \cdots , y_m) }[/math]과 다변수 사상 [math]\displaystyle{ F: U \rightarrow Y, G: X \rightarrow U }[/math]에 대해 점 [math]\displaystyle{ \mathbf{a} }[/math]에서 [math]\displaystyle{ (F \circ G): X \rightarrow Y }[/math]에서의 다변수 사상의 미분은 다음과 같이 유도된다.

[math]\displaystyle{ D(f \circ g) (\mathbf{a}) = Df(g(\mathbf{a})) D g(\mathbf{a}) }[/math]

파 디 브루노의 정리[편집 | 원본 편집]

함수의 합성의 고계 도함수에 대한 다음과 같은 공식이 성립하며, 이를 파 디 브루노 공식(영어: Faà di Bruno's formula)이라고 한다.

[math]\displaystyle{ (f\circ g)^{(n)}(x)=\sum_{k_1,\dots,k_n\ge0}^{k_1+2k_2+\cdots nk_n=n}\frac{n!}{k_1!\cdots k_n!}f^{(k_1+\cdots+k_n)}(g(x))\prod_{m=1}^n\left(\frac{g^{(m)}(x)}{m!}\right)^{k_m} }[/math]

증명[편집 | 원본 편집]

일변수 함수일 경우 증명[편집 | 원본 편집]

이 정리를 증명하기 위해서는 다음과 같은 보조정리를 우선 증명해야 한다.

보조정리
함수 [math]\displaystyle{ y = f(x) }[/math]가 x에서 미분가능할 때 x 주변의 값에 대해서 y의 변화량 [math]\displaystyle{ \Delta y }[/math]는 x의 변화량 [math]\displaystyle{ \Delta x }[/math]와 적당한 변량 [math]\displaystyle{ \epsilon }[/math]를 이용해서 다음과 같이 표현 가능하다:
[math]\displaystyle{ \Delta y = f'(x) \Delta x + \epsilon \Delta x }[/math]
여기서 [math]\displaystyle{ \Delta x \rightarrow 0 }[/math]이면 [math]\displaystyle{ \epsilon \rightarrow 0 }[/math]이다.
증명
[math]\displaystyle{ \epsilon = \begin{cases} {\frac{f(x+\Delta x) - f(x)}{\Delta x} - f'(x) } & {\Delta x \neq 0} \\ 0 & {\Delta x =0 } \end{cases} }[/math]
그런데 [math]\displaystyle{ \Delta y = f(x+ \Delta x) - f(x) }[/math]이므로 [math]\displaystyle{ \Delta y = \epsilon \Delta x + f'(x) \Delta x }[/math]이다. 또한 [math]\displaystyle{ \Delta y = 0 if \Delta x =0 }[/math]이므로 이 값은 [math]\displaystyle{ \Delta x }[/math]와 무관하게 성립한다.
마지막으로 미분가능의 정의를 이용해면 [math]\displaystyle{ \lim_{\Delta x \rightarrow 0 } \frac{f(x+\Delta x) - f(x)}{\Delta x} - f'(x) = 0 }[/math] 을 유도할 수 있다.

이제 이 보조정리를 이용해서 [math]\displaystyle{ u = g(x) }[/math]라고 놓으면 [math]\displaystyle{ \Delta(u) = g'(x) \Delta x + \epsilon_1 \Delta x }[/math]라고 놓을 수 있으며, 마찬가지로 [math]\displaystyle{ y = f(u) }[/math]인 것을 이용해서 [math]\displaystyle{ \Delta y = f'(u) \Delta u + \epsilon_2 \Delta u }[/math]임을 이용할 수 있다. 여기서 [math]\displaystyle{ \epsilon_1 , \epsilon_2 }[/math]는 각각 [math]\displaystyle{ \Delta x }[/math]가 0으로 갈 때 0으로 수렴한다. 이 식을 이용해서

[math]\displaystyle{ \Delta y = [f'(u) + \epsilon_2][g'(x) + \epsilon_1 ] \Delta x }[/math] 다시 말해 [math]\displaystyle{ \frac{\Delta y}{\Delta x} = (f'(u)+\epsilon_2)(g'(x) + \epsilon_1) }[/math]로 놓을 수 있다. 그런데 [math]\displaystyle{ \Delta x }[/math]가 0으로 수렴할 때 [math]\displaystyle{ \epsilon_1, \epsilon_2 }[/math]는 각각 0으로 수렴하므로 결과적으로
[math]\displaystyle{ \lim_{\Delta x \rightarrow 0}\frac{\Delta y}{\Delta x} = f'(u)g'(x) = f'(g(x))g'(x) }[/math]로 수렴하는 것을 알 수 있다.