방향도함수

정의[편집 | 원본 편집]

대수적 정의[편집 | 원본 편집]

[math]\displaystyle{ x }[/math]에서의 방향도함수란 x에서의 접공간 (tangent space)의 쌍대공간 (dual space)인 cotangent space의 원소를 말한다. 이때 [math]\displaystyle{ T_x{X} }[/math][math]\displaystyle{ x }[/math]의 tangent space, [math]\displaystyle{ T_x{X}^* }[/math][math]\displaystyle{ x }[/math]의 cotangent space라 하면 접벡터와 방향도함수의 내적으로써 자연스러운 짝짓기사상 (natural pairing)

[math]\displaystyle{ ε: T_x{X} \times T_x{X}^* \to \mathbb{R} }[/math]

을 얻고, 이 pairing의 함수값으로 그 방향 기울기가 나온다. 그리고 cotangent space는 tangent space의 dual space이기에 각각의 tangent space에 대응하는 쌍대기저 (dual basis)를 가지는데, 접공간의 기저 [math]\displaystyle{ \left\{e_1, …, e_n\right\} }[/math]의 쌍대기저로 편미분 [math]\displaystyle{ \left\{f_{x_1}, ..., f_{x_n}\right\} }[/math]를 가지고 따라서 모든 방향도함수는 각 편미분들의 선형결합으로 나타난다.

해석적 정의[편집 | 원본 편집]

함수 [math]\displaystyle{ f:A \subseteq \mathbb{R}^m \to \mathbb{R}^n }[/math](단, m, n은 양의 정수이고 [math]\displaystyle{ m\ge 2 }[/math][1])을 생각하자.

[math]\displaystyle{ A }[/math]의 내부점(interior point) [math]\displaystyle{ \mathbf{x} \in \operatorname{int} A }[/math] 및 영이 아닌[2] [math]\displaystyle{ \mathbf{u}\in \mathbb{R}^m }[/math]에 대하여 다음 극한

[math]\displaystyle{ \lim_{t\to 0}\frac{f(\mathbf{x}+t\mathbf{u})-f(\mathbf{x})}{t} }[/math]

이 존재하면, 이를 [math]\displaystyle{ \mathbf{x} }[/math]에서의 [math]\displaystyle{ \mathbf{u} }[/math]에 대한 [math]\displaystyle{ f }[/math]의 방향도함수(directional derivative of [math]\displaystyle{ f }[/math] at [math]\displaystyle{ \mathbf{x} }[/math] along the vector [math]\displaystyle{ \mathbf{u} }[/math])라고 하고, [math]\displaystyle{ f'(\mathbf{x};\mathbf{u}) }[/math], [math]\displaystyle{ D_\mathbf{u}f(\mathbf{x}) }[/math], [math]\displaystyle{ \nabla_\mathbf{u}f(\mathbf{x}) }[/math], [math]\displaystyle{ \partial_\mathbf{u}f(\mathbf{x}) }[/math] 등으로 표기한다.

이러한 정의는 일변수함수의 미분을 이용한 다음 정의

[math]\displaystyle{ f'(\mathbf{x};\mathbf{u}) = \left. \frac{\mathrm{d}}{\mathrm{d}t} f(\mathbf{x}+t\mathbf{u}) \right|_{t=0} }[/math]

와 동치임을 쉽게 확인할 수 있다.

예를 들어 우리가 산을 오른다고 하면, 우리는 걸어감에 따라 높이 변화를 경험하게 된다. 이때 우리가 겪는 높이 변화는 우리가 어떤 방향으로 가느냐에 따라 다를 것이다. 이렇게 특정한 방향으로 갈 때의 높이 변화를 식으로 나타낸 것이 바로 방향도함수이다. 즉, [math]\displaystyle{ \mathbf{x} }[/math]에서 [math]\displaystyle{ \mathbf{u} }[/math] 방향으로 갈 때의 함숫값의 순간변화율이 바로 방향도함수 [math]\displaystyle{ f'(\mathbf{x};\mathbf{u}) }[/math]이다.

다른 정의로 함수 [math]\displaystyle{ f }[/math]의 정의역이 노름공간(normed space)인 경우에는 위 벡터 [math]\displaystyle{ \mathbf{u} }[/math]의 크기, 즉 특정한 방향으로 가는 ‘속력’을 생각할 수 있다. 다시 산을 오르는 예를 들면, 우리가 빨리 가면 빨리 갈수록 높이의 변화도 비례해서 커질 것이다. 만약 우리가 정말로 특정한 ‘방향’으로 갈 때의 높이 변화만을 측정하고 싶다면 속력에 따른 변화를 상쇄하기 위해 속력으로 나누어 주어야 할 것이다. 따라서 방향도함수를 다음과 같이 정의하기도 한다.

[math]\displaystyle{ \frac{1}{\|\mathbf{u}\|} \lim_{t\to 0}\frac{f(\mathbf{x}+t\mathbf{u})-f(\mathbf{x})}{t} }[/math]

혹은 아예 [math]\displaystyle{ \mathbf{u}\in \mathbb{R}^m }[/math]를 크기가 1인 것 즉 단위벡터만으로 제한하기도 한다.

방향도함수를 이렇게 정의할 경우 특별히 [math]\displaystyle{ \mathbf{x} }[/math]에서의 [math]\displaystyle{ \mathbf{u} }[/math] 방향의 [math]\displaystyle{ f }[/math]의 방향도함수(directional derivative of [math]\displaystyle{ f }[/math] at [math]\displaystyle{ \mathbf{x} }[/math] in the direction [math]\displaystyle{ \mathbf{u} }[/math])라고 일컫기도 한다.

두 정의가 다 의미는 있으나, 후자는 무엇보다 먼저 정의역이 노름공간이어야 한다는 전제가 있다. 따라서 좀 더 일반적으로 확장이 가능한 정의는 전자라고 하겠다.

방향도함수의 성질[편집 | 원본 편집]

만약 [math]\displaystyle{ f }[/math][math]\displaystyle{ \mathbf{x} }[/math]에서 미분가능하면 [math]\displaystyle{ \mathbf{x} }[/math]에서 [math]\displaystyle{ f }[/math]의 모든 방향도함수가 존재하고

[math]\displaystyle{ f'(\mathbf{x};\mathbf{u})=Df(\mathbf{x})\cdot \mathbf{u} }[/math]

이다. 그 역은 성립하지 않는다.

편도함수의 정의에 의해 [math]\displaystyle{ \partial_i f(\mathbf{x}) = \frac{\partial f(\mathbf{x})}{\partial x_i} = f'(\mathbf{x};\mathbf{e}_i) = \partial_{\mathbf{e}_i} f(\mathbf{x}) }[/math]이다. 즉, 방향도함수는 편도함수의 일반화로 이해할 수 있다.

만약 [math]\displaystyle{ f'(\mathbf{x};\mathbf{u}) }[/math]가 존재하고 [math]\displaystyle{ \mathbf{v} = k\mathbf{u} }[/math](단, [math]\displaystyle{ k \neq 0 }[/math]이면 [math]\displaystyle{ f'(\mathbf{x};\mathbf{v}) }[/math]도 존재하고,[3]

[math]\displaystyle{ f'(\mathbf{x};\mathbf{v})=kf'(\mathbf{x};\mathbf{u}) }[/math] (다른 정의에 의할 경우 [math]\displaystyle{ f'(\mathbf{x};\mathbf{v})=f'(\mathbf{x};\mathbf{u}) }[/math])

이다.

오개념[편집 | 원본 편집]

어떤 점에서 함수의 모든 방향도함수가 존재한다고 그 함수가 미분가능한 것은 아니다. [math]\displaystyle{ f:\mathbb{R}^2 \to \mathbb{R} }[/math]

[math]\displaystyle{ f(x,y)=\begin{cases} \frac{x^3-y^3}{x^2+y^2},& (x,y)\ne (0,0)\\ 0,& (x,y)=(0,0) \end{cases} }[/math]

로 정의하고, [math]\displaystyle{ \mathbf{u}=(u_1,u_2)\ne \mathbf{0} }[/math]라고 할 때

[math]\displaystyle{ \begin{align} f'(\mathbf{0};\mathbf{u})&=\lim_{t\to 0}\frac{f(t\mathbf{u})-f(\mathbf{0})}{t}\\ &=\lim_{t\to 0}\frac{t^3u_1^3-t^3u_2^3}{t(t^2u_1^2+t^2u_2^2)}\\ &=\frac{u_1^3-u_2^3}{u_1^2+u_2^2} \end{align} }[/math]

이므로 [math]\displaystyle{ \mathbf{0} }[/math]에서 모든 방향의 방향도함수가 존재한다. 그런데 [math]\displaystyle{ f }[/math][math]\displaystyle{ \mathbf{0} }[/math]에서 미분가능하다면 [math]\displaystyle{ Df(\mathbf{0}) }[/math]은 1×2 행렬이므로 이를 [math]\displaystyle{ \begin{bmatrix}a & b\end{bmatrix} }[/math]라 하면

[math]\displaystyle{ f'(\mathbf{0};\mathbf{u})=Df(\mathbf{0})\cdot\mathbf{u}=au_1+bu_2 }[/math]

인데 이러면 앞에서 구한 방향도함수 식이 선형이 아니므로 모순이다. 그러므로 [math]\displaystyle{ f }[/math][math]\displaystyle{ \mathbf{0} }[/math]에서 미분가능하지 않다.

이름에 대하여[편집 | 원본 편집]

이름에 대해 의문을 가질 수 있는데, 우리가 일변수함수 [math]\displaystyle{ f:A \subseteq \mathbb{R} \to \mathbb{R} }[/math]x에서 미분가능할 때 [math]\displaystyle{ \lim_{t\to 0}\frac{f(x+t)-f(x)}{t} }[/math]는 도함수라기보다 미분계수라고 했고, 각 x에 대해 그 점에서의 미분계수를 대응시키는 함수라야 도함수라고 하였기 때문이다. 즉 여기서도 방향도함수라기보다 방향미분계수라고 하여야 하는 것이 아니냐는 것이다.

아마도 일변수함수에서는 x 근방에서의 함숫값을 가지고 평균변화율의 극한을 구해 보아야 그건 한 점에서의 미분계수의 값일 뿐으로서 그 점이 아닌 점에서의 극한에는 아무 영향이 없다는 점을 강조하고, 각 점마다 그 점에 대해 그러한 극한값을 생각하여야 비로소 도함수라는 함수를 상정할 수 있다는 점을 강조하기 위해 (특별히 고등학교) 교육과정에서는 이처럼 다른 이름을 가르쳐 주는 듯하나, 결국 미분계수라는 게 그 점에서의 도함수의 함숫값과 같게 되는 점, 일변수함수에서의 많은 경험을 한 이제 와서는 그냥 ‘도함수’라는 이름을 혼용해도 별 혼동은 없을 것이라는 점, 특히 영어에서는 어떤 함수의 이름을 그 함수 자체로도 또 함숫값으로도 쓰는 것이 전혀 어색하지 않다는 점에서 그냥 방향도함수(directional derivative)라고 뭉뚱그려 일컫는 듯하다.

같이 보기[편집 | 원본 편집]

각주

  1. 2 이상이어야 방향도함수를 말하는 의미가 있다.
  2. 후술하듯 단위벡터로만 제한하는 책도 있다.
  3. 증명: [math]\displaystyle{ kt=t' }[/math]으로 두면 [math]\displaystyle{ \lim_{t\to 0}\tfrac{f(\mathbf{x}+t\mathbf{v})-f(\mathbf{x})}{t} = \lim_{t\to 0}\tfrac{f(\mathbf{x}+tk\mathbf{u})-f(\mathbf{x})}{t} = \lim_{t\to 0}k \tfrac{f(\mathbf{x}+tk\mathbf{u})-f(\mathbf{x})}{tk} = k\lim_{t'\to 0}\tfrac{f(\mathbf{x}+t'\mathbf{u})-f(\mathbf{x})}{t'} }[/math]