사용자:CrMT/연습장/2: 두 판 사이의 차이

잔글편집 요약 없음
잔글편집 요약 없음
1번째 줄: 1번째 줄:
[[해석학]]과 [[위상수학]]에서, '''하이네-보렐 정리'''(Heine-Borel theorem)는 유클리드 공간에서, 닫힌 유계 집합만이 컴팩트하다는 것을 말한다. 유클리드 공간을 자주 다루는 실해석학에서 기본적인 성질, 특히 [[적분가능|적분가능성]]을 증명할 때 자주 사용된다.
\documentclass[12pt,a4paper]{article}
\usepackage{amsfonts,amsmath,amsthm,latexsym,amssymb,kotex,mathrsfs,enumitem,mathtools}
\usepackage{graphicx}
\usepackage[onehalfspacing]{setspace}
\allowdisplaybreaks


== 진술 ==
\newtheorem{theorem}{Theorem}
유클리드 공간의 부분집합 <math>K</math>에 대하여, 다음 두 조건이 동치이다:
\newtheorem{definition}[theorem]{Definition}
: <math>K</math>가 닫혀 있고 유계이다.
\newtheorem{lemma}[theorem]{Lemma}
: <math>K</math>가 [[컴팩트]]하다.
\newtheorem{corollary}[theorem]{Corollary}
단, 여기서의 '닫힘'은 보통의 위상(usual topology)에서를 말한다.
\newtheorem{proposition}[theorem]{Proposition}


== 설명 ==
\usepackage[hmargin=1in,vmargin=.5in]{geometry}
이 정리는 유클리드 공간 <math>\mathbb R^n</math>에서의 컴팩트성의 필요충분조건을 알려준다. 이 정리 없이 컴팩트성을 증명하려면 모든 열린 덮개에 대한 전수 조사를 해야 하는데, 이 정리를 이용하면 닫힘과 유계임만 보이면 되기 때문이다.  
\begin{document}
\title{General Leibniz Rule And Faà Di Bruno's Formula}
\author{$\sum_{1\le k \le 10} \sum_{1\le j \le k} jk$}
\date{20160204}
\maketitle
\section{General Leibniz Rule}
\subsection{Statement}
\textbf{일반화된 Leibniz 규칙}(generalized Leibniz rule)은 곱의 미분법을 일반화한 정리이다. $u, \; v$가 $t$에 대한 $n$-차 미분가능 일변수 함수이면 다음이 성립한다:
$$(uv)^{(n)} = \sum_{k=0}^n \binom{n}{k} u^{(k)} v^{(n-k)}.$$
더욱 일반적으로, $t$에 대한 $n$-차 미분가능한 일변수 함수 $u_1, \cdots, u_\ell$에 대하여 다음이 성립한다:
$$\left(\prod_{i=1}^\ell u_i \right)^{(n)} = \sum_{\sum_j k_j = n} \binom{n}{k_1, \cdots, k_\ell} \prod_{i=1}^\ell {u_i}^{(k_i)}.$$


이 정리에서 말하는 '닫힘'이란, 보통의 위상, 즉 usual topology에서의 닫힘을 말한다. , 열린 공(open ball)들을 [[기저#위상수학에서|basis element]]로 하는 위상을 말한다. 이 정리는 위상에 의존하는데, 그 예를 들자면: 이산 위상(discrete topology)에서는 유한집합만이 컴팩트한 집합이기 때문이다. 또한, 이 정리는 유클리드 공간의 거리 함수(metric)에도 의존한다. 이 정리는 우리가 보통 사용하는 유클리드 거리를 가졌을 때만 성립하는데, 예를 들면: 보통의 거리, 즉 유클리드 거리를 <math>d</math>라고 할 때 새로운 거리 함수 <math>d' = d / (1+d)</math>는 거리 함수의 조건을 모두 만족하며, 모든 <math>\mathbb R^n</math>의 부분집합을 유계로 만든다. 하지만 <math>[0, \infty)\subset \mathbb R</math>는 유계이고 닫혀 있음(여집합 <math>(-\infty, 0)</math>이 열려 있다)에도 불구하고 컴팩트하지 않다.
\subsubsection{Proof}
증명은 귀납법으로써 한다. $n=0$일 때엔 당연히 성립하며($\because \binom 0 {0, \cdots, 0} = 1$), $n=m$일 때를 가정하자. 그러면 $n=m+1$일 때,  
\begin{align*} \left(\prod_{i=1}^\ell u_i \right)^{(m+1)} &= \frac{\mathrm d}{\mathrm dt} \left(\prod_{i=1}^\ell u_i \right)^{(m)} \\ &= \frac{\mathrm d}{\mathrm dt}\sum_{\sum_j k_j = m} \binom{m}{k_1, \cdots, k_\ell} \prod_{i=1}^\ell {u_i}^{(k_i)}  \\ &= \sum_{\sum_j k_j = m} \frac{m!}{k_1 ! \cdots k_\ell !} \frac{\mathrm d}{\mathrm dt} \prod_{i=1}^\ell {u_i}^{(k_i)}  \\ &= \sum_{\sum_j k_j = m} \binom{m}{k_1, \cdots, k_\ell} \sum_{i=1}^\ell {u_i}^{(k_i + 1)} \prod_{1\le j \le \ell, \; j\ne i} {u_j} ^ {(k_j)}  \\ &= \sum_{i=1}^\ell \sum_{\sum_j k_j = m} \binom{m}{k_1, \cdots, k_\ell} {u_i}^{(k_i + 1)} \prod_{1\le j \le \ell, \; j\ne i} {u_j} ^ {(k_j)} \\ &= \sum_{i=1}^\ell \sum_{\sum_{j\ne i} k_j + (k_i + 1) = m+1} \binom{m}{k_1, \cdots, k_\ell} {u_i}^{(k_i + 1)} \prod_{1\le j \le \ell, \; j\ne i} {u_j} ^ {(k_j)} \\ &= \sum_{i=1}^\ell \sum_{\sum_{j} {\hat k_j} = m + 1} \binom{m}{\hat k_1, \cdots, \hat k_{i-1}, \hat k_i - 1, \hat k_{i+1}, \cdots,  \hat k_\ell} \prod_{j=1}^\ell {u_j} ^ {(\hat k_j)} \\ &= \sum_{\sum_{j} {\hat k_j} = m + 1} \sum_{i=1}^\ell \binom{m}{\hat k_1, \cdots, \hat k_{i-1}, \hat k_i - 1, \hat k_{i+1}, \cdots, \hat k_\ell} \prod_{j=1}^\ell {u_j} ^ {(\hat k_j)} \\ &= \sum_{\sum_{j} {\hat k_j} = m + 1} \binom{m+1}{\hat k_1, \cdots, \hat k_\ell} \prod_{j=1}^\ell {u_j} ^ {(\hat k_j)}.\end{align*}
(where $\hat k_j = k_j \text{ when }j\ne i, \; \hat k_i = k_i + 1$)으로 성립한다. 마지막 부분은 다항계수 항등식으로 자명하다.


어쨌든 이런 많은 제약이 있음에도 불구하고, 우리는 보통의 위상과 보통의 거리 함수를 이용하므로, 이 정리는 유클리드 공간에서 매우 유용하게 쓰인다. 특히 실해석학에서는 앞의 이론적인 배경을 쌓는 부분에 지겨울 정도로 보인다(...) 컴팩트가 나오면 무조건 하이네-보렐 정리를 쓸 정도로...
\subsection{Generalization for Multivariable Calculus}
다변수 함수의 경우에는 미분 연산자를 편미분 연산자로만 바꾸면 된다. 즉,  
$$\partial^\alpha (fg) = \sum_{0\le \beta \le \alpha} \binom \alpha \beta (\partial ^\beta f)(\partial ^{\alpha - \beta} g).$$
(양변에 $\partial ^\alpha t$는 생략.)


== 증명 ==
\section{Faà di Bruno's Formula}
이하는 [[PMA]]에 소개된 증명을 따른다.
\subsection{Statement}
\textbf{Faà di Bruno 공식}은 chain rule을 고차 미분으로 일반화한 공식이다. 함수 $f$와 $g$가 미분가능한 일변수 함수이면 다음이 성립한다:
$$\frac{\mathrm d ^n}{\mathrm dx^n} f(g(x)) = \sum_{\sum_{1\le j \le n} j\cdot m_j = n}\frac{n!}{m_1! m_2! \cdots m_n!} f^{(m_1 + \cdots + m_n)}(g(x)) \prod_{1\le  j \le n} \left(\frac{g^{(j)}(x)}{j!} \right)^{m_j}.$$
이를 \textbf{Bell polynomial} $$B_{n,k}(x_1, \cdots , x_{n-k+1} ) = \sum_{(j_1 , \cdots , j_{n-k+1})} \frac{n!}{j_1! j_2! \cdots j_{n-k+1}!} \prod_{i=1}^{n-k+1} \left(\frac{x_i}{i!}\right)^{j_i}$$ where $j_1 + \cdots + j_{n-k+1} = k$ and $j_1 + 2j_2 + \cdots + (n-k+1)j_{n-k+1} = n$을 이용하여 간단히(?) 나타내면
$$\frac{\mathrm d ^n}{\mathrm dx^n} f(g(x)) = \sum_{k=1}^n f^{(k)} (g(x)) B_{n,k} \left( g'(x) , \cdots , g^{(n-k+1)}(x)\right)$$
가 된다. 또한, 이를 `조합적'으로 나타내면 다음과 같다:
$$\frac{\mathrm d ^n}{\mathrm dx^n} f(g(x)) = \sum_{\pi \in \Pi }f^{(|\pi|)}(g(x)) \prod{B\in \pi} g^{(|B|)}(x),$$
이때 $\pi$는 $\{1, \cdots, n\}$의 partition들이며 $\Pi$는 그러한 $\pi$들의 집합이고, $B \in \pi$는 partition $\pi$의 한 `block'을 뜻하고, $\pi$의 cardinality는 `block'의 수, $B$의 cardinality는 `block' $B$의 size를 말한다.


=== 보조정리 1 ===
위 식에서의 $f^{(\cdot)}(g(x)) \prod (g^{(\cdot)}(x))^\cdot$의 계수들(\textbf{Faà di Bruno coefficients}) $$\frac {n!}{m_1! m_2! \cdots 1!^{m_1} 2!^{m_2}\cdots}$$은 $n=\underbrace{1+\cdots+1}_{m_1} \,+\, \underbrace{2+\cdots+2}_{m_2} \,+\, \underbrace{3+\cdots+3}_{m_3}+\cdots$으로 나누는 partition의 수이며, Bell polynomial에도 나타난다. 참고로, Bell polynomial은 통계학의 \textbf{cumulant}와도 관계가 있다.
<math>k</math> 차원 hyperrectangle은 컴팩트하다.


''Proof''. <math>I  = \prod_{j=1}^k [a_j, b_j]</math>를 <math>k</math> 차원 hyperrectangle이라고 하고, 그 대각선 길이를 <math>\delta = \sqrt{\sum (b_j - a_j)^2 }</math>이라 하자. <math>\delta = \operatorname{diam}I</math>이므로 <math>  I </math>의 두 점의 거리는 <math> \delta  </math>보다 작거나 같다. 이제, 모순을 이끌어 내기 위해서 유한한 부분 덮개를 가지지 않는 어떤 <math> I  </math>의 열린 덮개 <math>  \{ G_\alpha \} </math>가 있다고 하자. 그러면 <math> I  </math>의 각 변을 절반씩 나누어 만들어지는 <math> 2^k  </math>개의 hyperrectangle 중에서 <math>  \{G_\alpha\} </math>의 유한한 부분 덮개로 덮이지 않는 hyperrectangle이 하나 이상 존재하는데, 이 중 하나를 <math>  I_1 </math>이라고 하자. 이런 식으로, <math>  I_n </math>를 <math>  2^k</math> 개로 나눈 후 그 중 유한한 부분 덮개로 덮이지 않는 것을 <math>  I_{n+1} </math>이라 하자. 그렇다면 집합들의 열 <math>\left < I_n \right></math>은 <math> I_n \supseteq I_{n+1}  </math>이고, 이 중 어느 것도 <math> \{ G_\alpha \}  </math>의 유한한 부분 덮개로 덮이지 않고, <math> I_n </math>의 임의의 두 점 사이 거리는 <math> 2^{-n} \delta </math>보다 작을 수밖에 없다. <math> I_n = \prod_{j=1}^k [a_{n, j}, b_{n, j}]  </math>라 두고 <math>\mathbf x \in \prod _j [\sup_n a_{n, j}, \inf_n b_{n, j}] \ne \emptyset </math>라 하면 <math>\mathbf x\in \bigcap_{n=1}^\infty I_n</math>이다. <math> \{G_\alpha\} </math>는 열린 덮개이므로 어떤 <math>  G_\alpha </math>에 포함되는 <math>  \mathbf x </math>의 열린 <math> \epsilon  </math>-ball이 있을 것이고, [[아르키메데스 성질]]에 의하여 <math>  2^{-n}\delta \le \epsilon </math>인 <math> n  </math>이 존재한다. 그런데 이것은 <math>  I_n \subset G_\alpha </math>를 뜻하는 것이므로 모순이다.
\subsection{Statement: for Multivariable}
위의 $\pi, \; \Pi, \; B$의 정의를 그대로 가져와 쓰면, $y=f(x)$라고 할 때,
$$\frac{\partial ^n}{\partial x_1 \cdots \partial x_n} g(y) = \sum_{\pi \in \Pi} g^{(|\pi|)}(y) \prod_{B\in\pi} \frac{\partial^{|B|}y}{\prod_{j\in B}\partial x_j}$$
이다. 예를 들어 $n=3$이라고 하면
\begin{align*} {\partial^3 \over \partial x_1\, \partial x_2\, \partial x_3}f(y) & = f'(y){\partial^3 y \over \partial x_1\, \partial x_2\, \partial x_3} \\ & + f''(y) \left( {\partial y \over \partial x_1} \cdot{\partial^2 y \over \partial x_2\, \partial x_3} +{\partial y \over \partial x_2} \cdot{\partial^2 y \over \partial x_1\, \partial x_3} + {\partial y \over \partial x_3} \cdot{\partial^2 y \over \partial x_1\, \partial x_2}\right) \\ & + f'''(y) {\partial y \over \partial x_1} \cdot{\partial y \over \partial x_2} \cdot{\partial y \over \partial x_3} \end{align*}
이다.


=== 보조정리 2 ===
우리는 이 식을 이용하여 역함수의 $n$-계 도함수의 `linear recurrence'를 얻을 수 있다.
컴팩트한 집합의 닫힌 부분집합은 컴팩트하다.


''Proof''. 컴팩트 집합 <math>  K </math>의 (<math>  X </math>에 대해) 닫힌 부분집합 <math>  F </math>에 대하여, <math>  \{ V_\alpha \} </math>를 <math>  F </math>의 열린 덮개라 하자. 그러면 <math>  \{V_\alpha \} \cup \{ F^\mathrm c \} </math>은 <math> K  </math>의 열린 덮개를 이룬다. 그런데 <math>  K</math>가 컴팩트하므로 <math> K  </math>덮는 유한한 부분 덮개가 존재하고, 만약 그 부분 덮개에 <math> F^\mathrm c  </math>가 있으면 제외시키자. 그러면 그것은 <math>  \{ V_\alpha\}</math>의 부분 덮개가 된다.
\subsection{Proof}
우리는 다음의 두 가지 point에 집중할 것이다:
\begin{enumerate}[label=\textbf{Pt.\arabic*}]
\item $\frac{\partial^n}{\partial x_1 \cdots \partial x_n}$, 즉 모두 독립적인 변수로 미분했을 때의 식. 우변의 계수는 모두 1일 것이다.
\item $x_i$들이 모두 구별되지 않을 때. 예를 들면, 만약 $n=3$일 때 $x_2 = x_3$이라면, 다음 두 항은 `중복도 2의' 한 항으로 합쳐지게 된다: $$\frac{\partial y}{\partial x_2}\frac{\partial^2 y}{\partial x_1\partial x_3} + \frac{\partial y}{\partial x_3}\frac{\partial^2 y}{\partial x_1\partial x_2} = 2\frac{\partial y}{\partial x_2}\frac{\partial^2 y}{\partial x_1\partial x_2}.$$ 이런 `중복된 항의 수'구하는 데 초점을 둔다.
\end{enumerate}
이런 관점에서는, (다른 접근과는 다르게) 모든 변수가 같은 것보다도 independent한 게 오히려 편하고 쉽고 기본적이다.


=== 보조정리 3 ===
먼저 다음의 $\{1, \cdots, n+1\}$의 partition을 만드는 inductive한 방법(algorithm)을 생각하자: $\pi_n$를 $\{1, \cdots, n\}$의 partition이라고 할 때,
<math>  K </math>가 컴팩트하면 그 무한 부분집합은 <math> K  </math>의 극한점을 하나 이상 가진다. (사실 그 역도 성립한다.)
\begin{enumerate}
\item $\pi_{n+1} = \pi_n \cup \{\{n+1\}\}$,
\item $\pi_{n+1} = \pi_n \setminus \{B\} \cup \{B \cup \{n+1\}$ for some $B\in \pi_n$.
\end{enumerate}
이 두 가지 방법으로 모든 $\{1, \cdots , n+1\}$의 partition을 만들 수 있음은 당연하다. 이제 다음을 귀납적으로 보이자: $$\frac{\partial ^n}{\partial x_1 \cdots \partial x_n} f(y) = \sum_{\pi} f^{(|\pi|)}(y) \prod_{B\in\pi} \frac{\partial^{|B|}y}{\prod_{j\in B}\partial x_j}.$$
이때, $n\ge 0$이다. 만약 $n=0$이면, 다른 경우와 같이 $\pi$는 $ \{1, \cdots, n\}$의 특정한 non-empty subset들을 모은 것이므로 $\{1, \cdots , n \} = \emptyset$ if $n=0$에서 $\pi$는 아무 원소도 가질 수 없고, 즉 $\pi=\emptyset$으로 보는 것이 타당하다. 이에 따라 $n=0$일 때에 $f(y) = f(y)$로 성립한다.


''Proof''. <math>  K </math>의 무한 부분집합 <math>E</math> 안에 <math>K</math>의 극한점이 하나도 없으면, <math>q\in K</math>의 근방 <math>V_q</math>와 <math>E</math>가 많아야 하나가 되게 할 수 있다. 그런데 이 <math>V_q</math>는 <math>E</math>를 덮지 못하므로 <math>K</math> 역시 덮지 못하고, 이는 <math>K</math>의 컴팩트성에 모순이다.
이제 다음 전개를 보자:
\begin{align*} \frac{\partial^{n+1}}{\partial x_1 \cdots \partial x_{n+1}} f(y) &= \frac \partial {\partial x_{n+1}} \sum_{\pi} f^{(|\pi|)}(y) \prod_{B\in\pi} \frac{\partial^{|B|}y}{\prod_{j\in B}\partial x_j}


=== 보조정리 4 ===
<math>\mathbb R^k</math>의 부분집합 <math> K  </math>에 대하여, 임의의 <math>K</math>의 무한 부분집합이 <math> K  </math>의 극한점을 하나 이상 가지면 <math>K</math>는 닫혀 있고 유계이다.


''Proof''. 만약 <math>K</math>가 유계가 아니라고 가정하면 <math>K</math>에서 <math>|\mathbf x_ n | > n</math>인 원소들을 가져와 점렬을 만들 수 있고, <math>\{\mathbf x_n\}_{n\in\mathbb N}</math>은 극한점을 가지지 않으므로 모순이다.


만약 <math>K</math>가 닫혀 있지 않다고 가정하면, <math>\mathbf x^* \in K' \setminus K</math>가 존재한다. <math>\mathbf x_0</math>가 극점이므로 <math>| \mathbf x_n - \mathbf x^* | < 1/n</math>인 <math>\left< \mathbf x_n\right></math>가 존재하고, <math>\{\mathbf x_n \}</math>는 무한집합이며 <math>\mathbf x^*</math>만을 극한점으로 갖는다. 그런데 이 집합은 <math>K</math>의 극한점을 포함하지 않으므로 모순이다.


=== 본 정리의 증명 ===
(충분조건) <math>K</math>가 닫혀 있고 유계이면 <math>K</math>는 컴팩트하다.
: <math>K</math>가 유계이면 <math>K \subseteq I</math>인 hyperrectangle <math>I</math>가 존재하고, <math>K</math>는 컴팩트한 <math>I</math>(보조정리 1)의 닫힌 부분집합이므로 컴팩트하다(보조정리 2).


(필요조건) <math>K</math>가 컴팩트하면 닫혀 있고 유계이다.
: 보조정리 3과 보조정리 4에 의하여 증명된다.


== 이용 ==
이 정리는 특히 실해석학 전반부에서 많이 이용된다. 컴팩트, 유계, 수렴, 연속 등의 성질이 모두 변화의 폭이 '충분히 작다'는 것으로 일맥상통한다. 컴팩트성하면 유한한 부분덮개로 덮일만큼 '작고', 유계이면 어떤 적당한 반지름의 공(ball)보다 '작고', 수렴한다는 것은 [[엡실론-델타 논법]]으로 정의되므로 임의의 엡실론보다도 '작고', 연속이라는 것도 함숫값 주위의 값이 함숫값으로 수렴하는 것이기 때문에 변동의 폭이 '작다'는 것을 의미한다. 또한 적분가능성 역시 수렴성의 일종으로 볼 수 있으므로 컴팩트가 좋은 성질을 준다.<ref>실제로 이 하이네-보렐 정리가 적분가능성 부분에 많은 도움을 주었다.</ref> 그렇기 때문에 이와 관련된 성질에서는 컴팩트성이 많이 쓰인다. 컴팩트성은 이렇게 좋은 성질을 가지고 있는데, 안타깝게도 컴팩트성을 증명하는 것은 어렵다. 하지만 이 하이네-보렐 정리에 의하여 적어도 유클리드 공간에서는 닫힘과 유계임만 보이면 되니 꽤 잘 쓰일 수 있다는 것이다. 실해석학에서의 예를 들자면:
* 모든 <math>\mathbb R^k</math>의 닫히고 유계인 부분집합은 '컴팩트하므로' [[완비]]이다.
* 어떤 함수가 실수의 닫힌 구간에서 [[연속]]이면 '컴팩트하므로' [[균등연속]]이다. 즉 [[리만-스틸체스 적분]]이 가능하다. (모든 단조증가하는 integrator에 대해서)


== 일반화 ==
\end{document}
위에서 서술했듯이 이 정리는 일반적인 [[거리 공간]](또는 [[위상 벡터공간]])에서는 성립하지 않는다. 어떤 거리 공간(또는 위상 벡터공간)이 '''하이네-보렐 성질'''을 가진다는 것은 모든 닫힌 유계 부분집합이 컴팩트하다는 것을 말하는데, 이 하이네-보렐 성질을 만족하는 공간은 극히 드물다. 예를 들어, 모든 완비성을 만족하지 않는 거리 공간은 이 성질을 가지지 못하며, 완비성을 가지더라도 무한 차원 바나흐 공간과 같은 경우에는 하이네-보렐 성질을 만족하지 못한다. 하지만 ([[아르첼라-아스콜리 정리]]에 의해) 컴팩트한 집합 <math>K</math>에서 정의된 [[무한급 함수|매끄러운 함수]]들의 집합을 위상 벡터공간의 일종인 [[프레셰 공간]]으로 생각한다면, 이는 하이네-보렐 성질을 가진다. 일반적으로 [[핵형 공간|핵형]](nuclear) 프레셰 공간은 하이네-보렐 성질을 가진다. [[위상공간]]의 경우에 컴팩트하면 하이네-보렐 성질을 만족한다.
 
어쨌든 이렇게 위에서 정의된 하이네-보렐 성질을 만족시키기는 꽤 어렵고, 하이네-보렐 정리는 유클리드 공간 아니면 안 되는 게 아-주 많다. 그래서 더 일반화된 하이네-보렐 정리가 있다:
: 어떤 거리 공간의 부분집합이 컴팩트한 것과, 그것이 완비이고 [[완전히 유계]]임은 동치이다.
이 일반화는 거리 공간이 아니더라도 위상 벡터공간이나, [[균등공간]]에서도 성립한다.

2016년 6월 18일 (토) 14:33 판

\documentclass[12pt,a4paper]{article} \usepackage{amsfonts,amsmath,amsthm,latexsym,amssymb,kotex,mathrsfs,enumitem,mathtools} \usepackage{graphicx} \usepackage[onehalfspacing]{setspace} \allowdisplaybreaks

\newtheorem{theorem}{Theorem} \newtheorem{definition}[theorem]{Definition} \newtheorem{lemma}[theorem]{Lemma} \newtheorem{corollary}[theorem]{Corollary} \newtheorem{proposition}[theorem]{Proposition}

\usepackage[hmargin=1in,vmargin=.5in]{geometry} \begin{document} \title{General Leibniz Rule And Faà Di Bruno's Formula} \author{$\sum_{1\le k \le 10} \sum_{1\le j \le k} jk$} \date{20160204} \maketitle \section{General Leibniz Rule} \subsection{Statement} \textbf{일반화된 Leibniz 규칙}(generalized Leibniz rule)은 곱의 미분법을 일반화한 정리이다. $u, \; v$가 $t$에 대한 $n$-차 미분가능 일변수 함수이면 다음이 성립한다: $$(uv)^{(n)} = \sum_{k=0}^n \binom{n}{k} u^{(k)} v^{(n-k)}.$$ 더욱 일반적으로, $t$에 대한 $n$-차 미분가능한 일변수 함수 $u_1, \cdots, u_\ell$에 대하여 다음이 성립한다: $$\left(\prod_{i=1}^\ell u_i \right)^{(n)} = \sum_{\sum_j k_j = n} \binom{n}{k_1, \cdots, k_\ell} \prod_{i=1}^\ell {u_i}^{(k_i)}.$$

\subsubsection{Proof} 증명은 귀납법으로써 한다. $n=0$일 때엔 당연히 성립하며($\because \binom 0 {0, \cdots, 0} = 1$), $n=m$일 때를 가정하자. 그러면 $n=m+1$일 때, \begin{align*} \left(\prod_{i=1}^\ell u_i \right)^{(m+1)} &= \frac{\mathrm d}{\mathrm dt} \left(\prod_{i=1}^\ell u_i \right)^{(m)} \\ &= \frac{\mathrm d}{\mathrm dt}\sum_{\sum_j k_j = m} \binom{m}{k_1, \cdots, k_\ell} \prod_{i=1}^\ell {u_i}^{(k_i)} \\ &= \sum_{\sum_j k_j = m} \frac{m!}{k_1 ! \cdots k_\ell !} \frac{\mathrm d}{\mathrm dt} \prod_{i=1}^\ell {u_i}^{(k_i)} \\ &= \sum_{\sum_j k_j = m} \binom{m}{k_1, \cdots, k_\ell} \sum_{i=1}^\ell {u_i}^{(k_i + 1)} \prod_{1\le j \le \ell, \; j\ne i} {u_j} ^ {(k_j)} \\ &= \sum_{i=1}^\ell \sum_{\sum_j k_j = m} \binom{m}{k_1, \cdots, k_\ell} {u_i}^{(k_i + 1)} \prod_{1\le j \le \ell, \; j\ne i} {u_j} ^ {(k_j)} \\ &= \sum_{i=1}^\ell \sum_{\sum_{j\ne i} k_j + (k_i + 1) = m+1} \binom{m}{k_1, \cdots, k_\ell} {u_i}^{(k_i + 1)} \prod_{1\le j \le \ell, \; j\ne i} {u_j} ^ {(k_j)} \\ &= \sum_{i=1}^\ell \sum_{\sum_{j} {\hat k_j} = m + 1} \binom{m}{\hat k_1, \cdots, \hat k_{i-1}, \hat k_i - 1, \hat k_{i+1}, \cdots, \hat k_\ell} \prod_{j=1}^\ell {u_j} ^ {(\hat k_j)} \\ &= \sum_{\sum_{j} {\hat k_j} = m + 1} \sum_{i=1}^\ell \binom{m}{\hat k_1, \cdots, \hat k_{i-1}, \hat k_i - 1, \hat k_{i+1}, \cdots, \hat k_\ell} \prod_{j=1}^\ell {u_j} ^ {(\hat k_j)} \\ &= \sum_{\sum_{j} {\hat k_j} = m + 1} \binom{m+1}{\hat k_1, \cdots, \hat k_\ell} \prod_{j=1}^\ell {u_j} ^ {(\hat k_j)}.\end{align*} (where $\hat k_j = k_j \text{ when }j\ne i, \; \hat k_i = k_i + 1$)으로 성립한다. 마지막 부분은 다항계수 항등식으로 자명하다.

\subsection{Generalization for Multivariable Calculus} 다변수 함수의 경우에는 미분 연산자를 편미분 연산자로만 바꾸면 된다. 즉, $$\partial^\alpha (fg) = \sum_{0\le \beta \le \alpha} \binom \alpha \beta (\partial ^\beta f)(\partial ^{\alpha - \beta} g).$$ (양변에 $\partial ^\alpha t$는 생략.)

\section{Faà di Bruno's Formula} \subsection{Statement} \textbf{Faà di Bruno 공식}은 chain rule을 고차 미분으로 일반화한 공식이다. 함수 $f$와 $g$가 미분가능한 일변수 함수이면 다음이 성립한다: $$\frac{\mathrm d ^n}{\mathrm dx^n} f(g(x)) = \sum_{\sum_{1\le j \le n} j\cdot m_j = n}\frac{n!}{m_1! m_2! \cdots m_n!} f^{(m_1 + \cdots + m_n)}(g(x)) \prod_{1\le j \le n} \left(\frac{g^{(j)}(x)}{j!} \right)^{m_j}.$$ 이를 \textbf{Bell polynomial} $$B_{n,k}(x_1, \cdots , x_{n-k+1} ) = \sum_{(j_1 , \cdots , j_{n-k+1})} \frac{n!}{j_1! j_2! \cdots j_{n-k+1}!} \prod_{i=1}^{n-k+1} \left(\frac{x_i}{i!}\right)^{j_i}$$ where $j_1 + \cdots + j_{n-k+1} = k$ and $j_1 + 2j_2 + \cdots + (n-k+1)j_{n-k+1} = n$을 이용하여 간단히(?) 나타내면 $$\frac{\mathrm d ^n}{\mathrm dx^n} f(g(x)) = \sum_{k=1}^n f^{(k)} (g(x)) B_{n,k} \left( g'(x) , \cdots , g^{(n-k+1)}(x)\right)$$ 가 된다. 또한, 이를 `조합적'으로 나타내면 다음과 같다: $$\frac{\mathrm d ^n}{\mathrm dx^n} f(g(x)) = \sum_{\pi \in \Pi }f^{(|\pi|)}(g(x)) \prod{B\in \pi} g^{(|B|)}(x),$$ 이때 $\pi$는 $\{1, \cdots, n\}$의 partition들이며 $\Pi$는 그러한 $\pi$들의 집합이고, $B \in \pi$는 partition $\pi$의 한 `block'을 뜻하고, $\pi$의 cardinality는 `block'의 수, $B$의 cardinality는 `block' $B$의 size를 말한다.

위 식에서의 $f^{(\cdot)}(g(x)) \prod (g^{(\cdot)}(x))^\cdot$의 계수들(\textbf{Faà di Bruno coefficients}) $$\frac {n!}{m_1! m_2! \cdots 1!^{m_1} 2!^{m_2}\cdots}$$은 $n=\underbrace{1+\cdots+1}_{m_1} \,+\, \underbrace{2+\cdots+2}_{m_2} \,+\, \underbrace{3+\cdots+3}_{m_3}+\cdots$으로 나누는 partition의 수이며, Bell polynomial에도 나타난다. 참고로, Bell polynomial은 통계학의 \textbf{cumulant}와도 관계가 있다.

\subsection{Statement: for Multivariable} 위의 $\pi, \; \Pi, \; B$의 정의를 그대로 가져와 쓰면, $y=f(x)$라고 할 때, $$\frac{\partial ^n}{\partial x_1 \cdots \partial x_n} g(y) = \sum_{\pi \in \Pi} g^{(|\pi|)}(y) \prod_{B\in\pi} \frac{\partial^{|B|}y}{\prod_{j\in B}\partial x_j}$$ 이다. 예를 들어 $n=3$이라고 하면 \begin{align*} {\partial^3 \over \partial x_1\, \partial x_2\, \partial x_3}f(y) & = f'(y){\partial^3 y \over \partial x_1\, \partial x_2\, \partial x_3} \\ & + f(y) \left( {\partial y \over \partial x_1} \cdot{\partial^2 y \over \partial x_2\, \partial x_3} +{\partial y \over \partial x_2} \cdot{\partial^2 y \over \partial x_1\, \partial x_3} + {\partial y \over \partial x_3} \cdot{\partial^2 y \over \partial x_1\, \partial x_2}\right) \\ & + f'(y) {\partial y \over \partial x_1} \cdot{\partial y \over \partial x_2} \cdot{\partial y \over \partial x_3} \end{align*} 이다.

우리는 이 식을 이용하여 역함수의 $n$-계 도함수의 `linear recurrence'를 얻을 수 있다.

\subsection{Proof} 우리는 다음의 두 가지 point에 집중할 것이다: \begin{enumerate}[label=\textbf{Pt.\arabic*}] \item $\frac{\partial^n}{\partial x_1 \cdots \partial x_n}$, 즉 모두 독립적인 변수로 미분했을 때의 식. 우변의 계수는 모두 1일 것이다. \item $x_i$들이 모두 구별되지 않을 때. 예를 들면, 만약 $n=3$일 때 $x_2 = x_3$이라면, 다음 두 항은 `중복도 2의' 한 항으로 합쳐지게 된다: $$\frac{\partial y}{\partial x_2}\frac{\partial^2 y}{\partial x_1\partial x_3} + \frac{\partial y}{\partial x_3}\frac{\partial^2 y}{\partial x_1\partial x_2} = 2\frac{\partial y}{\partial x_2}\frac{\partial^2 y}{\partial x_1\partial x_2}.$$ 이런 `중복된 항의 수'를 구하는 데 초점을 둔다. \end{enumerate} 이런 관점에서는, (다른 접근과는 다르게) 모든 변수가 같은 것보다도 independent한 게 오히려 편하고 쉽고 기본적이다.

먼저 다음의 $\{1, \cdots, n+1\}$의 partition을 만드는 inductive한 방법(algorithm)을 생각하자: $\pi_n$를 $\{1, \cdots, n\}$의 partition이라고 할 때, \begin{enumerate} \item $\pi_{n+1} = \pi_n \cup \{\{n+1\}\}$, \item $\pi_{n+1} = \pi_n \setminus \{B\} \cup \{B \cup \{n+1\}$ for some $B\in \pi_n$. \end{enumerate} 이 두 가지 방법으로 모든 $\{1, \cdots , n+1\}$의 partition을 만들 수 있음은 당연하다. 이제 다음을 귀납적으로 보이자: $$\frac{\partial ^n}{\partial x_1 \cdots \partial x_n} f(y) = \sum_{\pi} f^{(|\pi|)}(y) \prod_{B\in\pi} \frac{\partial^{|B|}y}{\prod_{j\in B}\partial x_j}.$$ 이때, $n\ge 0$이다. 만약 $n=0$이면, 다른 경우와 같이 $\pi$는 $ \{1, \cdots, n\}$의 특정한 non-empty subset들을 모은 것이므로 $\{1, \cdots , n \} = \emptyset$ if $n=0$에서 $\pi$는 아무 원소도 가질 수 없고, 즉 $\pi=\emptyset$으로 보는 것이 타당하다. 이에 따라 $n=0$일 때에 $f(y) = f(y)$로 성립한다.

이제 다음 전개를 보자: \begin{align*} \frac{\partial^{n+1}}{\partial x_1 \cdots \partial x_{n+1}} f(y) &= \frac \partial {\partial x_{n+1}} \sum_{\pi} f^{(|\pi|)}(y) \prod_{B\in\pi} \frac{\partial^{|B|}y}{\prod_{j\in B}\partial x_j}




\end{document}