Partial derivative

2.2 Partial derivative

Given $f : E \to R^{p}$ , $x_{0} \in E \subseteq R^{m}$ is the interior point, ${v_{1}, . . ., v_{m}}$ compose a set of bases in $R^{m}$ . Therefore

x = x1v1 + ...+ xmvm =∈ ℝm

is called the coordinate based on $v_{1}, . . ., v_{m}$ .

Let $v = \sum_{i = 1}^{m} ξ_{i} v_{i}$ , assuming $f$ is differentiable at $x_{0}$ , then

∑m ∑m ∑m ∂f(x0)(v ) = ∂f (x0)∖left( ξivi∖right ) = ξi∂f(x0 )(vi) = ξi ∂f-(x0) i=1 i=1 i=1 ∂vi

Mark

∂f ∂f ---(x0 ) = ---(x0) ∂vi ∂xi

which is called the partial derivative of $f$ at $x_{0}$ over the $i^{th}$ component under the coordinate system $(x_{1}, . . ., x_{m})$ . Define the coordinate-projection function $x_{i} : R^{m} \to R$ ,

x =↦→ xi

It’s a linear function, therefore, $d x_{i} = x_{i} : R^{m} \to R$ , $x_{i} : R^{m} \to R$ ,

v = ↦→ ξi

is also linear. When $p = 1$ , we have

m∑ ∂f ∂f(x0 ) = ----(x0)dxi i=1 ∂xi

which is called the (total) differential of $f$ at $x_{0}$ . Here $d x_{i}$ are functions, not numbers! Take $z = f (x, y)$ as an example, we have

∂f ∂f dz = df = ---dx + ---dy ∂x ∂y

Consider $\begin{aligned} \partial f (x_{0}) (v) & = \sum_{i = 1}^{m} \frac{\partial f}{\partial x_{i}} (x_{0}) ξ_{i} = \underset{The representative matrix of \partial f (x_{0})}{\underset{⏟}{(\begin{array}{c} \frac{\partial f}{\partial x_{1}} (x_{0}) & \dots & \frac{\partial f}{\partial x_{m}} (x_{0}) \end{array})}} (\begin{array}{c} ξ_{1} \\ ⋮ \\ ξ_{m} \end{array}) \\ d f (x_{0}) & = (\begin{array}{c} \frac{\partial f}{\partial x_{1}} (x_{0}) & \dots & \frac{\partial f}{\partial x_{m}} (x_{0}) \end{array}) \end{aligned}$

When $p > 1$ , consider a mapping

f(x1,...,xm ) =: E ⊆ ℝm → ℝp

Here

∂f(x0) == p×m = Jf(x0)

is called the Jacobi matrix of $f$ at $x_{0}$ .

Chain rule. $\begin{aligned} \partial (G \circ F) (x_{0}) & = \partial G (y_{0}) \circ \partial F (x_{0}) \\ ⇕ \\ J (G \circ F) (x_{0}) & = J G (y_{0}) J F (x_{0}) \end{aligned}$

Assuming

= F (x1,...,xm ), = G (y1,...,yn)

then $\begin{aligned} {(\frac{\partial z_{i}}{\partial x_{j}})}_{l \times m} & = {(\frac{\partial z_{i}}{\partial y_{k}})}_{l \times n} {(\frac{\partial y_{k}}{\partial x_{j}})}_{n \times m} \\ \frac{\partial z_{i}}{\partial x_{j}} & = \sum_{k = 1}^{n} \frac{\partial z_{i}}{\partial y_{k}} \cdot \frac{\partial y_{k}}{\partial x_{j}} \forall i, j \end{aligned}$

If $G = g$ is a function, i.e.

= F(x1,...,xm ), z = g (y1,...,yn) = g(F (x1,...,xm ))

therefore $\begin{aligned} d z & = \sum_{i = 1}^{m} \frac{\partial (g \circ F)}{\partial x_{i}} d x_{i} = \sum_{i = 1}^{m} (\sum_{k = 1}^{n} \frac{\partial z}{\partial y_{k}} \frac{\partial y_{k}}{\partial x_{i}}) d x_{i} \\ = \sum_{k = 1}^{n} [\frac{\partial z}{\partial y_{k}} \sum_{i = 1}^{m} \frac{\partial y_{k}}{\partial x_{i}} d x_{i}] = \sum_{k = 1}^{n} \frac{\partial z}{\partial y_{k}} d y_{k} \\ d z & = \sum_{i = 1}^{m} \frac{\partial z}{\partial x_{i}} d x_{i} = \sum_{k = 1}^{n} \frac{\partial z}{\partial y_{k}} d y_{k} \end{aligned}$

which is called the formal invariance of first-order derivative, meaning for any set of variables to express $z$ , the form of the differential of $z$ remains invariant.

Example 2.2.1 Orthogonal coordinate and polar coordinate. Given $z = f (x, y)$ ,

f(rcos 𝜃,rsin𝜃) = g(r,𝜃)

Find the relation between $\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}$ and $\frac{\partial g}{\partial r}, \frac{\partial g}{\partial θ}$ . Notice that $\begin{aligned} d z & = \frac{\partial z}{\partial x} d x + \frac{\partial z}{\partial y} d y = \frac{\partial f}{\partial x} d x + \frac{\partial f}{\partial y} d y \\ d z & = \frac{\partial z}{\partial r} d r + \frac{\partial z}{\partial θ} d θ = \frac{\partial g}{\partial r} d r + \frac{\partial g}{\partial θ} d θ \\ d x & = \frac{\partial x}{\partial r} d r + \frac{\partial x}{\partial θ} d θ = \cos θ d r - r \sin θ d θ \\ d y & = \frac{\partial y}{\partial r} d r + \frac{\partial y}{\partial θ} d θ = \sin θ d r + r \cos θ d θ \\ \frac{\partial g}{\partial r} & = \frac{\partial f}{\partial x} \cos θ + \frac{\partial f}{\partial y} \sin θ \\ \frac{1}{r} \frac{\partial g}{\partial θ} & = \frac{\partial f}{\partial x} \sin θ - \frac{\partial f}{\partial y} \cos θ \\ (\begin{array}{c} \frac{\partial z}{\partial r} & \frac{\partial z}{\partial θ} \end{array}) & = (\begin{array}{c} \frac{\partial z}{\partial x} & \frac{\partial z}{\partial y} \end{array}) (\begin{array}{c} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial θ} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial θ} \end{array}) \end{aligned}$

Theorem 2.2.1 Assuming $\frac{\partial f}{\partial x_{1}}, . . ., \frac{\partial f}{\partial x_{m}}$ is continuous on $U$ , then $f$ is differentiable at every point in $U$ , and $\begin{aligned} \partial f (x_{0}) (v) & = \sum_{i = 1}^{m} \frac{\partial f}{\partial x_{i}} (x_{0}) ξ_{i}, \forall x_{0} \in U \\ \partial f (x_{0}) & = \sum_{i = 1}^{m} \frac{\partial f}{\partial x_{i}} (x_{0}) d x_{i} \end{aligned}$

Proof Prove only $m = 2$ . $z = f (x, y)$ , we need

$\frac{\partial f}{\partial x} (a, b)$ exists.
$\frac{\partial f}{\partial y} (x, y)$ exists on $U$ near $(a, b)$ and is continuous at $(a, b)$ .

We use the 1-norm here, so it is needed to be proven that when $(x, y) \to (a, b)$ ,

∂f- ∂f- f(x,y ) − f (a,b) = ∂x (a,b)(x − a ) + ∂y(a,b)(y − b) + o(|x − a| + |y − b|)

$\begin{aligned} f (x, y) - f (a, b) - \frac{\partial f}{\partial x} (a, b) (x - a) - \frac{\partial f}{\partial y} (a, b) (y - b) \\ = f (x, y) - f (x, b) - \frac{\partial f}{\partial y} (a, b) (y - b) & (1) \\ + f (x, b) - f (a, b) - \frac{\partial f}{\partial x} (a, b) (x - a) & (2) \end{aligned}$

Since $\frac{\partial f}{\partial x} (a, b)$ exists, for any $ϵ > 0$ , there exists $δ_{1} (ϵ, a, b) > 0$ such that

|x − a| < δ1 ⇒ |(2)| ≤ 𝜖|x − a|

According to Lagrange’s intermediate theorem, $\begin{aligned} f (x, y) - f (x, b) & = \frac{\partial f}{\partial y} (x, ξ) (y - b) \\ ξ & = (1 - t (x, y)) b + t (x, y) y & 0 \leq t (x, y) \leq 1 \\ (1) & = [\frac{\partial f}{\partial y} (x, ξ) - \frac{\partial f}{\partial y} (a, b)] (y - b) \end{aligned}$

Since $\frac{\partial f}{\partial y}$ is continuous at $(a, b)$ , for any $ϵ > 0$ , there exists $δ_{2} (ϵ) > 0$ such that

∂f- ∂f- |x − a| + |y − b| < δ2 ⇒ ∖left|∂y (x,ξ) − ∂y (a,b)∖right| < 𝜖

Here $| x - a | + | ξ - b | \leq | x - a | + | y - b | < δ_{2}$ , so $| (1) | \leq ϵ | y - b |$ . Select $δ = min {δ_{1} (ϵ), δ_{2} (ϵ)}$ , then for any $| x - a | + | y - b | < δ (ϵ)$ ,

|(1) + (2)| ≤ |(1)| + |(2)| ≤ 𝜖(|x − a| + |y − b|)

Terminally $f$ is differentiable at $(x, y)$ . $◻$