Introduction to geodesis

Overview

Because the field of differential geometry is too vast, this document aims at understanding geodesics only.
In engineering, geodesics are known as the shortest path between two points on a surface. It becomes a straight line if the surface is a flat plane. On a curved surface such as sphere, geodesics are no longer straight lines but can be explained as 'naturally straight lines'. As is known well, geodesics on a sphere is a largest circle whose center point matches with the center of the sphere.

What is surprising for engineers is that in contemporary differential geometry, it seems like they are defined in completely different manner.
The classic definition, the shortest path between two points, is a definition based on variational principle, which most engineers are familiar with.
Contrary, in contemporary differential geometry, we first define covariant differentiation from "connection", then parallel vectors from covariant differentiation, parallel transportation from parallel vectors, and finally geodesics from parallel transportation, which, fairy speaking, seems far beyond within our reach.

However, all of these simply means that once "connection" is given, we can draw a geodesics. The concept "connection' itself is an abstract concept, though, the concept is reallized by connection coefficients, which are the coefficients appear in covariant differentiation. Now it turned out that the contemporay way of defining geodesics is trully practical though it's difficult to visually understand, and thus all the engineers should be familiaried.

Connection coefficients

First, let us suppose that $x^1\cdots x^n$ represents a curvilinear coordinate parameters (curvilinear means not orthonormal) and

(1)
\begin{align} \boldsymbol{r}=\left[\begin{array}{c}f_1(x^1\cdots x^n)\\ \cdots \\ f_m(x^1\cdots x^n)\end{array}\right] \end{align}

represents a position vector that represents an n-dim surface (manifold) floating in an m-dim Euclidean space. By which, the position vector represents orthonormal coordinates.

This is a natural generalization of 2-dim surface in an 3-dim Euclidean space.
We define base vectors adjunct with the curvilinear coordinate parameters by

(2)
\begin{align} \boldsymbol{g}_i=\frac{\partial\boldsymbol{r}}{\partial x^i}=\left[\begin{array}{c} \frac{\partial f_1(x^1\cdots x^n)}{\partial x^i}\\ \cdots \\ \frac{\partial f_m(x^1\cdots x^n)}{\partial x^i}\end{array}\right]. \end{align}

With having $dx^1\cdots dx^n$, a small motion of position vector can be represented as

(3)
\begin{align} d\boldsymbol{r}=\frac{\partial\boldsymbol{r}}{\partial x^i}dx^i=dx^i\boldsymbol{g}_i\ . \end{align}

Next, we think about small change of the base vectors. This can be wrote as

(4)
\begin{align} d\boldsymbol{g}_j=\frac{\partial \boldsymbol{g}_j}{\partial x^i}dx^i. \end{align}

So far none of them are difficult. It's getting complicated from here and we need some geometric considerations.
In general, it is not guaranteed that $d\boldsymbol{g}_i$ is given as a linear combination of tangent vectors, $\boldsymbol{g}_i\cdots\boldsymbol{g}_n$. Because it contained a component that is perpendicular to the tangent plane.
So let's think about another differentiation that is similar to $d\boldsymbol{g}_i$, but truly given as a linear conbination of $\boldsymbol{g}_i\cdots\boldsymbol{g}_n$. We represent this differentiation as

(5)
\begin{align} \delta \boldsymbol{g}_1=w^1\boldsymbol{g}_1+w^2\boldsymbol{g}_2+\cdots \end{align}

Since there are n independent basis, we need to have n different $w^1\cdots w^n$. Thus, we can write

(6)
\begin{align} \delta\boldsymbol{g}_j=w_j^k\boldsymbol{g}_k \end{align}

さて、3式と同様、このような微分は$dx^1\cdots dx^n$の線形結合であると仮定します。(線形性だけは、勝手に仮定されていることは実は重要です)
するとそれぞれの$w_j^k$は一般に一次微分形式として

(7)
\begin{align} w_j^k\equiv\Gamma_{ij}^kdx^i \end{align}

と表されます。
$w_j^k$ は伝統的に接続形式と呼ばれ、また、$\Gamma_{ij}^k$は接続係数と呼ばれます。
ここまでは一般論です。山のようにある係数を整理しただけです。
さて、接続係数を総て求めるにはどうしたらよいでしょうか。一つの自然な方針として、$d\boldsymbol{g}_j$から超曲面に直交する成分を取り除く、というものがあります。別の言い方では、超曲面上へ正射影する、ともいえます。そのような操作は、

(8)
\begin{align} \delta\boldsymbol{g}_j=\left(d\boldsymbol{g}_j\cdot\boldsymbol{g}^k\right)\boldsymbol{g}_k \end{align}

と書けます。
一般に接ベクトル$\boldsymbol{a}$についてその成分は$a^i=\boldsymbol{a}\cdot\boldsymbol{g}^i$で与えられ、その線形結合は$\boldsymbol{a}=\left(\boldsymbol{a}\cdot\boldsymbol{g}^i\right)\boldsymbol{g}_i$で与えられることを思い出しましょう。ただし、この式は接平面に属していないベクトルに適用すると、接平面に直交する成分が消えてしまうのです。

同様に$d\boldsymbol{g}_i\cdot\boldsymbol{g}^k$$\boldsymbol{g}_k$成分を求める操作であり、 $\left(d\boldsymbol{g}_i\cdot\boldsymbol{g}^k\right)\boldsymbol{g}_k$は基底の線形結合を求める操作ですから、このようにすることで、接平面(空間)に属する成分はすべて保存され、一方直交する成分は取り除かれました。以上より、

(9)
\begin{align} \Gamma_{ij}^k\equiv\left(\frac{\partial \boldsymbol{g}_j}{\partial x^i}\cdot\boldsymbol{g}^k\right) \end{align}

また、

(10)
\begin{align} w_j^k=\left(\frac{\partial \boldsymbol{g}_j}{\partial x^i}\cdot\boldsymbol{g}^k\right)dx^i=\Gamma_{ij}^kdx^i \end{align}

そして、

(11)
\begin{align} \delta\boldsymbol{g}_j=\left(\frac{\partial \boldsymbol{g}_j}{\partial x^i}\cdot\boldsymbol{g}^k\right)dx^i\boldsymbol{g}_k=\Gamma_{ij}^kdx^i\boldsymbol{g}_k \end{align}

となります。

とりあえず測地線

測地線は次の微分方程式を満たすものとして定義されます。

(12)
\begin{align} \frac{da^k}{dt}=-\Gamma_{ij}^ka^ia^j \end{align}

ここで、

(13)
\begin{align} c(t)=\left[\begin{array}{c}a^1(t)\\ \vdots \\ a^n(t)\end{array}\right] \end{align}

は曲面上の座標を表します。これは、微分可能であれば、一つのパラメータ$t$を動かすことで、曲面上に曲線を描きます。また、

(14)
\begin{align} \frac{dc}{dt}=\left[\begin{array}{c} \frac{da^1}{dt}\\ \vdots \\ \frac{da^n}{dt}\end{array}\right] \end{align}

は曲線の接ベクトルを表します。$t$を時間と呼んだ時、これを速度ベクトルと呼ぶのは大変自然です。
もう少し詳しく計算すると曲線の実体は

(15)
\begin{align} \boldsymbol{r}(c(t))=\left[\begin{array}{c} f_1(a^1(t),a^2(t),\cdots,a^n(t))\\ \vdots \\ f_m(a^1(t),a^2(t),\cdots,a^n(t))\\ \end{array}\right] \end{align}

ですから、その$t$による微分は

(16)
\begin{align} \frac{d \boldsymbol{r}(c(t))}{dt}=\frac{d\boldsymbol{r}}{dx^1}\frac{d a^1(t)}{dt}+\cdots+\frac{d\boldsymbol{r}}{dx^n}\frac{d a^n(t)}{dt} \end{align}
(17)
\begin{align} =\frac{d a^i}{dt}\boldsymbol{g}_i \end{align}

ですから、速度ベクトルの計算は成分を直接微分してよいのです。
もちろん測地線の方程式は最短曲線が満たすべき方程式と一致します。
以下では、別の流儀で測地線の方程式の導出を行います。基本的なアイデアは”自然な”定義の連続により測地線を”自然に”定義するというものです。

共変微分

(18)
\begin{align} \delta\boldsymbol{g}_j=\Gamma_{ij}^kdx^i\boldsymbol{g}_k \end{align}

は、$dx^i$に値を代入することで様々な接ベクトルを与えるため、線形な関数とみることもできそうです。そこで、$\boldsymbol{b}=b^i\boldsymbol{g}_i$を用いて

(19)
\begin{align} \nabla\boldsymbol{g}_j(\boldsymbol{b})=\Gamma_{ij}^kb^i\boldsymbol{g}_k \end{align}

と定義します。すると、$d\boldsymbol{x}=d\theta^i\boldsymbol{g}_i$を用いて

(20)
\begin{align} \nabla\boldsymbol{g}_j(d\boldsymbol{x})=\Gamma_{ij}^kdx^i\boldsymbol{g}_k \end{align}

となります。
ただし、あまり関数に見えませんので、

(21)
\begin{align} \nabla_{\boldsymbol{b}}\boldsymbol{g}_j=\Gamma_{ij}^kb^i\boldsymbol{g}_k \end{align}

と書きましょう。
これは、基底ベクトルが、与えられたベクトルの方向において、どのくらい変化してゆくかの指標になっています。定義より、変化の量のうち、空間に直交する成分、すなわち曲面に対する方向の成分は取り除かれ、接空間(曲面の接平面)に投影して測った基底ベクトルの変化を表しています。
ある意味、基底ベクトルの、自然な微分が定義できたといえます。
さて、一般のベクトル場$\boldsymbol{a}(x^1,\cdots x^n)=a^i(x^1\cdots x^n)\boldsymbol{g}_i$の全微分や方向微分は一般に

(22)
\begin{align} d\boldsymbol{a}=\frac{\partial a^i}{\partial x^\alpha}\boldsymbol{g}_idx^\alpha+a^i\frac{\partial\boldsymbol{g}_i}{\partial x^\alpha}dx^\alpha \end{align}
(23)
\begin{align} D\boldsymbol{a}(\boldsymbol{b})=\frac{\partial a^i}{\partial x^\alpha}\boldsymbol{g}_ib^\alpha+a^i\frac{\partial\boldsymbol{g}_i}{\partial x^\alpha}b^\alpha \end{align}

と書けます。これは、接続係数を定義したときと同様、接空間(接平面)に属してはいませんん。
そこで、これとは別に全微分や方向微分によく似ていて、接空間(接平面)に属する微分を出来る限り自然に定義します。
まず、そのような微分は一般に

(24)
\begin{align} \delta a^k=\frac{da^k}{dx^i}dx^i+a^j\bar{\Gamma}_{ij}^kdx^i=dx^k+a^j\bar{\Gamma}_{ij}^kdx^i \end{align}
(25)
\begin{align} \nabla_{\boldsymbol{b}} \boldsymbol{a}=\left(\frac{da^k}{dx^i}b^i+a^j\bar{\Gamma}_{ij}^kb^i\right)\boldsymbol{g}_k \end{align}

と書けるでしょう。そして、$\bar{\Gamma}_{ij}^k$として、前述の接続係数

(26)
\begin{align} \Gamma_{ij}^k\equiv\left(\frac{\partial \boldsymbol{g}_j}{\partial x^i}\cdot\boldsymbol{g}^k\right) \end{align}

を採用することは大変自然です。このように決めると、これらの拡張された全微分や方向微分は、もともとの全微分や方向微分を接空間(接平面)へ投影したものとなります。
すなわち、ベクトルの変化率のうち、接空間(接平面)に直交する成分のみが取り除かれたのです。
このようにして、自然な微分として共変微分

(27)
\begin{align} \delta a^k=da^k+a^j\Gamma_{ij}^kdx^i \end{align}
(28)
\begin{align} \delta \boldsymbol{a}=\left(da^k+a^j\Gamma_{ij}^kdx^i\right)\boldsymbol{g}_k \end{align}
(29)
\begin{align} \nabla_{\boldsymbol{b}} \boldsymbol{a}=\left(\frac{da^k}{dx^i}b^i+a^j\Gamma_{ij}^kb^i\right)\boldsymbol{g}_k \end{align}

が定義されました。いずれも、本質的に同じものを表しています。

平行なベクトル

さて、共変微分はその凶悪な外見と裏腹に、大変”自然な”微分です。我々の馴染みの深い微分において

(30)
\begin{align} \frac{dy}{dx}=0\Leftrightarrow y=\mathrm{const} \end{align}

という直感的性質がありました。つまり、微分が0とは変化がない、という意味でした。
従って、共変微分においても

(31)
\begin{align} \delta a^k=0 \end{align}

が何か直感的性質をもつと考えるのは大変”自然”です。
ある点に接ベクトル

(32)
\begin{align} a^k=\left[\begin{array}{c}a^1\\ \vdots\\ a^n\end{array}\right] \end{align}

が存在するとしましょう。そこから

(33)
\begin{align} dx^i=\left[\begin{array}{c}dx^1\\ \vdots\\ dx^n\end{array}\right] \end{align}

だけ移動した場所に別の接ベクトル

(34)
\begin{align} \bar{a}^k=\left[\begin{array}{c}a^1+da^1\\ \vdots \\a^n+dx^n\end{array}\right] \end{align}

が存在するとします。もちろん、それぞれ

(35)
\begin{align} d\boldsymbol{x}=dx^i\boldsymbol{g}_i,\ \boldsymbol{a}=a^k\boldsymbol{g}_k,\ \bar{\boldsymbol{a}}=(a^k+da^k)\boldsymbol{g}_k \end{align}

が実体です。二つの接ベクトルの表現において、基底が実は異なるベクトルであることに注意してください。基底ベクトルが座標に沿って変化することを前提に議論しています。基底ベクトルはベクトル場です。
このとき、両者が

(36)
\begin{align} \delta a^k=0 \end{align}

を満たすとき両者は平行であると定義されます。
(ここで、本来もっと色々な準備が必要ですが、形式的な考察で終えました。つまり、共変微分はベクトル場に対して定義されましたが、ここではベクトル場ではなく、たった二つのベクトルが議論されています。ともかく、共変微分=0に幾何学的な意味を与えたい、という動機が咲きにあります。)

両者はもちろん平行ではありませんが、共変微分が0ですから、両者の差異は、接空間(接平面)に直交する成分しか持たないことになります。
もっと言うと、両者を$\boldsymbol{a}$の属する接平面に投影すると普通の意味での平行になります。
非ユークリッド空間においても$\delta a^k=0$に対し、我々の馴染みの深い”平行”という言葉を与えることにより、複雑な問題が少しイメージしやすくなるのです。また、非ユークリッド空間に住んでいる我々は確かに、このように定義された二つのベクトルを平行と呼んでいた、ということに後から気づかされます。
さて、もちろん

(37)
\begin{align} \delta a^k=0\Leftrightarrow da^k+a^j\Gamma_{ij}^kdx^i=0 \therefore da^k=-a^j\Gamma_{ij}^kdx^i \end{align}

です。上式は以降で繰り返し用いられます。

平行移動

平行なベクトルが定義されましたのでベクトルの平行移動が定義出来ます。基本的なアイデアは平行なベクトルを与えられた曲線に沿って次々に選択してゆくというものです。
一つのパラメータをもつn個の1パラメータ関数

(38)
\begin{align} c(t)=\left\{x^1(t),\cdots,x^n(t)\right\}\ \ \ (\alpha\leq t\leq \beta) \end{align}

は曲面上の曲線を与えます。
曲線$c(t)$に沿った座標$c(\alpha)={x^1(\alpha),\cdots,x^n(\alpha)}$における接ベクトル

(39)
\begin{align} \boldsymbol{a}_0=a^i_0\boldsymbol{g}_i\mid_\alpha \end{align}

の平行移動とは以下のように定義されます。
まず、

(40)
\begin{align} \boldsymbol{a}(t)=a^i(t)\boldsymbol{g}_i\mid_{c(t)}\ \ \ (\alpha \leq t \leq \beta) \end{align}
(41)
\begin{align} a^i(\alpha)=a^i_0 \end{align}

として、$a^i(t)$の満たすべき方程式が定義とされます。さて、曲線上では

(42)
\begin{align} dx^i=\frac{dx^i}{dt}dt \end{align}

です。また、平行移動には客観性を持たせたいので、$a^i(t)$$t$のみに依存すると要請することは自然です。つまり

(43)
\begin{align} da^i=\frac{da^i}{dt}dt \end{align}

です。これらを平行なベクトルの満たすべき条件$\delta a^k=0$に代入することで、

(44)
\begin{align} \delta a^k=0\Rightarrow\frac{da^k}{dt}+a^j\Gamma_{ij}^k\frac{dx^i}{dt}dt=0 \end{align}

さらに、$dt$をくくりだして

(45)
\begin{align} \left(\frac{da^k}{dt}+a^j\Gamma_{ij}^k\frac{da^i}{dt}\right)dt=0 \end{align}

$dt$の任意性より

(46)
\begin{align} \frac{da^k}{dt}+a^j\Gamma_{ij}^k\frac{dx^i}{dt}=0 \therefore \frac{da^k}{dt}=-a^j\Gamma_{ij}^k\frac{dx^i}{dt} \end{align}

これは、形式的に$dt$で両辺を除したものとして

(47)
\begin{align} \frac{\delta a^k}{dt}\equiv\frac{da^k}{dt}+a^j\Gamma_{ij}^k\frac{dx^i}{dt}=0 \end{align}

とも書かれますが、そのような演算はなくあくまで形式的なものですから、「$dt$の任意性より」とするのが正確です。
$a^k(t)$が(46)式を満足するとき、曲線$c(t)$に沿って平行であると言われます。
また、初期条件$a^k(\alpha)=a^k_0$を満たすとき、ベクトル$\boldsymbol{a}_0$の曲線$c(t)$に沿った平行移動と呼ばれます。

測地線

いよいよ測地線の定義です。基本的なアイデアは、ベクトルをベクトル自身にそって平行移動し、次々と繋いでゆくというものです。まず、曲線$c(t)={x^1(t),\cdots,x^n(t)}$の接ベクトルを$\boldsymbol{a}(t)=a^i\boldsymbol{g}_i$とおきます。つまり、

(48)
\begin{align} a^i\equiv\frac{dx^i}{dt} \end{align}

とします。これは速度ベクトルとも呼ばれます。
そして、$\boldsymbol{a}$$c(t)$に沿った平行移動であるとき、曲線$c(t)$を測地線と呼ぶのです。
(46)式に速度ベクトルの定義を代入すれば

(49)
\begin{align} \frac{da^k}{dt}=-\Gamma_{ij}^k\frac{dx^j}{dt}\frac{dx^i}{dt} \end{align}

もしくは

(50)
\begin{align} \frac{da^k}{dt}=-\Gamma_{ij}^k{a^j}{a^i} \end{align}

を得ます。これらが測地線の満たすべき方程式です。逆に曲線$c(t)$の速度ベクトル$a^i=\frac{dx^i}{dt}$がこの方程式を満たすとき、この曲線を測地線と呼びます。