pubDate: 2024-03-19
author: sakakibara
多様体と(局所)座標系
n次元多様体Mは各点がn次元に広がる座標近傍を持つような点を集めた集合である。つまり、そのような座標近傍はn次元ユークリッド空間と位相同型である。
多様体の対象は広いが、直感的に、単に多様体と言った場合はユークリッド空間を想定してもらえばいい。たとえば2次元の多様体といった場合は2次元の曲面をを想定してもらえばいい。
ただ、大域的な位相は異なることがある。球面は局所的には2次元ユークリッド空間と同じだが、曲がっていて、コンパクト(境界があり、閉じている)であるため、異なる大域的な位相的性質を持つ。
多様体Mは局所的にはn次元のユークリッド空間Enと等しく、各点は座標近傍内でξにより一意に定まる。
そこで、n個のξ1,ξ2,…,ξnで構成される局所座標系を導入する。
ξ=(ξ1,ξ2,…,ξn)
多様体はユークリッド空間とは異なる位相を持つため、一般的に複数の座標近傍と多様体全体を被膜する複数の局所座標系が必要となる。
局所座標系は座標近傍においてでさえ一意ではなく、多くの局所座標系が存在する。
ζ=(ζ1,ζ2,…,ζn)を別の局所座標系とする。
多様体M上の点P∈Mは2つの局所座標系ξ, ζを用いて表される。 そして2つの局所座標の間には一対一の関係が存在し、
以下の関係式を得る。
ξξ=f(ζ1,ζ2,…,ζn)=f(ξ1,ξ2,…,ξn)
ただし、f, f−1は互いに逆のベクトル関数である。これらは座標変換とその逆の変換となる。
我々は通常これらの変換をn個の局所座標の変数に対して可微分(differentiable)であると仮定する。
comment:
本文では’coordinate system’と書かれていた部分を適宜 局所座標系 に変更した。
局所がついているのは、局所座標系が局所的にしか成り立たないためである。
また、局所的に定義された座標系だということを強調したかったという考えもある。
多様体の座標変換が微分可能かどうか、可微分多様体を考える際に最も重要なポイントである。
可微分多様体はフランクに言ってしまえば、結果的に座標変換が微分可能である多様体であり、
“多様体”と言った場合、通常はC∞級可微分多様体を指すことが多い。
example of Manifolds
ユークリッド空間
二次元の平らなユークリッド空間を考える。
この空間では直交座標系ξ=(ξ1,ξ2)が便利である。
円筒座標系ζ=(r,θ)も時々使われる。ただし、rは半径で、θは角度である。
この2つの座標系間の変換は以下のようになる。
rξ1=ξ12+ξ22,θ=tan−1(ξ2/ξ1)=rcosθ,ξ2=rsinθ
球面
球面は3次元のボールの表面であり、地球の表面は各点が二次元の座標近傍を持つ球面とみなすことができる。
よって、局所的な地理の地図を二次元の紙に書くことができる。
緯度と経度によって局所座標系が与えられる。
しかし、球面はユークリッド空間とは異なる位相を持つため、一つの座標系だけでは全体を被覆することができない。
全体を皮膜するためには少なくとも2つの座標系が必要である。
もし、北極点を考えないならば、ユークリッド空間と位相同型である。
よって、北極点を含むような座標近傍とそれ以外の領域を被膜する座標近傍の少なくとも2つが必要となり、十分である。
確率分布
確率変数xのガウス分布は次のようにして与えられる。
p(x;μ,σ2)=2πσ21exp(−2σ2(x−μ)2)
ただし、μは平均、σ2は分散である。
よって、ガウス分布を集めた集合は二次元の多様体として表さる。
この多様体の各点は確率密度関数を表し、座標系は
ξ=(μ,σ2),σ2>0
を用いる。
これは2次元のユークリッド空間の上半分(σ2>0より)と位相同型である。
この座標系を用いることで、ガウス分布は一つの座標系で全体を被膜することができる。
この他にも座標系をとることができる。
たとえば、m1,m2をそれぞれ1,2次のモーメントとする。
m1=E[x],m2=E[x2]=μ2+σ2
ただし、E[⋅]は期待値を表す。ここで、
ζ=(m1,m2)
を座標系も座標系として考えることができる。
また、別の座標系を考えることができる。
θ1=σ2μ,θ2=−2σ21
これは自然パラメータと呼ばれ、ガウス分布の考察に非常に便利である。
離散分布
xをX={0,1,…,n}上の離散確率変数とする。
確率分布p(x)はn+1個の確率で指定される。
pi=Prob{x=i},i=0,1,…,n
これによりp(x)はベクトルとして表すことができる。
p=(p0,p1,…,pn)
なぜn+1ではなくnなのかというと、
i=0∑npi=1,pi≥0
という制約があるためである。
確率分布p(x)全体を集めた集合はn次元多様体を形成する。
その座標系は例えば
ξ=(p1,p2,…,pn)
のようにして与えられる。
また、p0には自由がないが、座標の関数であり、
p0=1−∑ξi
となる。
この多様体はn次元単体(確率単体)として知られていてSnで表される。
n=1の場合S2は三角形の内部であり、n=3の場合は四面体の内部である。
以下のようにn+1個の確率変数δi(x),i=0,1,…,nを導入する。
δi(x)={10if x=iotherwise
このとき、座標系ξから見たxの確率分布は
p(x,ξ)=p0(ξ)δ0(x)+i=0∑nξiδi(x)
となる。
さらに別の座標系を導入しよう。
θi=logp0pi,i=1,2,…,n
これは後で使うために導入しておく。
正則統計モデル
適当なxを確立変数とする。xは離散値かもしれないし、連続なスカラーやベクトルかもしれない。
統計モデルはξで指定される確率分布の族M={p(x;θ)}で与えられる。
統計モデルが正則性の条件を充たすとき、Mは正規統計モデルと呼ばれ、ξを座標系とすると、このようなMは多様体を形成する。
ガウス分布族と離散分布族が正則統計モデルの例である。
情報幾何学は正則統計モデルの不変的な幾何学構造の研究から始まった。
正測多様体
集合N={1,2,…,n}の元x∈Nをとる。
i=1,…,nそれぞれに正測度miを対応させる。
このとき、N上の測度の分布は以下で定義される。
ξ=(m1,m2,…,mn),mi≥0
そのようなすべての測度の集合は、n次元ユークリッド空間の第一象限にある。
その和をm=(m1,m2,…,mn)の全質量として以下のように表される。
m=i=1∑nmi
mの全質量が1に等しいとう条件を充たすとき、
i=1∑nmi=1
となり、これはSn−1に属する確率分布である。
よって、Sn−1はR+nの部分多様体となる。
正測度(正則化されていない確率分布)は工学において多く現れる。
例えば、x−y平面上に描かれた画像s(x,y)は正則であり、その明るさは正である。
s(x,y)≥0
x−y平面をn2個のピクセル(i,j)に分割すると、分割された画像{s(i,j)}はR+n2に属する正測度を形成する。
同様に、我々が音のパワースペクトルを離散化する場合、それは正測度になる。
観測されたデータのヒストグラムも正測度になる。
正定値行列
Aをn×nの行列とする。
このような行列全体を集めた集合はn2次元多様体を形成する。
Aが対象かつ正定値であるとき、2n(n+1)次元の多様体を形成する。
これは行列全体の多様体に埋め込まれた部分多様体である。
この場合、行列Aの上三角要素を座標系として考えることができる。
正定値行列は統計学、物理学、オペレーションズ・リサーチ、制御理論などの分野で重要である。
ニューラ多様体
ニューラルネットワークは大規模なニューロンの相互結合により構成され、動的な情報処理が行われる。
ネットワークはニューロンi, jへの重みwjiを持つ。
このようなニューロンの全体の集合は多様体を形成する。なお、行列W=(wji)が座標系となる。
我々は後で情報幾何学的な観点からこのようなニューロンの振る舞いを解析する。