他のメモへのリンク集。リンク集を飛ばして、このページの前書きへ。本文の目次へ。21、22などの数字は、メモの番号です。
![]()
遊びの数論49の続き。誤字脱字・間違いがあるかもしれません。

![]()
2025-10-14 フェルマーの最終定理(n = 3) 入門編 3 には約数が三つある?
#遊びの数論 #アイゼンシュタイン整数 #FLT(7) #FLT(3)
a3 + b3 = c3 を満たすような、 0 でない整数 a, b, c は、存在しない――超有名なフェルマーの最終定理の、指数 n = 3 の場合だ。
33 + 43 + 53 = 63 のような関係(美しいっ!)なら存在する。しかしフェルマーの最終定理は、(四つではなく)三つの立方数についてのもの。
このケースは「新しい数論」が活躍する場面の一例として、定番の話題といえる。
「新しい数論」(もはやそれほど新しくもないけど)とは?
もしもあなたの友達が、ある日突然「この世界では 3 には約数が三つある」とか「3 は素数の平方で割り切れる」とか言い出したら、どう思うか。「おいおい、頭、大丈夫か」と心配になるかもしれない。しかし、その友達が無造作に「この世界」と呼んだ世界は実在する――そこでは 3 は 1 と自分自身で割り切れるだけでなく、とある別の数でも割り切れる。そんなシュールな世界観が「新しい数論」の一例。不思議なようだが、それがフェルマーの最終定理(n = 3 の場合)の証明にも役立つ。
まぁ、くどくど説明するより、実際にその世界に飛び込んでみる方が手っ取り早い。「n = 7 の場合」(ジェノッキの定理)について長々と書いたので、その流れで、オーソドックスな「n = 3 の場合」についても、ちょっと考えてみたい。
![]()
「アイゼンシュタイン整数」の紹介から。「フェルマーの最終定理の n = 3 の場合の証明」のはずなのに、なぜ別の話が始まるの?
アイゼンシュタイン整数を使って、本題の証明を実行するからっ!
入門編(§1, §2, §3) とりあえず必要な最小限の予備知識の説明。
証明編(§4, §5, §6) 実際の証明。ドイツの Edmund Landau による証明法に基づく。
完結編(§7, §8, §9) 証明の続き。「解があると仮定すると矛盾が生じる」という結論に達する。
☆ 付録 別証明・補足。
☆ 特別付録 日本の高木貞治による同じ定理の証明は、ちょっと面白い。それを紹介。
![]()
§1/9. アイゼンシュタイン整数とは a + bω の形を持つ数。ここで a, b は普通の整数(正または 0 または負)。でもって ω (オメガ)ってのは、
ω2 + ω + 1 = 0 ‥‥①
という性質を持つ数†。2次方程式の解の公式によると:
ω = −1/2 + √−3/2 ‥‥②
こいつの正体は 1 の原始立方根。3乗すると初めて 1 になる数。 ω ≠ 1 だけど、
ω3 = 1 ‥‥③
だよ、と。②に含まれる √−3 は「2乗すると −3 になるような数」。そういう数は二つあるけど、虚部が正のやつを選んでおこう。
普通の整数(−1, 0, 1, 2, 3 など)もアイゼンシュタイン整数であり b = 0 の場合に当たる。
b = 0 なら a + bω = a + 0⋅ω = a
アイゼンシュタイン整数の中には、もちろん普通の整数以外のものも、無数にある。例えば 1 + ω とか 1 + 2ω とか 2 − 3ω のように。
普通の整数 a, b を好きに選ぶとして、アイゼンシュタイン整数 a + bω は、次の形を持つ(ω の定義については②参照):
a + bω = a + b(−1/2 + √−3/2)
= (2a − b/2
+ b√−3/2
アイゼンシュタイン「整数」といっても、このように複素数表示をした場合、その「成分の係数」は、しばしば 1/2 単位の端数を持つ。一方、定義から明らかなように、アイゼンシュタイン整数は 1/2 単位より細かい端数を持つことはない。例えば √−3/3 や √−3/4 のような成分(分母が 2 より大きい)を持つことはない。
その結果として、普通の整数の場合と同様に、「そのアイゼンシュタイン整数は 3 で割り切れるけど、このアイゼンシュタイン整数は 3 で割り切れない」みたいな区別が生じる(「割り切れる」というのは、割った結果が再びアイゼンシュタイン整数になること)。
† ω の代わりに文字 ρ や ζ や ζ3 などが使われることもある(文献による変数名などの違いについては、付録E参照)。
![]()
§2/9. 「1 の約数」は単数と呼ばれる(1 自身も 1 の約数なので、単数)。普通の整数の中には、単数は ±1 の二つしかない(−1 は 1 を割り切るので単数)。アイゼンシュタイン整数の世界では ±1 に加えて ±ω, ±ω2 も単数であり†、単数が合計 6 個ある。実際、 ω3 = 1 だから(③参照)、 1 = ω⋅ω2 であり、 ω は 1 を割り切るし(商は ω2)、 ω2 も 1 を割り切る(商は ω)。 1 = (−ω)⋅(−ω2) でもあるから −ω と −ω2 も単数。
† ①を移項すると ω2 = −1 − ω。よって ω2 もアイゼンシュタイン整数 a + bω の一種で、 a = −1, b = −1 の場合に当たる。同様に −ω2 = 1 + ω も、一つのアイゼンシュタイン整数。実はアイゼンシュタイン整数同士の和や積(平方・立方などを含む)は、再びアイゼンシュタイン整数となる(証明)。
単数―― 1 やその約数 ±1, ±ω, ±ω2 ――は、任意の整数の約数。約数やら倍数やらの関係について考える場合には、「単数倍の違いしかないような二つの数」は、「まぁ同じようなもの」と見なされる。例えば 3 は ±1, ±ω, ±ω2 のどれでも割り切れるけど、これを「6種類の異なる約数」とは見なさず、「単数」という「同じ1種類の数の仲間たち」と見なす。
アイゼンシュタイン整数の世界でも「割り切れる・割り切れない」「割り切れない場合の余り」といった概念があり、任意の数を約数に分解することができる。素因数分解も普通にできる。そういった性質を証明することはさほど難しくないし、理論的にも重要なことではあるが、ここでは理論面には立ち入らず、単にアイゼンシュタイン整数の世界をツールとして使って、フェルマーの最終定理(n = 3 の場合)の話題に集中したい。
〔注〕 「素因数分解の一意性」のような理論的裏づけがないままでは、この証明は、厳密に言えば不完全だ。しかしそういうテクニカルなギャップは、後から埋めればいい。
a + bω において a = 1, b = −1 としたもの――すなわち 1 − ω というアイゼンシュタイン整数――を文字 λ (ラムダ)で表すことにしよう。この λ という数が、フェルマーの最終定理の n = 3 の場合の証明において、極めて重要な役割を果たす。
以下の事実は、難しくはないけど、無味乾燥かもしれない。後で使うんで我慢してね…
補題1
〘ⅰ〙 アイゼンシュタイン整数 λ = 1 − ω は 3 の約数。言い換えると、 3 は λ で割り切れる。
〘ⅱ〙 一般に 3 の倍数は λ の倍数でもある。
〘ⅲ〙 実は 3 = −ω2 × λ2 である(従って 3 は λ2 でも割り切れる)。さらに λ2 = −3ω と書くこともできる。
コメント 普通の整数の世界では 3 は素数であり、 1 と自分自身以外の約数を持たない。アイゼンシュタイン整数の世界では 3 はもはや素数ではなく、 1 と自分自身以外の「第3の約数」を持つ。ちょっと面白いかも?
証明 〘ⅰ〙 定義より ω2 + ω + 1 = 0 なので(①参照)、移項すると:
−ω2 = ω + 1
上記の等式に留意しつつ λ を 2 + ω 倍‡してみる:
λ(2 + ω) = (1 − ω)(2 + ω) = 2 + ω − 2ω − ω2
= 2 + ω − 2ω + (ω + 1) = 3
要するに、アイゼンシュタイン整数の世界では、
3 = λ(2 + ω) ‥‥④
という分解が成り立ち、 3 は約数 λ = 1 − ω と約数 2 + ω の積に等しい。言い換えると 3 は λ の倍数。
〔注〕 ω を直接使った計算は、分かりにくいかもしれない。普通に複素数として表現すると(②参照)、
λ = 1 − ω = 1 − (−1/2 + √−3/2)
= 3/2 − √−3/2
2 + ω = 2 + (−1/2 + √−3/2)
= 3/2 + √−3/2
であり、この二つの数は、共役複素数のペアに過ぎない。両者の積が 3 に等しいことは、
(3/2 + √−3/2)(3/2 − √−3/2)
=
(3/2)2 − (√−3/2)2
=
9/4 − −3/4
=
12/4
という直接計算からも、容易に確かめられる。
〘ⅱ〙 P を任意のアイゼンシュタイン整数とする。④の両辺を P 倍すると:
3P = λ × (2 + ω)P
つまり 3 の倍数 3P は、 λ の倍数でもある。〘ⅰ〙を考えれば当たり前かも。
〘ⅲ〙 ②から:
ω2 = (−1/2 + √−3/2)2
=
1/4
+
2⋅(−1)⋅√−3/4
+
−3/4
=
−1/2 − √−3/2
∴ ωλ = ω(1 − ω) = ω − ω2
= (−1/2 + √−3/2
) − (−1/2 − √−3/2
) = √−3
従って:
−ω2 × λ2 = −(ωλ)2 = −(√−3)2 = −(−3) = 3
さらに、この最後の等式の両辺を −ω 倍すると[−(ω2)(−ω) = ω3 = 1 に留意]、
λ2 = −3ω
となる。∎
‡ 2 + ω という数の正体については付録A参照。
次の性質は、それなりに面白い。
補題2 任意のアイゼンシュタイン整数 P = a + bω は、 λ の倍数に等しいか(つまり λ で割り切れるか)、または λ の倍数より 1 大きいか、または λ の倍数より 1 小さい。記号で書くと:
P ≡ 0 または P ≡ 1 または P ≡ −1 (mod λ)
〔注〕 普通の整数は、「3 の倍数」「3 の倍数より 1 大きい数」「3 の倍数より 1 小さい数」の三つのグループに分類可能。それと似てるけど、アイゼンシュタイン整数は、 λ で割った余りに応じて三つのグループに分類可能、というわけである。
証明 0λ, ±λ, ±2λ, ±3λ などを考えると、 λ = 1 − ω の倍数の中には、
0(1 − λ) = 0,
1 − ω, 2 − 2ω, 3 − 3ω, ···
−1 + ω, −2 + 2ω, −3 + 3ω, ···
のような数が含まれる。
どんなアイゼンシュタイン整数 P = a + bω が与えられたとしても、その数の第2項 bω だけを考えるなら、その bω は
λ の倍数 −bλ = −b(1 − ω) = −b + bω
の第2項と一致する。 −bλ を X としよう(X は λ の b 倍だから λ の倍数)。もし
P − X = (a + bω) − (−b + bω) = a + b ← これは普通の整数
が 3 の倍数なら、
P − X = 3 の倍数
∴ P = 3 の倍数 + λ の倍数 X
ということになる。この場合、その P は、
3 の倍数 + λ の倍数 = λ の倍数 + λ の倍数 = λ の倍数
だ(なぜなら補題1〘ⅱ〙から、 3の倍数は λ の倍数)。要するに、与えられた数 P = a + bω について、もし a + b が 3 の倍数なら、その P は λ の倍数。
一方、もしこの a + b が 3 の倍数より 1 大きい〚小さい〛なら、その P は、上記のような λ の倍数より 1 大きい〚小さい〛。∎
〔例1〕 5 − 5ω と 8 − 5ω と 11 − 5ω は、どれも λ の倍数(5 − 5 = 0, 8 − 5 = 3, 11 − 5 = 6 がそれぞれ 3 の倍数)。実際、 5λ = 5(1 − ω) = 5 − 5ω は λ の倍数で、それに 3 や 6 を足した 8 − 5ω や 11 − 5ω も λ の倍数。
〔例2〕 6 − 5ω は λ の倍数より 1 大きい。これは〔例1〕の数に 1 を足したもの。
〔例3〕 4 − 5ω は λ の倍数より 1 小さい。これは〔例1〕の数に −1 を足したもの。
これで準備が完了した。ここからは、本題のフェルマーの最終定理(n = 3 の場合)の件。
![]()
§3/9. a, b, c は普通の整数で、どれも 0 ではないとする。フェルマーの最終定理によると a3 + b3 = c3 を満たすような a, b, c は存在しない。今からそれを証明するのだが、便宜上、問題を拡張して、「アイゼンシュタイン整数の範囲で考えても、そういう a, b, c は存在しない」ことを示そう。「普通の整数」も「アイゼンシュタイン整数」の一種だから、「アイゼンシュタイン整数」の範囲で解がないなら、もちろん「普通の整数」の範囲でも解がない。
a3 + b3 = c3 を移項すると、
a3 + b3 − c3 = 0 つまり a3 + b3 + (−c)3 = 0
であり、 a = x, b = y, −c = z と置くと、
x3 + y3 + z3 = 0
と表現可能。 x, y, z がアイゼンシュタイン整数だとしても、その一つ以上が 0 である場合を除き、このような等式は不可能である――ということを証明したい。
x, y, z について、「どの二つも互いに素†」と仮定して差し支えない――その仮定は、フェルマーの定理に不当な制約を課すものではない。実際、 x3 + y3 + z3 = 0 に解 x = A, y = B, z = C があったとして、仮にそのうち A, B は互いに素でない、としよう――つまり、単数以外の何らかの公約数 d を持つ、と。このとき A は d の p 倍、 B は d の q 倍として A = dp, B = dq と書くと、 A3 = d3p3, B3 = d3q3 となり、 A3, B3 はどちらも d3 の倍数。しかも、仮定により
A3 + B3 + C3 = 0 (♪)
が成り立ち、従って、
C3 = −A3 − B3
= −d3p3 − d3q3
= d3(−p3 − q3)
も d3 の倍数。結局 A3, B3, C3 はどれも d3 で割り切れる。(♪)の両辺を d3 で割ると、
(A/d)3
+ (B/d)3
+ (C/d)3 = 0
となるが、この等式も(それぞれの分数は割り切れて整数になるのだから)、有効な x3 + y3 + z3 = 0 の整数解を表す(アイゼンシュタイン整数の範囲での、拡張された意味での整数解)。
これは何を意味するか?
ある一組の解 p, q, r があるなら、その各数に共通の数 d を掛けたものも、一組の解。そのような「大きい」解 dp = A, dq = B, dr = C は、各数を d 倍(式の両辺を d3 倍)する前の「小さい」解 p, q, r と本質的に同じものであり、 d で“約分”できる。逆に言うと、最初から“約分”できるものはして、公約数を持たないような「小さい」解だけを考えればいい――本質的に同じなら、コンパクトな設定の方が考えやすくて便利。以上 x と y が公約数を持つ場合を例にしたが、他の二つの変数が公約数を持つ場合も全く同様。
† 普通の整数の世界において、普通の整数 x, y が互いに素というのは、両者の最大公約数が 1 であること。言い換えると、単数 ±1 以外の公約数を持たないこと。アイゼンシュタイン整数の世界でも、「互いに素」とは単数 ±1, ±ω, ±ω2 以外の公約数を持たないことを意味する。
(証明編へ続く)
![]()
2025-10-14 フェルマーの最終定理(n = 3) 証明編
入門編の続き。以下の証明手順の出典は、 Edmund Landau の整数論†・第3巻(1927)。少々技巧的であまり平明ではなく、最初はピンとこないかもしれないが、真意が分かってくると、精緻で味わい深い。近代的な標準的証明法だと思われる(高木の整数論にも Hardy & Wright の整数論にも収録されている)。
† [5] は、オンラインで自由に閲覧できる参考文献の例(42ページ LEMMA 5.1 から45ページまで)。
![]()
§4/9. 次の定理が証明の入り口。「入り口」とはいえ、証明全体の中で一番手ごわいかも。これさえ突破すれば…
定理1 アイゼンシュタイン整数 P が λ の倍数ではないなら、 P の立方 P3 は λ4 の倍数より 1 大きいか、または λ4 の倍数より 1 小さい。記号で書くと:
P は λ の倍数ではない ⇒ P3 ≡ 1 または P3 ≡ −1 (mod λ4)
解説 λ4 = (1 − ω)4 の直観的意味が分かりにくいかもしれないが、補題1〘ⅲ〙から λ2 = −3ω であり、その両辺を平方すると λ4 = 9ω2 だ。単数 ω2 を無視して大ざっぱに言うと、定理1は「9 で割ったら余りは何?」みたいな分類の話をしている。 P が λ の倍数より 1 大きい〚小さい〛とき、 P3 も λ の倍数より 1 大きい〚小さい〛ことは、明白――単に (±1)3 ≡ ±1 というだけのこと(普通の整数の世界で類例を挙げると: 4 の倍数より 1 大きい〚小さい〛数は、3乗しても 4 の倍数より 1 大きい〚小さい〛)。けれど同様の状況において、 P を3乗した後で基準を λ から L = λ4 に変えても、依然として P3 は L の倍数より 1 大きい〚小さい〛――これが定理1の意外性であり、要点でもある。
〔注〕 付録Bで別証明を紹介する。
証明 仮定により P は λ の倍数ではないので、補題2から、 P は λ の倍数より 1 大きいか 1 小さい。仮に 1 大きいとして、
P = λQ + 1
としよう(Q は何らかのアイゼンシュタイン整数。 λQ はもちろん λ の倍数)。両辺を立方すると†:
P3 = (λQ + 1)3 = λ3Q3
+ 3λ2Q2
+ 3λQ + 1 ‥‥⑤
† 和の3乗の展開の公式 (X + Y)3 = X3 + 3X2Y + 3XY2 + Y3 [証明] を使う。
3 = −ω2λ2 は λ2 の倍数なので(補題1)、 3λ2 = −ω2λ4 は λ4 の倍数。よって⑤の右辺第2項は λ4 で割り切れ、「⑤の値を λ4 で割った余り」には影響しない。同様に、補題1から、⑤の右辺第3項 3λQ は −ω2λ3Q に等しい。以上のことから、⑤を λ4 で割った余りは、次の数を λ4 で割った余りに等しい:
λ3Q3 − ω2λ3Q + 1 = λ3(Q3 − ω2Q) + 1 ‥‥⑥
⑥右辺 ( ) 内の Q3 − ω2Q は、常に λ で割り切れる。なぜならば――
〔注〕 合同式を使うと ω2 = −1 − ω
= (1 − ω) − 2 = λ − 2 ≡ −2 ≡ 1 (mod λ) なので、
Q3 − ω2⋅Q ≡ Q3 − 1⋅Q (mod λ)
となり、直ちに下記⑦に至る。以下の処理も本質的には同じことだが、合同式の代わりにトリックを使う。
−ω2 = −λω2 − 1 という関係‡に留意すると:
Q3 − ω2Q
= Q3 + (−λω2 − 1)Q
= Q3 − λω2 Q − Q
この第2項は λ の倍数なので、 Q3 − ω2Q が λ で割り切れるかどうかは、その項と無関係に残りの項
Q3 − Q ‥‥⑦
だけによって決まる。この数は、
Q(Q2 − 1) = Q(Q + 1)(Q − 1)
に等しく、必ず因子 λ を持つ。というのも、実は Q, Q + 1, Q − 1 のうち、どれか一つは λ の倍数――そのことは Q 自身が λ の倍数なら自明だが、もし Q が λ の倍数でないなら、 Q は λ の倍数より 1 大きいか 1 小さい(補題2)。 λ の倍数より 1 大きいのなら Q − 1 は λ の倍数だし、 λ の倍数より 1 小さいのなら Q + 1 は λ の倍数だ。
結局⑦は――従って⑥右辺の ( ) 内は――常に λ で割り切れ、よって⑥右辺第1項は λ4 で割り切れる。ゆえに⑥は λ4 の倍数より 1 大きく、従って⑤の値すなわち P3 も、 λ4 の倍数より 1 大きい。
一方、 P が λ の倍数より 1 小さいとして P = λQ − 1 と書くと、
P3 = (λQ − 1)3 = λ3Q3 − 3λ2Q2 + 3λQ − 1
となるが、⑤と同様にこの右辺第2項は結果に影響せず、結局⑤と比べ末尾の + 1 が − 1 に置き換わっただけ。⑥以下と同様に考えると、この場合の P3 は λ4 の倍数より 1 小さい。∎
‡ −ω2 + 1 = −ω2 + ω3 = −(1 − ω)ω2 = −λω2 なので −ω2 = −λω2 − 1。
定理1の系(派生命題) アイゼンシュタイン整数 P が λ の倍数ではないなら、 P3 は λ3 の倍数より 1 大きいか 1 小さい。記号では:
P は λ の倍数ではない ⇒ P3 ≡ ±1 (mod λ3)
証明 P が λ の倍数ではないとする。定理1から、 P3 は λ4 の倍数(それを λ4Q とする)より 1 大きいか 1 小さい。よって、
P = λ4Q ± 1
と書くことができる。ところが λ4 の倍数は、当然 λ3 の倍数でもある(16 の倍数が、当然 8 の倍数でもあるように)。上の式を
P = λ3 × λQ ± 1
と書くこともでき、この P は、明らかに λ3 の倍数(λ3 × λQ)より 1 大きいか 1 小さい。∎
![]()
§5/9. 以下で示すように、定理1の結果として、 x3 + y3 + z3 = 0 が所定の解を持つなら x, y, z のどれか一つ(それを z としよう)は λ の倍数でなければならない。この必要条件はそれなりに厳しい制約だが、フェルマーの式が「普通の整数」の範囲で解を持つことを直ちに妨げるものではない。 λ2 = −3ω なんで(補題1〘ⅲ〙)、 λ6 = (−3ω)3 = −27⋅ω3 = −27 は普通の整数。 z が因子 λ を 6 個(あるいは 12 個・18個など)持つとしたら、 z は普通の整数。「ひょっとしたらフェルマーの定理は間違っていて、実は普通の整数の解があるかも」って可能性は、まだ残っている。
定理2 x3 + y3 + z3 = 0 を満たす x, y, z が、アイゼンシュタイン整数の範囲で存在したとする。ただし x, y, z はどれも 0 ではなく、どの二つも互いに素とする(この仮定は不当ではない: §3 参照)。このとき x, y, z のうち一つだけが λ の倍数で、残りの二つは λ の倍数ではない。
証明 「どの二つも互いに素」という前提から、「x, y, z の中の二つ以上が λ の倍数」ということはない。可能性があるのは「x, y, z が、どれも λ の倍数ではない」というパターンと、「x, y, z のうち、一つだけが λ の倍数」というパターン。
x, y, z がどれも λ の倍数でないと仮定すると、定理1から、 x3, y3, z3 のそれぞれは、 λ4 の倍数より 1 大きいか 1 小さい。よって、
x3 + y3 = (λ4 の倍数 ± 1) + (λ4 の倍数 ± 1)
という2数の和は(この複号は同順と限らない。どのような符号の組み合わせも選択可)、 λ4 の倍数に等しいか(複号の一方で + 他方で − を選んだ場合)、もしくは λ4 の倍数 ± 2 に等しい(両方の複号で同じ符号を選んだ場合)。要するに:
x3 + y3 = (λ4 の倍数、またはそれ ± 2) ‥‥(♫)
ところが、仮定と定理1から z3 も (λ4 の倍数 ± 1) なので、それを(♫)に足した結果は、
x3 + y3 + z3 = (λ4 の倍数 ±1 or ± 3)
となるはず。 λ4 = 9ω2 であり(定理1の〔注〕参照)、 ±1 も ±3 も、 λ4 という「自分よりサイズがでかい」数(単数倍の違いを無視すれば 9 に等しい)では割り切れないので、 x3 + y3 + z3 は λ4 の倍数ではない。他方、成り立つはずの等式、
x3 + y3 + z3 = 0
の右辺 0 は、明らかに λ4 の倍数だ(0 倍)。
すなわち x, y, z がどれも λ の倍数ではないと仮定すると、「λ4 の倍数ではない左辺」と「λ4 の倍数である右辺」が等しい――という、不合理な結論が生じる。そんな不合理な仮定はやめて、「x, y, z のうち、一つだけが λ の倍数」と考えるしかない。∎
![]()
§6/9. x3 + y3 + z3 = 0 を満たすような 0 ではない整数 x = A, y = B, z = C が、アイゼンシュタイン整数(通常の整数を拡張したもの)の範囲で存在したとすると、解 A, B, C のうちどれか一つだけは λ = 1 − ω の倍数にならなければならない(定理2)。必要なら変数名を入れ替えることによって、「A, B は λ の倍数ではない。 C は λ の倍数」としよう。すると整数 C は因子 λ を(少なくとも一つ)持つわけだが、もしかしたら C は、因子 λ を二つ以上持つかも(例えば C = λ2D のように)。
一体 C は因子 λ を何個、持つのか?
この素朴な疑問を追究すると「矛盾」が明らかになり、そのことから、(x3 + y3 + z3 = 0 が解を持つという)仮定自体に無理があることが示されるであろう。つまりフェルマーの最終定理の n = 3 の場合の正しさが、証明されるであろう。
C が因子 λ をちょうど m 個持つとして C = λmD と書くと:
A3 + B3 + C3 = A3 + B3 + (λmD)3 = 0
つまり A3 + B3 + λ3mD3 = 0 ‥‥(✽)
証明は、二つのステップから成る。第一に、 m が 2 以上でなければならないことを示す。第二に、もし(✽)を満たすような A, B, D, m が存在したなら、もっと小さい m に関しても(✽)を満たす解が存在することを示す。――第二段階で得られるこの結論は、矛盾をはらんでいる。だって第一段階では「解があるなら m は 2 以上じゃなきゃ駄目っ!」っていうのに、第二段階では「もし解があるなら、もっと小さい m に対しても別の解があるよ」っていうんだから、つじつまが合わない(後述)。
次の定理が「第一段階」に当たる。
定理3 x3 + y3 + z3 = 0 を満たす整数解 {x, y, z} = {A, B, C} が存在したとする(A, B, C はどの二つも互いに素: §3 参照)。これら三つの整数のうちどれか一つ(それを C とする)だけは、因子 λ を持つ(定理2参照)。 C が持つ因子 λ の総数を m として C = λmD としよう(余因子 D は、もはや因子 λ を持たない)。便宜上、(✽)をわずかに拡張した方程式
A3 + B3 + uλ3m D3 = 0 (✽✽)
を考える。ただし u は、アイゼンシュタイン整数の任意の単数とする。 u = 1 とした場合が(✽)に当たる。――以上の設定において、 m は必ず 2 以上でなければならない。
〔注〕 λ3m D = C なので、 u = 1 の場合、(✽✽)は A3 + B3 + C3 = 0 という、もともとのフェルマーの式を表すが、 u がそれ以外の単数、例えば u = ω の場合、(✽✽)は A3 + B3 + ωC3 = 0 という関係を表す。最終的には「このような等式は、どれも不可能」という結論に達する。
証明 仮定により A, B は λ で割り切れないので、定理1から:
A3 ≡ ±1, B3 ≡ ±1 (mod λ4)
すなわち A3, B3 はそれぞれ λ4 の倍数より 1 大きいか 1 小さい。上記の二つの複号において、同じ符号が選択されるとすれば:
A3 + B3 ≡ ±2 (mod λ4) ‥‥㋐
異なる符号が選択されるとすれば:
A3 + B3 ≡ 0 (mod λ4) ‥‥㋑
㋑が真なら A3 + B3 は λ4 の倍数。一方、㋐が真なら A3 + B3 は、 λ4 の倍数(それを λ4Q とする)より 2 大きいか 2 小さいので、
A3 + B3 = λ4Q ± 2 = λ3⋅(λQ) ± 2
と表現可能であり、従って、λ3 の倍数より 2 大きいか 2 小さい。
さて、(✽✽)を移項すると
−uλ3m D3 = A3 + B3 ‥‥⑧
なので、⑧の左辺は因子 λ を 3m 個持つ(m ≧ 1)。よって、それに等しい⑧の右辺 A3 + B3 は、少なくとも λ3 の倍数(もしかすると λ6 や λ9 などの倍数)。だから、もしも㋐が正しければ、
A3 + B3 は λ3 の倍数であると同時に、 λ3 の倍数 より 2 大きいか 2 小さい(つまり λ3 の倍数ではない†)
ということになってしまう。それは不合理なので、㋐は正しくない。正しい可能性があるのは㋑だけ――つまり A3 + B3 は λ4 の倍数で、それに等しい −uλ3m D3 も(⑧参照)、当然 λ4 の倍数でなければならない。
そうなるためには――つまり −uλ3m D3 が因子 λ を 4 個(以上)持つためには――、 m = 1 では不足(なぜなら u は単数なので因子 λ を持たないし、定理3の仮定から、 D も因子 λ を持たない)。すなわち(✽✽)において m は 2 以上でなければならない。∎
† 「λ3 の倍数 ±2」が λ3 の倍数になるためには、 2 が λ3 の倍数でなければならない。しかし直接計算によると、 2 は λ の倍数ですらない。実際 −ω2λ2 = 3 (補題1)と ω2 = −1 − ω (§2 参照)に留意すると、
2/λ = 2(−ω2λ)/(−ω2λ2) = −2ω2λ/3
= 2(1 + ω)(1 − ω)/3
= 2(1 − ω2)/3 = 2(1 + 1 + ω)/3 = (4 + 2ω)/3
であり、 2 を λ を割った商はアイゼンシュタイン整数にならない(§1 参照)。次のように考えれば、計算するまでもない。すなわち 3 の単数倍である λ2 は、絶対値が 3。よって λ3 の絶対値は 3 より大。 2 が、自分より絶対値が大きい λ3 で割り切れるわけがない。
(完結編へ続く)
![]()
2025-10-14 フェルマーの最終定理(n = 3) 完結編
#遊びの数論 #アイゼンシュタイン整数 #FLT(7) #FLT(3)
証明編の続き。証明の第二段階。
![]()
§7/9. 必要な公式を準備しておく。
補題3 次の恒等式が成り立つ。
〘ⅰ〙 (X + Y) + ω(X + ωY) + ω2(X + ω2Y) = 0
〘ⅱ〙 X3 + Y3 = (X + Y)(X2 − XY + Y2) = (X + Y)(X + ωY)(X + ω2Y)
証明 〘ⅰ〙 左辺を展開して生じる6項について「X を含む項」と「Y を含む項」に分けて整理すると:
X + ωX + ω2X + Y + ω2Y + ω4Y
= X(1 + ω + ω2) + Y(1 + ω2 + ω4)
右端の第一の ( ) 内は ω の定義から 0 に等しい(①参照)。 ω4 = ω3⋅ω = 1⋅ω = ω に留意すると(③参照)、第二の ( ) 内も 1 + ω + ω2 = 0 に等しい。
〘ⅱ〙 一つ目の等号については、その右側の式を展開すると、
(X + Y)(X2 − XY + Y2)
= X(X2 − XY + Y2)
+ Y(X2 − XY + Y2)
= (X3 − X2Y + XY2)
+ (X2Y − XY2 + Y3)
= X3 + Y3
となって、左側の式と一致。〘ⅱ〙の二つ目の等号については、
(X + ωY)(X + ω2Y) = X2 − XY + Y2
を示せば十分。その左辺を展開すると、
X2 + ω2XY + ωXY + ω3Y
= X2 + (ω + ω2)XY + Y
となるが、①から ω + ω2 = −1 なので、上の式は確かに = X2 − XY + Y だ。∎
〔参考〕 −1 の立方根は −1, −ω, −ω2 だから、 X3 = −1 すなわち X3 + 1 = 0 の左辺は (X + 1)(X + ω)(X + ω2) と分解される。この等式を同次化すると〘ⅱ〙が得られる。あるいは同じことだが、 −Y3 の立方根は −Y, −ωY, −ω2Y だから、 X3 = −Y すなわち X3 + Y3 = 0 の左辺は〘ⅱ〙のように分解される。
![]()
§8/9. 本論。§6 の⑧を再掲する。
−uλ3m D3 = A3 + B3 ‥‥⑧再掲
その右辺に補題3〘ⅱ〙を適用すると:
−uλ3m D3 = (A + B)(A + ωB)(A + ω2B) ‥‥⑩
⑩の右辺の三つの因子について、順に
ƒ1 = A + B ‥‥㋕
ƒ2 = A + ωB ‥‥㋖
ƒ3 = A + ω2B ‥‥㋗
という名前を付けておこう。⑩の左辺(=⑧の左辺)は素数 λ の倍数なので、⑩の右辺の因子 ƒ1, ƒ2, ƒ3 のうち少なくとも一つは、因子 λ を持つ(つまり λ の倍数)。ところで ƒ1, ƒ2, ƒ3 から二つを選んで、両者の差を考えると:
ƒ1 − ƒ2 = B − ωB = B(1 − ω) = Bλ ‥‥㋚
ƒ2 − ƒ3 = ωB − ω2B = ωB(1 − ω) = ωBλ ‥‥㋛
ƒ3 − ƒ1 = ω2B − ω3B = ω2B(1 − ω) = ω2Bλ ‥‥㋜
このように、 ƒ1, ƒ2, ƒ3 のどの二つを考えても、両者の差は λ の倍数†なので(Bλ, ωBλ など)、もし ƒ1, ƒ2, ƒ3 のどれか一つが λ の倍数なら、 ƒ1, ƒ2, ƒ3 はどれも λ の倍数になる。ところが「三つの数のうち少なくとも一つは λ の倍数」ということは分かっている(上述)。だから、事実、三つとも λ の倍数だ。
† 単に ƒ1 ≡ ƒ2 ≡ ƒ3 (mod λ) と書くこともできる。この合同式を㋕㋖㋗から直接導くことも可能。それには 1 ≡ ω ≡ ω2 (mod λ) を示せば十分。定義により λ = 1 − ω なので、当然 1 − ω は λ の倍数(ちょうど 1 倍)。つまり 1 − ω ≡ 0、よって 1 ≡ ω (mod λ)。さらに ω2 − 1 = −2 − ω = −3 + 1 − ω = −3 + λ も λ の倍数(∵ 3 は λ の倍数)、よって ω2 ≡ 1 (mod λ)。
他方、 ƒ1, ƒ2, ƒ3 の中に λ2 の倍数が二つ以上存在することは、あり得ない(どれか一つだけが λ2 の倍数になることは可)。というのも、もしも例えば ƒ1, ƒ2 が両方 λ2 の倍数だったとすると、それらの差(㋚の Bλ)も λ2 の倍数になるはず。しかし仮定により B は λ の倍数ではないので(定理3参照)、それは不可能。三つの数のうち、他の二つについても同様。
よって⑩の値が持つ計 3m 個(少なくとも 6 個)の素因子 λ のうち、 3m−2 個は、㋕㋖㋗のどれか一つの(例えば ƒ1 の)因子となり、残り 2 個の λ が、それ以外の二つの ƒ に(例えば ƒ2 と ƒ3 に)、1 個ずつ配分される。 ƒ1, ƒ2, ƒ3 のうちの二つ以上が、素因子 λ を 2 個以上持つことはできないから。
〔例〕 仮に m = 4 とすると⑩の値は計 12 個の因子 λ を持つ。 ƒ1, ƒ2, ƒ3 は、その 12 個を分け合う。 ƒ1 に 10 個が配分されるとすると、 ƒ2, ƒ3 には 1 個ずつが配分される。「11 個 + 1 個 + 0 個」のような分け方は不可(λ は ƒ1, ƒ2, ƒ3 の公約数なので、全員が最低 1 個受け取る)。「6 個 + 3 個 + 3 個」のような分け方も不可。
〔注〕 付録Cでは、補足説明をかねて、上記の事柄について2種類の別証明を紹介する。
「アイゼンシュタイン整数の範囲」でフェルマーの定理の解を考える場合、アイゼンシュタイン整数 B, Bω, Bω2 を区別する必要性は少ない。というのも、フェルマーの定理は「整数を立方して足し算すると…」という内容だが、 ω3 = 1 だし (ω2)3 = (ω3)2 = 12 も = 1 なので、 B, Bω, Bω2 のどれも、立方してしまえば結果は同じ。のみならず、例えばもし旧 Bω をあらためて B と呼ぶと、旧 Bω2 は Bω になり、旧 B = Bω3 は Bω2 になる。
このような対称性から、(変数の意味を必要に応じて調整することを前提に)「3m−2 個の因子 λ を含むのは ƒ1 だ。 ƒ2 と ƒ3 は、どちらも因子 λ を 1 個だけ持つ」と決め付けて差し支えない。式で書くと:
ƒ1 = A + B = λ3m−2⋅ɡ1 ‥‥㋟
ƒ2 = A + ωB = λ⋅ɡ2 ‥‥㋠
ƒ3 = A + ω2B = λ⋅ɡ3 ‥‥㋡
ただし ɡ1, ɡ2, ɡ3 は、それぞれ「ƒ1, ƒ2, ƒ3 から因子 λ を分離した後に残る余因子」を指すものとする。
補題4 ㋟㋠㋡の ɡ1, ɡ2, ɡ3 のどれも λ の倍数ではない。 ɡ1, ɡ2, ɡ3 は、どの二つも互いに素。
証明 合計 3m 個しかない λ を㋟㋠㋡のように配分したのだから、 λ は「売り切れ」。 ɡ1, ɡ2, ɡ3 は因子 λ を一つも含まない。
ɡ1 と ɡ2 が互いに素であることを示そう。 ƒ1, ƒ2 が公約数 λ を持つことをわれわれは知っている。けれど―― ɡ1, ɡ2 は λ の倍数ではないから――、この λ は ɡ1, ɡ2 の共通因子ではない。 d を「単数でも λ でもないアイゼンシュタイン整数」とする。もしも ɡ1, ɡ2 がどちらも d の倍数だったとすると、㋟㋠によって ƒ1, ƒ2 も d の倍数、従ってそれらの差も d の倍数。ゆえに㋚によって B は d の倍数。のみならず、㋕によって A = B − ƒ1 も d の倍数になってしまう。この結論は「A と B が互いに素」という前提に反する。従って「ɡ1, ɡ2 がどちらも d の倍数」という仮定は不合理であり、 ɡ1, ɡ2 は互いに素。ɡ1, ɡ3 についても、 ɡ2, ɡ3 についても同様。∎
㋟㋠㋡を⑩に代入すると、
−uλ3mD3 = (λ3m−2⋅ɡ1)(λ⋅ɡ2)(λ⋅ɡ3) = λ3m⋅ɡ1⋅ɡ2⋅ɡ3
となる。両辺を λ3m で割ると:
−uD3 = ɡ1⋅ɡ2⋅ɡ3 ‥‥⑪
単数倍の違いを無視すると、⑪の左辺は立方数 D3 だ。その因子 ɡ1, ɡ2, ɡ3 のどの二つも互いに素なのだから(補題4)、 ɡ1, ɡ2, ɡ3 の積が(単数倍の違いを無視して)立方数になるためには、これら三つの数の一つ一つが、自分自身も立方数でなければならない。
解説 ここがこの証明の山場、核心部といえる。例えば、普通の整数の世界で N = 26⋅312⋅53 のような数は立方数だ――各素因子の個数が 3 の倍数であり、従って各因子の個数を 3 分の 1 にした 22⋅34⋅51 の立方だから。この N を二つの整数 X, Y の積に分解する方法は、すごくいっぱいある。例えば…
X = 23⋅36⋅52, Y = 23⋅36⋅51
あるいは X = 25⋅36⋅52, Y = 21⋅36⋅51
あるいは X = 26⋅32⋅52, Y = 20⋅310⋅51
…等々、 X と Y のトータルでの因子 2 の個数が N に含まれる因子 2 の個数と一致し、因子 3 と因子 5 についても同様の性質が成り立つ限りにおいて、 X と Y の積は N に等しい。しかし X, Y は互いに素、という条件をつけたらどうなるか。その場合、 X と Y は公約数 2 を(公約数 3 や公約数 5 も)持ち得ないので、例えば X に因子 2 が一つでも配分されたら、因子 2 は全部 X に配分される必要がある。因子 3 と因子 5 についても同様。具体例を挙げると、
X = 26⋅30⋅50, Y = 20⋅312⋅53
のような分け方になる。その結果、 X ないし Y の一方に含まれる因子 2 の個数はゼロであり、他方に含まれる因子 2 の個数は N に含まれる因子 2 の個数と一致する。因子 3、因子 5 についても同様。よって、 X も Y も、 N 同様に、各素因子を 3 の倍数個、持つ。言い換えると、 X と Y は、この条件においては、それぞれそれ自身も立方数になる。さて、⑪左辺の D3 に含まれる素因子を ɡ1, ɡ2, ɡ3 に配分する場合も(ɡ1, ɡ2, ɡ3 のどの二つも互いに素という条件があるので)、上記 N の分解と似た状況になる。実は、アイゼンシュタイン整数の世界でも――「どの数が素数か」といった設定は多少異なるものの――、普通の整数の世界の場合と同様の素因数分解が成り立ち、その結果、 N の例と同様のことが成り立つ。
〔注〕 単数 −u に当たる数が ɡ1, ɡ2, ɡ3 にどう配分されるかについては、特別な制限はない。
![]()
§9/9. 上記のことから、積 ɡ1⋅ɡ2⋅ɡ3 は、立方数 D3 と単数 −u の積に等しく、その結果 ɡ1, ɡ2, ɡ3 の一つ一つも、立方数と何らかの単数(それぞれ u1, u2, u3 としよう)の積に等しい(ただし u1⋅u2⋅u3 = −u)。
㋟㋠㋡を再掲すると:
A + B = λ3m−2⋅ɡ1
A + ωB = λ⋅ɡ2
A + ω2B = λ⋅ɡ3
このうち ɡ1, ɡ2, ɡ3 の部分が「立方数の単数倍」になる。それぞれ ɡ1 = u1⋅H3, ɡ2 = u2⋅E3, ɡ3 = u3⋅F3 と書くと(H3, E3, F3 は何らかの立方数)、上記の事柄は次のように表現される:
A + B = λ3m−2⋅(u1⋅H3) ‥‥㋤
A + ωB = λ⋅(u2⋅E3) ‥‥㋥
A + ω2B = λ⋅(u3⋅F3) ‥‥㋦
補題5 上記の数 E, F, H は、どれも λ の倍数ではない。
証明 E について。定義により ɡ2 = u2⋅E⋅E⋅E だが、 ɡ2 は λ の倍数ではない(補題4)。つまり u2⋅E⋅E⋅E という積は、因子 λ を含まない。当然 E は、因子 λ を含まない。 F, H についても同様。∎
補題3〘ⅰ〙から、
(A + B) + ω(A + ωB) + ω2(A + ω2B) = 0
が成り立つ。三つの ( ) 内に、対応する㋤㋥㋦の右辺を代入すると:
(λ3m−2⋅u1⋅H3) + ω(λ⋅u2⋅E3) + ω2(λ⋅u3⋅F3) = 0
両辺を λ で割って:
λ3m−3⋅u1⋅H3 + ω⋅u2⋅E3 + ω2⋅u3⋅F3 = 0 ‥‥⑫
アイゼンシュタイン整数の世界に単数は6種あるが(±1 or ±ω or ±ω2)、単数同士の積や商は、再び単数†。 u1, u2, u3 も、それぞれ6種の単数のどれかを表し、⑫に含まれる単数の積 ω⋅u2 も、6種の単数のどれかを表す。式を整理するため、この単数 ω⋅u2 で⑫の両辺を割り算しよう。
u1/(ω⋅u2) を v
ω2⋅u3/(ω⋅u2) を v′
とすると(v, v′ もそれぞれ単数)、上述の割り算の結果は‡:
λ3m−3⋅v⋅H3 + E3 + v′ F3 = 0
項を並び替え整理すると:
E3 + v′ F3 + vλ3(m−1) H3 = 0 (✽✽✽)
† {±1, ±ω, ±ω2} が掛け算について閉じていることは明白(ω⋅ω2 = ω3 = 1)。割り算は逆数の掛け算であり、単数の逆数は単数なので、単数の集合は割り算についても閉じている。
‡ ⑫を項ごとに ω⋅u2 で割る。第1項 λ3m−3⋅u1⋅H3 を ω⋅u2 で割ると λ3m−3⋅u1/(ω⋅u2)⋅H3 のようになるが、真ん中の分数は上記 v だ。その v という変数を使うと、この商を簡潔に λ3m−3⋅v⋅H3 と書くことができる。第2項・第3項についても同様に。
まとめると…。もしも x3 + y3 + uz3 = 0 に所定の解があるとして(u は単数)、因子 λ の分布状況を検討すると、
A3 + B3 + uλ3m D3 = 0 (✽✽)再掲
の形でなければならない。逆にこの形の式が成り立つなら、 C = λm⋅D と置くだけで、 x3 + y3 + uz3 = 0 の有効な解 A, B, C が得られる。ところが、出発点となる(✽✽)が成り立つとしたら、論理的帰結として(✽✽✽)も成り立ってしまう。二つの式は似ている。実際、仮に単数 v′ が = 1 だとすると、(✽✽✽)は、
E3 + F3 + vλ3(m−1) H3 = 0
となって、出発点の式の m を m−1 に置き換えたのと同じ形式になる(A が E に置き換わる、というように文字は変化してるけど、式全体の形について)。この場合も G = λm−1⋅H と置くだけで E, F, G は x3 + y3 + vz3 = 0 の有効な解。
それっておかしくない?
もともとの解 A, B, C のうち、 C が例えば λ4 を含んでたとすると、新しい解 E, F, G の G は λ3 を含んでいる。 λ の個数が一つ減る。この新しい解を使って同じ操作をすれば、さらに m を一つ減らした解を構成できる。そして再び同じ操作をすると…
m は、とあるアイゼンシュタイン整数が持つ因子 λ の個数なので、原理的に 0 より小さくなれない。そればかりか、定理3によって、最低 2 であることが必要。 m をどんどん減らせる、ってのは矛盾している。すなわち、もし v′ = 1 なら、 x3 + y3 + uz3 = 0 は不合理な等式であり、そのうち特に u = 1 の場合を考えると、フェルマーの最終定理の n = 3 の場合が証明される。抽象的な間接証明だけど「不可能性の証明」なので、議論が抽象的なのは仕方あるまい。
単数 v′ が = −1 の場合にも、
E3 − F3 + vλ3(m−1) H3 = 0
つまり E3 + (−F)3 + vλ3(m−1) H3 = 0
となって、 (−F) を一つの変数だと見れば、直ちに同一の不合理が生じ、証明が完了する。
一方、もしも v′ が ±1 以外の単数(±ω or ±ω2)だったとすると、上記の論法では矛盾を導けない。証明を完成させるため、 v′ の値が ±1 以外になり得ないことを示そう。(✽✽✽)を移項して、ほんの少し変形すると:
F3⋅v′ + E3
=
−vλ3(m−1) H3 ‥‥⑬
定理3から m ≧ 2 なので、⑬右辺の λ の指数 3(m−1) は、最小でも 3。よって⑬右辺は λ3 の倍数。記号で書くと ≡ 0 (mod λ3) だ。それに等しい⑬左辺
F3⋅v′ + E3
も、当然 λ3 の倍数になるはずだが、この条件は実現可能だろうか。 F も E も、それ自身は λ の倍数ではないので(補題5)、 F3 と E3 は、どちらも λ3 の倍数より 1 大きいか 1 小さい(定理1の系)。記号で書くと、
F3 ≡ ±1 ゆえに F3⋅v′ ≡ ±v′ (mod λ3)
E3 ≡ ±1 (mod λ3)
となり、以上のことをまとめると、⑬はこうなる(複号は同順とは限らず 4 パターンの組み合わせが選択可):
±v′ ± 1 ≡ 0 (mod λ3) ‥‥⑭
「単数(±1 or ±ω or ±ω2)の −1 倍も単数」という事実を踏まえ ±v′ を V と略すと、⑭は「V ± 1 は λ3 の倍数」と要約される。 V = ∓1 なら V ± 1 = 0 は明らかに λ3 の倍数(0 倍)であり、条件⑭は実現可能。それ自体としては、矛盾していない。他方において…
補題6 八つの数 ω ± 1, −ω ± 1; ω2 ± 1, −ω2 ± 1 は、いずれも λ3 の倍数ではない。つまり ≡ 0 (mod λ3) ではない。
コメント この補題を示せば、条件⑭との関係上 v′ は ±ω にも ±ω2 にもなり得ないことが確定し、 v′ = ±1 と決まる。それによって、フェルマーの定理(指数 3 の場合)の証明が終わる。
証明 八つの数のうち ω + 1 = −ω2 と −ω − 1 = ω2 は¶単数(1 の仲間)なので、 λ3 の倍数ではない。 ω2 + 1 = −ω と −ω2 − 1 = ω も単数。
残りの四つの数について。 ω − 1 = λ と −ω + 1 = −λ は、明らかに λ3 の倍数ではない。 ω2 − 1 = −(1 − ω2) = −(ω3 − ω2) = −ω2(ω − 1) = −ω2λ は λ の単数倍(λ の仲間)なので、やはり λ3 の倍数ではない。 −ω2 + 1 = 1 − ω2 = ω(1 − ω) = ωλ も λ の単数倍。∎
¶ ω2 + ω + 1 = 0 なので(§1 ①参照)、 ω + 1 = −ω2。もう一つの等式は、その両辺を −1 倍したもの。
〔注〕 補題6に当たる部分では、 Landau のオリジナルでは mod λ2 での議論が行われていて、多くの文献でも同じようになっている。一方、 Nagell と高木は、代わりに mod λ3 を使っていて、その方がほんの少し証明がスムーズになる。付録Dで補題6の別証明を紹介する。
![]()
フェルマーの最終定理(n = 3 の場合)という「趣味のパズルのようなもの」を解決することだけを目的として、アイゼンシュタイン整数(あるいは「拡張された意味での整数」のような理論)を導入するとしたら、いささか大掛かりとも思える。
事実、このような理論はフェルマーの定理の証明のためだけにあるわけではない――フェルマーの定理ばかりにこだわって「木を見て森を見ず」になっては、つまらない。でも、フェルマーの定理の研究を一つの手掛かりとしつつ、森を散歩するのは悪くあるまい。このメモでは、ギャップが残るのを承知の上で、技術的細部をぼかしたまま証明の流れを紹介した。「ギャップの部分」や「より広い範囲の観点」について多少なりとも興味が湧いてくるとしたら、結果的にそれもいいかと…
n = 7 のケース(ジェノッキの定理)は古典数論の範囲で議論が完結して、 n = 3 のケースよりかえって簡単だ――という意外な事実も、はっきりと感じられるだろう。 n = 7 は7乗なので代数計算はそれなりに複雑だけど、フェルマーの時代の古典的なツールだけで証明を完了できる。それに対して n = 3 のケースの議論では、「拡大された整数の世界」という全く新しい理論的枠組みが使われる。
![]()
2025-10-16 フェルマーの最終定理(n = 3) 付録
「フェルマーの最終定理 n = 3 の場合」(入門編・証明編・完結編)では、5種類の文献を参考にしつつ、標準的と思われる証明法(Landau 版)をなるべく平明にアレンジした。でも、どの方法が分かりやすいかは人それぞれ。幾つかの部分について別証明・補足を記す。
![]()
付録A λ = 1 − ω とすると 3 = λ(2 + ω) という補題1。確かに
λ = 1 − ω に 2 + ω を掛けると 3
というのは、計算するとそうなる。でも、この 2 + ω って数は、どこから出て来たのか?
ω = −1/2 + i√3/2 という定義(§1)から、
λ = 1 − ω
= 2/2 − (−1/2 + i√3/2)
= 3/2 − i√3/2
と、その共役複素数
λ*
= 3/2 + i√3/2
の積は、
λ⋅λ* = (3/2 + i√3/2)(3/2 − i√3/2)
= 9/4 − −3/4
= 12/4 = 3 ‥‥❶
だ。ところが、
λ*
= 3/2 + i√3/2
= 4/2
+ (−1/2 + i√3/2)
= 2 + ω
なので、これを❶に代入するとλ⋅λ* = λ⋅(2 + ω) = 3 ってことになる!
2 + ω の正体は λ の共役複素数。実はこの 2 + ω って数は、 λ = 1 − ω の単数倍(−ω2 倍)でもある。実際 −ω2 = 1 + ω なので:
λ(−ω2) = (1 − ω)(1 + ω) = 1 − ω2 = 1 + (1 + ω) = 2 + ω
結局 3 = λ⋅(2 + ω) = λ⋅λ(−ω2) = −ω2⋅λ2 となる。
〔参考〕 これは有理素数 3 が ramify されたもの。
![]()
付録B フェルマーの定理(n = 3)の証明では、入り口となる定理1が結構面倒だった。ここでは、参考までに Landau 自身によるオリジナル版の証明法を紹介する。
P が λ の倍数でなければ、 P = λQ + 1 または P = λQ − 1 と書ける(補題2)。まず P = λQ + 1 の場合を考える。 P3 − 1 を P についての3次式と見ると、その根、つまり 1 の立方根は 1, ω, ω2 だから:
P3 − 1 = (P − 1)(P − ω)(P − ω2)
と分解される†。 P = λQ + 1 を代入して:
P3 − 1 = (λQ + 1 − 1)(λQ + 1 − ω)(λQ + 1 − ω2)
= λQ(λQ + 1 − ω)ア(λQ + 1 − ω2)ウ
= λQ(λQ + λ)イ(λQ − ω2λ)エ
= λ3Q(Q + 1)(Q − ω2) ‥‥❷
( ) 内の変形のうち、ア→イは 1 − ω = λ による。ウ→エは 1 − ω2 = −(ω2 − 1) = −(ω2 − ω3) = −ω2(1 − ω) = −ω2λ による。
もし仮に❷の Q(Q + 1)(Q − ω2) の部分が λ の倍数なら、❷は λ4 の倍数となり、
P3 − 1 = λ4 の倍数 つまり P3 = λ4 の倍数 + 1
となる。
実際に Q(Q + 1)(Q − ω2) が λ の倍数であることを示そう。第一に、 1 − ω2 = (1 + ω)(1 − ω) = (1 + ω)λ = (−ω2)λ つまり −ω2 = (−ω2)λ − 1 なので、 −ω2 は λ の倍数より 1 小さい。よって、もし Q が λ の倍数より 1 大きければ、 Q − ω2 は λ で割り切れる。第二に、もし Q が λ の倍数より 1 小さければ、 Q + 1 は λ で割り切れる。第三に、もし Q が λ の倍数なら、もちろん Q は λ で割り切れる。――すなわち Q が λ の倍数、 λ の倍数 + 1、 λ の倍数 − 1 のどれだとしても(補題2から、必ずその三つのどれかになる)、
Q あるいは Q + 1 あるいは Q − ω2
のどれか一つは λ の倍数で、従って Q(Q + 1)(Q − ω2) は λ の倍数。これが示したいことだった。
P = λQ − 1 の場合についても、上記と同様。
P3 + 1 = (P + 1)(P + ω)(P + ω2)
という分解を利用して(この恒等式を得るには P3 + 1 の根つまり −1 の立方根を考えてもいいし、補題3〘ⅱ〙で Y = 1 と置いてもいい)、その P に λQ − 1 を代入すると、❷に当たるものは λ3Q(Q − 1)(Q + ω2) となる。 Q(Q − 1)(Q + ω2) が λ の倍数であることを示せばいい。それには Q, Q − 1, Q + ω2 のどれか一つは λ の倍数であることに、留意すればいい。∎
高木バージョンでは λ4 をその単数倍 9 に置き換えることによって、この証明と実質同じことが分かりやすく行われている。
† 補題3〘ⅱ〙で X = P, Y = −1 と置いても、同じ恒等式が得られる。
![]()
付録C §8 ⑩について、
−uλ3m D3 = (A + B)(A + ωB)(A + ω2B)
の右辺の三つの因子のうち、一つは素因子 λ をちょうど 3m−2 個持ち、残りの二つは素因子 λ をちょうど 1 個ずつ持つ。 Landau のオリジナル版では、ほぼ同様の議論をするに当たって、この式の両辺を次のように λ3 で割り算している。
−uλ3m−3 D3 = (A + B)/λ⋅(A + ωB)/λ⋅(A + ω2B)/λ
この方法のメリットとして、「右辺の三つの分数のうち、一つだけが素因子 λ を 3m−3 個持ち、残りの二つは λ で割り切れない」という簡潔な記述ができる。証明の内容自体は、 §8 のそれと同様。
Nagell は次の論法を使っている。
三つの分数は、どの二つも互いに素。実際、もしも
(A + B)/λ と (A + ωB)/λ
が両方、素因数 d の倍数だったら、
(A + B)/λ − (A + ωB)/λ
=
(B − ωB)/λ
=
B(1 − ω)/λ
=
Bλ/λ
= B
も d の倍数。従って −B も d の倍数。さらに λ⋅(A + B)/λ = A + B も d の倍数なので、
−B + (A + B) = A
も d の倍数。これは A, B が互いに素という前提(定理3参照)に反する。他の二つの分数についても同様。左辺は λ3m−3 の倍数なので、それに等しい右辺(三つの分子の積)も λ3m−3 の倍数。しかし三つの分数は、どの二つも互いに素なので、 λ はどの二つの公約数でもない――分数のどれか一つだけが因子 λ3m−3 を持ち、残りの二つは因子 λ を一つも持たない。よって三つの分数それぞれの λ 倍を考えると、
A + B, A + ωB, A + ω2B
のうち、どれか一つは λ3m−2 の倍数で、残りの二つは因子 λ を一つだけ持つ(つまり λ の倍数だが λ2 の倍数ではない)。
デメリットがあるとすれば、分数だと「整数の話」ということが不鮮明になって、見通しが悪くなる場合があり得ることだろう。 Hardy & Wright は、この分数を使わずに、次の論法を使っている。
§8 の ƒ1, ƒ2, ƒ3 のどの二つを選んでも、両者の差は λ の倍数だが、 λ2 の倍数ではない†。ゆえに ƒ1, ƒ2, ƒ3 は、どれも λ の倍数だが‡――言い換えると λ は ƒ1, ƒ2, ƒ3 の公約数――だが、 λ2 は、 ƒ1, ƒ2, ƒ3 のどの二つの公約数でもない。その結果、⑩の値が持つ計 3m 個(少なくとも 6 個)の素因子 λ のうち、 3m−2 個はどれか一つの ƒ の因子となり、残り 2 個の λ は、それ以外の二つの ƒ に 1 個ずつ配分される。
† 仮定により B は因子 λ を持たない。単数 ω は、もちろん因子 λ を持たない。
‡ 例えば ƒ2 が λ の倍数であることが確定したとしよう。上記のように
ƒ1 − ƒ2 = λ の倍数 つまり ƒ1 = ƒ2 + λ の倍数
なので、 ƒ2 が λ の倍数なら自動的に ƒ1 も λ の倍数になる。 ƒ1, ƒ2, ƒ3 のどの二つの間にも、この「自動的な伝染」の関係がある。ところが ƒ1, ƒ2, ƒ3 のうち少なくとも一つは λ の倍数でなければならないから(前述)、その性質が伝染して、全員が λ の倍数となる。
![]()
付録D 最後の詰めとなる補題6の別証明。回りくどい方法だが、もしかすると、この方が具体的で分かりやすいかも。本来、八つの数が λ3 の倍数ではないことを証明したい。それらが λ2 の倍数ですらないことを示せば当然「λ3 の倍数ではない」という結論になる。よって λ2 の倍数でないことを示す。
複素数としての絶対値†を考えてみる。補題1〘ⅲ〙から
λ2 = −3ω = −3⋅(−1 + √−3)/2
=
(3 − i⋅3√3)/2
であり、 λ2 の絶対値の平方は (9 + 9⋅3)/4 = 9、従って λ2 の絶対値は 3 だ。よって何かが λ2 の倍数であるためには、その何かの絶対値は 3 の倍数でなければならない‡。補題6に挙げられている ω ± 1 などの八つの数の中に、絶対値が 3 の倍数のものが含まれているか?
八つの数はどれも 0 ではなく(∵虚部 ≠ 0)、従って絶対値 0 ではない。よって λ2 の倍数であるためには、絶対値が 3, 6, 9, ··· などでなければならない。けれど、これら八つの数のどれを考えても、絶対値がそんなに大きいわけないことは明らかだろう。実際、単数 ±1, ±ω, ±ω2 は、いずれも絶対値 1 であり、「単数 ± 1」の絶対値は 2 を超えられない¶。∎
† a, b が実数のとき、複素数 a + bi の絶対値(複素平面上での原点からの距離)の平方は a2 + b2 に等しい(ピタゴラスの定理)。
‡ P の絶対値が p で Q の絶対値が q なら、積 PQ の絶対値は pq に等しい――このナイスな性質は、絶対値の定義と直接計算によって、容易に確認可能。この性質の結果として、 Q が P の倍数になるためには、 q が p の倍数であることが必要。
¶ ω 等の絶対値が 1 であることは、直接計算によっても容易に確認可能(1 の原始3乗根といった数値の意味からも、当然そうなる)。 P の絶対値が p で Q の絶対値が q なら、P + Q の絶対値も P − Q の絶対値も、 p + q を超えられない――この性質は三角不等式と呼ばれる。その直観的意味は、「長さ 1 の矢印を二つ継ぎ足しても 2 よりは長くならない」。
〔注〕 この種の議論では、通常、絶対値そのものではなくノルムが使われる。この付録では、あえて絶対値を使った。
![]()
付録E 文献による変数名などの対照表。教科書と読み比べる場合、参考にしてください。
| Landau | H–W | Nagell | Rib.1 | Rib.2 | 高木 | |
|---|---|---|---|---|---|---|
| ω | ρ | ζ | ω | |||
| A, B, C | ξ, η, ζ | ξ, η, θ | α, β, γ | |||
| D | γ | δ | α0 | |||
| E, F, H | ν, σ, μ | φ, ψ, θ | ξ1, η1, ζ1 | μ2, μ3, μ1 | φ2, φ3, φ1 | β′, γ′, α′ |
| 定理1 | (1001) | Theo 228 | Lemma 3 | Lemma 5.1 | Lemma | (2) |
| 定理2 | (1002) | Theo 229 | (2) | First Case | Case 1 | (3) |
| 定理3 | Theo 230 | (a) | Step 1 | |||
どの文献の著者たちも、アイゼンシュタイン整数をギリシャ文字で表している。われわれは A, B, C, D, ··· という、小学生が使うような変数名を使った。
![]()
2025-10-22 フェルマーの最終定理(n = 3) 高木バージョン
x3 + y3 = z3 を満たすような 0 でない整数 x, y, z はない――というフェルマーの最終定理(n = 3)の証明は、高木
「フェルマーの最終定理」の証明については実質 Landau 版そのままとはいえ、高木バージョン独特の工夫が若干あって、入り口の部分の説明に関しては、ある意味、最も分かりやすい。半面、証明の後半部は、ある意味、最も分かりにくい書き方になっている。
![]()
x, y, z をどれも 0 でないとすると、 x3 + y3 + z3 = 0 には整数解はない―― Landau は、この定理をアイゼンシュタイン整数の範囲で証明した。この証明の高木バージョンをダイジェストで。
3 = −ω2λ2 なので(補題1参照)、普通の整数が 3 で割り切れるとしたら、その整数は λ でも割り切れる(λ2 でも割り切れる)。逆に、普通の整数が λ で割り切れるとしたら、その整数は 3 で割り切れる†。
† このことはノルム(絶対値の平方)を考えれば明白。 λ のノルムは 3 なので、 λ で割り切れる数のノルムは 3 の倍数。 d を有理素数(普通の整数であるような、普通の意味での素数)とすると、 d の絶対値はもちろん d なのでノルムは d2 であり、有理素数のうちノルムが 3 の倍数に等しいものは d = ±3 しかない。よって λ で割り切れるような普通の整数は、素因子 3 を持つ。
3 = −ω2λ2 = −(ωλ)2 = −(√−3)2 でもある。この右端の数は −(−3) = 3 で、もちろん左端の 3 に等しいが、 ωλ が √−3 に等しいという途中計算は、それほど明白ではない。実は:
ωλ = ω(1 − ω) = ω − ω2 =
((−1 + √−3)/2)
− ((−1 − √−3)/2)
= (−1 + √−3 + 1 + √−3)/2
= 2√−3/2
= √−3 ‥‥⓵
λ と √−3 は単数倍の違いだけの仲間同士、ということが分かる。 ω3 = 1 に留意しつつ⓵の両辺を ω2 倍すると:
λ = ω2⋅√−3 ‥‥⓶
高木の p. 258 にある「問題 1」の趣旨は次の通り。
a, b を普通の整数とする。アイゼンシュタイン整数 P = a − bω が λ = 1 − ω で(すなわち √−3 で)割り切れるのは、 a − b が 3 で割り切れるときである(ということを示せ)。
〔注〕 ミステリアスな代数的整数 λ の代わりに、初心者に優しい √−3 を前面に出している。両者は単数倍の関係なので、一方で割り切れる(割り切れない)ことは、他方で割り切れる(割り切れない)ことと同値。どっちで考えてもいいわけだ。 P = a + bω とせず P = a − bω としているが、 b の符号は(値も)任意なので、これまたどっちでも同じこと。
解 λ = 1 − ω だから ω = 1 − λ。ゆえに:
P = a − bω = a − b(1 − λ) = a − b + bλ ‥‥⓷
これが λ で割り切れるのは、 a − b が λ で割り切れるときに限られる(bλ の部分は必ず λ で割り切れるので)。 a − b は普通の整数なので、 λ で割り切れる必要十分条件は 3 で割り切れること。∎
高木はここで「注意」として、 P = a − bω が λ で割り切れないなら、そのとき普通の整数 a − b は 3 で割り切れないから、3 の倍数より 1 大きいか 1 小さいかのどちらかだ、と指摘する。つまり、何らかの 3 の倍数 3N があって a − b = 3N ± 1 が成り立つ。 3 = −ω2λ2 を代入すると:
a − b = (−ω2λ2)N ± 1 = λ⋅(−ω2λN) ± 1
これを⓷に代入すると:
P = a − b + bλ = λ⋅(−ω2λN) ± 1 + bλ
= λ⋅(b − ω2λN) ± 1
すなわち λ で割り切れないような P は、必ず λ の倍数より 1 大きいか 1 小さい(補題2と同等)。変化球として、 λ の倍数は √−3 の倍数でもあるから(⓶参照)、 λ で割り切れないような P は、√−3 の倍数より 1 大きいか 1 小さい、という性質も持つ。何らかのアイゼンシュタイン整数 Q が存在して、
P = Q√−3 ± 1 ‥‥⓸
を満たすわけである(P が λ で割り切れないときは)。そして定理の鍵となる次の命題が、さらりと導入される。
命題(高木版の定理1) アイゼンシュタイン整数 P が λ = 1 − ω で(すなわち √−3 で)割り切れないなら、 P3 は 9 の倍数より 1 大きいか 1 小さい。記号で書くと:
P3 ≡ ±1 (mod 9)
〔注〕 ここにおいても、直観的意味が分かりにくい mod λ4 の代わりに、平明な mod 9 が使われているのが独特。これによって、記述が易しくなるだけでなく、証明も簡潔になる。 λ = 1 − ω と √−3 は異なる数だが、一方で割り切れることと他方で割り切れることは同値なので「すなわち」と言い換えている。
証明 ⓸の両辺を立方すると:
P3 = Q3(−3√−3)
+ 3⋅Q2(−3)⋅(±1)
+ 3⋅Q√−3⋅(±1)2
+ (±1)3
この右辺第2項は 9 の倍数なので、 P3 が 9 で割り切れるかどうかは、残りの三つの項、すなわち次の数によって決まる:
−3√−3(Q3 − Q) ± 1 ‥‥⓹
ところが Q3 − Q = Q(Q2 − 1) = Q(Q + 1)(Q − 1) は、必ず √−3 の倍数。このことは Q が √−3 の倍数なら明白。 Q が √−3 の倍数でなければ、その Q は √−3 の倍数より 1 大きいか 1 小さいので、 Q − 1 と Q + 1 のどちらかが √−3 の倍数。いずれにしても⓹は、
−3√−3 × (√−3 の倍数) ± 1
であり、その第1項は 9 の倍数。すなわち P3 は 9 の倍数 ± 1。∎
天衣無縫。何の技巧もトリックも見えないけれど、同じ定理の Landau 版の証明と比べると、ほんのちょっとの言い換えによって、同じ内容のことが軽妙にまとめられている。この先は Landau バージョンと同様に進む。せっかく mod 9 で準備したのに、結局、高木は mod λ4 で議論を続ける。まぁ、どっちでも同じことなのだが、「どっちでも同じだから、その場の気分で適当に」という天才のおおらかさは、往々にして素人の読者を混乱させる。
数論入門として見た場合の最大の難点は、結論を導く§9相当の部分で、行列式の理論が使われていること。高木の『初等整数論講義』では――数論そのものに関しては文字通りの「入門書」(予備知識不要)に近いものの――、入門レベルではないような代数的ツールが、説明なしに使われることがある。この本は、もともと代数学の教科書の第2巻として計画されたもので、そのため「読者には代数学の予備知識がある」という前提になっているようだ。
行列式を使う明確な必然性があるならともかく、補題3〘ⅱ〙を使って立方和をバラバラにしておきながら、バラバラのものを立方和に戻すとき補題3を逆向きに使わずに行列式を使うのは、必ずしも分かりやすい説明の仕方ではない。とはいえ、他の教科書の斜め上を行くこの論法も、興味深い――以下ではそれを紹介する。

§9の㋤㋥㋦を再掲(これを導く過程については、他の教科書と実質同じ)。
A + B = λ3m−2⋅(u1⋅H3)
A + ωB = λ⋅(u2⋅E3)
A + ω2B = λ⋅(u3⋅F3)
高木はここで「この行列式を第3列に関して展開すれば余因数はいずれも λ の同伴数であるから、展開の各項を λ で割って、結論に至る」という、素人お断りのような説明をする(本人には特別な意識はなく、当たり前の簡単なことと思っているのだろう)。何を言っているのか、一般人にも分かるように翻訳すると、およそ次の通り。
上記三つの式を次のような連立方程式と見ることができる(方程式の気分を出すため、文字 A, B の代わりに X, Y を使い、さらにダミーの変数 Z = 1 を追加しておく):
X + Y − (u1⋅λ3m−2⋅H3)Z = 0
X + ωY − (u2⋅λ⋅E3)Z = 0
X + ω2Y − (u3⋅λ⋅F3)Z = 0
仮定によると、この連立方程式に当てはまるような X = A と Y = B が存在するのだから(どちらも 0 ではない)、下記の3行3列の行列(それを M としよう)に対応する行列式の値 det(M) は 0 でなければならない(→ 解説1)。
第1行 1 1 −u1⋅λ3m−2⋅H3
第2行 1 ω −u2⋅λ⋅E3
第3行 1 ω2 −u3⋅λ⋅F3
つまり det(M) = 0 が必要条件。第3列から −λ をくくり出して −λ det(M′) = 0 とすると(→ 解説2)、条件は det(M′) = 0 と同値。ここで M′ は:
第1行 1 1 u1⋅λ3m−3⋅H3
第2行 1 ω u2⋅E3
第3行 1 ω2 u3⋅F3
これが高木の提示した行列式。第3列が複雑だが、それ以外の要素は単数だけなので、第3列に関して展開(→ 解説3)すると簡単になる。この展開によって、条件 det(M′) = 0 の真相も、はっきりしてくる:
|1 ω; 1 ω2|⋅u1⋅λ3m−3⋅H3
− |1 1; 1 ω2|⋅u2⋅E3
+ |1 1; 1 ω|⋅u3⋅F3
= 0 ‥‥⓺
⓺の両辺を λ で割ることができる。実際、⓺左辺に含まれる三つの行列式それぞれの値(先頭の符号を含めていう。高木が「余因子」と呼んでいるのは、この値)、すなわち
1⋅ω2 − ω⋅1 = ω(ω − 1) = −ω(1 − ω)
−(1⋅ω2 − 1⋅1) = −(ω2 − ω3) = −ω2(1 − ω)
1⋅ω − 1⋅1 = ω − 1 = −1⋅(1 − ω)
は、いずれも λ = 1 − ω の単数倍であり、それらを λ で割った商(単数)と u1, u2, u3 の積をそれぞれ U1, U2, U3 とすると(それらも単数)、⓺の両辺を λ で割った結果は:
U1⋅λ3m−3⋅H3
+ U2⋅E3
+ U3⋅F3 = 0
この両辺を U2 で割り、単数 U1/U2, U3/U2 をそれぞれ v, v′ と置くと:
vλ3(m−1) H3
+ E3
+ v′ F3 = 0
これは §9の(✽✽✽)に他ならない。あるいは左辺第1項を右辺に移項し v′, −v をそれぞれ θ, θ′ とすると、高木の講義にある式となる(変数名対照表)。
こんな面倒なことをしなくても§9のようにすれば済むのだが、天下り的に補題3の恒等式を使うのを避けたかったのかもしれない。オーソドックスなフェルマーの定理であっても、高木の記述はちょっとユニーク。
『初等整数論講義』は名著とされるから分かりやすいか?というと、それは微妙。でも無味乾燥な一般的教科書と違って――そしてオイラーやクヌースの教科書と似て――、この講義は全体として、実に楽しそうに書かれている。「一見不規則に見える現象」の仕組みが明快になるような視点が得られたとき、高木は感激したように「この観点からの展望は素晴らしい!」という趣旨のコメントをする。「どうです、美しいでしょう」と読者に押し付けるのではなく、高木自身が心底楽しんでいるようだ。「明媚なる風景」「思わず深入りをした」といった表現からも、そのことが感じられる。「数論の美しさを伝えたい」という著者の思いに、読者は引き込まれてしまうのだろう。
![]()
(付録)簡易正誤表
| ページ | 誤 | 正 |
|---|---|---|
| 258 | §36 の λ = 1 − i に類似 | §37 の λ = 1 − i に類似 |
| 261 | ε が √−3 で割れないならば | ζ が √−3 で割れないならば |
| 262 | β + ω2γ = (β + γ) − λγ | β + ω2γ = (β + γ) + ω2λγ |
![]()
解説1 ゼロから始めて5分で分かる行列式入門(笑)。一般論は大変なので、高木の証明の理解に必要な要点だけ。(代数は得意じゃないんで、説明に間違いがあったらごめんネ。)
X, Y, Z を未知数とする次の連立方程式を考える。
《あ》 a1X + a2Y + a3Z = 0
《い》 b1X + b2Y + b3Z = 0
《う》 c1X + c2Y + c3Z = 0
Z を消去するために《あ》の b3 倍から《い》の a3 倍を引くと:
《え》 (a1b3 − a3b1)X
+ (a2b3 − a3b2)Y = 0
同じ目的で《う》の b3 倍から《い》の c3 倍を引くと:
《お》 (b3c1 − b1c3)X
+ (b3c2 − b2c3)Y = 0
便宜上、《え》を
《か》 (a1b3 − a3b1)X
+ pY = 0 ただし p = a2b3 − a3b2
と表記し、《お》を
《き》 (b3c1 − b1c3)X
+ qY = 0 ただし q = b3c2 − b2c3
と表記しよう。《き》の p 倍から《か》の q 倍を引けば(どちらも pqY を含む)、未知数 Y を消去できる。その結果は:
《く》 (b3c1 − b1c3)pX
− (a1b3 − a3b1)qX = 0
《く》の左辺第2項に関連して:
−(a1b3 − a3b1)q
= −(a1b3 − a3b1)(b3c2 − b2c3)
= −a1b3b3c2
+ a1b2b3c3
+ a3b1b3c2
− a3b1b2c3 《け》
《く》の左辺第1項に関連して:
(b3c1 − b1c3)p
= (b3c1 − b1c3)(a2b3 − a3b2)
= a2b3b3c1
− a3b2b3c1
− a2b3b1c3
+ a3b1b2c3 《こ》
《け》と《こ》の和が、《く》の左辺の X の係数。《け》の末尾の項と《こ》の末尾の項は打ち消し合うので、《く》はこうなる(符号が + の項を前に集めて表記):
(a1b2b3c3 + a2b3b3c1 + a3b1b3c2
− a1b3b3c2 − a2b3b1c3 − a3b2b3c1)X = 0
両辺を b3 で割って(便宜上 b3 ≠ 0 と仮定):
(a1b2c3 + a2b3c1 + a3b1c2
− a1b3c2 − a2b1c3 − a3b2c1)X = 0 《さ》
X, Y, Z を未知数とする連立方程式《あ・い・う》の係数たちと解 X は、関係《さ》を満たす。よって、この連立方程式が、 X = 0 でない解を持つとしたら、
a1b2c3 + a2b3c1 + a3b1c2
− a1b3c2 − a2b1c3 − a3b2c1 《し》
が 0 に等しい必要がある。本文で㋤㋥㋦を連立方程式に見立てて、対応する3行3列の行列式 det(M) が = 0 という条件を付けたのは、この意味。つまり、
第1行 a1 a2 a3
第2行 b1 b2 b3
第3行 c1 c2 c3
の行列(この場合、連立方程式の係数だけを抜き出して並べたものに他ならない)を M と呼ぶなら、 det(M) とは上記《し》の値を指す。
〔注〕 《し》の値は、添え字だけを見るなら 123 とそれを回転させた 231, 312 が + で、ひっくり返しの 321 とそれを回転させた 213, 132 が − になる。あるいは、同じことだが、行列式の最初の行の各要素から始めて、右下がりの(行の前方へ進む)斜線上の三つの項を選んで(行の端に達したら、次には反対側の端に行くものとする)掛け算したものに + を付け、左下がりの(行の後方に戻る)斜線上の三つの項を選んで掛け算したものに − を付ければいい。同様の計算規則は、2行2列の行列式にも当てはまる。
![]()
解説2 もし行列式のどれか一つの行またはどれか一つの列(どれでもいい)の各要素が S 倍されたとすると――例えば、上記の3行3列が
第1行 a1 a2 Sa3
第2行 b1 b2 Sb3
第3行 c1 c2 Sc3
に置き換わったとすると――、《し》の値は、当然
a1b2Sc3 + a2Sb3c1 + Sa3b1c2
− a1Sb3c2 − a2b1Sc3 − Sa3b2c1
= S(a1b2c3 + a2b3c1 + a3b1c2
− a1b3c2 − a2b1c3 − a3b2c1)
に置き変わる。これは、もともとの《し》の各項がそれぞれ S 倍され、結果的に《し》の値(つまり行列式の値)全体が S 倍されたことに当たる。逆に言うと、この新しい行列式の値を直接計算する代わりに、とりあえず第3列の共通因子 S を行列式の外にくくり出し、《し》を計算してから、単にその結果を S 倍しても同じこと。特に「行列式の値が 0」と決まっている場合には、(本文でやっているように)行または列の共通因子をくくり出すことで、事実上その共通因子を消滅させられる(一種の約分)。
![]()
解説3 行列式の「展開」とは…
行列式 det(M) の要素が、
第1行 a1 a2 a3
第2行 b1 b2 b3
第3行 c1 c2 c3
だとしよう。 det(M) の値は一般公式《し》によって計算可能だが、《し》はゴチャゴチャしていて、必ずしも便利ではない。実は、ある一つの行(または一つの列)を軸に det(M) を「展開」して、2行2列の小さい行列式を使った表現に変換することもできる――展開の仕方は、どの行あるいはどの列を基準とする場合でも、同じ原理に基づく。例として、第3列に関して det(M) を展開すると:
det(M) =
a3⋅|b1 b2; c1 c2|
− b3⋅|a1 a2; c1 c2|
+ c3⋅|a1 a2; b1 b2| 《す》
このように、軸とする行ないし列の各要素(この例では a3, b3, c3)を順に一つずつ選択して、それと小さい行列式を掛け合わせる。小さい行列式の中身は「現在選択されている要素と同じ行でも、同じ列でもない」ような要素たち。例えば b3 が選択されているなら、 b3 と同じ行の b1, b2, b3 は除外され、 b3 と同じ列の a3, b3, c3 も除外される。残った要素 a1, a2; c1, c2 が、ちび行列式の中身になる。「選択されている要素と、ちび行列式の積」の先頭に付く符号は、選択されている要素が第 i 行第 j 列だとして、 i + j が偶数ならプラス、奇数ならマイナス。例えば b3 は第2行・第3列であり 2 + 3 = 5 は奇数なので、マイナスが付いている。2行2列の行列式自体は、
|a b; c d| = ad − bc
のように計算される。従って《す》は、
a3⋅(b1c2 − b2c1)
− b3⋅(a1c2 − a2c1)
+ c3⋅(a1b2 − a2b1)
= a3⋅(b1c2 − b2c1)
− a1b3c2 + a2b3c1
+ (a1b2 − a2b1)⋅c3
となって a, b, c の添え字が 123, 231, 312 のものに + が付き、その逆順のものに − が付いている。つまり、一般公式《し》の値と等しい。どっちでも値は同じなんだから、そうしたければ(計算の都合次第で)展開して処理してもいい――ってことになる。
![]()
2025-10-06 「ニュートンの式」の実践的活用 フェルマーの最終定理に
解のべき和に関するニュートンのメタ公式。見掛けは簡単だが、証明は意外と面倒…
「ニュートンの式・軽妙な入門」では、それをうまく導入する方法(ライヒシュテインによる)を紹介した。でも証明が中心で、実際にその式をどう活用するのか?という、実践面が充実していなかった。「n 次方程式の n 個の解の m 乗和を求める」――そんな例題は「問題のための問題」のようなもんで、「それが何の役に立つの?」という展望に欠ける。
「フェルマーの最終定理の n = 7 の場合」のジェノッキによる巧妙な証明では、3次方程式の3解の7乗和の公式が一つの土台となる。「フェルマーの最終定理」は超有名問題だし、ジェノッキの証明法は平易で面白い。いい機会なので、そこで必要になる「7乗和の公式」を「ニュートンの式」から導出してみたい。「説明用の無味乾燥な例」ではなく「有名問題の解決に役立つ実例」。
「公式を再帰的に使うだけ」と言ってしまえばそれまでだが、この計算では符号ミスをしやすい。符号ミスを防ぐ工夫なども検討したい。
![]()
大文字の A, B, C, ··· で、次のように方程式の係数(定数項を含む)を表すことにする(最高次の係数は 1 とする)。
例 4次方程式なら、
x4 − Ax3 + Bx2 − Cx + D
5次方程式なら、
x5 − Ax4 + Bx3 − Cx2 + Dx − E
6次方程式なら、
x6 − Ax5 + Bx4 − Cx3 + Dx2 − Ex + F
等々。 m 次式の m−1 次の係数は A、 m−2 次の係数は B、·· ·。係数の文字の符号設定はマイナスとプラスが交互。
〔注〕 「係数の具体的な数値として、負の数・正の数が交互に現れる」という意味ではない。例えば、係数の具体的数値が 5, −2, −3, ··· なら A = −5, B = −2, C = +3, ··· となり、係数の具体的数値が −5, 2, 3, ··· なら A = +5, B = +2, C = −3, ··· となる。(要するに、奇数番目の係数は、符号を変えたものが A, C 等に格納され、偶数番目の係数は、そのまま B, D 等に格納される。)
![]()
「m 次方程式の m 個の解の m 乗和」を考える。具体的には…
1次方程式 x − A = 0 の解(その解を x = a とする)の1乗和(和といっても、とりあえず1項しかないが)を
ƒ1 = a1
とし、2次方程式 x2 − Ax + B = 0 の2解 x = a, b の2乗和を
ƒ2 = a2 + b2
としよう。3次方程式 x3 − Ax2 + Bx − C = 0 の3解 x = a, b, c の3乗和を
ƒ3 = a3 + b3 + c3
とし、4次方程式 x4 − Ax3 + Bx2 − Cx +D = 0 の4解 x = a, b, c, d の4乗和を
ƒ4 = a4 + b4 + c4 + d4
としよう。以下同様に進めて、一般に m 次方程式
xm − Axm−1 + Bxm−2 − ···
の m 個の解 a, b, c, ··· の m 乗和を
ƒm = am + bm + cm + ··· + (m 個目の解)m
とする。
このとき、次の関係が成り立つ(Newton の恒等式たちの一つの書き方。導出については後述)。
ƒ1 = Aƒ0
ƒ2 = Aƒ1 − Bƒ0
ƒ3 = Aƒ2 − Bƒ1 + Cƒ0
ƒ4 = Aƒ3 − Bƒ2 + Cƒ1 − Dƒ0
ƒ5 = Aƒ4 − Bƒ3 + Cƒ2 − Dƒ1 + Eƒ0
︙
ƒm = Aƒm − Bƒm−1 + Cƒm−2 − ···
上記の関係は「m 次方程式の m 個の解の m 乗和」に限らず、一般に「任意の n 次方程式の n 個の解の m 乗和」についても、同様の等式が成り立つ(方程式の次数 n は、 m より小さくても、 m に等しくても、 m より大きくてもいい)。ただし、方程式の次数 n つまり解の個数 n とは無関係に、解の m 乗和 ƒm を考える場合には ƒ0 = m と約束する。そのような ƒ0 を使って求めた ƒ1, ƒ2, ··· は、どれも m の値と無関係に有効。
![]()
(1) ƒ1 については ƒ0 = 1 なので、上の式から、 ƒ1 = Aƒ0 = A⋅1 = A。以下では、いつでも ƒ1 に A を代入することができる。
(2) 従って、
ƒ2 = Aƒ1 − Bƒ0 = A⋅A − B⋅2 = A2 − 2B
となる(前記のように、 ƒ2 を求めるときには ƒ0 = 2 であることに注意)。以下では、いつでも ƒ2 に A2 − 2B を代入することができる。
(3) 得られた ƒ1, ƒ2 の式を ƒ3 についての式に代入すると:
ƒ3 = Aƒ2 − Bƒ1 + Cƒ0
= A⋅(A2 − 2B) − B⋅A + C⋅3
= A3 − 3AB + 3C
(4) ƒ4 = Aƒ3 − Bƒ2 + Cƒ1 − Dƒ0
= A⋅(A3 − 3AB + 3C) − B⋅(A2 − 2B) + C⋅A − D⋅4
= A4 − 4A2B + 4AC − 4D + 2B2
ジラルの4乗和公式が得られた。参考までに、もう一段階進めてみる。
(5) ƒ5 = Aƒ4 − Bƒ3 + Cƒ2 − Dƒ1 + Eƒ0
= A⋅(A4 − 4A2B + 4AC − 4D + 2B2) − B⋅(A3 − 3AB + 3C)
+ C⋅(A2 − 2B)
− D⋅A + E⋅5
=
(A5 − 4A3Bア + 4A2Cイ − 4ADウ + 2AB2)
− (A3Bア − 3AB2 + 3BC)
+ (A2Cイ − 2BC)
− ADウ + 5Eエ
= A5 − 5A3Bア + 5A2Cイ − 5ADウ + 5Eエ + 5AB2 − 5BC
![]()
これらの公式は、見た目ほど複雑ではない。第一に、 m が何であれ、根の m 乗和の公式は、
ƒm = Am − mAm−2B + mBm−3 − ·· ·
という「単純部分」を含んでいる。例えば m = 5 なら、まず A5 と書いて、その後ろに、指数を 2 減らした項から順々に
A3, A2, A1, A0 (=1)
の項を書き、それぞれに B, C, D, E を掛けて全部 (m =) 5 倍すればいい。この型のべき和公式における符号については、アルファベット順で奇数番目の文字 A, C, E, ·· · はプラス、 B, D, F, ·· · はマイナス(偶数個あればプラス)に決まっているので、個々の公式の各項ごとに個別に記憶する必要もない。問題は「非単純部分」だが、 ƒ3 までの式には「単純部分」しかなく、 ƒ4 には 2B2 が一つあるだけ、 ƒ5 には 5AB2 と BC の二つがあるだけなので(それらの項の符号も今述べた同じ規則に従う)、 ƒ5 の公式の係数は A5 以外は全部 ±5 という事実と考え合わせると、覚えることは意外と少ない。
例題1 3次方程式 x3 + 3x2 + 9x + 14 = 0 の解を a, b, c とする。 ƒ2 = a2 + b2 + c2 と ƒ3 = a3 + b3 + c3 を求める。
〔解〕 与えられた式について x3 − Ax2 + Bx + C に当てはめると A = −3, B = 9, C = −14。よって:
ƒ2 = A2 − 2B = (−3)2 − 2⋅9 = 9 − 18 = −9
ƒ3 = A3 − 3AB + 3C = (−3)3 − 3⋅(−3)⋅9 + 3⋅(−14)
= −3 × (9 − 27 + 14) = (−3) × (−4) = 12
〔注〕 与式 x3 + 3x2 + 9x + 14 = (x + 2)(x2 + x + 7) の根は x = −2, (−1 ± 3√−3)/2。この三つの数を a, b, c として a2 + b2 + c2 を直接計算してもいいが、少し面倒。 a3 + b3 + c3 の直接計算はさらに面倒。解と係数の関係を使う方が手っ取り早い。
![]()
根の m 乗和の公式は、方程式の次数 n と無関係に同じ式が有効。その際、もし n が m より大きければ、余った係数は無視すればいい。
例題2 5次式 x5 − x4 − 10x3 + 10x2 + 16x + 12 の五つの根を a, b, c, d, e とする。それらの3乗和 ƒ3 = a3 + b3 + c3 + d3 + e3 を求める。
〔解〕 A = +1, B = −10, C = −10, D = +16, E = −12 に当たるが(奇数番目の文字 A, C, E の値は、方程式の係数とは符号を反転させることに注意)、根の3乗和の公式
ƒ3 = A3 − 3AB + 3C
では D 以下は不要。 A = 1, B = −10, C = −10 だけを使って:
ƒ3 = 13 − 3⋅1⋅(−10) + 3⋅(−10) = 1 + 30 − 30 = 1
〔参考〕 与えられた5次式 = (x + 3)(x4 − 4x3 + 2 x2 + 4x + 4) の一つの根は a = −3 だが、余因子 x4 − 4x3 + 2 x2 + 4x + 4 の根
b = 1 + √(2 + √), c = 1 − √(2 + √), d = 1 + √(2 − √), e = 1 − √(2 − √)
を求めることは、ちょっと面倒。まして、これらの数値を使って a3 + b3 + c3 + d3 + e3 を直接計算するのは大変。根のべき乗和の公式を使えば、上記のように簡単な処理で済む。
![]()
一方、もし方程式の次数 n が m より小さければ、根の m 乗和の公式の「過剰な文字」については、値 0 と見なして無視すればいい。例えば、3次方程式の係数データは A, B, C の三つだけで D, E はない。この場合、もし D, E の値が必要なら D = 0, E = 0 と見なす。
例題3 例題1と同じ3次方程式 x3 + 3x2 + 9x + 14 = 0 の3解 a, b, c について、 ƒ4 = a4 + b4 + c4 と ƒ5 = a5 + b5 + c5 を求める。
〔解〕 A = −3, B = 9, C = −14。ジラルの4乗和公式
ƒ4 = A4 − 4A2B + 4AC − 4D + 2B2
において −4D の項を(D = 0 と見なして)無視すると:
ƒ4 = (−3)4 − 4⋅(−3)2⋅9 + 4⋅(−3)⋅(−14) − 4⋅0 + 2⋅92
= 81 − 4⋅81 + 4⋅42 + 2⋅81 = (−1)⋅81 + 168 = 87
同様に、5乗和の公式
ƒ5 = A5 − 5A3B + 5A2C − 5AD + 5E + 5AB2 − 5BC
において D, E を含む項を無視すると(35 = 33⋅9 = 3 × 92 = 243 に留意):
ƒ5 = (−3)5 − 5⋅(−3)3⋅9 + 5⋅(−3)2⋅(−14)
− 0 + 0
+ 5⋅(−3)⋅92 − 5⋅9⋅(−14)
= −243 + 5⋅243 + 5⋅(−126)
+ 5⋅(−243) + 5⋅126
= −243
仮に話を「3次方程式」に限って解の4乗和・5乗和・6乗和などを考えるなら、どうせ解の m 乗和の公式の D, E, F などは無視されるのだから、最初から――公式を生成する段階から―― D, E, F などを無視してもいいことになる。つまり、汎用バージョンの
ƒ4 = Aƒ3 − Bƒ2 + Cƒ1 − Dƒ0
ƒ5 = Aƒ4 − Bƒ3 + Cƒ2 − Dƒ1 + Eƒ0
︙
の代わりに、3次方程式限定なら、
ƒ4 = Aƒ3 − Bƒ2 + Cƒ1
ƒ5 = Aƒ4 − Bƒ3 + Cƒ2
ƒ6 = Aƒ5 − Bƒ4 + Cƒ3
ƒ7 = Aƒ6 − Bƒ5 + Cƒ4
だけでも足りる。
具体的には(ƒ3 = A3 − 3AB + 3C と ƒ2 = A2 − 2B については既に知っているとすると):
ƒ4 = Aƒ3 − Bƒ2 + Cƒ1
= A⋅(A3 − 3AB + 3C) − B⋅(A2 − 2B) + C⋅A
= A4 − 4A2B + 4AC + 2B2
さらに、この3次方程式限定の ƒ4 を使って3次方程式限定の ƒ5 を生成すると:
ƒ5 = Aƒ4 − Bƒ3 + Cƒ2
= A⋅(A4 − 4A2B + 4AC + 2B2)
− B⋅(A3 − 3AB + 3C)
+ C⋅(A2 − 2B)
= A5 − 5A3B + 5A2C + 5AB2 − 5BC
例題3の計算内容を考えると、最初から「限定バージョン」の ƒ4, ƒ5 を使っても良かった。同様に進めると:
ƒ6 = Aƒ5 − Bƒ4 + Cƒ3
= A⋅(A5 − 5A3B + 5A2C + 5AB2 − 5BC)
− B⋅(A4 − 4A2B + 4AC + 2B2)
+ C⋅(A3 − 3AB + 3C)
= A6 − 6A4B + 6A3C
+ 9A2B2 − 12ABC − 2B3 + 3C2
そして:
ƒ7 = Aƒ6 − Bƒ5 + Cƒ4
= A⋅(A6 − 6A4B + 6A3C + 9A2B2 − 12ABC − 2B3 + 3C2)
− B⋅(A5 − 5A3B + 5A2C + 5AB2 − 5BC)
+ C⋅(A4 − 4A2B + 4AC + 2B2)
= A7 − 7A5B + 7A4C
+ 14A3B2
− 21A2BC
− 7AB3
+ 7AC2
+ 7B2C
3次方程式の解の7乗和の公式が得られた! フェルマーの最終定理の n = 7 の場合の研究に役立つ。
実際には、もちろん変数を表す文字は x とは限らず、係数を表す文字は A, B, C などとは限らない。例えば、もともとの3次方程式を
U3 − pU2 + qU − r = 0
としよう。その場合 A = p, B = q, C = r なので†、解の7乗和は:
ƒ7 = p7 − 7p5q + 7p4r
+ 14p3q2 − 21p2qr − 7pq3
+ 7pr2 + 7q2r
U3 − pU2 + qU − r = 0 の3解を a, b, c の代わりに x, y, z と呼ぶなら、それらの7乗和 x7 + y7 + z7 が上記 ƒ7 に当たる。
† 奇数番目の大文字 A, C の値は、方程式の対応する係数とは符号が逆になることに注意。2次の係数 −q から A = +q、定数項(0次の係数)の −r から C = +r だ。早い話、その下の p7 から始まる式は、 A7 から始まる公式の A, B, C をそれぞれ p, q, r に置き換えただけ。
![]()
この導出の理論的根拠となる「ニュートンの式」との関係は、次の通り。
ニュートンの恒等式たちは、表記のバリエーションが豊富だけど、例えば次のような形を持つ(詳細・証明については「ニュートンの式・軽妙な入門」参照)。
p1 + S1⋅1 = 0
p2 + S1⋅p1 + S2⋅2 = 0
p3 + S1⋅p2 + S2⋅p1 + S3⋅3 = 0
p4 + S1⋅p3 + S2⋅p2 + S3⋅p1 + S4⋅4 = 0
p5 + S1⋅p4 + S2⋅p3 + S3⋅p2 + S4⋅p1 + S5⋅5 = 0
ここで p1, p2 などは ƒ1, ƒ2 などと同じ意味(単に別の文字を使っただけ)。 S1, S2, S3 などは、与えられた方程式の係数をそのまま(奇数番目の値の符号を変えずに)使ったもの。前記 A, B, C などは、奇数番目の係数については、係数の値と符号を逆に設定するので、アルファベット順で奇数番目の大文字は、
A = −S1, C = −S3, E = −S5, ···
のように、符号が逆になる。偶数番目の大文字は、次のようにどちらの表記でも(符号も値も)等しい。
B = S2, D = S4, F = S6, ···
上の形式のニュートンの式をそのまま使う場合、まず p1 + S1⋅1 = 0 なので、
p1 = −S1
となる。次に p2 + S1⋅p1 + S2⋅2 = 0 なので、移項して上記の等式を代入すると、
p2 = −S1⋅p1 − 2S2 = (−S1)⋅(−S1) − 2S2 = (−S1)2 − 2S2
となる。ここでもちろん (−S1)2 は (S1)2 に等しいが、説明の便宜上、マイナスの2乗をマイナスの2乗のままで表記しておく。
同様に進めると:
p3 = −S1⋅p2 − S2⋅p1 − 3S3
= (−S1)⋅[(−S1)2 − 2S2] − S2⋅(−S1) + 3(−S3)
= [(−S1)3 − 2(−S1)⋅S2]
− (−S1)⋅S2
+ 3(−S3)
= (−S1)3 − 3(−S1)⋅S2 + 3(−S3)
となり、さらに、
p4 = −S1⋅p3 − S2⋅p2 − S3⋅p1 − 4S4
= (−S1)⋅[(−S1)3 − 3(−S1)⋅S2 + 3(−S3)]
− S2⋅[(−S1)2 − 2S2]
− S3⋅(−S1) − 4S4
= [(−S1)4 − 3(−S1)2⋅S2 + 3(−S1)(−S3)]
− (−S1)2⋅S2 + 2(S2)2
+ (−S1)(−S3) − 4S4
= (−S1)4 − 4(−S1)2⋅S2 + 4(−S1)(−S3)
− 4S4
+ 2(S2)2
となる。この最後の例は、ジラルの4乗和公式
A4 − 4A2B + 4AC − 4D + 2B2
と全く同じ意味だが、内容は同じでも符号がゴチャゴチャして、実用上扱いにくい。
ニュートンの恒等式たちを
p1 + S1⋅1 = 0
p2 + S1⋅p1 + S2⋅2 = 0
p3 + S1⋅p2 + S2⋅p1 + S3⋅3 = 0
︙
のように書くのは、導出(恒等式の証明)の仕方や目的によっては便利かもしれないけど、ジラルの公式のような実践的文脈では、
S1 = −A, S2 = B, S3 = −C, S4 = D, ···
と置いて、次のように書き換えた方が都合がいい。
p1 − A⋅1 = 0
p2 − A⋅p1 + B⋅2 = 0
p3 − A⋅p2 + B⋅p1 − C⋅3 = 0
︙
移項すると:
p1 = A⋅1
p2 = Ap1 − B⋅2
p3 = Ap2 − Bp1 + C⋅3
︙
このメモの前半では、文字 p の代わりに ƒ を使い、さらに「ƒm の計算においては ƒ0 は整数 m を表す」と約束することで、表記を簡潔化した。実質は「普通のニュートンの式」全く同じ。変数名や符号の設定を変えたり、移項したりしただけ。
![]()
S1, S2, S3, ··· の表記では、多項式の係数を(符号を変えずに)そのまま扱うことができる。方程式の研究などでは理論上、便利なことがある。他方、奇数番目の符号を変えたものは「解についての基本対称多項式」に等しく、別の文脈ではそっちの符号設定の方が便利。
そんなわけで「解と係数の関係」では、場合によって符号の設定の仕方が異なり、紛らわしい。その上、もともとの方程式も、単純に
x5 + a1x4 + a2x3 + a3x2 + a4x + a5 = 0
とする代わりに、しばしば「奇数番目の係数の符号」をマイナスにして、
x5 − a1x4 + a2x3 − a3x2 + a4x − a5 = 0
のような形式で記される。その方が便利なことも多いのだけど、そのせいで、かえってますます符号の扱いに混乱が生じることも…
実践上、符号の混乱を避け余計な労力を省くため、この場合 A, B, C 形式を基本にするのが便利だと思われる。「奇数番目の文字 A, C 等はプラス属性、偶数番目の文字 B, D 等はマイナス属性」――と考えると、公式ごとに細かく符号を覚える必要がなくなる(この件については「忘れられた偉人ヒルシュ」参照)。最初に A, B, C 等の値を設定するときだけ、多項式の奇数番目の係数(A, C など)は符号を逆にして読み取ることに留意。このアプローチなら、符号の扱いの苦労からほぼ解放されるだろう。
例えば、
x7 + y7 + z7 = p7 − 7p5q + 7p4r
+ 14p3q2 − 21p2qr − 7pq3
+ 7pr2 + 7q2r
の右辺は、プラスの項とマイナスの項が複雑に入り乱れているように見える。ところが次の見方をすると、プラスかマイナスかは直ちに明白になる。すなわち p, q, r はそれぞれ A, B, C であり、上述のことから p, r はプラス属性なので、符号に関係しない。マイナスの原因になるのは、マイナス属性の q だけ。「因子 q を奇数個含む項」はマイナスになり、それ以外の項は全部プラスになる。
![]()
2025-10-19 二項展開を覚えるこつ + ちょっとマニアックな話題
#遊びの数論 #コーシーの多項式 #ミリマノフ多項式 #FLT(7)
二項式 x + y の累乗 (x + y)n の展開、例えば、
(x + y)3 = x3 + 3x2y + 3xy2 + y3
のような恒等式は、基本公式として当たり前のように使われる。ややもすれば「丸暗記して機械的に使う」ってことになってしまうのだが、意味も分からず丸暗記するより、内容をちゃんと理解した方が気分もいいし、応用も利く。
丸暗記するにしても、こつがある。1文字ずつベタに記憶するのではなく、シンプルな
(x + 1)3 = x3 + 3x2 + 3x + 1
の形で考えた方が、覚えやすい。つまり y = 1 としたわけ。「y が = 1 じゃなかったら、どーすんの?」っていうと、次のように、指数の和が 3 になるように y を復活させればいい:
(x + y)3 = x3⋅y0 + 3x2⋅y1 + 3x⋅y2 + 1⋅y3
〔注〕 0 乗は 1 なんで(そして 1 倍は何もしないのと同じなんで)最初から省略して構わないのだが、一応、書いた。
二項展開ってのはそういうもんだ―― (x + y)n を展開した各項では x の指数と y の指数の和が n になる。 x の指数を順に n, n−1, n−2, ···と書く場合、対応する y の指数は 0, 1, 2, ··· となる。ただそれだけのことなんだから、そもそも文字 x も文字 y もそれらの指数たちも覚える必要がなくて、各項の係数だけ分かれば足りる。この「各項の係数」を覚えるのにもこつがあって、パターンを知ってると結局、何も覚える必要がない―― 3 乗の展開だけでなく、4 乗の展開や 5 乗の展開は余裕だし、全然別の意外なことにも応用が利く。
てなわけで、関連する豆知識みたいなものを適当にいくつか書いてみる。
![]()
1.1 非常時のサバイバル術。便利な小技の前に、いざというときのための原始的な方法を確かめておきたい。小さい二項係数なんかは、いちいち覚えてなくてもパスカルの三角形から余裕で構成できるわけだが、万一「公式を全部忘れてしまった」「パスカルの三角形を使えばいい、ってことも忘れてしまった」という絶体絶命のピンチ(?)に陥っても、心配は要らない。いくらなんでも、掛け算のやり方と分配法則くらいは覚えてるだろうから:
w(x + y) = wx + xy この式で w = x + y とすると
(x + y)(x + y) = (x + y)x + (x + y)y
= (xx + yx) + (xy + yy) = x2 + 2xy + y2
これで基本公式 (x + y)2 = x2 + 2xy + y2 を手作りできた! もちろん普通は、いちいちこんなことやる必要ない。あくまで説明を兼ねた非常手段。けど「万一のための非常口」が準備してあると、安心。不思議なもんで「忘れてしまっても大丈夫。いざとなったら自力で切り抜けられる」とのんきに構えているのと、なぜかかえって忘れず、「忘れてしまったらどうしよう」と不安があるようなことに限って、記憶があやふやになりやすいようだ。まぁ、ともあれ (x + y)3 は (x + y)2 = x2 + xy + y2 にもう一度 (x + y) を掛け算したものなんで、機械的にシャカシャカやると…
w(x + y) = wx + wy この式で w = x2 + 2xy + y2 とすると
(x2 + 2xy + y2)(x + y) = (x2 + 2xy + y2)x + (x2 + 2xy + y2)y
= (x2x + 2xxy + xy2) + (x2y + 2xyy + y2y) =
x3 + 3x2y + 3xy2 + y3
これで3乗の展開公式も得られた! 2乗の展開の係数 1, 2, 1 と、3乗の展開の係数 1, 3, 3, 1 については†、
112 = 121 そして 113 = 1331
という平方数・立方数の桁でもある‡。逆に言えば、2乗・3乗の作るとき、 112 と 113 の値を利用してもいい。世の中には (x + y)2 と (x + y)3 の展開を丸暗記していてスラスラ言えるのに、 112 と 113 の値をパッと言えない――という人もいると思われるが、もったいないというか記憶力の無駄遣いというか、前者と後者は本質的に同じこと。どっちも知ってて損はないことなので、まとめて考えれば一石二鳥かと…
† (x + y)2 = 1x2 + 2xy + 1y2, (x + y)3 = 1x3 + 3x2y + 3xy2 + 1y3。
‡ 理由は簡単に分かるはず――多項式の筆算の掛け算と、整数の筆算の掛け算を見比べてもいいし、単に展開公式で x= 10, y = 1 と置いてもいい。
![]()
1.2 裏技紹介の前に、上記と同じ調子で4乗の展開公式も作っておく。
(x3 + 3x2y + 3xy2 + y3)(x + y)
= (x3 + 3x2y + 3xy2 + y3)x + (x3 + 3x2y + 3xy2 + y3)y
= (x3x + 3x2xy + 3xxy2 + xy3) + (x3y + 3x2yy + 3xy2y + y3y)
= (x4 + 3x3y + 3x2y2 + xy3) + (x3y + 3x2y2 + 3xy3 + y4)
= x4 + 4x3y + 6x2y2 + 4xy3 + y4 【ア】
機械的な単純計算とはいえ x と y が入り乱れて、あまり見通しが良くない。指数の書き間違いなどのケアレスミスも起きやすそう(と自分で言いつつ、書き間違いがあったらごめんね)。この種の直接計算を行う場合、 y = 1 と置いた略算で代用すると、手っ取り早く便利かと…
(x + 1)(x3 + 3x2 + 3x + 1)
= (x4 + 3x3 + 3x2 + x) + (x3 + 3x2 + 3x + 1)
= x4 + 4x3 + 6x2 + 4x + 1 【イ】
【ア】と比べると【イ】の方がすっきりして、はるかに扱いやすい。もし y = 1 に限りたくなければ、 y の累乗を各項に後から追加すればいい――その際、 x の指数と y の指数の和が 4 になるように y の指数を設定することに注意。シンプルな【イ】を容易に【ア】の形式に変換できる。この操作を同次化(または斉次化)という。
(x + y)4 = x4⋅y0
+ 4x3⋅y1
+ 6x2⋅y2
+ 4x⋅y3 + 1⋅y4
〔注〕 【ア】ないし【イ】の係数 1, 4, 6, 4, 1 も 114 = 14641 の桁と一致する。しかし、もう一つ上の「5 乗の展開」の係数 1, 5, 10, 10, 5, 1 は 115 の桁とは一致しない。係数に 10 があって、桁が 0 ~ 9 の10進整数では桁あふれ(繰り上がり)が起きてしまうから。
![]()
1.3 小さい指数の二項展開については、直接計算しなくても「パスカルの三角形」を利用できる。
パスカルの三角形は 1 + 2 = 3 のような単純な足し算でできている。すなわち各数は、自分の「左上にある数」と「右上にある数」(空欄なら 0 と見なす)の和。パスカルの三角形の各行を(横に)読むと、2行目・3行目・4行目に、それぞれ2乗・3乗・4乗の展開の係数(二項係数)が現れている。これらの係数は左右対称だ。例えば3乗の係数 1, 3, 3, 1 は右から読んでも左から読んでも同じだし、4乗の係数 1, 4, 6, 4, 1 もまたしかり。
(x + y)n を展開すると n+1 項が生じる(x + y の n 乗の展開が n 項でなく 1 項多いのは、 x の指数が n, n−1, n−2, ···, 1 の n 個ではなく、それらに加えて 0 乗つまり x0 を含む項が加わるため)。従って x + y の奇数乗の展開では、項が偶数個、発生し、それらのちょうど半分ずつは、逆順で同一の係数になる――
1, 3 | 3, 1 とか 1, 5, 10 | 10, 5, 1
のように、前半の数と後半の数は順序を除き同一であり、中央付近にある「一番大きい係数」(上の例では 3 ないし 10)は、反復される。一方、 x + y の偶数乗の展開では、項が奇数個、発生。奇数個の項はちょうど半分ずつにはできないので、真ん中にある「一番大きい係数」は反復されない――
1, 4 | 6 | 4, 1 とか 1, 6, 15 | 20 | 15, 6, 1
のように。
この違いにさえ注意すれば、二項係数の具体的な値は――前半と後半で順序を除き同一なのだから――約半数の(前半だけの)係数さえ分かれば十分。例えば 7 乗の展開の係数が 1, 7, 21, 35 と始まるとしたら、残りの係数は、考えるまでもなく 35, 21, 7, 1 となる。
さらに (x + y)n の展開の最初の(従って最後の)係数は必ず 1 で、2番目の(従って最後から2番目の)係数は必ず n に等しい。
以上のパターン性から、小さい二項係数は、次のようになる(A ~ F は何らかの整数)。
2乗の係数(n = 2) 1 | 2 | 1
3乗の係数(n = 3) 1, 3 | 3, 1
4乗の係数(n = 4) 1, 4 | A | 4, 1
5乗の係数(n = 5) 1, 5, B | B, 5, 1
6乗の係数(n = 6) 1, 6, C | D | C, 6, 1
7乗の係数(n = 7) 1, 7, E, F | F, E, 7, 1
「二項定理」というものによると、3番目の係数(上記 A, B, C, E など)は n(n − 1)/2
に等しい。つまり:
A = 4⋅3/2 = 6 そして B = 5⋅4/2 = 10
C = 6⋅5/2 = 15 そして E = 7⋅6/2 = 21
「二項定理」によると、4番目の係数(上記 D, F など)は n(n − 1)(n − 2)/6
に等しい。つまり:
D = 6⋅5⋅4/6 = 20 そして F = 7⋅6⋅5/6 = 35
以上によって、7乗までの二項係数は、完全に確定する。
1, 5, 10, (10, 5, 1)
1, 6, 15, 20, (15, 6, 1)
1, 7, 21, 35, (35, 21, 7, 1)
n(n − 1)/2 や n(n − 1)(n − 2)/6 のような形の分母 2, 6 の正体は? これらは 2! = 2⋅1 と 3! = 3⋅2⋅1 だ。二項係数の順列・組み合わせ的解釈によると、 m 番目の係数は
n(n − 1)(n − 2)···/m!
となる(この分子は、 n から初めて 1 ずつ小さくなる m 個の整数の積)。そして一般の二項定理は:
(x + y)n = xn
+ (n/1)xn−1y
+ [n(n−1)/(2⋅1)]xn−2y2
+ [n(n−1)(n−2)/(3⋅2⋅1)]xn−3y3
+ ··· 【ウ】
この一般の形【ウ】は、いきなりだと、ちょっと手ごわいかも…。まぁ例えば n = 4 とすると【ア】と同じ式が得られる、と。この一般形は、もちろん n の部分に特定の指数を当てはめれば、特定の○乗の展開公式となる。けど、そういう使い方より、指数が不特定の場合(n が不特定の場合の n 乗の展開)に関連して使われることが多い。【ウ】の右辺に現れる分数(実際には割り切れて整数を表す)は、順に次のような記号で表される。
(n C 1), (n C 2), (n C 3), ···
例えば n(n−1)(n−2)/(3⋅2⋅1) という分数を
(n C 3)
と略す。
こういう記号も初めて見ると、少々難解に感じられるかもしれない。実際には、ごちゃごちゃした分数を省略表記できて、むしろ便利な代物だけど…
![]()
1.4 次の事実は、係数の明らかな勘違いがないかのチェックに役立つだけでなく、いわゆる「新入生の夢」として、数論のいろいろな文脈で重要な役割を果たす。
n が素数(1 と自分自身以外では割り切れない数)のとき、 (x + y)n を展開した係数は、両端の 1 を別にすると、どれも素数 n の倍数。
簡潔化のため、以下 y = 1 の形で記す。
〔例1〕 5 は素数。 (x + 1)5 = x5 + 5x4 + 10x3 + 10x2 + 5x + 1 の両端以外の係数 5, 10 は 5 の倍数。
〔例2〕 7 は素数。 (x + 1)7 = x7 + 7x6 + 21x5 + 35x4 + 35x3 + 21x2 + 7x + 1 の両端以外の係数 7, 21, 35 は 7 の倍数。
〔例3〕 3 は素数。 (x + 1)3 = x3 + 3x2 + 3x + 1 の両端以外の係数 3 は 3 の倍数。
そうしたければ、次のような語呂合わせを使ってもいい(両端の係数は 1 に決まっているので、語呂合わせでは省略)。でも、そうまでして無理に覚えなくても、パスカルの三角形を使えば、これらの係数は簡単に決定できる。個々に覚えるより、原理を覚えた方が合理的かと…
| (x + 1)4 = x4 + 4x3 + 6x3 + 4x + 1 |
|---|
| よろしい(4, 6, 4) |
| (x + 1)5 = x5 + 5x4 + 10x3 + 10x2 + 5x + 1 |
| 古都統合(5*, 10*, 10*, 5*) |
| (x + 1)6 = x6 + 6x5 + 15x4 + 20x3 + 15x2 + 6x + 1 |
| ジャム、イチゴの煮汁、イチゴジャム(6, 15, 20, 15, 6) |
| (x + 1)7 = x7 + 21x6 + 355 + 35x4 + 21x3 + 7x + 1 |
| なんか太~い、産後、産後、太~い、なんか(7*, 21*, 35*, 35*, 21*, 7*) |
現代社会には、とかく「太ってるのは悪いことで、やせているのは良いこと」というゆがんだイメージがあるけど、一般には、重過ぎるのも軽過ぎるのも不健康だろう。お産した人は赤ちゃんに授乳するのだから、それに適した体型になるは自然なことで、妊娠中や産後にやたらとやせてら、むしろ異常だろう。いずれにせよ上記の文は、単なる記憶の便宜上の語呂合わせなので、あまり突っ込まないでくださいね。
まとめ
〘ⅰ〙 サバイバル術。いざとなれば2乗・3乗・4乗くらいの二項展開の公式は、いつでもその場で導出できる。係数があやふやなときは「勘」でやらず、パスカルの三角形で確認するのが基本(第一次防衛ライン)。パスカルの三角形の作り方も忘れちゃった場合、4乗までは整数計算 112 = 121, 113 = 1331, 114 = (112)2 = 14641 で代用可能(第二次防衛ライン)。
〘ⅱ〙 二項定理が理解できれば、何乗の展開公式でも機械的に作れる。だけど小さい次数の展開をいちいち二項定理から導くのは非効率なんで、実用上、少なくとも2乗~4乗は個別に直接覚えておく必要がある。
〘ⅲ〙 裏技。二項定理を完全に理解してなくても、両端の係数が 1 で、端から 2 番目の係数が n で、端から 3 番目の係数が n(n − 1)/2 という知識だけでも、5乗までの公式を作れる。
〘ⅳ〙 豆知識。 (x + y)n の n が素数のとき(n ≦ 10 の範囲では n = 2, 3, 5, 7 の場合)、両端以外の係数は素数 n の倍数に。この事実(いわゆる新入生の夢)は、公式の記憶・確認にも役立つが、数論の研究でもとても役立つ。
〘ⅴ〙 小技。多項式そのものを操作する場合には、 (x + y)n の代わりに、 y = 1 とした (x + 1)n を考える方が楽。必要なら後から y を追加できる。
〔参考〕 〘ⅴ〙に関連して、 y = 1 と置く処理を dehomogenization(非同次化)、 y を追加する処理を homogenization(同次化)という。

2.1 二項展開の結果の両端の項を除去すると、どうなるか。
例えば (x + 1)3 = x3 + 3x2 + 3x + 1 から両端の項を引き算すると:
(x + 1)3 − x3 − 1 = 3x2 + 3x = 3x(x + 1) 【カ】
これだけでは、特に面白いことはないように思える。
一方、
(x + 1)5 = x5 + 5x4 + 10x3 + 10x2 + 5x + 1
の両端の項を引き算すると:
(x + 1)5 − x5 − 1 = 5x4 + 10x3 + 10x2 + 5x
= 5x(x3 + 2x2 + 2x + 1)
= 5x(x + 1)(x2 + x + 1) 【キ】
この最後の等号は、次の性質に基づく。
命題1 奇数次の多項式は、もし最高次の係数が 1 で係数が回文的(左右対称)なら x + 1 で割り切れる。
証明 n を奇数とする。 n 次の多項式 ƒ(x) は、定数項を含めて n+1 個(偶数個)の項から成る。 ƒ(−1) の各項の値を考えよう。両端の2項について: x = −1 のとき、命題の仮定から最高次の項は 1⋅(−1)奇数 = −1、定数項は 1、両者の和は 0。その一つ内側の項について: n−1 次の項を axn−1 とすると 1 次の項は ax なので、 x = −1 のとき前者は a(−1)偶数 = a、 後者は a(−1) = −a、両者の和は 0。以下同様に進めて ƒ(−1) = 0 と結論される。ゆえに ƒ(x) は x + 1 で割り切れる。∎
上記で例とした3次の因子 x3 + 2x2 + 2x + 1 の場合、 x + 1 で割ると割り切れて商は x2 + x + 1。これは整数の割り算 1221 ÷ 11 = 111 と本質的に同じ。
同様に:
(x + 1)7 − x7 − 1 = 7x6 + 21x5 + 35x4 + 35x3 + 21x2 + 7x
= 7x(x5 + 3x4 + 5x3 + 5x2 + 3x + 1)
= 7x(x + 1)(x4 + 2x3 + 3x2 + 2x + 1) = 7x(x + 1)(x2 + x + 1)2 【ク】
最後から2番目の等号は命題1による(割り算は 135531 ÷ 11 = 12321 と同様)。最後の等号は、恒等式† (x2 + x + 1)2 = x4 + 2x3 + 3x2 + 2x + 1 による(この計算は 111 × 111 = 12321 と同様)。
† この恒等式は、右辺の係数が 1, 2, 3, 2, 1 という特徴的な形なので、記憶に残りやすい(使用頻度はそれほど高くないけど、時として鍵となる)。
【カ・キ・ク】を並べて書くと…
コーシー&リューヴィルの恒等式(1839年)
(x + 1)3 − x3 − 1 = 3x(x + 1)
(x + 1)5 − x5 − 1 = 5x(x + 1)(x2 + x + 1)
(x + 1)7 − x7 − 1 = 7x(x + 1)(x2 + x + 1)2
同次化した形式では:
(x + y)3 − x3 − y3 = 3x(x + y)
(x + y)5 − x5 − y5 = 5x(x + y)(x2 + xy + y2)
(x + y)7 − x7 − y7 = 7x(x + y)(x2 + xy + y2)2
![]()
2.2 これらの美しい恒等式たちは、「フェルマーの最終定理」の研究に関連して発見された。きっかけは、1839年、ラメ(Lamé)が「最終定理の指数 7 の場合」について最初の(ややこしい)証明を完成させたこと。コーシーたちは、ラメの証明の内容について確認・報告してほしいと学会から頼まれた――査読とは違うのかもしれないが、当時としては重要な研究だったので、慎重を期したたのだろう。コーシーたちは「ラメが証明で使った命題を一般化できないか」「証明を簡単化できないか」を検討し、その成果の一つとして、「ラメが使った恒等式を、より一般的な形で解析的に証明できる」ことを発見。上記の5乗や7乗の展開を含む恒等式は、その例。コーシーたち自身の言葉†を引用すると「ラメ氏の補題は、ある解析的な定理の必然的な結果である。その定理は大変好奇心をそそるもので、この報告書に含めるに値すると思われる」。この「好奇心をそそる」と形容されている定理は、次のようなもの。
多項式に関するコーシーの定理 n が 3 以上の奇数で 3 の倍数ではないとき、
ƒn(x, y) = (x + y)n − xn − yn
は、多項式として、 x2 + xy + y2 で割り切れる。特に n が 3 の倍数より 1 大きいときには (x2 + xy + y2)2 で割り切れる。
〔例〕 (x + y)11 − x11 − y11 は x2 + xy + y2 で割り切れ、 (x + y)13 − x13 − y13 は (x2 + xy + y2)2 で割り切れる(詳細)。
明言はされてないが、 n が 3 の倍数のときは ƒn(x, y) は x2 + xy + y2 では割り切れない。他方、上記3種の恒等式の例からも分かるように、 n が奇数なら ƒn(x, y) は常に x(x + y) でも割り切れる(この事実は命題1から直ちに明らか)。
コーシー自身による証明(上記の報告書には含まれていないが、別の場所‡に記されている)は、次の通り。簡略化して、非同次形式で表記する。
証明 2次方程式 x2 + x + 1 = 0 の解を α, β とする(両者は 1 の原始立方根。しばしば ω, ω2 と表記される複素数)。このとき解と係数の関係から α + β = −1。従って、
α + 1 = −β 【サ】
β + 1 = −α 【シ】
が成り立つ。一方、 α, β は 1 の相異なる原始立方根なので、 n が 3 の倍数でなければ、
1 + αn + βn = 0 【ス】
が成り立つ。
n を 3 以上の奇数で、 3 の倍数ではないとする。 ƒn(x) = (x + 1)n − xn − 1 が x と x + 1 で割り切れることを示すには、 ƒn(α) = ƒn(β) = 0 を言えばいい。実際、 ƒn(α) = ƒn(β) = 0 が成り立つなら ƒn(x) は因子 x − α と因子 x − β を持ち、従って、
(x − α)(x − β) = x2 + x + 1
で割り切れる。さて、【サ】を使うと、
ƒn(α) = (α + 1)n − αn − 1 = (−β)n − αn − 1
であり、この右辺は【ス】の左辺の −1 倍に等しい(∵仮定により n は、 3 の倍数ではない奇数)。よって ƒn(α) = 0。同様に ƒn(β) = 0。これで ƒn(x) が x2 + x + 1 で割り切れることが示された。
n が 3 の倍数より 1 大きい奇数のとき ƒn(x) が (x2 + x + 1)2 で割り切れること――つまり、そのとき α, β は ƒn(x) の重根であること――を示そう。 α, β が根であることは既に分かっているので、両者が ƒn(x) の導関数
ƒ′n(x) = n(x + 1)n−1 − nxn−1 = n[(x + 1)n−1 − xn−1]
の根でもあることを示せばいい。 3 の倍数より 1 大きい奇数は 6 の倍数より 1 大きいこと(従って n−1 は 6 の倍数であること)、 α も −β も 1 の6乗根であること(従って「6 の倍数」乗すると 1 になること)に留意すると、
ƒ′n(α) = n[(α + 1)n−1 − αn−1]
の [ ] 内は (−β)n−1 − αn−1 = 1 − 1 = 0 に等しい。よって ƒ′n(α) = 0。同様に ƒ′n(β) = 0。証明終わり。∎
〔注〕 最小多項式という観点からは、 α が根なら自動的に β も根であり、従って α についてだけ証明すれば十分。しかしそのような理論に頼らず、単純に α, β のそれぞれについて証明してもいい。
† https://gallica.bnf.fr/ark:/12148/bpt6k2968p/f360.item
le lemme de M. Lamé est une conséquence nécessaire d’un théorème d’analyse qui nous semble assez curieux pour mériter d’être indiqué dans ce rapport
‡ https://archive.org/details/exercicesdanaly02caucrich/page/n142/mode/1up
![]()
2.3 ƒn(x) が持つ因子 x2 + x + 1 の個数は―― n が 3 以上の奇数のとき、 n ≡ 0, −1, 1 (mod 3) に応じて、それぞれちょうど 0 個・1 個・2 個。
実際 n が 3 の倍数の場合には、前節と同じ表記を用いて、 α は 1 の3乗根、 α + 1 は 1 の6乗根(−1 の3乗根)であるから、
ƒn(α) = (α + 1)n − αn − 1
は、 n が 6 の倍数なら 1 − 1 − 1 = −1 に等しく、 n が 6 の倍数より 3 大きいなら −1 − 1 − 1 = −3 に等しい。いずれにしても α は根ではない。これで分かったこととして、 n が 3 の倍数のとき、 ƒn(x) は因子 x2 + x + 1 を一つも持たない。今、「どんな場合でも ƒn(x) は因子 x2 + x + 1 を 3 個(以上)は持たない」ということを示そう。それには n が 6 の倍数より 1 大きいときでも(そのときに限って α, β は ƒn の重根である)、 α, β が三重根ではないことを示せばいい。
1 の原始6乗根を 5 乗しても、結果は依然として 1 の原始6乗根。より一般的に k ≡ −1 (mod 6) のとき、 1 の原始6乗根の k 乗は、再び 1 の原始6乗根。そのことに留意しつつ、 n ≡ 1 (mod 6) と仮定して ƒn(x) の導関数の導関数に x = α を代入すると:
ƒ″n(α) = n(n − 1)[(α + 1)n−2 − αn−2]
この値が = 0 になるためには [ ] 内が 0 になる必要があり、そのためには (α + 1)n−2 と αn−2 が等しくなる必要がある。ところが、それは不可能。なぜなら α + 1 は 1 の原始6乗根であり、それを n−2 乗したものも原始6乗根―― n−2 ≡ −1 (mod 6) なので。一方 α は 1 の原始立方根であり、その整数乗は決して 1 の原始6乗根と等しくならない。∎
ƒn(x) = (x + 1)n − xn − 1 が (x2 + x + 1)3 で割り切れないということは、次のように、結構重要な意味を持つ。まずコーシーの定理によって、 n が奇数のとき、
ƒn(x) = x(x + 1)(x2 + x + 1)λ⋅ɡn(x)
という分解ができることが分かっている(ここで λ の値は、 n ≡ 0, −1, 1 (mod 3) に応じて 0, 1, 2)。 ƒn(x) の自明な因子 x(x + 1) とコーシーの定理によって保証されている因子 (x2 + x + 1)λ を取り除いたときに残る余因子 ɡn(x) は、一体、どういう性質を持つか?
この ɡn(x) は(コーシー・)ミリマノフ多項式と呼ばれ、今でもその正体が完全には分かっていないようだ――有理係数の範囲で既約かどうかすら、未解決の問題らしい。しかし、たとえコーシーの定理が λ = 2 を保証してくれる場合でも、その保証範囲を超えて ƒn(x) 全体が (x2 + x + 1)3 で割り切れるということはない――という事実から、「ミリマノフ多項式 ɡn(x) は因子 x2 + x + 1 を持たない」ということは確定的。
命題2 n を 3 以上の奇数とする。コーシーの定理により ƒn(x) は、多項式として x(x + 1)(x2 + x + 1)λ で割り切れる。この割り切れたとき残る商の多項式を ɡn(x) とすると、 ɡn(x) は、もはや因子 x2 + x + 1 を含まない。
証明は上述の通り。この一見何でもないようなことが、ミリマノフ多項式の研究において、かなりのインパクトを持つ。ここではミリマノフ多項式の世界に深入りすることはできないけど、一つの命題を証明しておきたい。
命題3 n を 3 以上の奇数とする。 ɡn(x) は、単根しか持たない(つまり、決して重根を持たない)。
証明 コーシーの定理の証明(上記)と同様に考えて、 ƒn(x) が重根を持つとしたら、
ƒ′n(x) = n[(x + 1)n−1 − xn−1] = 0 つまり
(x + 1)n−1 = xn−1 【タ】
が成り立つ必要がある。重根かどうかはともかく、 ƒn(x) = (x + 1)n − xn − 1 が何らかの根 x を(複素数の範囲で)持つとしたら、
(x + 1)n − xn − 1 つまり
1 = (x + 1)n − xn = (x + 1)⋅(x + 1)n−1 − x⋅xn−1 【チ】
が成り立つ。もしこの x が重根であるなら、同時に条件【タ】も成り立つ。そこで【チ】に【タ】を代入すると:
1 = (x + 1)⋅xn−1 − x⋅xn−1 = (x + 1 − x)⋅xn−1 = xn−1
要するに xn−1 = 1
すなわち ƒn(x) が重根を持つとしたら、それは必ず 1 の n−1 乗根でなければならない†。言い換えると、重根 x は絶対値が 1 でなければならず、複素平面上において、原点を中心とする単位円上にある。このとき、当然 xn−1 の絶対値も 1 なので、条件【タ】と考え合わせると、 x が重根なら x + 1 もまた絶対値が 1 で、同じ単位円上にある。 x と x + 1 が両方とも単位円上にあるというのは、強い制約だ。複素数の世界は無限といえども、そんな条件を満たす x は、 1 の原始立方根 α, β の二つしかない。
要するに ƒn(x) が持ち得る重根は α, β に限られる(実際 n が 6 の倍数より 1 大きいときには、 α, β が重根となる)。 ƒn(x) の因子 ɡn(x) が持ち得る重根があるとすれば、当然 α, β だけ。ところが ɡn(x) は因子 x2 + x + 1 を持たない(命題2)。つまり α, β が ɡn(x) の根となることは――重根どころか単根としてであっても――あり得ない。ゆえに ɡn(x) は重根を一切持たない。∎
† 事実、もし n が 6 の倍数より 1 大きいなら(n = 7, 13, 19, ···)、コーシーの定理は ƒn(x) が重根 α, β を持つことを保証する―― α, β は 1 の原始立方根ではあるが、それは 1 の6乗根でもあり、12乗根・18乗根などでもある(なぜなら原始立方根は 3 乗すれば 1 になるのだから、当然 6 乗や 12 乗などでも 1 になる。これらは 1 の n−1 乗根に他ならない)。
![]()
ミリマノフ多項式が重根を持たないことについては、既に何度か証明した(「コーシー/ミリマノフ多項式・その23」「その24」など)。 1 の原始4乗根・原始5乗根などはコーシー型多項式の根になり得ない――という、やや大掛かりな定理13に依存した証明だった。上記の別証明(定理13に依存せずに自己完結)の方が、軽快だろう。