異性体の数は難しいが、炭素数12くらいまでなら素朴な計算ができる。中学数学くらいの予備知識で気軽に取り組めて、めちゃくちゃ奥が深い。「キーワードのクラスター」のような問題ともつながっている。
構造異性体として、ノナン骨格(炭素数9)に3個のメチル基を付ける方法は何種類あるか?
ルール: 1番と9番の C
には枝が付かない。2~8番の C
には、それぞれ最大2個枝が付く。
C-C-C-C-C-C-C-C-C 1 2 3 4 5 6 7 8 9 ▲ ノナン骨格 C C C C C | | | | | C-C-C-C-C-C-C-C-C C-C-C-C-C-C-C-C-C | C ▲ 例えば2,2,3-トリメチルノナン(左)と2,3,8-トリメチルノナン(右)
難問ではなく、紙に書いて数えることもできるので、挑戦してみてほしい。
相手は分子で、3次元空間内を自由に動けることに注意。例えば 7,8,8-
というメチルの付け方(下図)は、X軸(画面の上下方向)の周りを180度回転させれば 2,2,3-
と同一なので、これらを重複してカウントしてはいけない。
C C | | C-C-C-C-C-C-C-C-C | C
実は、主鎖の炭素数 m が奇数のとき次の関係が成り立つ:
左辺の意味は:
ここで {1,1,1} は枝の組み合わせ(多重集合)を表し、「長さ1の枝」(メチル基)が3個あるという意味。m = 9 を代入すれば 40 となる(最初のパズルの答え)。
上記のタイプの「枝パターンごとの公式」を一つずつ得ることがこのシリーズの主題となる。特定の m についての答えではなく、一般の m についての公式を得たい。さらに、枝が {1,1,1} の場合だけでなく、いろいろな枝の組み合わせについて公式を得たい。
これはゲームバランスのいい非常に面白い問題だ。中学の数学くらいの予備知識で気軽に取り組めて、めちゃくちゃ奥が深い。
この式は三角数と関係している。三角数は、自然数を 1 からある数まで足し合わせたもので、次の図のような数。
* 1 = 1 * ** 1 + 2 = 3 * ** *** 1 + 2 + 3 = 6 * ** *** **** 1 + 2 + 3 + 4 = 10 * ** *** **** ***** 1 + 2 + 3 + 4 + 5 = 15 * ** *** **** ***** ****** 1 + 2 + 3 + … + 6 = 21 * ** *** **** ***** ****** ******* 1 + 2 + 3 + … + 7 = 28
突然だが、奇数番目の三角数を4個足してみよう。1 + 6 + 15 + 28 = 50。ところで、4番目の三角数は 10。前者から後者を引くと 40。あっという間に、トリメチルノナンの種類の数が求まった!
この手品のような計算の種明かしは第3回で。
上記のタイプの問題を一般的に扱うための「グラフ理論」は、例えば「ウェブページが作るリンク構造の分類・研究」とも関係する。化合物の C
をウェブページ、C-C
という結合をリンクと解釈すれば、確かに似た問題だ。
ということは、検索エンジンはどのページを最初に表示するべきかという問題ともつながるし、あるキーワードがどういうキーワードと結び付くかという問題ともつながる。もしかすると、「言葉の意味とは何か」「知識とは何か」「人工知能の意識とは」…といった深遠な研究ともつながるのかもしれない。
初期のグラフ理論としては「七つの橋」の問題や四色問題が知られているが、四色問題の研究が始まったのとほぼ同時期、19世紀半ばに英国の数学者 Arthur Cayley が異性体の数え上げに取り組んでいる(Molecular graph)。グラフ理論の「グラフ」という用語自体、Sylvester の「化学と代数」(1878)で使われたものだ。グラフ理論は今やコンピューター関連を代表とする多くの分野で使われる重要な手法だが、その源流にある問題に取り組んでみるのも悪くないだろう。
上記のようなパズルや、C{1,1,1}(m) のような記法が、異性体の数の計算とどう関わってくるのか?
例えば、ヘキサン(合計炭素数6)の異性体は、「主鎖(メイン)の炭素数 + それ以外(サイド)の炭素数」に着目すると、「6 + 0」「5 + 1」「4 + 2」…などのパターンに分類される。そこで、次のように書いてみよう:
ここで Isomers (6) はヘキサンの異性体の数であり、Side0(6) は「サイドに0個の炭素があるような、主鎖の炭素数6の異性体の種類の数」、Side1(5) は「サイドに1個の炭素があるような、主鎖の炭素数5の異性体の種類の数」、Side2(4) は「サイドに2個の炭素があるような、主鎖の炭素数4の異性体の種類の数」…を表す。
このうち、サイド0の場合は、要するに枝のない直鎖アルカンであり、主鎖の炭素数 m ごとに1種類しか存在しない(m は 1 以上の整数とする):
サイド炭素数1のアルカンは、炭素数1の枝(メチル基)を1個だけ持つ:
サイド炭素数2のアルカンは、炭素数2の枝(エチル基)を1個持つか、または炭素数1の枝(メチル基)を2個持つ:
以下同様に進めることができる。
ところが、この CB(m) の形の項について、枝の組み合わせ B ごとに、次のような明示的公式を作ることができる:
C∅(m) | = | 1 | |
C{1}(m) | = | ⌊(m − 1)/2⌋ | |
C{2}(m) | = | ⎧ ⎨ ⎩ |
0 (m < 3) ⌊(m − 3)/2⌋ (m ≥ 3) |
C{1,1}(m) | = | ⌊(m − 1)2/4⌋ | |
C{3}(m) | = | ⎧ ⎨ ⎩ |
0 (m < 5) 2 ⌊(m − 5)/2⌋ (m ≥ 5) |
C{2,1}(m) | = | ⎧ ⎪ ⎨ ⎪ ⎩ |
0 (m = 1) (m − 3)2/2 (m ≥ 3: 奇数) (m − 2)(m − 4)/2 (m: 偶数) |
C{1,1,1}(m) | = | ⎧ ⎨ ⎩ |
(m2 − 1)(m − 3)/12 (m: 奇数) (m2 − 4)(m − 3)/12 (m: 偶数) |
⋮ |
ここで ⌊a⌋ は a の小数点以下切り下げ(切り捨て)を表す。
これらを使えば CB(m) の各項は直接計算可能であり、従ってその和である Sides(m) の形の項(s: サイド炭素数)も計算可能であり、従ってその和である Isomers (t) を計算で求めることが可能になる(t: 合計炭素数)。ヘキサンの場合、Side3(3) 以下の項が 0 であることは簡単に示されるため、次のようになる:
この計算は、「ヘキサンの異性体は5種類あること」「その内訳は、直鎖のヘキサンが1、メチルペンタンが2、ジメチルブタンが2であること」を示している。
CB(m) は漸化式ではない。サイド炭素数が増えて複雑な B が絡むと「その項については、まだ公式がないので計算できない」という事態に陥ってしまう。それでも、このアプローチは一定の意味を持つ:
有機化学に興味がある人なら、デカン(合計炭素数10)の異性体の数が75であることは、一度はどこかで読んだことがあるだろう。75種類、自分で図解してみた人もいるかもしれない。だが、この計算を見たことがある人はいるだろうか?
以上の計算により、デカンの異性体は合計 45 + 23 + 7 = 75 種類! と分かった。
問題はこの計算が成り立つ根拠だが…。
特に難しいのは、最後の1項 C{1,1,1,1,1}(5) だ。ラスボス「
このモンスター、ただでさえ4次元怪物なのに、体内の点の一つ一つから5次元ベクトルのとげとげが生えている。
と迫ってくる。くそ、何という怪物だ。上下・左右・前後・4次元、全部とげとげで、数えるどころか何が何だか分からねえ。
しかし、このモンスターには弱点があった。「四次元の東」に回りこんで、そこから眺めると、とげとげのパターンが一目瞭然なのだ。
おまげのとげとげ、見切った!
ウギャ~! どうして分かったぁぁぁ?!
比喩的に言えば、そんな感じ。発想が小学生っぽいけど(笑)
代数学的方法を使えば、《うそのとげ》を数えることは それほど難しくない。だけど手っ取り早く、図を描いて数えちゃえ!
でも、その図が4次元なんですが?
よろしい、ならば4次元だ!!
実際には C{1,1,1,1,1}(5) = C{1}(5) という置き換えが可能であり、当面、ラスボスは回避可能だ。そもそも五胞体を4次元的に考えるまでもなく、もっと簡単に計算する方法もある。でも、面白いので「4次元の超立体」という考え方もしてみよう(第8回)。
もう一つの見所は、小枝を持つ枝「イソプロピル」のトリッキーさ(第5回)。こいつを相手にしていると、化学というより詰め碁や詰め将棋の気分になってくる。イソプロピルだけがそうなのではなく、小枝を持つ枝はそれぞれトリッキーだが、C11までの範囲では、小枝がある枝はイソプロピルだけ。デカンの計算で C{3,1,1}(5) が 0 にならずに 1 になるのもイソプロピルが絡んでいる。
単純に考えると、ペンタン骨格みたいな小さい親にC3枝なんていうでかい子がいるわけないのだが…。実際、ペンタン骨格は単独のC3枝を持てないのだが…。「わが家には自動車1台を置くスペースはないし、ましてや自動車1台とバイク1台は置けません。でも自動車1台とバイク2台なら置けますよ」という謎かけ。「ちなみに自動車2台とバイク2台も置けますね」
もはや不可能犯罪!
ここで1問、ルール(IUPAC命名規則)を知っている人向けの簡単な「詰めアルカン」を出題しよう。このシリーズを準備している途中で思い付いたゲームなのだが…
C-C-C-C-C-C-C-C 持ち駒 C1 C5 「フェアリー詰めアルカン」
詰めアルカンでは「成り打ち」ができる。つまり、C5は直鎖ペンチルとしてもいいし、イソペンチルなどとしてもいい。こんな短い主鎖にC5枝を付けるには徹底的に「折り畳む」必要があるが、それにしても枝がでか過ぎる。どう折り畳めばルール違反にならないのか。
組み合わせが無限にあるようだが(C1枝なんか、どこにでも打てそうだが)、正しい詰め方は順序も含めて一つしかなく、それ以外は禁じ手になってしまう。
これらはどれも、本来グラフ理論で扱うべき深い問題だろう。「算数」のような素朴な手法で立ち向かうのは、無謀なようだ。
だが意外なことに、うまくルートを選べば、これは素晴らしいハイキングコースになる。「難しいが難し過ぎない」というゲームバランスの良さ、2次元・3次元・4次元…と昇っていく高揚感、ときおりある美しい眺め…。もし4次元が初めてなら、4次元の対象を思い浮かべることができた、というだけでも結構わくわくするかもしれない。
具体的な目標があった方がいいので、「合計炭素数11までのアルカンの構造異性体とそのIUPAC名について、どうしてそうなるのか原理を理解できること」を一応のゴールとしよう。
数学的手法としては、幼稚で野暮ったい面もあるだろう。でも、抽象代数学的な深みには及ばなくても、だからといって、波打ち際できれいな貝殻を見つける喜びは変わらない…。
「五胞体」というキーワード(5-cell, pentatope, pentachoron)で検索してみたところ、こんな方法で異性体を数え上げる話はどこにも書かれていないみたいだ。「最新理論で誰も書いていない」というわけではなく、単にマイナー過ぎるし、具体的過ぎるし、意味もないので誰も通らない道なのだが、まあ、それはそれ。誰も行かない旧道を散策し、風変わりな角度から物事を眺めてみるのも乙なもの。triangular numbers (三角数)と isomers (異性体)で検索するとヒットする論文もあるので、この方法が根本的に筋違い というわけでもないようだ。
算数に毛が生えたような雑多な小火器を手に、ハイテク兵器「グラフ理論」の牙城にまさかの奇襲を仕掛けよう。敵がのろのろと抽象概念を起動している隙に、われわれはC10デカン高原までを制圧、一気にC11になだれ込む。だが調子に乗ってはいけない。そのまま進んでもC20のはるか手前で、当方の陣地は都市区画ごと粉砕されてしまうだろう…。総力戦(一般解)では、グラフ理論にとても太刀打ちできない。長居は無用、一撃離脱だ!
イソマーチャレンジは、素朴な手計算だけで、どこまで「アルカンの構造異性体の数の公式」を構成できるか試してみる遊び。
コンピュータープログラムに計算させるのは反則とする(普通の電卓は使用可)。一般公式を導くために図を描いて考えるのは もちろんありだが、「特定炭素数のアルカン」の異性体を数えるだけでは得点にならない。探求対象は「異性体の数」ではなく、あくまで
とする(一般に、主鎖の長さが偶数か奇数かなどによる場合分けが必要になる)。
頑張ればC10越えはできるが、場合によっては、第5回までのライトコース(異性体数35のC9までを扱う)にチャレンジしてほしい。C11くらいでは物足りない人は、公式をどんどん自作してC13(異性体数802)あたりを目指そう。一番楽しいのは、このシリーズの記事を一切読まず、全部自力で再構築することだ!
小さな枝がたくさん付いた異性体は、パターンのバリエーションが繊細。柔軟な発想と緻密な計算でそれを攻略するところに、ゲームの面白さがある。大きな枝が少しだけ付いた異性体では、計算上の複雑さはないが、「そんな枝の付け方があったのか!」「しまった、このパターンは重複だった!」という見落としが起きやすく、ある種の大局観が必要とされる。
公式を作るのは少し難しいが、特定炭素数のアルカンの異性体を数えるだけでもパズルのような楽しさがある。
全9回予定のシリーズ第2回。今回の内容は分かり切ったことが多くあまり面白くないかもしれないが、先へ進むための準備として一応基本を確認しておこう。
例えばヘキサン C6H14
があるとして…
H H H H H H | | | | | | H-C-C-C-C-C-C-H | | | | | | H H H H H H 1 2 3 4 5 6 ←炭素の番号
…そのどれかの H
をメチル基 -CH3
に置換する方法は、何パターンあるか?
H | H-C-H | ▲ メチル基
つまり、6炭素の主鎖(ヘキサン骨格)と1炭素の枝(メチル基)を1個を持つようなアルカン(ヘプタンの異性体)は、何種類存在するか?
以下では、H
を省略して、次のように書く。
C | C-C-C-C-C-C 1 2 3 4 5 6 ▲ ヘキサン(左)と メチル基(右)
要するに: 炭素が6個並んでいるとして、そのどれかに1個メチルを付けるとしたら、何番の炭素にメチルを付けられるか?
素朴に考えれば「炭素が6個あるんだから、枝を付ける場所も6カ所ある」ようだが(物理的にはその通りだが)、異性体を考える場合、次の二つの制限がある。
▼ あえて端にメチル基を付けてみたが… C | C-C-C-C-C-C 1 2 3 4 5 6
有機化合物を分類して名前を付けるとき、上記のような図において直線状であるかどうかは意味がなく、単に「つながり方」だけが問題になる。図が L 字型でも直線状でも、「両端の炭素は1個の炭素とつながっていて、それ以外の炭素は2個の炭素とつながっている」というつながり方に変わりはない。
そもそも図では直線状に書いてあっても、現実の原子の空間配置は直線状ではない。
定義上、炭素が一番長く連続している場所が主鎖となる。従って、上記のような場合、枝のない7炭素の主鎖が存在することになる。つまり、これはヘプタンであって、「6炭素の主鎖 + 1炭素の側鎖」(メチルヘキサン)にはならない!
C-C-C-C-C-C-C 1 2 3 4 5 6 7 ▲ ヘプタン
これは「IUPAC名の規則によれば」という話であり、「そこに枝が付くことはあり得ない」という数学的証明ではない。しかし、IUPAC名に基づいて異性体を分類すると数学的にもうまくいくので、当面、「IUPAC名=公理」のように扱う。
ヘキサンの例では、4番の炭素以降に枝を付けることも、意味上、無効となる。分子は空間中を漂っているのだから「向き」というものがなく、180度回転したら同じである分子は、同じ分子だ。「4-メチルヘキサン」の場合、X軸(図の縦方向)の周りを180度回転したら明らかに「3-メチルヘキサン」と同じ化合物であり、新しい種類の異性体になっていない。
▼ 「3-メチルヘキサン」(左)と「4-メチルヘキサン」(右) 6 5 4 3 2 1 C C | | C-C-C-C-C-C C-C-C-C-C-C 1 2 3 4 5 6 1 2 3 4 5 6
光学異性体の関係になる場合や、炭素の一つが同位体に置き換わっている場合や、炭素に付いている水素の一つが重水素であるような場合には、厳密にいえば「ひっくり返せば同じ」とは限らないが、このシリーズではそのような微視的レベルは考えず、比較的大きなレベルの構造(構造異性体)だけを問題にする。
いちいち頭の中で180度回転させて裏返すのは面倒なので、主鎖の番号を逆順にした裏番号を考え、「裏番号を使った裏の名前が既存の名前と同じなら新しい異性体ではない」と考えると早い。裏番号は、「主鎖の炭素数 + 1」から表の番号を引き算することで、簡単に暗算できる。ヘキサン骨格の場合、7から番号を引けば「4-メチルヘキサンの裏は3-メチルヘキサン」と分かる。
「3-メチルヘキサン」と「4-メチルヘキサン」は同じ化合物の裏表だが、ではどちらの名前で呼ぼうか? 実はIUPAC名では、番号は小さい方が偉いという大原則があって、この場合、3-メチルヘキサンが採用される。言い換えると、枝に近い方の末端炭素が1番となる。
結局、主鎖の長さが 6 なら、中央より向こうの3個はメチル基を付けても無効、残りの3個のうち端の1個も駄目なので、メチルを付けられる場所は2カ所しかない。一般に、主鎖の長さ m が 2 以上の偶数の場合、メチルアルカンの種類は m/2 − 1 個であることが分かる。言い換えれば、(m − 2)/2 個だ。
m が 3 以上の奇数の場合は「ちょうど真ん中」に付けるという選択肢(下図)があるので、偶数の場合よりある意味ちょっと選択肢が豊富になる。つまり、メチルを付けられる場所は (m − 1)/2 個だ。
▼ 4-メチルヘプタン C | C-C-C-C-C-C-C 1 2 3 4 5 6 7
この関係は、m = 1 の場合にも正しい(主鎖の長さが 1 なら枝が付くことができる場所は 0 個)。
奇数・偶数の両方のケースをまとめて ⌊(m − 1)/2⌋ と書くこともできる。ここで、かぎかっこのような記号は floor
関数と呼ばれ、「その数を超えない最大の整数」を表す。要するに「小数点以下切り下げ」の処理であり、負の数が絡まないなら「小数点以下切り捨て」といってもいい。
意味は「ガウスの記号」の角かっこと同じ。このシリーズでは、角かっこは(計算順序を示す)普通のかっことして使われる。
エチル基(2炭素の枝)が付くことができる場所は、メチル基が付くことができる場所とほとんど同じだが、ただし、エチル基は、主鎖の端から2番目の炭素に付くことができない。例えば、ヘキサン骨格において「2-エチルヘキサン」は成り立たない。定義上、一番長く炭素がつながっている区間が主鎖となるからだ(§2.1)。
▼ 「2-エチルヘキサン」(左)は実は 3-メチルヘプタン C C 1 | | C C 2 | | C-C-C-C-C-C C-C-C-C-C-C 1 2 3 4 5 6 3 4 5 6 7
「2-エチルヘキサン」の場合、エチルの先端を1番として数えれば主鎖は7炭素になり、その解釈が優先される。なお、逆順に番号を振っても7炭素になるが、それだと結果が「4-メチルヘプタン」になってしまうので、「番号は小さい方が偉い」の法則によってその順序は「裏」となる。
エチルの場合、主鎖の左右の端から2個ずつの炭素が使用不可になる。比較として、メチルの場合、主鎖の左右の端から1個ずつの炭素が使用不可だった。つまり、エチルの場合、「メチルと比べると使える炭素が2個減る」ことになる。従って、メチルの公式の m を m − 2 で置き換えれば、エチルの公式となる。
長さ 2 の枝(エチル)が付くことができる場所は、主鎖の左右の端のうち近い方を基点として、3 個目以降の炭素に限られる。従って、長さ 4 の主鎖 ―― そこでは「最も端から遠い炭素」でも端から 2 個目にすぎない ―― や、それより短い主鎖には、エチルが付くことはない:
一般に、主鎖の左右の端のうち近い方を基点として、端から k 個目の炭素には、長さ k 以上の枝を付けることができない。理由はエチルの場合と同様で、「それをするとそっちが主鎖になってしまう」からだ。
ジメチル、つまりメチル基が2個付く場合を考えよう。
ジメチルでも「端には枝を付けられない」点に変わりなく、一番数字が小さい異性体は 2,2
-ジメチルとなる。
▼ 2,2-ジメチルヘキサン C | C-C-C-C-C-C | C 1 2 3 4 5 6
メチルアルカンの場合と違い、ジメチルアルカンの2個目のメチルは、一般に、中央より向こう側に付くことができる。1個目のメチルとの組み合わせによって左右対称性が破れるため、「ひっくり返せば同じ」といえなくなるためだ。
▼ 3-メチルヘキサンと「4-メチルヘキサン」はひっくり返せば同じ C C | | C-C-C-C-C-C C-C-C-C-C-C 1 2 3 4 5 6 1 2 3 4 5 6 ▼ 2,3-ジメチルヘキサンと 2,4-ジメチルヘキサンはひっくり返しても同じではない C C | | C-C-C-C-C-C C-C-C-C-C-C | | C C 1 2 3 4 5 6 1 2 3 4 5 6
ジメチルヘキサンの「数字部分」(枝番号)の可能な組み合わせは、次の形に書くことができ、6種類存在する:
2,2 2,3 2,4 2,5 3,3 3,4
置換基の番号を並べるとき、小さい順にソートすることに注意。例えば、「2,3
-ジメチル」は正しいが、「3,2
-ジメチル」は正しくない。これも「小さい方が偉い」の法則の一種だ。
2
に付いた場合で、2個目のメチルは端以外ならどこにでも付くことができる。3
に付いた場合。この場合、3,2
は 2,3
と同じことで既に数え終わっているので、3,3
から数え始めなければならない。さらに、3,5
は裏返せば 2,4
で、既に数え終わっているので、これも駄目。4
以降に付けることはできない。というのは、1個目のメチルを付ける時点ではヘキサン骨格は他に枝を持たず「つながり方が左右対称」なので、あえて1個目のメチルを 4
に付けたとしても「ひっくり返せば 3
に付けたのと同じ」であり、新しい付け方にならないからだ。言い換えれば、上記のような三角形状の図を描いた場合、行の数はメチルヘキサンの種類の数 C{1}(6) = 2 に等しい。同様に、ジメチルヘプタン(主鎖7炭素)について「数字部分」の可能な組み合わせを列挙すると…
C-C-C-C-C-C-C 1 2 3 4 5 6 7 2,2 2,3 2,4 2,5 2,6 3,3 3,4 3,5 4,4
2
や 6
)に関わることはない。一般に、主鎖の長さ m が 3 以上のとき、ジメチルの「数字部分」の組み合わせを三角形状にを並べると:
従って、三角形状に並んだ要素の数を一番下の行から数えて足し合わせると、合計の要素数は:
この足し算の結果は「1項あたりの平均の大きさ×項数」に等しいが、この場合、項の平均の大きさは (初項 + 末項)/2 に等しく、項数は行数 C{1}(m) に等しい(上記の式において直接、項数を数えることも難しくない)。すなわち:
次のように、まとめて書くことができる。メチルの公式と比べると、「小数点以下切り下げ」記号の中身がちょうど2乗になっていて、覚えやすい。これらの公式は、m = 1, 2 に対しても、化学的に正しい結果を与える。
以上、3個の基本公式を導入した。これだけで、既にヘキサンまでの異性体を分類するツールが手に入ったことになる。
(1) 枝を持たない「主鎖だけ」の異性体、言い換えればサイド(側鎖)の炭素数が 0 である異性体は、明らかに1種類のみ存在する。一般に、主鎖の長さ m と無関係に:
ただし m は 1 以上の整数とする。
(2) 主鎖の端の炭素には枝がつくことがないので、主鎖に「端以外の炭素」がないメタン骨格(炭素数1)とエタン骨格(炭素数2)は、枝を持つことができない。すなわち、サイドの炭素数 s が 0 ではないなら:
ゆえに:
一般に、主鎖・側鎖を合わせた合計炭素数 t が 3 以上の異性体については、計算上 Sidet − 2(2) と Sidet − 1(1) を考える必要はない(どちらも 0 に等しい)。
直鎖のブタンの他に、異性体がもう1個だけ存在することが示された。上記の計算によれば、その1個は「長さ 3 の主鎖 + メチル基1個」を持つ。長さ 3 の主鎖はプロパン骨格であり、枝の場所は 2
しかあり得ないのだから、この異性体は2-メチルプロパン(通称イソブタン)である(Butane: Isomers 参照)。
直鎖のペンタンの他にメチルブタンが1個、ジメチルプロパンが1個だけ存在することが示された(Pentane: Isomers 参照)。枝のある異性体は、2-メチルブタン(通称イソペンタン)と、2,2-ジメチルプロパン(通称ネオペンタン)。
このうち、Side3(3) は、次のように展開される:
実際、サイドの炭素数が 3 なら、「3炭素の枝が1個」か、または「2炭素の枝が1個、1炭素の枝が1個」か、または「1炭素の枝が3個」が存在しなければならない。ところが、この場合、主鎖の炭素数も 3 であり、結果として、右辺の3項はいずれも 0 に等しい。なぜなら:
一般に、プロパン骨格に枝が付くとすればメチル基だけで、最大でもメチル基2個までしか付くことができないのだから、「プロパン骨格 + サイドの炭素数 3 以上」というアルカンを構成することは できない。従って、合計炭素数 t が 6 以上の異性体を考える場合、Sidet − 3(3) 以降の項は 0 であり、計算を Sidet − 4(4) までで打ち切って構わない:
結局、ヘキサンの異性体の数は5個であること、直鎖のヘキサンの他にメチルペンタンが2個、ジメチルブタンが2個存在することが示された(Hexane: Isomers 参照)。
第1回の「小さなパズル」で取り上げた軽妙な問題を掘り下げてみよう。C1枝(メチル基)が3個付く場合(トリメチル)に当たる。
主鎖の長さ(炭素数)を 3 以上の奇数 d として、しばらくの間、主鎖の長さが奇数の場合だけを考える。具体例として、長さ9のノナン骨格を考えよう。ノナン骨格に三つのメチル基を付ければ、結果は合計炭素数12(メイン9 + サイド3)のトリメチルノナンとなる(ドデカンの異性体)。例えば:
▼ ノナン骨格 C-C-C-C-C-C-C-C-C 1 2 3 4 5 6 7 8 9 ▼ 2,2,3-トリメチルノナン C C | | C-C-C-C-C-C-C-C-C | C
念のために、水素を省略せずに描けば:
H H HCH HCH H | | H H H H H H HC - C - C - C - C - C - C - C - CH H | H H H H H H H HCH H
主鎖の左右の端の炭素には枝を付けられないので(§2.1)、メチル基が付くことができる最小の位置は 2
だ。とりあえず1個目のメチルは 2
に付くものとして、これを固定する。2個目のメチルも同じ 2
に付けられるが、それをすると主鎖の2番炭素においては置換する水素がなくなるので、3個目のメチルは 2
に付けられない。番号が最小のトリメチルは 2,2,3
となる。
化学的にはそうなのだが、数学的に考える場合、あえて 2,2,2
も考察に含める方が都合がいい。そうすれば、次のように「枝番号の組み合わせ」を整然と三角形状に並べることができる:
2,2,2# 2,2,3 2,2,4 2,2,5 2,2,6 2,2,7 2,2,8 2,3,3 2,3,4 2,3,5 2,3,6 2,3,7 2,3,8 2,4,4 2,4,5 2,4,6 2,4,7 2,4,8 2,5,5 2,5,6 2,5,7 2,5,8$ 2,6,6 2,6,7 2,6,8@ 2,7,7 2,7,8@ 2,8,8@ #と@と$の意味は本文参照
「枝番号の組み合わせ」をこのように三角形状に並べて書いたものを三角図と呼ぼう。このような三角図に含まれる三つ組の数は、一番下の行から数えれば 1 + 2 + 3 + 4 + … で、数学的な性質がはっきりしている。2,2,2#
という組み合わせは物理的に無効だが(ここで #
印は物理的に無効であることを表す)、無効な配置の数については後から引き算すればいい。
さて、この考え方における難所は、「組み合わせの中には、物理的には有効でも意味的に無効なものが含まれている」という点だ。この点を理解するために、2,5,8
-トリメチルノナンを考えてみよう。
1 2 3 4 5 6 7 8 9 C-C-C-C-C-C-C-C-C | | | C C C 9 8 7 6 5 4 3 2 1
この異性体の枝の位置は、左右どちらから番号を付けても 2,5,8
で、つながり方が「左右対称」になっている。
図のつながり方が左右対称でも、原子レベルでの物理的配置が本当に左右対称であるとは限らないが、便宜上、この種の状態を「左右対称」と呼ぶことにする。
これは「ちょうど左右が釣り合っている状態」なので、もしこれ以上少しでも枝の位置が右に片寄ると、下図のようなシチュエーションが生じる。
1 2 3 4 5 6 7 8 9 C-C-C-C-C-C-C-C-C | | | C C C 9 8 7 6 5 4 3 2 1
この異性体は、左から番号を付けると 2,6,8
-トリメチルノナンだが、右から番号を付けると 2,4,8
-トリメチルノナンとなる。つまり、2,4,8
と 2,6,8
は、番号の付け方が違うだけで同じ構造なので、構造異性体を考える場合、2重にカウントしてはいけない。IUPAC名では「番号が小さい方を優先」という原則があるため、2,4,8
が正規の名称となり、2,6,8
は無効となる。
この種の無効配置は、三角図において、一番右の列の中段より下で発生する。その理由は次の通り:
(1) 図において、一番右の列の三つ組(例えば 2,2,8
や 2,3,8
)は、主鎖上で次の3カ所にメチルが付く場合の、枝の配置を表している:
2
(左から2番目)2
以上、「右から2番目」以下のどこかこの列において、第1のメチルと第3のメチルの位置番号は固定されている。一方、第2のメチルの番号は、列の上から下に向かって、2
から「右から2番目」の炭素の番号まで、順に変化する。主鎖の長さ d が奇数であり、図の行数 d − 2 も奇数であるから、図には「真ん中」の行があり、そこにおいて「第2のメチルの位置=主鎖の真ん中の炭素」となる。
第2のメチルの位置が主鎖の真ん中になったとき、第1と第3のメチルの位置は左右の端から等距離に固定されているのだから、三つのメチル全体の配置は「左右対称」となる。すなわち、これが 2,5,8$
であり $
印は「左右対称」を表すものとする。
図の一番右の列において、$
印よりさらに下の行が表す枝の配置は、「左右対称の地点を超過して、第2のメチルが右に片寄り過ぎ」という状態にある。
これに該当する 2,6,8@
と 2,7,8@
と 2,8,8@
の3種は、裏返せばもっと小さい番号(裏番号 2,4,8
と 2,3,8
と 2,2,8
)で表現され、実際それらは既に図中に現れている。つまり @
印(意味的無効を表す)の配置は、既存の配置の重複にすぎず、カウントから除外されなければならない。
(2) この三角図全体において第1のメチルは左から2番目の 2
なのだから、三つの枝の配置が左右対称を超過するためには、第3のメチルが右から2番目以内であることが必要。この前提条件が満たされる枝の組み合わせは、三角図の一番右の列のものに限られる。つまり、(1) 以外に、@
が発生することはない。
ところで、2,7,7
のような配置は有効なのだろうか? これも3個中2個のメチルが中央を越えているのだが…。
1 2 3 4 5 6 7 8 9 C | C-C-C-C-C-C-C-C-C | | C C 9 8 7 6 5 4 3 2 1
2,7,7
-トリメチルは、逆から読めば 3,3,8
-トリメチルであり、数字の和は後者の方が小さい。しかしIUPAC名の「番号が小さい方が偉い」というのは和の問題ではなく、一つ一つの番号の比較に基づく。つまり、1個目同士・2個目同士・3個目同士の番号を順々に比較して、もし1個目の番号に違いがあれば、そこで大小が決まる。もし1個目の番号が等しければ、2個目の番号を比較して、そこに違いがあれば、そこで大小が決まる。もし2個目の番号も等しければ、3個目の番号を比較して、そこに違いがあれば、そこで大小が決まる。この定義によれば、2,7,7
は 3,3,8
より小さい。
上記の大小の定義に照らして、もし裏の名前の方が「小さい」なら裏の名前が採用され、もともとの名前は無効となる(意味的無効)。逆に、もし裏の名前の方が「大きい」なら裏の名前は無効であり、もともとの名前が有効となる。この「有効・無効」は枝の付き方の「左右のバランス」と関係しているが、単純に左右どちらに片寄っているかという問題ではなく、大小の定義に従って判定される。
特に、左右の端のうち近い方から数えて「左から2番目」または「右から2番目」の炭素に枝があるなら、必ずそこが 2
となる(「左から2番目・右から2番目」の両方に枝がある場合にどちらが 2
になるかは別の問題だが、必ずどちらかが 2
)。端から3番目以降の炭素に付く枝がどんなに片寄っていようと関係なく、端から2番目に枝がある場合には、その枝によって番号の向きが決まる。
上記のノナン骨格の場合、左右どちらにせよ端から2番目に枝がある組み合わせは「2,*,*
-トリメチル」と呼ばれ、従って「2,*,*
の三角図」のどこかに出現し、この三角図によって数え尽くされている。従って「1個目のメチルが 3
にある 3,*,*
-トリメチル」を考えるときには、「左端から2個の炭素・右端から2個の炭素(合計4個の炭素)」については考えないでいい。むしろ考えてはいけない。3,*,8
などを考えてしまうと、その裏番号は 2,*,7
なので、カウント済みの異性体の重複になってしまう。
この重複を避ける方法は簡単で、3,*,*
を考えるとき、単に 2
と 8
の炭素については存在を無視すればいい。上の 2,*,*
-トリメチルでも、1
と 9
の炭素は完全に無視されているが(端に枝は付けられないので)、3,*,*
-を考えるときには無視される炭素が2個増える。同じ発想を反復して使えば、4,*,*
-を考えるときには無視される炭素がさらに2個増え、5,*,*
-を考えるときには無視される炭素がさらに2個増え…のようになる。
3
以降の場合実際に 3,*,*
- の配列を書いてみよう:
3,3,3# 3,3,4 3,3,5 3,3,6 3,3,7 (3,3,8などは無視) 3,4,4 3,4,5 3,4,6 3,4,7 3,5,5 3,5,6 3,5,7$ 3,6,6 3,6,7@ 3,7,7@
3,3,3#
は物理的に無効だが、図を三角状にするために追加してある。3,5,7$
は「左右対称」であり、その下の 3,6,7@
と 3,7,7@
は意味的に無効だ。同様に進めると、4,*,*
- は:
4,4,4# 4,4,5 4,4,6 1/2/3と9/8/7は完全無視 4,5,5 4,5,6$ 4,6,6@
最後に 5,*,*
- を考えると:
5,5,5$# 1/2/3/4と9/8/7/6は完全無視
たった1個の要素(枝番号の組み合わせ)があるだけの、寂しい三角図になった。しかも、このたった1個の要素は物理的に不可能な配置を表していて、化学的には意味がない。しかし、ここまで考えることによって、問題の数学的性質が明確になる。すなわち…
主鎖の長さが 3 以上の奇数の場合に現れる三角図の一つ一つについて、その要素の数 Dk を小さい順に並べると次のようになる:
内容としては、1からある奇数までの整数の和を問題にしている(「奇数番目の三角数」に当たる)。このような和を計算するには、最初の項(つまり1)と最後の項(問題の奇数)を足して2で割ったもの(つまり項の平均的な大きさ)に、項数(問題の奇数に等しい)を掛けてやればいい。「テトリス」風に図解すると:
三角数 1+2+3=6 * ** *** クローンを180度回転 %%% %% % 合体! (3+1)×3=12: 元の三角数はその半分 %%% %%* %** ***
具体的に:
k 番目の項は:
どの三角図においても、左上の1個の要素(枝番号の組み合わせ)は「物理的に無効な配置」を表している(#
印)。言い換えれば、考えている三角図一つにつき1個、物理的無効要素が含まれる。
さらに、それぞれの三角図において、一番右側の縦列の要素のうち、下側の半分ほどは「意味的に無効な配置」(@
印)となっている。正確に言うと、主鎖の長さが奇数の場合、この縦列の真ん中において「左右対称配置」($
印)が生じ、そこより下は「意味的に無効」となる。具体的に、D1, D2, D3, D4, … には、それぞれ 0, 1, 2, 3, … 個の意味的無効要素が含まれ、Dk には k − 1 個の意味的無効要素が含まれる。
物理的無効要素の1個も合算すると D1, D2, D3, D4, … のそれぞれに含まれる無効要素の合計はそれぞれ 1, 2, 3, 4, … 個であり、Dk に含まれる無効要素は k 個だ。
一つの三角図には Dk = 2k2 − k 個の要素が含まれるのだから、そこから無効な要素を除外した有効要素数は:
直鎖アルカンに3個のメチル基を付ける組み合わせの数を求めるには、この D′k = 2k2 − 2k の形の数を、k = 1 から k = (d − 1)/2 まで足せばいい。これで、関連する全ての三角図に含まれる有効要素数を足し合わせたことになる:
ここで (d − 1)/2 は、「2番目の炭素」「3番目の炭素」…「真ん中の炭素」をそれぞれ「1個目のメチル基の場所」の候補と見た場合の、候補地の総数に当たる。なぜこれだけの三角図を考えれば十分なのか。なぜなら、仮に1個目のメチル基が真ん中の炭素より向こう側にあるとすれば、左右をひっくり返すことで、そのメチル基を真ん中より手前に持ってくることができるからだ。つまり、真ん中より向こうに1個目のメチルを付けても「新しい異性体」にならない。従ってノナン骨格でいえば 5,*,*
- までを考えれば十分であり、一般的にいえば (d − 1)/2 個の三角図を考えれば十分。
現実には、真ん中の炭素に1個目のメチル基を付けた場合、1要素から成る「寂しい三角図」になり、物理的に無効な配置しか得られない。つまり、D′1 = 0 については、足しても足さなくても結果に影響しない。しかし、以下で見るように、この項も含めておいた方が計算がシンプルになる。
実際に D′k を k = 1 から k = (d − 1)/2 まで足してみよう。上記のように
なのだから
となる。従って:
「あ」のかっこを外して足し算の順序を変更し、平方数の2倍の項は前半に集め、それ以外の項は後半に集め、前半と後半のそれぞれにおいて係数の 2 と −2 をくくり出すと、「い」になる。
ここで次の公式を利用しよう:
前者は2乗和の公式だが、疑問があれば末尾(§3.8)の付録を見てほしい。後者は「連続整数の和 = 項の平均値×項数 = (初項+末項)÷2×項数」という関係にほかならない。
a = (d − 1)/2 であることに注意して、これらの公式を「い」に適用すると:
これで答えが得られた。
すなわち、長さ d の骨格に3個のメチルを付ける方法は (d2 − 1)(d − 3)/12 通り存在する。三角図を用いた考察は d が 3 以上の奇数である場合に意味を持つが、この公式は d = 1 に対しても化学的に正しい(メタン骨格に3個のメチル基を付ける方法は0種類)。
トリメチルノナンの場合、d = 9 だから、上記の式に当てはめれば、
…となる。最初に挙げた4個の三角図の有効要素(#
と @
を除いたもの)を手動で数えれば、ちょうど 40 個であることを確認できる。
振り返って考えると、この計算では (d − 1)/2 が繰り返し現れ、最終的な解でもそれが因数になるのだから、A = (d − 1)/2 とでも置いた方が良かったようだ。試しにそのやり方でやってみよう。「い」の辺りから書くと:
結果的にはこのやり方の方がスッキリする。ただしそれは、「う」が1次式の積に分解されていて「え」で変数を戻した瞬間に面倒が起きない…という点がラッキーだからだ。もし「う」が分解できない A の3次式だったら、A = (d − 1)/2 と戻したとき分数の2乗・3乗の計算が発生し、かえって話がややこしくなるかもしれない。
実は、2乗和の公式は次のように書くこともできる:
この形は6で割る通常の公式より美しい上、「い」のように「2分の何とか」まで足すときには便利なショートカットとなる:
2,2,2#
から始まる三角図を見ると、有効な「2,*,*
-トリメチルノナン」(C9骨格: ドデカンの異性体)は24種類あることが分かる。List of isomers of dodecane を見て数えてみると、確かにその数になっている。これは D′4 = 24 に当たる。
3,3,3#
から始まる三角図を見ると、有効な「3,*,*
-トリメチルノナン」は12種類ある。上記のリストでもそうなっている。D′3 = 12 に当たる。
ところがこれは、「2,*,*
-トリメチルヘプタン」(C7骨格: デカンの異性体)の種類の数に等しい! List of isomers of decane を見て数えてみよう。
同様に、「4,*,*
-トリメチルノナン」(C9骨格)と、「3,*,*
-トリメチルヘプタン」(C7骨格)と、「2,*,*
-トリメチルペンタン」(C5骨格: オクタンの異性体)は、いずれも4種類存在する(Octane: Isomers 参照)。これは D′2 = 4 だ。
つまり、主鎖の長さが 3 以上の奇数のとき、その奇数の大きさと無関係に D′1 = 0, D′2 = 4, D′3 = 12, D′4 = 24, … という数列が繰り返し現れる。
なぜだろうか?
例えば、1個目のメチル基が 3
に付くとすると:
3,3,4
や 3,4,5
はありうるが、3,2,3
などは不可。ということは、3,*,*
-トリメチルにおいて、2
にメチルが付くことはあり得ない。3,*,*
-トリメチルの場合、逆の端から2個目(裏番号2番)の炭素にメチルが付くこともあり得ない。もしそうなったら、裏番号が 2,*,*
になって、そちらが優先されてしまう。3,*,*
の場合、左右両端とも端から2番目の炭素が使用不可。これは(両端の炭素だけが使用不可の 2,*,*
と比べると)実質的に、主鎖が2短くなったのと同じこと。3,*,*
-トリメチル」は、主鎖の長さが m − 2 の「2,*,*
-トリメチル」と同じこと(組み合わせの数という点では)。4,*,*
以降についても、同じ原理が繰り返し適用される。主鎖の長さ m が与えられたとき、2,*,*
- の形のトリメチルアルカンの種類の数を f(m) としよう。この m は奇数でも偶数でもいい。すると 3,*,*
- の形のトリメチルアルカンの数は f(m − 2) で与えられ、4,*,*
- の形のトリメチルアルカンの数は f(m − 4) で与えられ、…以下同様になる。
具体的に、d が 3 以上の奇数のとき、「2,*,*
-トリメチルアルカン」の種類の数とは、「そのトリメチルアルカンに関連する一番大きい三角図」が含む有効要素数であり:
例えば、2,*,*
-トリメチルノナンの数は:
3,*,*
-トリメチルノナンの数は:
4,*,*
-トリメチルノナンの数は:
5,*,*
-トリメチルノナンの数は:
トリメチルノナンは、必ず「2,*,*
-トリメチルノナン」「3,*,*
-トリメチルノナン」「4,*,*
-トリメチルノナン」…のどれかに分類される。
つまり、トリメチルノナンの種類の数は、「2,*,*
-トリメチルノナン」「3,*,*
-トリメチルノナン」「4,*,*
-トリメチルノナン」…のそれぞれの種類の数の和に等しい。そうすると、上記の考察からは次のように書けそうだ:
これは §3.2 で得た答えと一致して、結果的に正しい。ただし、論理的には問題がある。三角図に基づくここまでの議論は、主鎖の長さ d が 3 以上の奇数のときのものだった。従って f(3) = 0 はいいのだが、f(1) は議論の範囲外だ。実際、一番大きい三角図の1行目の要素の数は d − 2 だが、d = 1 だとそれがマイナスになってしまって、図が描けない!
しかし、その点を無視して形式的に計算すると、f(1) = (12 − 4⋅1 + 3)/2 = 0 は、結果として化学的に正しい(メタン骨格に3個のC1枝を付ける方法は0種類)。この事実を確認した上でなら、f(1) を使うこと自体は問題ない。
化学的に考えれば、整数 m が一定の数(実際には 4)より小さいとき f(m) は常に 0 に等しい。これは「主鎖が短過ぎて、C1枝を3個付けられない」状況を表している(m が 0 以下になって化学的に意味を成さない場合も含む)。つまり、理論上、上記の和は f(5) までで打ち切ってよく、f(3) と f(1) は必要ない。化学的事実としては、f(3) = f(1) = 0 であり、これらの項は足しても足さなくても和に影響しない。
理論上はそれだけの話なのだが、実際の計算としては、いつもそう単純に話が進むとは限らない。でも、今回はうまくいくので、これ以上気にしないことにしよう…。
従って、一般に、主鎖の長さが 3 以上の奇数 d のとき、トリメチルアルカンの総数は:
「お」を得るための式変形は、「あ」から「い」の変形と同様。ここで (3 + 3 + 3 + … + 3) は (d + 1)/2 項ある: これは 1 から d までの奇数の個数に当たる。
(1 + 3 + 5 + … + d) も当然、同じ項数を持つ。
さらに、奇数の2乗和の公式によって、(12 + 32 + 52 + … + d2) は d(d + 1)(d + 2)/6 に等しい。
従って「お」は:
これは §3.2 の計算結果と一致する。
この方法なら枝の組み合わせの全パターン(=複数の三角図)を考える必要がなく、「1個目のメチルが 2
の場合の種類の数」f(d) さえ分かれば、あとは計算で処理できる。理論的に簡潔で、状況によっては便利な解法だ。
もっとも、この方法には欠点もある。「複数の三角図を考えなくていい」ということは、逆に言うと、「複数の三角図の間に成り立つパターンを有効活用しない」ということだ。そのため、すぐ計算に持ち込める半面、計算が複雑になる傾向がある。
今回の計算は、
の形の項を m = 1, 3, 5, …, d について足すものだった。これは §3.2 の計算と本質的に同じことだ。実際、
と置いてみよう。次の二つは、全く同じ意味になる:
後者は §3.2 の計算にほかならない(§3.2 では k = 0 は考えていないが、形式的に D′0 = 0 なので同じこと)。
1 から a までの a 個の自然数を足し合わせたものは、a 番目の三角数と呼ばれる。これを T(a) で表すことにしよう。
T(a) の式は、自然数の和の公式そのものだ。
奇数番目の三角数だけを抜き出すと:
ここで a は正の奇数とする。§3.2 では、これらの数を D1, D2, D3, … などと呼んでいたが、書き方を変えただけで中身に違いはない。実際、Dk = 2k2 − k だが(§3.2)、k 個目の「奇数番三角数」は 2k − 1 個目の三角数であり:
以下では T(1), T(3), T(5), …, T(a) の和を考えて、それを Δodd(a)(デルタ・オッド・エー)と呼ぶことにしよう。この変な記号の真意は後述するが、例えば
となる。そうすると:
Δodd(a) は、「一辺の長さ(要素数)が 1 の三角図」「一辺の長さが 3 の三角図」「一辺の長さが 5 の三角図」…「一辺の長さが a の三角図」が含む要素(枝番号の組み合わせ)の数の総和に当たる。トリメチルアルカンの異性体の数は、基本的には、このような形の和によって表される(§3.1)。ただし、この和はあくまで三角図の要素の総数であり、異性体の総数を求めるためには、三角図に含まれる物理的・意味的無効要素の数を引き算する必要がある。
主鎖の長さが 3 以上の奇数 d のとき、関連する最大の三角図(2,*,*
-トリメチルに対応する)の一辺の長さは d − 2 であり、関連する全ての三角図を考えた場合の要素の総数は:
§3.2 の記法を使えば、「か」について、次のように書くこともできる:
一方、これらの三角図が含む無効要素の数(§3.2)の総和は:
「か」から「き」を引けば、これらの三角図が含む有効要素の総数が得られる:
計算の意味を整理すると:
Dk の総和は「3次元方向の足し算」であり、例えば、
…といった考え方に相当する。
3階 ***** **** *** ** * 2階 *** ** * 1階 *
パターンはやや分かりにくいが、それを利用することで、比較的簡単な計算で見通しよく答えを出せる。他方、再帰性を利用する方法(§3.3)では、たった1個の三角図を考えるだけで計算に持ち込むことができ手っ取り早いのだが、計算部分は比較的ややこしい。二つのやり方を比較すると、計算の複雑さとパターン認識の複雑さのトレードオフのような面がある。
第1回冒頭の手品のような計算の正体は、今や明らかだろう。
「三角数のうち奇数番目だけを抜き出したもの」(奇数番三角数)について、最初の 4 個を足すと:
これは「か」の Δodd(9 − 2) に当たり、ノナン骨格について全ての三角図を考えたときの、要素の総数(無効要素を含む)を表している。一方、4番目の三角数は:
これは「き」の T((9 − 1)/2) に当たり、ノナン骨格について全ての三角図を考えたときの、無効要素の総数を表している。
前者から後者を引いた 40 は、これらの三角図に含まれる有効要素の総数を表している。つまり、トリメチルノナンの種類の数となる。
T(1) から T(a) までの a 個の三角数を足し合わせたものは、a 番目の四面体数(三角すい数)と呼ばれる(ここでは a は奇数とは限らない)。これを Δ(a) で表すことにしよう。Δ(デルタ)については、四面体(三角すい)のシンボル(象形文字?)と解釈してほしい。
…という三角数を順々に足し合わせると:
四面体数の一般項 Δ(a) を表す式は、定義により三角数の和の公式でもあるが、これは奇数2乗和・偶数2乗和の公式(§3.8)と同じ形をしている。そうなるわけは、次の作図から一目瞭然だ。
T(1) から始めて偶数個の三角数を足し合わせる場合、次の図のように、奇数番目の「ピース」をひっくり返せば、一つ大きい偶数番目のピースにぴったり はまって結果は正方形になる。従って、「偶数番目の三角数」と「その一つ手前の三角数」の和は、その偶数の2乗に等しい。つまり、これら偶数個の三角数の和は、偶数の2乗の和に等しい。
T(1) = 1 * T(2) = 3 T(1)+T(2) = 2×2 % %* %% %% T(3) = 6 * ** *** T(4) = 10 T(3) + T(4) = 4×4 % %*** %% %%** %%% %%%* %%%% %%%%
T(1) から始めて奇数個の三角数を足し合わせる場合は、逆に偶数番目の「ピース」をひっくり返せば、一つ大きい奇数番目のピースにはまって結果は正方形になる。
T(1) = 1 T(1) = 1×1 * * T(2) = 3 % %% T(3) = 6 T(2)+T(3) = 3×3 * *%% ** **% *** *** T(4) = 10 % %% %%% %%%% T(5) = 15 T(4) + T(5) = 5×5 * *%%%% ** **%%% *** ***%% **** ****% ***** *****
最初の T(1) だけは「はめる」相手がないようだが、T(1) = 1 = 12 はもともと奇数の平方に等しいので問題ない。もしくは T(0) = 0 と定義して、それとペアになっていると考えればいい。いずれにしても、これら奇数個の三角数の和は、奇数の2乗の和に等しい。
三角数の和がこの形になることは、もちろん計算によって普通に示すこともできる:
四面体数 Δ(a) は、第6回以降で活躍するだろう。
さて、「三角数の和」という点においては、
という和も、四面体数(三角すい数)に似た数だといえる。つまり、奇数番目の三角すい数を考えた場合の「奇数段から成る三角すい」について、「奇数個目の段に含まれる要素の数を足し合わせたもの」に当たる。例えば、
は本物の四面体数だが、奇数番目の項だけを抜き出して足せば:
Dk の総和を Δodd で表すのは、この理由による。動画用語を使えば、いわば「インターレース四面体数の奇数フィールド」だ。
主鎖の長さを 4 以上の偶数 e とすると、可能性のある枝番号の組み合わせは、(e − 2)/2 個の「偶数番三角数」の和によって表現される(その中には無効な組み合わせも含まれる)。例えば、オクタン骨格(e = 8)について:
2,2,2# 2,2,3 2,2,4 2,2,5 2,2,6 2,2,7 2,3,3 2,3,4 2,3,5 2,3,6 2,3,7 2,4,4 2,4,5 2,4,6 2,4,7 2,5,5 2,5,6 2,5,7@ 2,6,6 2,6,7@ 2,7,7@ 3,3,3# 3,3,4 3,3,5 3,3,6 3,4,4 3,4,5 3,4,6 3,5,5 3,5,6@ 3,6,6@ 4,4,4# 4,4,5 4,5,5@
現れる三角数を §3.2 と同様の記号で表して、同様に計算を進めよう:
これらの三角数一つ一つにつき、物理的に無効な要素(枝の組み合わせ)が1個、意味的に無効な要素が k 個が含まれている。従って、Ek 個の要素のうち、有効要素数は:
ゆえに:
この式は、e = 2 に対しても化学的に正当。
§3.3 とほぼ同様に進める。
主鎖の長さが 4 以上の偶数 e のとき、「2,*,*
-トリメチルアルカン」の種類の数とは、「そのトリメチルアルカンに関連する一番大きい三角図」が含む有効要素数であり:
さて、化学的には、f(2) = 0 となる。つまり、主鎖の長さが 2 の場合、どこにも枝を付けることができないのだから、有効な枝の組み合わせは全く存在しない。ところが、「く」に無理やり e = 2 を代入すると f(2) = −1 となってしまい、化学的な事実と計算が一致しない。化学的な事実を正確に表現するためには、次のように、f(e) を場合分けして定義する必要がある。
f(e) = | ⎧ ⎨ ⎩ |
(e2 − 4e + 2)/2 (e ≥ 4: 偶数) 0 (e ≤ 2: 偶数) |
これはこれでいいのだが、§3.3と同様の方法で(=多項式の単純な和として)計算を進める上では、定義に場合分けがあるのは不便だ。
そこで発想を転換して、化学的な正確さにこだわらず、「く」によって、任意の偶数に対して f(e) を定義することにしよう。その場合、以下の和において、化学的に間違っているのは f(2) だけなのだから(そしてその本来の値は 0 なのだから)、その項は引き算しておけば問題ないだろう(定義を場合分けして処理した場合も、結局これと同じ計算になる)。
偶数の2乗和の公式が使われた。f(2) をいったん足してから末尾でまた引いているのは、この公式が使えるようにするため。実質的には、次の計算を行ったことになる:
主鎖の長さが奇数の場合には、
という単純な計算が成り立ったが(§3.3)、いつでも「奇数なら f(1) から、偶数なら f(2) から単純に足せる」とは限らない。“小さ過ぎる”自然数 m(すなわち「問題にしている枝の組み合わせ」を持つことができない非常に短い骨格の長さに当たる整数 m)に関して:
従って、再帰性を利用する解法では、「実質的にどこからどこまで足せばいいのか」(=どこが再帰の起点なのか)を見極めて、「起点より前にあるナンセンスな項」については計算から除外(引き算)する必要がある。
仮に計算の都合を考えず常に「化学的に正しい」値を取るように f(m) を定義するとしても、そのときは定義の段階で結局同じ見極めを行う必要がある。
再帰性に基づく計算は、最小限の情報から全体を再構成するものであり、ミニマリスト的な美しさ、理論的な小気味よさを持っている。同じコインの裏表として、多項式 f(m) は最小限の情報をコーディングしたものにすぎず、「一番端の項はどうなるのか」といった微妙な問題を自己制御できない。その点は、計算時に手動で調整する必要がある。トリッキーな面もあるが、やり方が分かっていれば大した手間ではない。
再帰性を利用する解法の(実用上の)一番の問題点は、計算が最適化されていないことだろう。狭い範囲でしか考えていないため、複数の三角図の間の関係をうまく利用した場合と比べると、計算が強引になってしまう。
§3.4 と同様に進める。
a を正の偶数として、次のように偶数番三角数の和を考え、これを Δeven(a)(デルタ・イーブン・エー)と呼ぶことにしよう。
主鎖の長さが 4 以上の偶数 e のとき、関連する全ての三角図に含まれる要素の総数(無効要素を含む)を g0(e) とすると:
g0(e) に含まれる物理的無効要素の総数を g1(e) とすると:
g0(e) に含まれる意味的無効要素の総数を g2(e) とすると:
従って g0(e) に含まれる有効要素の総数は:
このやり方は整然として見通しが良く、計算もシンプルだ。計算式自身が「どこからどこまで足すのか」という情報を内包しているため、再帰性を利用した場合のようなトリッキーさがない。半面、「偶数番三角数の和」という出発点がやや分かりにくい。
次の節では、もっとシンプルなアプローチを紹介する。
§3.2 では、主鎖の長さが奇数の場合の公式を得た(§3.3 と §3.4 では別解を検討した)。§3.5 では、主鎖の長さが偶数の場合の公式を得た。結論をまとめると、次のようになる。
m が 1 以上の整数のとき:
C{1,1,1}(m) = | ⎧ ⎨ ⎩ |
(m2 − 1)(m − 3)/12 (m: 奇数) (m2 − 4)(m − 3)/12 (m: 偶数) |
以下の方法を使うと、上記の公式を簡単に導くことができる。ただしこの方法では、個々の異性体について正しいIUPAC名を直接的に知ることはできない。
まず、主鎖の長さ m を偶数として、次のような図を考える。以下は m = 6 の場合を表している。図に含まれる要素(枝番号の組み合わせ)の数は、四面体数 Δ(m − 2) に等しい。
2,2,2# 2,2,3 2,2,4 2,2,5 2,3,3 2,3,4 2,3,5 2,4,4 2,4,5 2,5,5 3,3,3# 3,3,4 3,3,5 3,4,4 3,4,5 3,5,5 4,4,4# 4,4,5 4,5,5 5,5,5#
この図には多くの意味的無効要素が含まれているが、それらについて @
印は省略した。図には、一つ一つのトリメチルヘキサンの種類について、その表の名前と裏の名前がいずれも一度ずつ現れる。例えば、2,2,3
を裏返せば 4,5,5
だが、それは下の方のブロックに現れている。「どの要素が意味的に有効か」ということを度外視して総数だけを問題にするなら、「この図が含む要素の数のちょうど半分」が意味的に有効だ。ただし、図には m − 2 個の物理的無効要素(#
印)が含まれるので、それを除外してから残りの要素数の半分を考えよう。
物理的に可能な要素数は:
このうち半数が意味的に有効なのだから:
これで偶数に対する公式が得られた。
次に、主鎖の長さ m を奇数として、同様の図を考える。以下は m = 7 の場合を表している。
2,2,2# 2,2,3 2,2,4 2,2,5 2,2,6 2,3,3 2,3,4 2,3,5 2,3,6 2,4,4 2,4,5 2,4,6$ 2,5,5 2,5,6 2,6,6 3,3,3# 3,3,4 3,3,5 3,3,6 3,4,4 3,4,5$ 3,4,6 3,5,5 3,5,6 3,6,6 4,4,4#$ 4,4,5 4,4,6 4,5,5 4,5,6 4,6,6 5,5,5# 5,5,5 5,5,6 6,6,6#
この場合、「3個の枝の位置が左右対称である要素」($
印)については、裏返した名前がもともとの名前に等しくなる。言い換えると、他の要素(表と裏の名前でそれぞれ2回ずつ現れる)と違い、これらの要素はそれぞれ1回ずつしか図に現れない。従って、単純に要素の数の半分を考えると、これらの要素のカウントで問題が生じる。#$
印の1要素については物理的無効要素として計算から除外されるので影響はないが、それ以外の (m − 3)/2 個の $
要素はいずれも有効であり、そのままでは「1回ずつしかカウントされていないのに2で割り算される」ことになる。そこで補正として、割り算の前に (m − 3)/2 を加えておくことにしよう。「け」を出発点にすれば、全要素を2回ずつカウントした場合の物理的有効要素の数は:
上記の半分が、物理的・意味的に有効な要素の数に当たる:
これで奇数に対する公式が得られた。
最後に、今回得た公式(§3.6)を使って「ヘプタン(C7)の異性体が9種類であること」を示そう。
まずは普通に分解:
このうち C{3}(4) + C{2,1}(4) + C{1,1,1}(4) は、長さ4の主鎖(ブタン骨格)にいろいろな枝の組み合わせを付けるパターンの数を表している。ところが、ブタン骨格で枝が付くことができる場所は左または右の端から2番目の炭素のみであり(それ以外の炭素は末端炭素)、そこには長さ2以上の枝は付かない(§2.2)。だから、3項中の最初の2項は「不可能な枝の組み合わせの種類の数」に当たり、0 に等しい。問題は C{1,1,1}(4) の値、つまり「ブタン骨格 + メチル基3個」の組み合わせの数だが、今回得た新しい公式を使えば機械的に答えを出すことができる:
これで計算は完璧なのだが…。実は、C1枝について、次の二つの組み合わせの数は等しい:
どちらも要するに、4個の場所から3個選ぶ話だからだ。つまり、次の簡単な計算でも同じ結果が得られる:
この裏技を使えば、第2回までの基本公式でもヘプタンは処理でき、トリメチルの公式は不要だった。
どちらの方法を使うにせよ、この 1 という結果を用いれば:
シンプルな計算で、きれいに答えがが得られた。9個の異性体の内訳は、直鎖のヘプタン1、メチルヘキサン2、エチルペンタン1、ジメチルペンタン4、トリメチルブタン1…。そこまで分かるところに、数学的手法の強力さ・頼もしさが感じられる(Heptane: Isomers 参照)。
「生もの」の対象を扱う化学者から見ると、この「きれい過ぎる」計算が本能的に気に入らないのだろう…。「こっちは毒性や爆発の危険がある有機化合物を真剣に扱っているのに、てめえら机上で空理空論をもてあそびやがって。現実の化学は そんなきれいには いかないぜ!」というわけだ。
化学者の言い分も正しい。数学的手法が威力を発揮する場所は限定的だろう。
しかし少なくとも異性体の問題に関しては、数学の有効性は明らかだ。
「フン、だが数学者もなかなかやるな。それは認めてやるよ」というのがフェアな評価だろう。
12 + 22 + 32 + … のような2乗の和(平方和)は、次のように計算される。
次の等式は簡単に確かめられる。
さて、次のような X と Y があったとしよう:
ひねくれた気分になって、「ウ」をわざわざ次のように書き直してみよう。
右辺第1項の 13 はただの 1 に等しいので、以下ではそう書くことにする。右辺の残りの項については、「ア」によって展開しよう。ちょっとゴチャゴチャするが、計算自体は難しくない:
「オ」から「イ」を引くと、右辺の3乗の項は全部消えてくれる:
「キ」の 1 × a は、「カ」の丸かっこ内の定数項 1(合計 a 個ある)に対応している。
左辺を見ると「ク」は Y − X に等しいが、「エ」によれば、Y − X は (a + 1)3 に等しい。ということは…
「2乗和」の項だけ左辺に残すように移項すると:
両辺を 3 で割れば:
これで公式が得られた!
2乗和の公式により:
両辺を 22 倍すると:
a = 2n と置けば:
これで偶数の2乗和は分かった。奇数の2乗和は、単に普通の2乗和から偶数の2乗和を引けばいい。以下の a は奇数であり、従って偶数の2乗和の方は最後の項が (a − 1)2 になる:
このように、奇数の2乗和と偶数の2乗和は結果が同じ形になる。同様の性質は4乗和についても成り立つが、3乗和や5乗和については成り立たない。
一つおきの2乗和の結果は、四面体数(三角すい数)でもある(§3.4)。三角数、四面体数、五胞体数、六超胞体数…は、次の美しい関係を満たすことが知られている。
ここで ΔΔ(a) は、1 番目から a 番目までの a 個の四面体数を足し合わせた「4次元的」な図形数を表す。
ΔΔΔ(a) は、その「4次元的」な数を足し合わせた「5次元的」な図形数を表す(5-simplex number)。
これらの面白い数 ―― 4次元以上の単体数 ―― は、第6回でチラッと登場し、第8回以降で主役となるだろう。
5,5,5#
を 5,5,5#$
に修正。#$
から $#
に表記変更。2,4,4
が 2,4,4,
になっていた。画像も含めて全てパブリックドメイン。
誤字や内容の間違いがあるかもしれません。気付いたら訂正します。
2015年10月18日版: 2015年10月25日公開予定の記事のテスト版(下書き・未完成)。
異種の枝(例えばエチルとメチル)が付く場合の組み合わせは、同種の枝(例えば2個のメチル)が付く場合とは異なる原理に従う。
ある骨格にエチル基が1個、メチル基が1個付く異性体は、何種類あるか?
単独のエチルが付くことができる場所の数については、既に計算の仕方が分かっている。基本的には、その一つ一つに対してメチルが付くことができる場所を考えて、掛け算してやればいい。
主鎖の長さ m を偶数とする。例として、オクタン骨格(m = 8)を考えよう。
1 2 3 4 5 6 7 8 C C C-C-C-C-C-C-C-C C
エチルが付く場所を単独で考えると 3
か 4
だけだが、とりあえず 3
を選択してこれを固定しておく。上の図は、3-エチル-2-メチルオクタンを表している。
このタイプの異性体の名前を言う場合、必ず「エチル」が先になる。「エチル」と「メチル」を紹介する順序を入れ替えて「2-メチル-3-エチルオクタン」と呼ぶことはできない。IUPAC名では「置換基を紹介するときはアルファベット順に」という規約があり、ethyl-
は methyl-
よりアルファベット順で前だからだ。
さて、エチル基の付加によってオクタン骨格の左右対称性は破られ、その結果、例えば「3-エチル-4-メチルオクタン」と「3-エチル-5-メチルオクタン」は別の構造になる。つまり、裏返しても重ならない。メチル単独なら「5-メチルオクタン」は「4-メチルオクタン」の「裏」で無効なのだから、これは大きな違いだ。
一般に、対称性が破れた骨格上においては、メチルは両端の炭素以外ならどこにでも付くことができるようになる(もちろん、その場所が空いていればだが)。つまり、m が 2 以上の整数のとき、メチルが付く可能性のある場所は m − 2 個になる。われわれは記号 Ȼ(シー・スラッシュ)を使って、これを次のように表す:
ここで Ȼ{1}(m) は C{1}(m) とほぼ同じ意味だが、主鎖の対称性がない場合(つまり、主鎖に左右の区別が生じた場合)の組み合わせの数を表す。一般に、ȻB(m) によって、
を表すことにしよう。例えば、主鎖の対称性が破れた場合、エチル基は「両端から2個以内(合計4個)の炭素」を除いてどこにでも付けるようになるので、主鎖の長さ m が 4 以上の整数のとき:
m が 2 以上の偶数のとき、メチルないしエチルが単独で付くことのできる場所の数は、m の半分程度だった(§2.1, §2.2):
「あ」「い」と比較すれば、主鎖の長さが偶数の場合には、対称性が破れると、枝が付くことができる場所が2倍に増えることが分かる。理由は単純で:
主鎖の長さが奇数の場合には少し話が複雑になるが、対称性が破れることで枝が付くことができる場所が約2倍に増える点には変わりない(詳細は後述)。
さて、オクタン骨格においてエチルが 3
に付いたとき、メチルが付くことのできる場所は Ȼ{1}(8) 種類ある。オクタン骨格においてエチルが 4
に付いたときも、メチルが付くことのできる場所は同じ数であり、これらは(エチルの位置が違うので)全て別の異性体だ。結局、この場合の異性体の総数は:
一般に、m が 4 以上の偶数のとき:
これで偶数に対する公式が得られた。
主鎖の長さ m を奇数とする。例として、ノナン骨格(m = 9)を考えよう。次の図は、5-エチル-2-メチルノナンを表している。
1 2 3 4 5 6 7 8 9 C C C-C-C-C-C-C-C-C-C C
エチルが単独で付くことができる場所は 3
か 4
か 5
だが:
3
か 4
に付いた場合には(主鎖の長さが偶数の場合と同様に)対称性が破れ、メチルが付くことのできる場所は Ȼ{1}(m) = m − 2 個に増える。5
に付いた場合には対称性が保たれるため、メチルが付くことのできる場所は C{1}(m) = (m − 1)/2 個のまま。このため、Ȼ{1}(m) は C{1}(m) の2倍とは少し違う値になる。Ȼ{1}(m) = m − 2 という公式「あ」自体は、偶数・奇数の区別なく 3 以上の任意の整数 m について成り立つ。
そうすると:
ゆえに:
一般に、5 以上の奇数 m について:
これで奇数に対する公式が得られた。「え」は m = 3 に対しても、化学的に正しい値を返す。
「x-エチル-y-メチル」の形の異性体をリストアップする手っ取り早い方法は:
エチルの位置は x = 3, 4, 5, … , c の範囲を取る。
メチルの位置は、通常は y = 2, 3, 4, …, m − 2 の範囲を取る。ただし、m が奇数かつ x = c のときは、y = 2, 3, 4, …, c の範囲を取る。
「う」「え」の公式も、この発想に用いて組み合わせを数えている。これを単純な列挙法と呼ぶことにしよう。
このようにしてIUPAC名を言う場合、y がエチルの裏番号 (m + 1) − x より大きくなってしまったときは、x と y の両方を「裏」に切り替える必要がある。例えば、「3-エチルオクタン」の裏は「6-エチルオクタン」なので、「3-エチル-2-メチル」「3-エチル-3-メチル」「3-エチル-4-メチル」「4-エチル-5-メチル」「3-エチル-6-メチル」オクタンまではいいが、「3-エチル-7-メチル」オクタンについては、番号を裏返して「6-エチル-2-メチル」オクタンと言い換える必要がある。
1 2 3 4 5 6 7 8 C C (a) C-C-C-C-C-C-C-C C 8 7 6 5 4 3 2 1
これは、「左右どちらにせよ、端から一番近い枝がある側の末端が 1
となる」というIUPAC名の原則に基づく。エチルの裏番号 6
は、表の番号としては「エチルの位置の対称の位置=図の (a)
」に当たる。メチルの番号がこの番号より大きいなら、メチルはエチルより端に近い。従って、IUPAC名の原則により、メチルがある側の末端が 1
になるように番号の付け方が裏返される。
同様に、「4-エチルオクタン」の裏は「5-エチルオクタン」なので、「4-エチル-2-メチル」「4-エチル-3-メチル」「4-エチル-4-メチル」「4-エチル-5-メチル」オクタンまではいいが、「4-エチル-6-メチル」オクタン、「4-エチル-7-メチル」オクタンについては、それぞれ番号を裏返して「5-エチル-3-メチル」オクタン、「5-エチル-2-メチル」オクタンと言い換える必要がある。
これで12種類の「x-エチル-y-メチルオクタン」の全部について、一応正しいIUPAC名が言えることになる。このやり方では、いくつかの名前については、単純な列挙法で作った名前を「裏返す」必要があるが、それは難しい処理ではない: オクタン骨格の例でいえば、「x-エチル-y-メチルオクタン」を「(9−x)-エチル-(9−y)-メチルオクタン」と言い換えるだけの話だ。IUPAC名をリストアップしたい場合、このようなシンプルな方法でも十分に実用になるだろう。
しかし、理論的には、ここにはいろいろな問題がある。
第1に、一般論としていえば、いちいち枝番号の有効性をチェックして必要に応じて「裏返す」という処理は面倒くさい。面倒なだけで難しいわけではないが、もっと良い方法はないだろうか?
第2に、「う」や「え」の公式はこの単純な列挙法に基づいているが、その計算は本当に正しいのだろうか?
今見たように、列挙される組み合わせの中には無効な名前が含まれていて、あとから名前を修正している。つまり「う」や「え」の計算法では、無効な名前もカウントに含まれていることになる。無効なものもカウントしているのに総数が正しい、というのは怪しい話ではないか。
第3に、「3-エチル-6-メチル」オクタンや「4-エチル-5-メチル」オクタンにおいては、エチルとメチルが互いに反対側の端から等距離の位置にある。「左右どちらにせよ、端から一番近い枝がある側の末端が 1
」というIUPAC名の原則からすれば、これらの場合、どちらの端も 1
になる資格がある。つまり、「3-エチル-6-メチル」オクタンの代わりに「6-エチル-3-メチル」オクタンと呼んでもいいことになり、正式名称が一つに決定できない。この点については、規則を明確にしておく必要がある。
例えば「3-エチル-7-メチルオクタン」は裏返せば「6-エチル-2-メチルオクタン」だが、IUPAC名としては後者が有効で前者が無効となる。その理由は「定義によって後者の方が小さいから」だ。「大小の定義」については、§3.1でも大ざっぱに説明されているが、基本原理に則していえば、最も端に近い枝がある側の末端炭素が 1
になる。
1 2 3 4 5 6 7 8 C C C C-C-C-C-C-C-C-C 8 7 6 5 4 3 2 1
具体的に:
3,7
に枝がある。3,7
の裏は 2,6
。2,6
は 3,7
より小さいので、前者が有効・後者が無効となる。一般に、枝番号 b の裏番号を ~b とすれば、主鎖の長さが m のとき:
任意の2個の枝番号を昇順(小さい順)にソートして、小さい方を b1 大きい方を b2 とする(b1 = b2 のときは、どちらを b1 としても同じ)。このとき、枝番号の組み合わせ (b1, b2) について、その裏番号の組み合わせ(昇順にソートされたもの)を ~(b1, b2) とすれば:
例えば、m = 8 のとき:
「x-エチル-y-メチル」の裏は「~x-エチル-~y-メチル」だが、この場合も:
ここで、枝番号の組み合わせの大小は次のように定義される:
p = (p1, p2) を任意の2個の枝番号の組み合わせとする。ただし、p1 ≤ p2 になるように番号はソートされているものとする。q = (q1, q2) を同様にソートされた別の任意の枝番号の組とすると:
枝の数が3個以上の場合でも、同様に考えることができる。要するに、比較したい枝番号の組と組をそれぞれ昇順にソートしておいて、まず第1の番号同士を比較する。そこに大小の違いがあれば、それによって全体の大小が決定される。もしどちらの組の第1の番号も同じなら、今度は第2の番号同士を比較する。違いがあればそれが全体の大小の違いとなり、違いがなければ今度は第3の番号同士を比較する。以下同様。
このルールは first point of difference と呼ばれる。つまり、枝番号の組の構成要素を順に比較して、違いが生じた最初の場所によって全体の大小が決まる。
大小の比較が「引き分け」になる場合については、特別な考慮が必要だ。
(1) エチルとメチルが互いに反対側の端から等距離にあって、メチルの裏番号がエチルの番号と等しい場合にはどうするか。例えば「3-エチル-6-メチルオクタン」か、それとも「6-エチル-3-メチルオクタン」か?
1 2 3 4 5 6 7 8 C C C-C-C-C-C-C-C-C C 8 7 6 5 4 3 2 1
このような場合、上記のアルゴリズムだけでは有効なIUPAC名を決定できず、「タイブレーク(同点決勝)」の追加ルールが必要となる(Rule A2.4)。その規則とは:
エチルとメチルではエチルが先に紹介されるのだから、「6-エチル-3-メチルオクタン」ではなく「3-エチル-6-メチルオクタン」となる。
これは表と裏の大小が等しいという特殊な状況における規則であり、一般には、先に紹介されるからといって小さい番号を持つとは限らない。例えば「6-エチル-2-メチルオクタン」。
(2) 主鎖の長さが奇数のときは、両方の枝が中央炭素に付くことがある。5-エチル-5-メチルノナンがその例だ。
1 2 3 4 5 6 7 8 9 C C C-C-C-C-C-C-C-C-C C 9 8 7 6 5 4 3 2 1
この場合、裏の名前が元の名前に等しく、どちらにしても「5-エチル-5-メチルノナン」となる。これも例外的で興味深い状況ではあるが、IUPAC名の選択という点では(名前の候補が一つしかないのだから)悩む余地はないだろう。
以上によって、ある「枝番号の組み合わせ」と「それを裏返した組み合わせ」のどちらが有効でどちらが無効になるのか、形式的には明確になった。組み合わせの有効・無効がどのように分布しているのか図示してみよう。
「x-エチル-y-メチル」を x Et y
と略記して、「う」の方法で考えた場合の異性体(主鎖の長さを 8 とする)をリストアップすると:
3Et2 3Et3 3Et4 3Et5 3Et6 3Et7@ 4Et2 4Et3 4Et4 4Et5 4Et6@ 4Et7@
図中で @
印の3要素は無効な名前だが、「う」では、これらの無効要素もカウントされている。どうしてそれで正しい結果が得られるのだろうか。状況を確認するために、次のように図を拡大してみよう。
3Et2 3Et3 3Et4 3Et5 3Et6 3Et7@ 4Et2 4Et3 4Et4 4Et5 4Et6@ 4Et7@ 5Et2 5Et3 5Et4@ 5Et5@ 5Et6@ 5Et7@ 6Et2 6Et3@ 6Et4@ 6Et5@ 6Et6@ 6Et7@
一般に、主鎖の長さが 5 以上の整数 m のとき、この大きな長方形状の図において:
従って、要素の組み合わせに漏れはない(Ȼ の計算は「あ」と「い」による)。このような図を組み合わせマップ(略してマップ)と呼ぶことにしよう。
原則として、組み合わせマップには、全ての枝の組み合わせが実質的に2回ずつ(表の名前と裏の名前で)登場する。例えば、上記の図において、右上隅の 3Et2
と左下隅の 6Et7@
は同じ名前の裏表に当たる。右上隅から2番目の 3Et3
と左下隅から2番目の 6Et6@
も同じ名前の裏表に当たる。このように、同じ名前の裏表のペアは、長方形の中心に当たる点に関して点対称の位置に現れる。
主鎖の長さが偶数の場合、同じアルファベットの大文字・小文字を使って対応するペアの位置を図示すると、次の例のようになる。
A B C D E F 3Et2 3Et3 3Et4 3Et5 3Et6 3Et7@ G H I J K L 4Et2 4Et3 4Et4 4Et5 4Et6@ 4Et7@ 5Et2 5Et3 5Et4@ 5Et5@ 5Et6@ 5Et7@ l k j i h g 6Et2 6Et3@ 6Et4@ 6Et5@ 6Et6@ 6Et7@ f e d c b a
「A
とa
」「B
とb
」「C
とc
」…の各ペアは、いずれも同じ名前の裏表であり、それぞれ同じ異性体を表している。IUPAC名としては、それぞれのペアにおいて、どちらか一方だけが有効で他方は無効だが、「どちらの名前が有効か」という問題を度外視して異性体の数だけを問題にするなら、「A
からL
までの文字数」を数えればいいことは明らかだ。従って、長方形の前半の行を数えれば、それがちょうど異性体の種類の数となる。「う」の数え方は、まさにこれに当たる。
ところで、「う」とは逆に、先にメチルの位置を(通常のメチルの公式により)選択して、その一つ一つについて可能なエチルの位置を(対称性が破れた場合のエチルの公式により)選択して掛け算しても、「う」と同じ結果が得られる。すなわち、m が 4 以上の偶数のとき:
これは組み合わせマップの左側半分の要素を数えることに当たり、表・裏のペアが中心に対して点対称に分布していることから、この数え方でも全く同じ結果が得られる。
主鎖の長さが奇数の場合も、同様に説明される。例えば、主鎖の長さを 9 とした場合の組み合わせマップは:
3Et2 3Et3 3Et4 3Et5 3Et6 3Et7 3Et8@ 4Et2 4Et3 4Et4 4Et5 4Et6 4Et7@ 4Et8@ 5Et2 5Et3 5Et4 5Et5 5Et6@ 5Et7@ 5Et8@ 6Et2 6Et3 6Et4@ 6Et5@ 6Et6@ 6Et7@ 6Et8@ 7Et2 7Et3@ 7Et4@ 7Et5@ 7Et6@ 7Et7@ 7Et8@
この場合も、一つ一つの枝の組み合わせの種類について、「表の名前」と「裏の名前」のペアは長方形の中央の点に対して点対称の位置に現れる。唯一例外として、中央にある 5Et5
については、点対称の位置が自分自身になるため、マップ上に1回だけしか現れない。同じアルファベットの大文字・小文字を使って、裏の名前と表の名前の対応を示せば:
3Et2 3Et3 3Et4 3Et5 3Et6 3Et7 3Et8@ A B C D E F G 4Et2 4Et3 4Et4 4Et5 4Et6 4Et7@ 4Et8@ H I J K L M N 5Et2 5Et3 5Et4 5Et5 5Et6@ 5Et7@ 5Et8@ O P Q R q p o 6Et2 6Et3 6Et4@ 6Et5@ 6Et6@ 6Et7@ 6Et8@ n m l k j i h 7Et2 7Et3@ 7Et4@ 7Et5@ 7Et6@ 7Et7@ 7Et8@ g f e d c b a
どのような数え方であっても、A
からR
までを1回ずつ数えるなら、枝の組み合わせの全種類を1回ずつ数えたことになる。「え」の数え方は、このマップでいえば、「中央の行より上の2行」と、「中央の行のうち左端から 5Et5
までの4要素」を数えることに当たり、まさにそのような数え方になっている。
「え」とは逆に、先にメチルの位置を考えてみよう。m が 5 以上の奇数のとき:
結果は「え」と一致するが、これはマップ上で「中央の縦列より左の列」、および「中央の縦列のうち一番上の要素から中央の要素まで」を数えることに当たり、やはり全要素が1度ずつカウントされる。
主鎖の長さが奇数の場合も偶数の場合も、組み合わせマップ上において、意味的無効要素(@
印)は、ある「斜線」を境界にして右側に集まっていて、意味的有効要素は同じ「斜線」の左側に集まっている。境界になっている「斜線」は、エチルの番号とメチルの番号が「対称の位置」(=互いに逆の末端炭素から等距離)にあるような要素だ。主鎖の長さを 8 として、この種の要素を $
印で表すと:
3Et2 3Et3 3Et4 3Et5 3Et6$ 3Et7@ 4Et2 4Et3 4Et4 4Et5$ 4Et6@ 4Et7@ 5Et2 5Et3 5Et4$@ 5Et5@ 5Et6@ 5Et7@ 6Et2 6Et3$@ 6Et4@ 6Et5@ 6Et6@ 6Et7@
「$
要素」自身は、中央の行またはそれより上の行に含まれているなら意味的に有効、そうでなければ意味的に無効となる。$
ライン(並んだ$
要素が作る斜線)とそれより左の部分だけを考えれば、意味的に有効な要素を全て含むコンパクトな図が得られる。「x-エチル-y-メチル」のIUPAC名をリストアップする場合、「枝番号の正当性をチェックして必要に応じて裏返す」手間を省きたいなら、マップ上において、このような台形状の領域を考えてもいいだろう。
3Et2 3Et3 3Et4 3Et5 3Et6$ 4Et2 4Et3 4Et4 4Et5$ 5Et2 5Et3 5Et4$@ 6Et2 6Et3$@
合計炭素数11のウンデカンには、主鎖の長さが e = 8 で枝が {2,1} という異性体が存在するが、「う」によればこのような異性体は 12 種類ある。実際に List of isomers of undecane を見てみると、3-Ethyl-2-methyloctane
をはじめ12種類がリストアップされていて、計算と事実が一致していることを確認できる。
主鎖の長さが奇数の場合についても、同じように考えることができる。
3Et2 3Et3 3Et4 3Et5 3Et6 3Et7$ 4Et2 4Et3 4Et4 4Et5 4Et6$ 5Et2 5Et3 5Et4 5Et5$ 6Et2 6Et3 6Et4$@ 7Et2 7Et3$@
「え」に d = 9 を代入すれば、結果は 18 となる。実際、ドデカンの異性体のうちこのタイプのものは、3-Ethyl-2-methylnonane
をはじめ18種類ある(List of isomers of dodecane 参照)。
「エチル1個とメチル1個」の場合、エチルについての組み合わせとメチルについての組み合わせを別々に求めて、掛け算するだけでよかった。「エチル1個とメチル2個」の場合もほぼ同じだが、「枝と枝の干渉」という新たな問題が発生する。
主鎖の長さを 3 以上の整数 m とする。何らかの理由で主鎖に左右の区別が生じた場合、「あ」と同様に、ジメチル(2個のメチルの組み合わせ)のそれぞれの枝は、主鎖上において、両端を除く m − 2 個の炭素のどこにでも付くことができるようになる。ただし、その場合でも、例えば 3,4
と 4,3
は(枝の組み合わせとして)同じ意味なので、そのような重複カウントを防ぐために、第2のメチルの枝番号は第1のメチルの枝番号以上であると仮定しなければならない。
そうすると、例えば m = 8 の場合、2個のメチルは次の位置に付く可能性がある。
2,2 2,3 2,4 2,5 2,6 2,7$ 3,3 3,4 3,5 3,6$ 3,7? 4,4 4,5$ 4,6? 4,7? 5,5? 5,6? 5,7? 6,6? 6,7? 7,7?
このうち、?
を付けた 3,7?
や 4,6?
は、通常なら(=主鎖の対称性が保たれているときは)許されない配置だ(§2.3)。例えば、3,7?
は、通常なら「2,6
の裏」であり、意味的に無効となる。対称性が破れて「裏返せば同じ」といえなくなった場合にのみ、これらの ?
印の配置が可能になる。
「?
要素」は、右上隅から左斜め下に走る「$
ライン」の下側に集まっている。「$
要素」自体を別にすると、「$
ライン」を境目としてその両側に「ノーマル要素」(常に有効)と「?
要素」(主鎖が非対称のとき有効)が同じ数ずつ分布する。
ジメチルだけで考えた場合、ある要素とそれを裏返した要素は「$
ライン」について対称の位置に現れる。同じアルファベットの大文字・小文字によってこの対応を図示すると、次のようになる。「$
要素」の一つ一つについては、裏返した要素は再び自分自身であり、他の要素とペアを成さない。
2,2 2,3 2,4 2,5 2,6 2,7$ A B C D E F 3,3 3,4 3,5 3,6$ 3,7? G H I J e 4,4 4,5$ 4,6? 4,7? K L i d 5,5? 5,6? 5,7? k h c 6,6? 6,7? g b 7,7? a
この三角形状の図に含まれる要素の総数は、次のように、三角数で表される:
例えば、組み合わせを例示した m = 8 のケースでは、この値は T(6) = 21 となる。
例えば、主鎖の長さを 8 として(オクタン骨格)、「x-エチル-y,z-ジメチル」オクタンを考えよう。次の図は、3-エチル-2,2-ジメチルオクタンを表している。
1 2 3 4 5 6 7 8 C C C C-C-C-C-C-C-C-C C
3-Ethyl-2,2-dimethyloctane
という名称では、Ethyl
が dimethyl
より先に紹介されている。素朴に考えると、これはアルファベット順というルールに反しているように見える。
実は、IUPAC名における「アルファベット順」では、枝の数を表す di-
, tri-
, tetra-
, … は原則として無視されることになっている。
つまり、「メチル」「ジメチル」「トリメチル」…は、IUPAC名におけるアルファベット順ソートに関する限り、全て「メチル」と同じ扱いになる。そのため「3-エチル-2-メチル」と同様に、「3-エチル-2,2-ジメチル」が正しい順序となり、「2,2-ジメチル-3-エチル」とはならない。
ただし、「ジ」「トリ」などが複雑な枝の名前の一部として「枝の枝(小枝)の数」を表している場合は、それもアルファベット順に含めて考える。例えば「tert-ブチル」の意味の「1,1-ジメチルエチル」は d から始まる枝の名前として扱われる。
この主鎖において、エチルが単独で付くことのできる場所の数は:
すなわち、エチルは 3
または 4
の 2 カ所に付くことができる。これらのエチルの付け方の一つ一つについて「可能なジメチルの配置」を考え、掛け算してやればいい。
主鎖の長さが偶数の場合、エチルが1個付いた主鎖は(エチルがどこに付く場合でも)左右対称でなくなるため、その主鎖上における「2個のメチルの可能な配置」の数は、基本的には「お」によって与えられる:
ただし、一つの炭素には枝が2個までしか付くことができないのだから、エチルが 3
に付いたとすると、3,3
-ジメチルは物理的に不可能だ。また、エチルが 4
に付いたとすると、4,4
-ジメチルは物理的に不可能だ。従って、一つのエチルの位置に対して、真に可能なジメチルの種類の数は Ȼ{1,1}(8) より 1 小さくなる。
ゆえに、オクタン骨格にエチルが1個・メチルが2個付いた異性体の種類の数は:
一般に、主鎖の長さが 4 以上の偶数 e のとき、エチルが単独で付くことのできる場所の数は:
これらのエチルの付け方の一つ一つについて、真に「可能なジメチルの配置」の数は:
ゆえに:
例えば、主鎖の長さが 9 だとする(ノナン骨格)。次の図は、5-エチル-2,2-ジメチルノナンを表している。
1 2 3 4 5 6 7 8 9 C C C C-C-C-C-C-C-C-C-C C
エチルが付く場所は 3
か 4
か 5
だが:
3
か 4
に付いた場合、主鎖の長さが偶数の場合と同様に、ジメチルの行き先が Ȼ{1,1}(9) − 1 = T(9 − 2) − 1 = 27 に増える。5
に付く場合は、左右対称性が保たれるため、ジメチルが付いていい場所は増えず、基本的には C{1,1}(9) = (9 − 1)2/4 = 16 のまま。ただし、この場合 5
にエチルが付いているので、5,5
-ジメチルは物理的に不可能。よって、真に可能なジメチルの組み合わせは 15 となる。要するに、エチルについて、2 個のケースでジメチルの取りうる配置が 27 種類、1 個のケースでジメチルのとりうる配置が 15 種類であり、合計すれば:
一般に、主鎖の長さが 5 以上の奇数 d のとき、C{2}(d) 種類のエチルの位置の一つ一つを考えると…
すなわち、C{2}(d) 通りのケースのうちで、例外になるのは 1 個だけで、残りの C{2}(d) − 1 個のエチルの位置については、Ȼ{1,1}(d) − 1 が適用される。
ゆえに:
「き」は d = 3 に対しても、化学的に正しい値を返す。
「か」「き」には、「x-エチル-y-メチル」の場合と同様の問題がある。すなわち、「x-エチル-y,z-ジメチル」の正しい総数を与えてくるものの、正しいIUPAC名を生成するためには、名前の有効性をチェックして、必要に応じて枝の向きを逆にする必要がある。例えば「3-エチル-7,7-ジメチルオクタン」と「6-エチル-2,2-ジメチルオクタン」は同じ名前の裏表だが、大小の定義により後者が有効で前者は無効となる。(2, 2, 6) の方が (3, 7, 7) より小さいからだ。
§4.1と同様に c を定義しよう。すなわち、主鎖の長さ m が奇数なら c = (m + 1)/2、m が偶数なら c = m/2 とする。このとき、x = 3, 4, 5, …, c の一つ一つについて、(y, z) のあらゆる組み合わせを考えることで「x-エチル-y,z-ジメチル」を全種類をリストアップすることができるが、その際、もし「z がエチルの裏番号 (m + 1) − x より大きい」か、または「z がエチルの裏番号に等しく、かつ y > c」なら、その枝番号の組み合わせについては裏返す必要がある。
主鎖の長さが奇数の場合には、裏の名前と表の名前の大小が一致してタイブレーク(規則A2.4)が発動されるケースがある。「z がエチルの裏番号に等しく、かつ y = c」となる場合だ。例えば「3-エチル-4,5-ジメチルヘプタン」の裏の名前は「5-エチル-3,4-ジメチルヘプタン」であり、枝の位置だけを抜き出せばどちらも (3, 4, 5) となる。このような場合、先に紹介される枝が小さい枝番号を与えられるため、「3-エチル-4,5-ジメチルヘプタン」が正しいIUPAC名となる。
一方、「3-エチル-6,6-ジメチルオクタン」と「6-エチル-3,3-ジメチルオクタン」に関しては、(3, 6, 6) は (3, 3, 6) より大きいのだから、自動的に後者が有効になる。「3-エチル-6-メチルオクタン」と「6-エチル-3-メチルオクタン」の場合はタイブレークとなり、前者が採用されたが、それとは状況が異なる。
組み合わせマップは次のようになり、これまでよりやや複雑だ。
3Et| 2,2 2,3 2,4 2,5 2,6 2,7$ | 3,3# 3,4 3,5 3,6$ 3,7@ | 4,4 4,5$ 4,6 4,7@ | 5,5 5,6@ 5,7@ | 6,6@ 6,7@ | 7,7@ 4Et| 2,2 2,3 2,4 2,5 2,6 2,7$ | 3,3 3,4 3,5 3,6$ 3,7@ | 4,4# 4,5$ 4,6@ 4,7@ | 5,5@ 5,6@ 5,7@ | 6,6@ 6,7@ | 7,7@ 5Et| 2,2 2,3 2,4 2,5 2,6 2,7$@ | 3,3 3,4 3,5 3,6$@ 3,7@ | 4,4 4,5$@ 4,6@ 4,7@ | 5,5#@ 5,6@ 5,7@ | 6,6@ 6,7@ | 7,7@ 6Et| 2,2 2,3 2,4 2,5 2,6 2,7$@ | 3,3 3,4 3,5@ 3,6$@ 3,7@ | 4,4@ 4,5$@ 4,6@ 4,7@ | 5,5@ 5,6@ 5,7@ | 6,6#@ 6,7@ | 7,7@
大ざっぱにいえば、「$
ライン」より左(2,2
から見て手前)の要素は意味的に有効、「$
ライン」より右の要素は意味的に無効。特に、中央付近の三角形(上の例では 4Et
ブロックと 5Et
ブロック)においては、この規則が例外なく成り立つ。ここで「中央付近の三角形」というのは、m が奇数ならエチルの位置が c であるブロック、m が偶数ならエチルの位置が c または c + 1 であるブロックを指す。
エチルの番号が c より小さいときは、「$
ライン」より右にも意味的有効要素が現れることがある。この傾向は、エチルの番号が小さければ小さいほど強まる。逆に、エチルの番号が大きくなればばるほど、「$
ライン」より左にも意味的無効要素が現れるようになる。正確には次の規則に従う:
$
要素」は x ≤ c なら意味的に有効、そうでなければ意味的に無効。3Et5,5
がこの例で、「$
ライン」の右側に当たるにもかかわらず @
にならない。他方、その「裏」の位置(後述)は意味的無効となる。各ブロックの上から ~x 行目以降がこれに当たる。3Et4,6
がこの例で、「$
ライン」より右にあるにもかかわらず @
になっていない。他方、各ブロックの上から ~x − 1 個目の行については、z ≥ c なら意味的に無効、そうでなければ意味的に有効。$
ライン」より右の要素は全て意味的に無効。他方、上から ~x − 2 個目までの行において、「$
ライン」より左の要素は全て意味的に有効。上記のようになる理由は難しくはないが、「異性体の数の公式」という本題とは関係ないので、ここでは立ち入らないことにする。今は公式「か」「き」の正当性を確かめることに集中しよう。
実は、上のマップの例では、3Et
ブロックの要素を裏返した要素は 6Et
ブロックにある。ブロックの違いを無視して、三角形内部における相対的な位置関係だけを問題にすると、ジメチルだけで考えた場合の表裏のペアと同様に、ある要素の裏の要素は「$
」ラインに対する対称の位置に現れる。
3Et| 2,2 2,3 2,4 2,5 2,6 2,7$ A B C D E F | 3,3# 3,4 3,5 3,6$ 3,7@ G H I J K | 4,4 4,5$ 4,6 4,7@ L M N O | 5,5 5,6@ 5,7@ P Q R | 6,6@ 6,7@ S T | 7,7@ U 6Et| 2,2 2,3 2,4 2,5 2,6 2,7$@ u t r o k f | 3,3 3,4 3,5@ 3,6$@ 3,7@ s q n j e | 4,4@ 4,5$@ 4,6@ 4,7@ p m i d | 5,5@ 5,6@ 5,7@ l h c | 6,6#@ 6,7@ g b | 7,7@ a
同様に、4Et
ブロックの要素を裏返した要素は 5Et
ブロックにある。IUPAC名として正しい名前は「A
とa
」「B
とb
」「C
とc
」…の各ペアのうち、それぞれどちらか一方だけだが、組み合わせの種類がいくつあるのか知りたいだけなら「A
」「B
」「C
」…を数えれば十分であり、従って、前半のブロックだけを考えればいい。「か」の計算は、まさにそのような考え方に対応するものだった。
一般に、このタイプのマップを構成する三角形状のブロックを順に積み重ねた三角柱を考えると、ある要素 v(例: 3Et2,2
)を裏返した要素 ~v(例: 6Et7,7
)は、次の位置に現れる。
$
ライン」に対して対称の位置にある。主鎖の長さが奇数の場合の「き」についても、ほとんど同様に説明されるが、この場合、エチルの位置が c のときの三角形(言い換えると W 上にあるブロック)に含まれる要素については、各要素の裏の要素が同じ三角形内に現れる。その場合の裏表の対応は、ジメチルだけで考えた場合の裏表の対応と同様になり、有効な要素数は(1個の物理的無効要素を別にすれば)通常のジメチルの公式と同一になる。「き」の計算は、まさにそのようになっていた(ある一つのエチルの位置については通常のジメチルの公式に準じ、それ以外のエチルの位置については、主鎖の長さが偶数の場合と同じ)。
結局、「か」「き」いずれにおいても、表の名前・裏の名前のどちらがカウントされるのかは一定しないものの、トータルで見ると、全部の可能な枝の組み合わせが過不足なく一度ずつカウントされている。
合計炭素数12のドデカンには、主鎖の長さが 8 で枝が {2,1,1} という異性体が存在するが、「か」によればこのような異性体は 40 種類ある。実際に List of isomers of dodecane を見ると、3-Ethyl-2,2-dimethyloctane
をはじめ40種類がリストアップされていることを確認できる。
合計炭素数11のウンデカンには、主鎖の長さが 7 で枝が {2,1,1} という異性体が存在するが、「き」によればこのような異性体は 22 種類ある。実際に List of isomers of undecane を見ると、3-Ethyl-2,2-dimethylheptane
をはじめ22種類がリストアップされていることを確認できる。
主鎖の長さ e を 4 以上の偶数とする。この主鎖上において、ジメチルが単独で付くことができる場所を考えると:
2,2 2,3 2,4 2,5 2,6 2,7$ 3,3 3,4 3,5 3,6$ 4,4 4,5$
そのうち (e − 2)/2 カ所については対称性が保たれ(「$
要素」に当たる)、残りの 1 + 3 + 5 + … + (e − 3) = (e − 2)2/4 カ所については対称性が破られる。さらに、(e − 2)/2 カ所については2個のメチルが同じ炭素 y に付くが、このうち 2,2
を除く (e − 4)/2 カ所については、「y-エチル-y,y-ジメチル」の形の物理的無効要素を発生させる。従って:
「か」と同じ結果が得られた。
主鎖の長さ d を 5 以上の奇数とする。この主鎖上において、ジメチルがそれだけで付ける場所を考えると:
2,2 2,3 2,4 2,5 2,6 2,7 2,8$ 3,3 3,4 3,5 3,6 3,7$ 4,4 4,5 4,6$ 5,5$
そのうち (d − 1)/2 カ所については対称性が保たれ(「$
要素」に当たる)、残りの 2 + 4 + 6 + … + (d − 3) = (d − 1)(d − 3)/4 カ所については対称性が破られる。さらに、(d − 1)/2 カ所については2個のメチルが同じ炭素 y に付くが、このうち 2,2
を除く (d − 3)/2 カ所については、「y-エチル-y,y-ジメチル」の形の物理的無効要素を発生させる。従って:
「き」と同じ結果が得られた。
「シンプルな列挙法によりIUPAC名を生成するとき、裏返さなければならない名前の数」を転倒の数と呼ぶことにしよう。一般に、2種類の枝 α と β から成る枝の組み合わせを考えるとき、「最初に α の位置を考えてその一つ一つに対して可能な β の位置を考える」方法でも、その逆の方法でも、組み合わせの総数という点では同じ結果が得られるが、「短い枝を先に考えた場合の転倒の数」は「長い枝を先に考えた場合の転倒の数」以下になり、差は大きいこともある。従って、シンプルな列挙法によって名前を生成する場合、実用上、短い枝を先に考えた方が便利かもしれない。もっとも、どちらが計算が簡単かということは、また別問題だ。
最後に、複数個のエチルについても考えておこう。
エチルアルカンについての計算は、メチルアルカンについての計算に帰着された(§2.2)。 より一般的に、エチル、ジエチル、トリエチル…の公式は、それぞれメチル、ジメチル、トリメチル…の公式において m を m − 2 で置き換えたものに等しい。ただし m は 3 以上の整数とする。
実際、異性体の数を問題にする限りにおいて、エチル基は、「左右の端から2番目の炭素に付くことができない」という制限を除けば、メチル基と全く同様に振る舞う。 つまり、主鎖の長さが同じなら、枝が付くことができる場所が2個減るが、それ以外の点ではメチル、ジメチル、トリメチル…の公式と同じになる:
特に、ジメチルの公式の m を m − 2 で置き換えれば、ジエチルの公式が得られる:
C{2,2}(m) = ⌊(m − 3)2/4⌋ = | ⎧ ⎨ ⎩ |
(m − 3)2/4 (m ≥ 3: 奇数) (m − 2)(m − 4)/4 (m ≥ 4: 偶数) |
合計炭素数12のドデカンには、主鎖の長さが 8 で枝が {2,2} という異性体が存在するが、上の公式によればこのような異性体は 6 種類ある。実際に List of isomers of dodecane を見ると、3,3-Diethyloctane
をはじめ6種類がリストアップされていることを確認できる。
「オクタン骨格(C8)にエチルを2個付ける場合の組み合わせの数」と「ヘキサン骨格(C6)にメチルを2個付ける場合の組み合わせの数」が等しいことは、次の図からも明らかだろう。
1 2 3 4 5 6 7 8 1 2 3 4 5 6 C C C C-C-C-C-C-C-C-C C-C-C-C-C-C C C C 3,3 3,4 3,5 3,6$ 2,2 2,3 2,4 2,5$ 4,4 4,5$ 3,3 3,4$
m を 3 以上の整数とする。
§4.1によれば:
C{2,1}(m) = | ⎧ ⎨ ⎩ |
(m − 3)2/2 (m: 奇数) (m − 2)(m − 4)/2 (m: 偶数) |
§4.3によれば:
C{2,2}(m) = | ⎧ ⎨ ⎩ |
(m − 3)2/4 (m: 奇数) (m − 2)(m − 4)/4 (m: 偶数) |
§4.2によれば:
C{2,1,1}(m) = | ⎧ ⎨ ⎩ |
(m − 3)(m2 − 4m + 1)/4 (m: 奇数) (m − 3)(m2 − 4m)/4 = m(m − 3)(m − 4)/4 (m: 偶数) |
2015年10月18日版: 2015年10月25日公開予定の記事のテスト版(下書き・未完成)。
炭素数3の枝には、ストレートなプロピル基と、小枝を持つイソプロピル基の2種類が存在する。
C | C C | | C C-C | | ▲ プロピル基(左)とイソプロピル基(右)
念のために水素も表記すると:
H HCH | H HCH HCH | | H HCH HC - CH | | H
どちらも炭素数は 3 だが、枝の長さという点では、プロピルは長さ 3 だが、イソプロピルは長さが 2 しかない。
プロピル基とイソプロピル基は、どちらも「プロパンの H
が1個取れた形」をしている。プロパンから、両端の炭素につながる H
がどれか1個取れるとプロピル基、中央の炭素につながる H
がどれか1個取れると、イソプロピル基となる。
H H H H H H H H H HC-C-CH HC-C-C- HC-C-CH H H H H H H H | H ▲ 左からプロパン、プロピル基、イソプロピル基
メチルが主鎖末端の炭素に付くことができず、エチルが末端から2個以内の炭素に付くことができないのと同様、プロピルは末端から3個以内の炭素に付くことができない(§2.2)。主鎖の端から4番目以降の炭素には自由に付くことができるが、主鎖の対称性があるデフォルトの状態では、主鎖の中央より向こう側に付くことはできない。プロピルが付くことができる位置に、代わりにイソプロピルが付くこともできる。次の図は、4-プロピルノナンと4-イソプロピルノナンを表している。
C | C C | | C C-C | | C-C-C-C-C-C-C-C-C C-C-C-C-C-C-C-C-C 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 ▲ 4-プロピルノナン(左)と4-イソプロピルノナン(右)
この場合、枝の位置は「5-プロピル」や「5-イソプロピル」になることもできるが、「6-プロピル」「6-イソプロピル」は裏返せば「4-プロピル」「4-イソプロピル」と同じなので、意味的に無効。
直鎖のプロピルは、骨格の左右の端から3番目までの炭素・計6個には付くことができないので、メチルと比べると、同一骨格において、付くことができる場所が4個少ない。比較として、エチルの場合は、メチルと比べると、同一骨格において付くことができる場所が2個少ない。
従って、直鎖のプロピルが付いた異性体の数は、メチルの公式で主鎖の炭素数を4減らしたものに帰着される。例えば、プロピルオクタン(C8骨格)の種類の数は、メチルブタン(C4骨格)の種類の数に等しい。
一般に、CB(m) のうち、(小枝のない)直鎖の枝だけを考えたものを C̅B(m) とすると:
このうち C̅{2}(m) は C{2}(m) に等しい。C{3}(m) は、上記の C̅{3}(m) に「イソプロピルが付く場合の数」を足し合わせたものになる。
主鎖の長さが m のとき、プロピルが単独で付くことができる位置は ⌊(m − 5)/2⌋ カ所であり、これは m が 5 以上の奇数なら (m − 5)/2、m が 6 以上の偶数なら (m − 6)/2 に等しい。
実は、イソプロピルが単独で付くことができる位置も全く同じ数であり、C3枝が単独で付くことができる位置は上記の数の2倍になる:
C{3}(m) = 2⌊(m − 5)/2⌋ = | ⎧ ⎨ ⎩ |
m − 5 (m ≥ 5: 奇数) m − 6 (m ≥ 6: 偶数) |
「あ」 |
イソプロピルはプロピルより長さが短いのに、なぜプロピルと同じ位置にしか付けないのか?
これは数学の問題というより、化学における定義の問題だ。すなわち…
概念的には、下図・左のように「端から3番目の位置」にイソプロピルを付けることができる。この場合、右の図のようにイソプロピルの先端を 1
と再解釈したとしても、その方が主鎖が長くなるわけではない。つまり「主鎖の長さ」という点では、左側の解釈も「あり」だろう。
C 1C | | C-C 2C-C | | C-C-C-C-C-C-C-C-C C-C-C-C-C-C-C-C-C 1 2 3 4 5 6 7 8 9 3 4 5 6 7 8 9
もし左の解釈が正しければ、この異性体は「3-イソプロピルノナン」だが、もし右の解釈が正しければ、この異性体は「3-エチル-2-メチルノナン」となる。どちらの解釈でも主鎖の長さは 9 になるので、「長い方が偉い」というだけでは、どこが主鎖になるのか決定できない。
実はIUPAC名では、「炭素のつながり方が一番長い場所」が複数ある場合、「直接つながる枝の数が多い方が主鎖である」という判定が行われる。そうすると、
3
にイソプロピルがつながっているだけで「枝の数」は1だが、2
にメチル、3
にエチルがつながっていて、「枝の数」は2。結局、右の解釈の「勝ち」になる。
この理由のため、イソプロピルは、単独では 3
に付くことができず、プロピル同様、端から4番目以降の位置であることを要求されてしまう。
「枝が多い方が偉い」というルールは真意がつかみにくいが、直観的にいえば「多くの枝道がある道路は幹線と呼ばれる」ということだろう。異性体の分類において、この種のルールは重要な役割を果たす。実際、「3-エチル-2-メチル」は既に§4.1でカバー済みの枝配置であり、もし「3-イソプロピル」を別の異性体だと考えると、同じ異性体を二重に数えてしまうことになる。こういった混乱を防ぐためには「どこが主鎖なのか・この異性体の名前は何なのか」という定義が明確になっていなければならない。
主鎖の選択に関連して、既に「枝番号が小さい方が偉い」という別のルールが使われている。これは主鎖の向きを決定するとき常用される重要な規則で、しばしばこれによって意味的有効・無効が決まるのだが、規則の適用順序としては「枝が多い方が偉い」の方が優先順位が高い。同じ長さの主鎖候補が複数ある場合、最初に「直接つながる枝の数が多い方が主鎖である」という判定が行われ、第2に「枝番号が小さくなる方が主鎖である」という判定が行われる。例えば、次のシチュエーションを考えてみよう。
(b) C 1 CC 2 C 3 C | (a) C-C-C-C-C-C-C-C (c) C 1 2 3 4 5 6 7 8
この異性体の名前は何か。もし「枝が多い方が偉い」が優先されるなら (a) の炭素が 1
となり「3,3-ジメチル-4-なんとかオクタン」となるが、もし「枝番号が小さい方が偉い」が優先されるなら (b) の炭素が 1
となり「2-メチル-4-かんとかオクタン」となる。ここで「なんとか」は小枝を1個持つ4炭素の枝の名前、「かんとか」は小枝を2個持つ5炭素の枝の名前だが、その部分は今は関係ない。重要なのは「規則の適用順序により、最初に (a) が主鎖の一部であることが決定される」ということだ。その後で、今度は「枝番号が小さい方が偉い」という規則が適用され、(a) と (c) のどちらが 1
になるかが決定される。
イソプロピルはよく使われる慣用名であり、IUPAC名としても有効だが、系統的に構成された名称ではない。
イソプロピル基を指す系統名は2種類あって、1-メチルエチル(1979年勧告 A-2.25)、またはプロパン-2-イル(1993年勧告 R-2.5) となる。規定上、2013年12月以降、後者が PIN すなわち Preferred IUPAC name(好まれるIUPAC名)となったが、PIN 以外の「イソプロピル」と「1-メチルエチル」も引き続き有効。2015年現在、このケースの PIN はあまり普及していない。この記事では慣用名として「イソプロピル」、系統名として「1-メチルエチル」を使う。
「1-メチルエチル」は、「エチル基の 1
番の炭素に、メチル基が付いている」という単純明快な呼び方。枝の炭素の一つ一つにも番号が付いていて、枝の付け根に近い側が 1 となる。以下の図は4-(1-メチルエチル)ヘプタンを表している。
2 C | 1 C-C | C-C-C-C-C-C-C
「小枝のある枝」を表す系統名は、意味を明確にするために丸かっこで囲まれることが多い(「イソプロピル」は系統名ではないので例外)。次の三つは同じ意味になる:
4-(1-メチルエチル)ヘプタンのような丸かっこの使い方は、枝構造の階層に対応している。
4
に、この (1-メチルエチル)という枝が付いていることを表す。「あ」によれば、ヘプタン骨格(C7)にC3枝が付く組み合わせは2種類存在する:
これらは10炭素(デカン)の異性体に当たる。List of isomers of decane によっても確認できる。
オクタン骨格(C8)にC3枝が付く組み合わせも2種類存在する:
これらは11炭素(ウンデカン)の異性体に当たる。List of isomers of undecane によっても確認できる。
ノナン骨格(C9)にC3枝が付く組み合わせは4種類存在する:
これらは12炭素(ドデカン)の異性体に当たり、List of isomers of dodecane によって確認することができる。
ある長さの主鎖について、メチルが1個、C3枝(プロピルまたはイソプロピル)が1個付く異性体は何種類あるか?
大筋では「エチル1個とメチル1個」(§4.1)と同様に考えることができるが、トリッキーな付加要素がある。
複数の枝の組み合わせについて、一つ一つの枝がいずれも「単体でも可能な位置」にあるとき、その組み合わせを自由な配置と呼ぶことにする。ただし「自由」の定義に関する限り、裏返した名前の方が小さい場合の意味的に無効な配置も「単体で可能」と見なす(名前が間違っているだけで配置そのものは可能なので)。これまでに考えた配置はすべて自由な配置だったが、イソプロピルとメチルの組み合わせでは「自由でない」組み合わせ、すなわち「単体では不可能だが別の枝のアシストによって可能になる配置」が存在している。
次の図は2-メチル-4-プロピルオクタンを表している。アルファベット順の関係で、この場合「メチル」(methyl
)が「プロピル」(propyl
)より先に紹介される。
C C C C C-C-C-C-C-C-C-C 1 2 3 4 5 6 7 8
「x-エチル-y-メチル」の場合と同様、「x-メチル-y-プロピル」の組み合わせの数を決定するには、基本的には、単体で可能な x の一つ一つについて可能な y の種類を考えて、掛け算してやればいい。この場合、プロピルの代わりにイソプロピルが付く場合の組み合わせについても併せて考える必要がある。
主鎖の長さを 6 以上の整数 m とする。単体で可能なメチルの配置は C{1}(m) 種類だが、その付加によって一般には主鎖の対称性が破れる。対称性が破れた主鎖上において、C3枝は、左端の3個と右端の3個(計6個)を除く m − 6 個の炭素のどこにでも付くことができる。しかも、同じ炭素に対して、プロピルとイソプロピルの2パターンで付くことができるのだから、組み合わせの数は2倍となる:
さて、m が偶数の場合、メチルの付加によって常に対称性が破れるのだから、メチルとプロピル(またはイソプロピル)には以下の自由な組み合わせが存在する:
一方、m が奇数の主鎖にメチルを付加した場合、メチルが中央炭素に付加される 1 種類のパターンにおいては主鎖の対称性が保たれ、残りの C{1}(m) − 1 種類のパターンについては主鎖の対称性が破れるのだから、プロピル(またはイソプロピル)との自由な組み合わせの数は:
ここまでの計算は簡単だった。
ちなみに、C3枝単体の位置を先に考えて、その一つ一つに対してC1枝の位置を考えても同じ結果が得られる。m が偶数の場合、次のようになって「う」と一致する:
m が奇数の場合、中央炭素にプロピルまたはイソプロピルが付くという2種類のケースでは対称性が保たれ、それ以外のケースでは対称性が破れるのだから、次のようになって「え」と一致する:
プロピルが 4
以降にしか付かないのは明白だが、イソプロピルが 4
以降にしか付かない理由は微妙だ。例えば、「3-イソプロピルオクタン」を考えてみると…
1 2 3 4 5 6 7 8 C 1 C | | C-C 2 C-C | | C-C-C-C-C-C-C-C C-C-C-C-C-C-C-C 3 4 5 6 7 8
第1の解釈が駄目で第2の解釈が採用される理由は、「その方が主鎖が持つ枝の数が多いから」というものだ。要するに「3-イソプロピルは主鎖の枝が少な過ぎるから駄目!」というのだ。
ところが、今は「C3枝とC1枝の2個を付ける」ことを考えている。イソプロピルを単独で 3
に付けるのは駄目だったが、今は持ち駒にC1枝がある。それをうまい場所に付ければ…。「もう枝が少な過ぎるとは言わせないぞ!」というリベンジが可能にならないだろうか?
これは、それほど単純な問題ではない。例えば適当に 6
あたりにメチルを付けてみると…
1 2 3 4 5 6 7 8 C 1 C | | C-C C 2 C-C C | | | | C-C-C-C-C-C-C-C C-C-C-C-C-C-C-C 3 4 5 6 7 8
第1の解釈「3-イソプロピル-6-メチルオクタン」では確かに主鎖に付く枝が2個に増えたが、第2の解釈「3-エチル-2,6-ジメチルオクタン」でも主鎖に付く枝が増え、こちらは枝が3個になってしまった。自分の枝が増えても、ライバルの枝も増えるので、これでは「どっちが偉いか」を逆転させられない。この理由により、いくらメチルのアシストがあっても、「3-イソプロピル-x-メチル」は、ほとんどの x に対して無効になってしまう。
しかし、一つだけ道がある。「自分の主鎖だが、ライバルの主鎖ではない」ところに枝を生やせば、自分の枝だけ増えてライバルの枝は増えないので、差が縮まる。メチルを 2
に付ければ!
1 2 3 4 5 6 7 8 C 1 C | | C-C 2 C-C | | C-C-C-C-C-C-C-C C-C-C-C-C-C-C-C | | 3 4 5 6 7 8 C C
第1の解釈「3-イソプロピル-2-メチルオクタン」は、これでライバルに並んだ(主鎖の長さでも枝の数でも)。そればかりか、ライバルの解釈で主鎖を選択しても、今やそちらも同じ「3-イソプロピル-2-メチルオクタン」だ。折り紙の「だまし舟」のような、不思議な構造が現れた。
主鎖の 3
にある三差路において「8
に続く主鎖」以外の二つの「道」を考えると、どちらに進んでもその先には同じ「Y字構造」(=イソプロピル)がある。今まで何度も登場した左右対称とは意味が違うけれど、ある種の対称性(どちらに進んでも同じパターン)が生じている…。そのため、そのどちらを主鎖だと見なしても、主鎖だと見なされずに側鎖になった側は「3-イソプロピル」ということになる。興味深い構造だ。
結局、主鎖の長さが 6 以上のとき、2
にメチルがある場合限定で、イソプロピルは 3
に付くことができる。この特殊な1種類の配置のため、C{3,1}(m) の値は、「う」「え」より 1 大きくなる:
C{3,1}(m) = | ⎧ ⎨ ⎩ |
m2 − 8m + 13 (m ≥ 6: 偶数) m2 − 8m + 14 (m ≥ 7: 奇数) |
「お」 |
主鎖の長さが 6 の場合、{3} 単体はどこにも付けられないが、{3, 1} なら、1種類のみだが、3-イソプロピル-2-メチルヘキサンが存在する。系統名で言えば2-メチル-3-(1-メチルエチル)ヘキサンだ。
1 2 3 4 5 6 C C | | C-C C-C | | C-C-C-C-C-C C-C-C-C-C-C | | C C
このアルカンは合計炭素数10であり、デカンの異性体だ。「3-イソプロピル-2-メチル」は成立するが、「3-イソプロピル-4-メチル」(右の図)や「3-イソプロピル-5-メチル」は成立しない、という点に注意。「3-イソプロピル-4-メチル」のような形の異性体はもちろん存在するが、定義によって、どこが主鎖になるかの解釈が異なる。すなわち、6
の位置はそれでいいとして、「イソプロピル基の先端」に見える場所が主鎖の 1
になる(その方が主鎖が持つ枝の数が多いから)。
主鎖の長さが 5 のときには、2
にメチルがあっても、それだけではイソプロピルは 3
に付くことができない。
1 2 3 4 5 C 5C | | C-C 4C-C | 1 2 | C-C-C-C-C C-C-C-C-C | | 3 C C
というのも、その場合、2カ所の「Y字構造」を両方通過するように主鎖を選択すれば、3個の枝を持つ2,4-ジメチル-3-エチルペンタンと解釈することができる。そして、その解釈は「3-イソプロピル-2-メチルペンタン」という解釈より優先される。主鎖の長さは同じで、主鎖に直接つながる枝の数が多いからだ。従って:
「イソプロピル」(isopropyl
)については、アルファベット順の関係で、「メチル」と並べる場合の順序がただの「プロピル」とは逆になる。プロピルの場合、例えば「2-メチル-4-プロピル」「2-メチル-5-プロピル」のようになるが、イソプロピルの場合は逆順の「4-イソプロピル-2-メチル」「5-イソプロピル-2-メチル」が使われる。この場合、系統名を使うなら、「2-メチル-4-(1-メチルエチル)」「2-メチル-5-(1-メチルエチル)」のように「プロピル」の場合と同じ紹介順序になる。
アルファベット順によって紹介順序が入れ替わる現象と、$
要素(=表・裏で名前に大小の差がない要素)についての「判定ルール」が組み合わさると、以下の例のような、微妙で分かりにくい問題が発生する。
1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 C C C C CC | | C-C-C-C-C-C-C-C C-C-C-C-C-C-C-C C C 8 7 6 5 4 3 2 1 8 7 6 5 4 3 2 1
さて、「x-メチル-y-プロピル」を x Mt y
と略記して、主鎖の長さが m = 8 の場合の組み合わせマップを作ると:
2Mt4 2Mt5 3Mt4 3Mt5 4Mt4 4Mt5$ 5Mt4$@ 5Mt5@ 6Mt4@ 6Mt5@ 7Mt5@ 7Mt5@
「エチルとメチル」の場合と同様、同一の枝の組み合わせについての表・裏の名前のペアは、マップ上で長方形の中心に対する点対称の位置にある。枝番号の組み合わせが左右対称(両端から等距離)になる「$
ライン」を境に、意味的有効・無効が分かれ、「$
要素」自身については、判定により、アルファベット順で先になる枝が小さい番号になるような組み合わせが有効となる。
上記のマップには6個の有効要素が含まれるが、プロピルをイソプロピルに置き換えても同じ組み合わせが成り立つため、このマップは実質12種類の要素を持つ。これは「う」の計算と一致する。この他、マップ外に特例的な配置、3-イソプロピル-2-メチルオクタンがあるため、合計では13種類となる。これは「お」の計算と一致する。「3-イソプロピル-2-メチル」は、系統名で言えば「2-メチル-3-(1-メチルエチル)」だ。List of isomers of dodecane を見れば、このタイプの異性体が 2-Methyl-4-propyloctane
をはじめ13種類であることを確認できる。
公式「う」「え」では、「x-メチル-y-プロピル」の x を x = 2, 3, 4, …, (m − 1)/2 に固定して異性体の数を考えているが、これはマップの上半分だけを考えることに当たる。
「x-メチル-y-プロピル」の y を先に考えても同じ公式が得られる(マップの左半分だけを考えることに相当する)。ただし、その考え方だと、転倒の数、つまり「機械的な組み合わせで生成された名前のうち、正しいIUPAC名から見ると裏返しになっているものの数」が、かなり多くなってしまう。一般に、長い枝を先に考えた場合の転倒の数は、短い枝を先に考えた場合の転倒の数以上になる。
上記のオクタン骨格の例では、メチルを先に考えれば転倒が全く発生しないが、一般には、メチルを先に考えたからといって常にそううまくいくとは限らない。名前を裏返す手間をなくしたければ、上記のようなマップの全体を想定して「$
ライン」までの台形状の領域を考えればいいだろう。
主鎖の長さ m(6 以上とする)が与えられたとき、枝 {3, 1, 1} を持つアルカンは何種類あるか?
答えは「y,z-ジメチル-x-プロピル」の種類の数 a と「x-イソプロピル-y,z-ジメチル」の種類の数 a′ の和だが、「3-イソプロピル-2-メチル」の特例から派生するパターンをひとまず無視すれば、a と a′ は等しい。つまり、「y,z-ジメチル-x-プロピル」の一つ一つにおいて、プロピル基をイソプロピル基に置き換えたものは、それぞれ別の有効な異性体となる。
従って、問題の核心は、「y,z-ジメチル-x-プロピル」が何種類あるのか数えることだが、これについては y,z の組を先に選択して、その一つ一つに対して可能な x の数を考えてもいいし、逆に先に x を選択して、その一つ一つに対して可能な y,z の組み合わせの数を考えてもいい。後者のアプローチの方が簡単なので、それを先に考え、前者の方法は別解としよう。
問題の残りは、特例配置から派生する「3-イソプロピル-2,z-ジメチル」が何種類あるかだが、これは簡単に分かる: z = 2, 3, 4, …, m − 1 のどれかなのだから m − 2 種類だ。
要するに、特例配置を含めると a′ = a + (m − 2) であり、
ということになる。
特例配置を別にすれば、「x-プロピル」または「x-イソプロピル」という枝の配置は合計 C{3}(m) = m − 6 種類存在する。そして、その一つ一つに対して可能である「y,z-ジメチル」の組み合わせの数は、大筋において
に等しい。主鎖の長さが偶数なら、プロピルまたはイソプロピルが付いたとき常に対称性が破れるからだ。
ただし、x = y = z という「x,x-ジメチル」だけは物理的に不可能。従って、真に可能なジメチルの組み合わせは、上記の三角数マイナス 1 となる。
そうすると、「か」において:
ゆえに:
主鎖の長さが 6 の場合、枝集合 {3, 1, 1} を持つ異性体としては、「3-イソプロピル-2-メチル」の特例を利用した「3-イソプロピル-2,z-ジメチル」ヘキサンのみが存在する(z = 2, 3, 4, 5)。「く」は、この m = 6 のケースにも対応している。
特例配置を別にすれば、「x-プロピル」または「x-イソプロピル」という枝の配置は合計 C{3}(m) = m − 5 種類存在する。そのうち、中央炭素にプロピルまたはイソプロピルが付く 2 種類の配置においては対称性が保たれるので話が違ってくるが、残りの m − 7 種類の配置では主鎖の対称性が破れ、主鎖の長さが偶数の場合と同様の計算が成り立つ。
対称性が保たれる 2 種類の配置のどちらに対しても、可能である「y,z-ジメチル」の組み合わせの数は、大筋において
に等しい。ただし、この場合も、2個のメチルがC3枝と同じ炭素に付こうとする「x,x-ジメチル」だけは物理的に不可能なので、真に可能な組み合わせは、上記の数マイナス 1 となる。
そうすると:
ゆえに:
主鎖の長さが 5 の場合、枝集合 {3} を持つ異性体が存在しないのはもちろん、「3-イソプロピル-2-メチル」の特例を利用しても、枝集合 {3, 1} を持つ異性体も構成できなかった。ところが、枝集合 {3, 1, 1} の場合、次のようにすることで、たった1種類だが異性体を構成することができる。
1 2 3 4 5 C 5C | | C-C 4C-C | 1 2 | C-C-C-C-C C-C-C-C-C | | | 3 | C C C C
この配置の場合、3
の炭素を中心に、どの方向に進んでもその先に「Y字の三差路」があるように、「Y字の三差路」が3方向に配置されている。この特殊な対称性のため、どのように主鎖を選択しても「3
にイソプロピル、2
と 4
にメチル」ということになる。つまり、これは3-イソプロピル-2,4-ジメチルペンタンであり、系統名で言えば2,4-ジメチル-3-(1-メチルエチル)ペンタンだ。
ペンタン骨格に {3} は付けられないし、{3, 1} も付けられないが、{3, 1, 1} なら付けられる…というところに妙味がある。このアルカンも合計炭素数10であり、デカンの異性体だ。これまた「C10越え」における難所の一つだろう。
主鎖の長さが 4 以下の場合には、C3枝を含む異性体は全く存在できない。
主鎖の長さを m = 9 とする。このとき、ジメチルとしては C{1,1}(9) = 16 種類の配置が可能だが、そのうち 4 種類($
)においては主鎖の対称性が保たれ、残りの 12 種類においては主鎖の対称性が破られる。
2,2 2,3 2,4 2,5 2,6 2,7 2,8$ 3,3 3,4 3,5 3,6 3,7$ 4,4 4,5 4,6$ 5,5$
そうすると、C3枝との可能な組み合わせの総数は、大ざっぱには:
ここで 4 は「$
要素」の数であり、C{1}(9) = (9 − 1)/2 に等しい。
これに加えて、2
にメチルがあるジメチル7種については、特例によりイソプロピルが 3
に付くことが可能なため、そのようなジメチル1種につき、C3枝との可能な組み合わせが1種類増加する。その数は:
一方、同じ炭素に2個のメチルが付くジメチル(2,2
や 3,3
や 4,4
など)においては、その同じ炭素にプロピルが付く配置(1種類)とイソプロピルが付く配置(1種類)が物理的に不可能であるため、そのようなジメチル1種につき、C3枝との可能な組み合わせが2種類減少する恐れがある。ただし、2,2
-ジメチルはこの種の干渉を引き起こさない(もともと 2
にC3枝は付かないので)。さらに、3,3
-ジメチルとC3枝の組み合わせも もともと不可能であり(特例で 3
にイソプロピルが付く場合、最低1個のメチルが 2
になければならない)、従って 3,3
もこの問題には関係しない。結局、この干渉を引き起こすのは、「x,x-ジメチル」のうち 2,2
と 3,3
の2種を除いた 4,4
以上のもの、ということになる。この数は「$
要素の数マイナス2」に等しい。発生する影響の大きさは:
以上をまとめると:
一般に、主鎖の長さ m が 6 以上の整数のとき:
m が 7 以上の奇数なら:
再び「く」と同じ結果が得られた。
m が 6 以上の偶数のとき、「し」によって:
再び「こ」と同じ結果が得られた。
「y,z-ジメチル-x-プロピル」のような枝番号の組み合わせについて、正しいIUPAC名を選択する方法は§4.2と全く同様になる(枝を紹介する順序が違うだけ)。実用上「y,z」を先に考えた方が便利だ(転倒の数が非常に少なく、結果も自然にソートされる)。例えば、主鎖の長さが 7 のとき、「y,z-ジメチル」の組み合わせは次の9種:
2,2 2,3 2,4 2,5 2,6$ 3,3 3,4 3,5$ 4,4$
その一つ一つについて、「-4-プロピルヘプタン」を付ければ、有効なIUPAC名が得られる。ただし「4,4-ジメチル-4-プロピルヘプタン」は物理的に不可能なので、除外される。
代わりに「-4-(1-メチルエチル)」を付ければイソプロピルになるが、当然「4,4-ジメチル」は除外される。一方、2,2
~ 2,6
については「-3-(1-メチルエチル)」も可能となる(特例配置)。
実際のリストは、List of isomers of dodecane の 2,2-Dimethyl-4-propylheptane
以下に当たる。
同様に、主鎖の長さが 8 のとき「y,z-ジメチル」の組み合わせは:
2,2 2,3 2,4 2,5 2,6 2,7$ 3,3 3,4 3,5 3,6$ 4,4 4,5$
これらのジメチルの一つ一つについて、「-4-プロピルオクタン」を付ければいい。「$
要素」を除けば、「-5-プロピルオクタン」を付けることもできる。「4,4-ジメチル-4-プロピル」は除外されるが、「4,4-ジメチル-5-プロピル」は有効。イソプロピルの付け方についても、ヘプタン骨格の場合と同様。
「5-プロピル」の場合に「$
要素」が除外される理由は、例えば「2,7-ジメチル-5-プロピルオクタン」は「2,7-ジメチル-4-プロピルオクタン」の裏の名前にすぎず、意味的に無効だからだ。表・裏の名前のペアの分布の仕方は、「x-エチル-y,z-ジメチル」の場合と全く同じになる。説明の便宜上、IUPAC名の紹介順序を無視し「x-プロピル-y,z-ジメチル」であるかのように考えることにすると、番号の組を、次のように三角柱状に並べることができる。
4Pr| 2,2 2,3 2,4 2,5 2,6 2,7$ | 3,3 3,4 3,5 3,6$ 3,7@ | 4,4# 4,5$ 4,6@ 4,7@ | 5,5@ 5,6@ 5,7@ | 6,6@ 6,7@ | 7,7@ 5Pr| 2,2 2,3 2,4 2,5 2,6 2,7$@ | 3,3 3,4 3,5 3,6$@ 3,7@ | 4,4 4,5$@ 4,6@ 4,7@ | 5,5#@ 5,6@ 5,7@ | 6,6@ 6,7@ | 7,7@
三角柱を上下2等分する平面を W とするとき、ある要素(ジメチルの種類を示す枝番号の組み合わせ)とそれを裏返した要素のペアは、W に関して対称の位置にある三角形内にあり、(三角形の違いを区別せずに)三角形内での相対的な位置関係だけを問題にするなら、「$
ライン」に対して対称の位置にある。
「エチル + ジメチル」の場合との唯一の小さな違いは、アルファベット順の都合により「判定」が絡んだ場合の裏表が入れ替わること。この違いは、主鎖の長さが奇数の場合にのみ生じる。例えば主鎖の長さが 9 の「4-プロピル-5,6-ジメチルノナン」における枝番号の組 (4, 5, 6) は、裏返しても (4, 5, 6) であり、裏表の大小の差がない。よってアルファベット順による判定に持ち込まれる。
1 2 3 4 5 6 7 8 9 C C C C C C-C-C-C-C-C-C-C-C 9 8 7 6 5 4 3 2 1
もし本当に「プロピル」が先に紹介されるのなら「4-プロピル-5,6-ジメチルノナン」で正しいのだが、実際のIUPAC名の順序は「5,6-ジメチル4-プロピルノナン」であり、それは判定により無効。裏返した「4,5-ジメチル-6-プロピルノナン」が判定により有効となる。同様に、小枝があるバージョンも系統名は「4,5-ジメチル-6-(1-メチルエチル)ノナン」となる。一方、慣用名を使うのなら、「4-イソプロピル-5,6-ジメチルノナン」のままで正しい。
現実の化学においては、常にここまで厳格とは限らない。
このマップの要素の意味的有効性は、ほぼ§4.2と同じ規則に従う。アルファベット順の影響を受けるのは、「右から x − 1 個目の縦列」および「それと対称の位置の行」の要素に関する規則だけだ。すなわち、主鎖の長さが奇数で、かつ「メチルではない枝」の名前がアルファベット順で「メチル」より後ろなら、問題の縦列の要素については有効条件が y ≤ c から y < c に変わり、「上から ~x − 1 個目の行」の要素については無効条件が z ≥ c から z > c に変わる(付録参照)。
§5.1 によれば:
C{3}(m) = | ⎧ ⎪ ⎨ ⎪ ⎩ |
0 (m < 5) m − 5 (m ≥ 5: 奇数) m − 6 (m ≥ 6: 偶数) |
プロピルだけ(またはイソプロピルだけ)を考えた場合には:
C̅{3}(m) = | ⎧ ⎨ ⎩ |
0 (m ≤ 6) ⌊(m − 7)/2⌋ (m ≥ 7) |
§5.2 によれば:
C{3,1}(m) = | ⎧ ⎪ ⎨ ⎪ ⎩ |
0 (m ≤ 5) m2 − 8m + 13 = (m − 4)2 − 3 (m ≥ 6: 偶数) m2 − 8m + 14 = (m − 4)2 − 2 (m ≥ 7: 奇数) |
これらの異性体のうち、C3枝として直鎖のプロピルを含むものだけを考え、その総数を C̅{3,1}(m) で表そう。「う」「え」によると:
C̅{3,1}(m) = | ⎧ ⎨ ⎩ |
(m2 − 8m + 12)/2 (m ≥ 6: 偶数) (m2 − 8m + 13)/2 (m ≥ 7: 奇数) |
この値は、C3枝としてイソプロピルを含むもの(特例配置を除く)だけを考えたときの総数とも一致する。
m ≥ 6 の主鎖は 3
にイソプロピルを持つことができるが、2
にメチルがあることが条件。このように、条件付きで可能になる枝の配置を条件付き配置または特例配置と呼ぶことにしよう。比較として、通常の枝は、無条件で(=「他の枝がどこどこにある場合に限る」という制約なしに)、主鎖上の一定範囲内にあるどの炭素にでも付くことができる。「無条件」といっても物理的に不可能な場合や意味的に無効な場合には許容されないが、通常の配置と特例配置には次の大きな違いがある:
例えば「2-メチル-3-(1-メチルエチル)デカン」は成立するが、メチルを取った「3-(1-メチルエチル)デカン」は成立しない。通常の枝では、「x-メチル-y-なんとかデカン」が成り立つならメチルを取った「y-なんとかデカン」も成り立つのだから(ただし名前が裏返しになっている場合も含む)、状況が大きく異なっている。
§5.3 によれば:
C{3,1,1}(m) = | ⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩ |
0 (m ≤ 4) 1 (m = 5) (m3 − 9m2 + 20m − 4)/2 (m ≥ 6: 偶数) (m3 − 9m2 + 21m − 7)/2 (m ≥ 7: 奇数) |
m = 5 の主鎖は 3
にイソプロピルを持つことができるが、2,4
に2個のメチルがあることが条件。
これらの異性体のうち、C3枝として直鎖のプロピルを含むものだけの総数を考えよう(特例配置を除くイソプロピルだけを考えた場合の総数とも等しい)。「き」「け」の計算を変形すると:
C̅{3,1,1}(m) = | ⎧ ⎨ ⎩ |
(m − 3)(m2 − 6m + 1)/4 (m ≥ 7: 奇数) (m − 3)(m2 − 6m)/4 = m(m − 3)(m − 6)/4 (m ≥ 6: 偶数) |
m ≥ 6 のとき:
3
にイソプロピル、2
にメチルを持つ配置)の数は m − 2まずサイド3炭素までのケースを片付けてしまおう:
C{3}(5) = 0 は分かってしまえば何でもないことだが、舞台裏では「イソプロピルが 3
に付くか付かないか」が大問題だった。
ここまで片付ければ、あとは、
だけだが、C4(ブタン)骨格にC2枝以上は付かないので、この場合、最後の項だけを計算すればいい。ところが、C4骨格にはメチル基が付くことのできる場所が4個しかないので、計算するまでもなく、テトラメチルブタンの組み合わせは明らかに1種類と分かる。次回導入するテトラメチルの公式を使えば、直接的に計算することもできる:
最初の17種類と合わせて、合計18種類であることが確定された。
オクタンの異性体に関しては、化学の応用上、一つ変なことがある。通常「イソブタン、イソペンタン、イソヘキサン」のような「イソ」は (CH3)2CH-
の構造を指すのだが、イソオクタンは例外で、2-メチルヘプタンではなく2,2,4-トリメチルペンタンを指す。これはオクタン価の定義に使われるガソリンの成分。「イソオクタン」は、IUPAC名としては許容されない名称だが、一般的に使われるのでそういうものだと割り切るしかないだろう。歴史的・産業的な理由でこうなっているらしい。
オクタン(炭素数8)の異性体においてC4(ブタン)骨格は「満員」になってしまうので、これ以降はC5(ペンタン)骨格以上だけを考えればいい。つまり、ノナンの場合、「メイン4・サイド5」とするためにはブタン骨格に合計5炭素の枝を付ける必要があるが、ブタン骨格にはメチル基が4個までしか付かないのでそれは不可能。
先にサイド3までを計算すると:
次にサイド4を計算すると:
サイド3までの27種類と合わせて、合計35種類と分かった。
このうち C{1,1,1,1}(5) の計算法については第6回で扱うが(次回)、ペンタン骨格でメチルが付くことができる場所は6個なので、「そのうち2カ所にメチルが付かない組み合わせ」と考えることもできる。そうすれば、C{1,1}(5) = (5 − 1)2/4 = 4 という簡単な計算に帰着される。C{1,1,1,1} の公式がなくても、ノナンまでは異性体の数が計算可能ということになる。
2015年10月18日版: 2015年10月25日公開予定の記事のテスト版(下書き・未完成)。
第3回では三角数を利用して、メチルが3個のトリメチルを扱った。今回は「3次元の三角数」に当たる四面体数を利用して、メチルが4個のテトラメチルを数える。第3回と同様に、①再帰性に基づく方法、②「高次のインターレース三角数」を使う方法、③「高次の三角数」を使う方法をこの順序で紹介する。①②③の順で概念や原理は少しずつ抽象的になるが、計算はどんどん簡単になる。
第3回と同様に、主鎖の長さが3以上の奇数 d である場合から考えよう。 具体例として、ノナン骨格(d = 9)にメチルが4個付いたテトラメチルノナンを考える。
とりあえず一つ目のメチルを 2
に限定すると、可能性のある枝の配置の組み合わせは次のように図示される(#@$
の意味は第3回と同じ)。
2,2,2,2# 2,2,2,3# 2,2,2,4# 2,2,2,5# 2,2,2,6# 2,2,2,7# 2,2,2,8# 2,2,3,3 2,2,3,4 2,2,3,5 2,2,3,6 2,2,3,7 2,2,3,8 2,2,4,4 2,2,4,5 2,2,4,6 2,2,4,7 2,2,4,8 2,2,5,5 2,2,5,6 2,2,5,7 2,2,5,8 2,2,6,6 2,2,6,7 2,2,6,8 2,2,7,7 2,2,7,8 2,2,8,8$ 2,3,3,3# 2,3,3,4 2,3,3,5 2,3,3,6 2,3,3,7 2,3,3,8 2,3,4,4 2,3,4,5 2,3,4,6 2,3,4,7 2,3,4,8 2,3,5,5 2,3,5,6 2,3,5,7 2,3,5,8 2,3,6,6 2,3,6,7 2,3,6,8 2,3,7,7 2,3,7,8$ 2,3,8,8@ 2,4,4,4# 2,4,4,5 2,4,4,6 2,4,4,7 2,4,4,8 2,4,5,5 2,4,5,6 2,4,5,7 2,4,5,8 2,4,6,6 2,4,6,7 2,4,6,8$ 2,4,7,7 2,4,7,8@ 2,4,8,8@ 2,5,5,5# 2,5,5,6 2,5,5,7 2,5,5,8$ 2,5,6,6 2,5,6,7 2,5,6,8@ 2,5,7,7 2,5,7,8@ 2,5,8,8@ 2,6,6,6# 2,6,6,7 2,6,6,8@ 2,6,7,7 2,6,7,8@ 2,6,8,8@ 2,7,7,7# 2,7,7,8@ 2,7,8,8@ 2,8,8,8#@
この図は7個の三角図の集まりだが、それらの三角図が3次元方向に積み重なっていると考えれば、全体として、一つの四面体図となる。「四面体の断面図を並べた図」ともいえる。
このうち #
の組み合わせは物理的に無効(これらの炭素には1個当たり2個までしか枝を付けられないので)。
@
の組み合わせは物理的には可能だが、意味的に無効。
例えば 2,3,8,8@
は裏返せば 2,2,7,8
であり、これは一番上の三角図に既に含まれているので重複してカウントすることはできない。この問題は、あとで詳しく検討する(§6.3)。
2,8,8,8#@
は物理的に無効であり、同時に意味的に無効でもある(対応する「表」の名前は 2,2,2,8#
)。
$
は「左右対称」配置を表す。この種の配置は、意味的無効配置の出現パターンを考えるときに手掛かりになるが、$
それ自体は有効な配置を表している。
3
以降の場合
四面体図を上記のようにきちんと記すのは面倒なので、以下では次のように略記しよう。
222 2# 3# 4# 5# 6# 7# 8# 223 3 4 5 6 7 8 224 4 5 6 7 8 225 5 6 7 8 226 6 7 8 227 7 8 228 8$ 233 3# 4 5 6 7 8 234 4 5 6 7 8 235 5 6 7 8 236 6 7 8 237 7 8$ 238 8@ 244 4# 5 6 7 8 245 5 6 7 8 246 6 7 8$ 247 7 8@ 248 8@ 255 5# 6 7 8$ 256 6 7 8@ 257 7 8@ 258 8@ 266 6# 7 8@ 267 7 8@ 268 8@ 277 7# 8@ 278 8@ 288 8#@
第1メチルが 3
以降に付く場合も含めて、関連する全ての四面体図を並べて描くと次のようになる。
222 2# 3# 4# 5# 6# 7# 8# 223 3 4 5 6 7 8 224 4 5 6 7 8 225 5 6 7 8 226 6 7 8 227 7 8 228 8$ 233 3# 4 5 6 7 8 333 3# 4# 5# 6# 7# 234 4 5 6 7 8 334 4 5 6 7 235 5 6 7 8 335 5 6 7 236 6 7 8 336 6 7 237 7 8$ 337 7$ 238 8@ 244 4# 5 6 7 8 344 4# 5 6 7 444 4# 5# 6# 245 5 6 7 8 345 5 6 7 445 5 6 246 6 7 8$ 346 6 7$ 446 6$ 247 7 8@ 347 7@ 248 8@ 255 5# 6 7 8$ 355 5# 6 7$ 455 5# 6$ 555 5$# 256 6 7 8@ 356 6 7@ 456 6@ 257 7 8@ 357 7@ 258 8@ 266 6# 7 8@ 366 6# 7@ 466 6#@ 267 7 8@ 367 7@ 268 8@ 277 7# 8@ 377 7#@ 278 8@ 288 8#@
これらの四面体図に含まれる有効要素の総数が、テトラメチルノナンの(有効な)種類の数に当たる。 一般の d について有効要素の総数を表す式を導けば、それが求める公式だ。 概念的には第3回とほとんど同じだが、主役となる数が三角数から四面体数に変わった。
222 2# 3# 4# 5# 6# 7# 8# 223 3 4 5 6 7 8 224 4 5 6 7 8 225 5 6 7 8 226 6 7 8 227 7 8 228 8$ 233 3# 4 5 6 7 8 234 4 5 6 7 8 235 5 6 7 8 236 6 7 8 237 7 8$ 238 8@ 244 4# 5 6 7 8 245 5 6 7 8 246 6 7 8$ 247 7 8@ 248 8@ 255 5# 6 7 8$ 256 6 7 8@ 257 7 8@ 258 8@ 266 6# 7 8@ 267 7 8@ 268 8@ 277 7# 8@ 278 8@ 288 8#@
テトラメチルノナンの例において、一番大きい四面体図(2,*,*,*
に対応するもの)に含まれる7個の三角図について要素数を数えると、下から順に:
これらの要素の合計は7番目の四面体数となる:
四面体数(三角すい数)については、§3.4でも少し扱ったが、1段目・2段目・3段目…に1番目・2番目・3番目…の三角数を重ねた三角すい(四面体)が含む要素の数に当たる(これを説明したアニメーションGIF)。三角数の和の公式は四面体数の一般項の公式と同じであり、
となる(§3.4)。
一般に、主鎖の長さが 3 以上の奇数 d のとき、一番大きい四面体図が含む要素数(無効要素を含む)は:
同じ四面体図が含む物理的無効要素の数を f1(d) とすれば、ノナン骨格の場合 f1(9) = 7 + 6 であり、一般の場合には次のようになる。
実際、図から明らかなように、一つ一つの四面体図において、物理的無効要素が現れる場所は「一番上の三角図の一辺」全体と「それ以外の三角図一つにつき1個」の2種類だ。 前者の個数は d − 2、後者の個数は d − 3 なので、合計すれば「い」になる。 (もう少し「立体的」な見方をすると、物理的無効要素は、「一辺の長さ d − 2 の四面体」の2辺の上に並んでいる。 単純計算ではそれらの要素数の合計は 2(d − 2) だが、1要素は2辺によって共有されているため、それを2重にカウントしないように補正すれば 2(d − 2) − 1 となる。)
一方、同じ四面体図が含む意味的無効要素の数を f2(d) とすれば、ノナン骨格の場合
であり、一般の場合には次の形になる:
「う」の根拠は難しくないが、その説明は後回しにして、先に全体的な見通しをつけておこう。大筋においては、この四面体図が含む要素数から「物理的に無効な要素数」と「意味的に無効な要素数」を引けば有効な要素数が得られ、それは「2,*,*,*
-テトラメチルアルカン」の種類の数を表す。その数を U(d) とすれば、基本的には:
実際には、「お」は d = 3 の場合にのみ正しい。d ≥ 5 の場合、一番大きな四面体図には「物理的に無効かつ意味的に無効」である配置(#@
印)が1個含まれており、この1個の要素は f1(d) と f2(d) の両方によってカウントされている。従って「お」の単純計算では、同じ1個の無効要素が2重に除外(減算)されてしまう。その点を補正すると:
U(d) | = | ⎧ ⎨ ⎩ |
Δ(d − 2) − f1(d) − f2(d) (d = 3) Δ(d − 2) − f1(d) − f2(d) + 1 (d ≥ 5: 奇数) |
「か」 |
この問題については、「う」の説明と併せて、あとでもう一度考えることにする(§6.3)。この U(d) が計算できれば、再帰性により、トリメチルの種類の数は次のように計算される:
実際にどこまで足すのか ―― 本当に U(1) まで足すのかそれとも U(3) くらいまでで打ち切るべきか ―― という問題は、別に検討しなければならないが、とりあえず上記の U(m) は、
…と仮定しておく。その仮定なら「どこまで足せばいいか」という問題は生じない。「か」のレシピは「あ」「い」「え」で明示されていて、「か」は d の3次式となる。従って「き」は、大筋においては3次式の総和として計算可能だ。
技術的な細部の問題は実際に計算するときに解決することにして、後回しにしておいた「う」の根拠を先に片付けておこう。「う」は「一つの四面体図は、意味的無効要素をいくつ含むのか?」を表しており、要するに @
の数を表している。
@
数」の分析どのような解法を使うにしても「@
数」つまり意味的無効要素の数は、問題解決の鍵を握る。後述するように「@
数」を直接数えない方が数学的には簡単になるが、化学の文脈では、IUPAC名の有効・無効が具体的に分かった方がいい。「@
」の分布の検討は、数学的にも良い解法のヒントを与えてくれるだろう。
主鎖の長さが奇数 d であるテトラメチルアルカンの枝の組み合わせは、例えば 2,2,4,5
のような4個の番号の組み合わせによって特定される。番号は 2 以上、d − 1 以下の整数だ(§2.1)。ある番号を d + 1 から引いたものを、その番号の裏番号と呼ぶ。これは、主鎖の番号の付け方を逆順にしたときの番号に当たる(§2.1)。
意味的無効配置というのは、番号を全部裏にした方がかえって「小さくなる」ような番号の組み合わせのことだ。平たくいえば「IUPACの命名規則に合っていない番号の付け方」「もっと簡単な(小さい)番号で表現できるのにそうなっていない、間違った名前」に当たる。
この意味を明らかにするためには、番号の組み合わせの「大小」を定義する必要がある。次のような、二つの組み合わせを考えよう。
a と b の内容は任意だが、番号の範囲はルール(§2.1)に従っていて、4個の番号は昇順に正しくソートされているものとする。
例えば、ノナン骨格において 2,4,7,8@
が意味的無効である理由は、裏の名前(裏番号を逆順に並べたもの) 2,3,6,8
の方が上記の意味で小さいからだ。
2,4,7,8@
と 2,3,6,8
は同一の枝の組み合わせを表す同じ名前の表と裏に当たり、指し示す対象は同じなので、両者を重複してカウントするわけにはいかない。
小さい方の名前だけが有効になり、他方は無効となる。
これが意味的無効の正体だ。
今、第1の番号(第1メチル)を 2
に固定して (2,x,y,z)
という配置だけを考えることにする(一番大きい四面体図を抜き出したことになる)。
このとき、@
が生じるためには、z = d − 1 であることが必要。なぜなら:
z
の裏番号は 3
以上になり、裏の名前は最小でも 3,*,*,8
の形になるため、元の組み合わせより小さくなることはない。そうすると、@
が生じる可能性がある場所は、四面体図を構成している各三角図の右側の一辺に限られる(立体的にいえば、逆三角すいの、特定の一つの側面)。このエリアを臨界帯と総称し、臨界帯に含まれる要素を臨界要素と呼ぶことにする。ノナン骨格でいえば、(2,x,y,8)
の形の要素、一般的に言えば
(2,x,y,d−1)
の形の要素だ。
臨界要素において、第1の番号 2
と第4の番号 d−1
は裏表の関係にあり、一方の番号を裏返せば他方に等しくなる。
従って、それらの番号が原因となって意味的無効が生じることはない(意味的無効になるためには、裏の番号が表の番号より小さくなる必要がある)。
結局、臨界要素が意味的無効になるかならないかは、第2と第3の番号 x
と y
のみによって決まる。
つまり、この場合の意味的無効配置とは、
y
が大き過ぎて裏返すと x
未満になるような組み合わせ…のことだ。
ノナン骨格の例から臨界要素だけを抜き出すと、次のようになる。
2228# 2238 2248 2258 2268 2278 2288$ 2338 2348 2358 2368 2378$ 2388@ 2448 2458 2468$ 2478@ 2488@ 2558$ 2568@ 2578@ 2588@ 2668@ 2678@ 2688@ 2778@ 2788@ 2888#@
2,5,5,8$
の組み合わせでは、x
と y
が等しくなる。この等しい値を c = (d + 1)/2 として、その番号に対応する主鎖の炭素を中央炭素と呼ぶことにしよう。
この形の番号の組み合わせ (2,c,c,d−1)
を仮に「峠」と呼ぶと、図中で「峠」より下方にある臨界要素は全て意味的無効となる。実際、そこにおいては x
と y
の両方が中央炭素の番号 c = (d + 1)/2 より大きく、y
を裏返せば c
未満になるので、常に裏の名前の方が小さい。
「峠」を含むブロック(三角図)は (d − 1)/2 個の行を含み、臨界要素に限っていえば、(d − 1)/2 個の要素を含む。同様に、「峠」を含むブロックの次の(=図で下方にある)ブロックは、(d − 3)/2 個の臨界要素を含む。一番小さいブロックから「峠」ブロックの一つ下のブロックまで、下から上へブロックごとの臨界要素を数えれば、それらの個数は:
既に示したように、これらの要素は全て意味的に無効だ。
一方、「峠」を含むブロックは (2,c,y,d−1)
の形の (d − 1)/2 個の臨界要素を含むが、このうち、y = c となる1個の要素(つまり「峠」自身)は、意味的に無効ではない(裏返しても大きさが変わらないので)。一方、このブロックに含まれるそれ以外の要素は、意味的に無効だ。それらについては y > c であり、第3の番号 y
を裏返せば第2の番号 c
未満になる。
結局、「峠」ブロックに含まれる意味的無効要素の個数は:
「峠」より1個上のブロックでは、第2要素が x = c − 1 となるため、第3要素が y > c + 1 を満たすことが「意味的無効」の条件となる。 条件における y の下限が 1 増えるので、条件を満たす y は(「峠」ブロックと比べると) 1 減る。さらに1個上のブロックでは、y > c + 2 が「意味的無効」の条件となり、条件を満たす y は、さらに 1 減る。以下同様に進んで、ブロックが上がるごとに含まれる意味的無効要素は 1 ずつ減り、最終的には一番上のブロックにおいて条件が y > d − 1 となって、条件を満たす y は 0 個となる。
従って、一番上のブロックから「峠」ブロックまで、上から下へブロックごとの意味的無効要素を数えると、それらの個数は:
「く」は「峠」ブロックより下にある @
の数、「け」は「峠」ブロックとそれより上にある @
の数であり、それらは等しい。合算すれば:
これが「う」であり、これによって f2(d) の正当性が確認された。
第1の番号(第1メチル)が 3
以上の場合、それに対応して第4の番号の範囲が狭まるため、やはり三角図の右端の列が @
を含む唯一の領域(臨界帯)となり、上記と全く同じパターンが現れる。
#@
」要素四面体図の右上の組み合わせ(ノナン骨格における 2,2,2,8#
)、言い換えれば第1の臨界要素は、明らかに物理的に無効だ。それを裏返した組み合わせは臨界帯の一番下に現れ、一般には、物理的に無効であると同時に意味的にも無効となる(ノナン骨格における 2,8,8,8#@
)。
ただし d = 3 の場合には、第1の臨界要素は 2,2,2,2$#
となり、それは四面体図が持つ唯一の要素であり、その裏の名前はそれ自身となる。
d=7 d=5 d=3 2226# 2224# 2222$# 2236 2234 2246 2244$ 2256 2266$ 2334$ 2344@ 2336 2346 2444#@ 2356$ 2366@ 2446$ 2456@ 2466@ 2556@ 2566@ 2666#@
枝の配置 2,2,2,2$#
は、物理的には「ますます無効」だが(2個までしか枝が付けられない2番炭素に4個も枝を付けようとしている)、裏の名前より大きいわけではないので「意味的に無効」ではない。
実際、「え」によれば f2(3) = 0 であり、d = 3 の四面体図に含まれる意味的無効要素は 0 個だ。
「物理的かつ意味的に無効」か「物理的に無効」かという違いはあるものの、臨界帯の最後に現れる要素はいずれにしても無効であり、有効な異性体の種類を数える場合には除外されなければならない。その際、次の点を慎重に扱う必要がある:
#
(物理的無効)と @
(意味的無効)に分けて数える場合、#
かつ @
の要素を2重に減算したままではいけない。「#@
である要素」を別に数えて補正する必要がある。「f1(d) は物理的無効要素の数(#@
を含む)、f2(d) は意味的無効要素の数(#@
を除く)」のように無効要素のカウントの重複をなくせば、一応上記の問題を回避することができる。ただし、その場合でも、どこかで「#@
を除く」という補正が必要なので、問題の本質は変わらない。
テトラメチルの場合、要するに「一辺の長さが 1 より大きい四面体図は、1個の #@
を含む」というだけのことであり、比較的簡単に対処することができる。
最初に、「あ」「い」「え」を使って「か」を具体的に計算しておこう。まずは、d = 3 の場合:
d ≥ 5 の場合、「#@
補正」により結果は上記より 1 大きくなる:
U(d) | = | ⎧ ⎨ ⎩ |
(2d3 − 9d2 − 8d + 51)/12 (d = 3) (2d3 − 9d2 − 8d + 63)/12 (d ≥ 5: 奇数) |
「こ」 |
「こ」は「2,*,*,*
-テトラメチルアルカン」の種類の数を表している。
例えば U(7) = 21 は「2,*,*,*
-テトラメチルヘプタン」(ウンデカンの異性体の一種)の種類の数に当たる。
実際に List of isomers of undecane を眺めて該当する異性体を数えてみると、ちょうどこの数になっていることを確認できる。
U(5) = 4 は「2,*,*,*
-テトラメチルペンタン」(ノナンの異性体の一種)の種類の数だが(List of isomers of nonane)、再帰性によって(§3.3)、それは「3,*,*,*
-テトラメチルヘプタン」の種類の数でもある。
さらに、U(3) = 0 は「2,*,*,*
-テトラメチルプロパン」の数だが、再帰性により、「3,*,*,*
-テトラメチルペンタン」の数でもあり、「4,*,*,*
-テトラメチルヘプタン」の数でもある。これらの数は 0 であり、「プロパン(C3)骨格には枝を付けられる場所が2個しかないので、テトラメチルは存在できない」という当たり前の事実に対応している。
意味的には当たり前のことだとしても、再帰性を利用して計算する場合、数式上でどこまで足せばいいのか明確にしておく必要がある(§3.5)。U(3) まで足してもいいのだが、U(3) = 0 なので、U(5) まで足せば同じ答えが得られる。U(5) 以上と式の形が違う U(3) を計算に含めると話がややこしくなるので、U(5) まで足してそこで打ち切ることにしよう。
例えば、テトラメチルヘプタンの総数は:
テトラメチルノナンの総数は:
一般に d が 5 以上の奇数のとき:
この計算を実行するために、次の関数を考えよう:
この右辺は「こ」の第2式と同じ内容だが、k ≥ 5 という制限を取り払ってある。その意図は§3.5の別解1と同様。f(3) = 1 は純粋に計算上の値であり、化学的な事実 U(3) = 0 とは一致しない。f(1) = 4 も計算上の値であり、化学的には U(1) = 0 となるべきだろう。しかし、たとえ化学的事実と一部ずれていたとしても、和の計算は単純な3次式に基づく方が便利だ。
f(1) + f(3) については「あとからまた引くのなら最初から足さなければいいのでは?」とも思えるが、これは、左側の角かっこ内を 1, 3, 5, … が絡む形にして、いろいろな一般公式を適用できるようにするため。この点は、実際の計算を見た方が分かりやすいだろう。
ちなみに、総和記号を使って書くと、これは次の変形に当たる:
「し」の前半の角かっこ内の各項から 1/12 を外に出し(共通分母とし)、丸かっこはいったん全部外して足し算の順序を変更しよう: 「奇数の立方が入っているパーツ」はそればかり集め、「奇数の平方が入っているパーツ」はそればかり集め…とやって、パーツの共通因数はまとめてくくり出せば、次のように整理整頓される。 定数項 63 は「1, 3, 5, …, d という数列が含む項の数と同じ回数」出現するが、その数は (d + 1)/2 に等しい。
「す」を計算するためには、次の公式が使われる。このうち最初の式は、奇数の3乗和の公式。疑問があれば、末尾の付録を見てほしい。2番目は奇数の2乗和の公式を展開した形。3番目の式は説明不要だろう。
これらを「す」に適用すれば:
⎡ | d4 | + 4d3 | + 4d2 | − 1 | ⎤ | |
⎢ | − 6d3 | − 18d2 | − 12d | ⎥ | ||
⎢ | − 8d2 | − 16d | − 8 | ⎥ | ||
⎢ | + 126d | + 126 | ⎥ | |||
⎣ | − 240 | ⎦ |
途中で現れる巨大かっこの部分は、ただの普通の足し算。 筆算の足し算のように、縦に並べて書いてみた。
最後に一応因数分解を行った。「せ」において「定数項 123 の約数 ±1 または ±3」が式の零点(=イコール0と置いた方程式の解)になっている可能性を考え、実際 d = 3 を代入すると結果が 0 になることを確認した上で、d − 3 による割り算をした。 この式はテトラメチルアルカンの種類の数を表しているのだから、大きな d に対して 0 になることはあり得ない。 そのため、零点があるとすれば d = 3 以下に違いないと見当がつく。
この零点のおかげで、上記の式は、d = 3 を代入したとき 0 になる。 これは化学的にも正当な値だ。 計算途中では、化学的事実を表す U(3) = 0 と数学上の計算を表す f(3) = 1 が紛らわしいずれ方をしていたが、最終的にはうまい形になってくれた。 結局、d ≥ 5 という制限を緩和して、d ≥ 3 にまで範囲を広げることができる。
「す」以下の計算はやや力技かもしれないが、本質的に難しい点はなかった。しかし、これは最善の計算法とはいえない。問題点を挙げれば:
「2,*,*,*
」の場合だけを考えて済ませる方法は一見、考える範囲が狭くていいので手っ取り早いのだが(実際、ある意味においては、思考の節約にもなっているのだが)、上記のように短所も多く、憂鬱なものだ。もっとスッキリした方法はないものだろうか。視野を広げて、テトラメチルノナンに関連する全ての四面体図をじっくり眺めてみよう。
222 2# 3# 4# 5# 6# 7# 8# 223 3 4 5 6 7 8 224 4 5 6 7 8 225 5 6 7 8 226 6 7 8 227 7 8 228 8$ 233 3# 4 5 6 7 8 333 3# 4# 5# 6# 7# 234 4 5 6 7 8 334 4 5 6 7 235 5 6 7 8 335 5 6 7 236 6 7 8 336 6 7 237 7 8$ 337 7$ 238 8@ 244 4# 5 6 7 8 344 4# 5 6 7 444 4# 5# 6# 245 5 6 7 8 345 5 6 7 445 5 6 246 6 7 8$ 346 6 7$ 446 6$ 247 7 8@ 347 7@ 248 8@ 255 5# 6 7 8$ 355 5# 6 7$ 455 5# 6$ 555 5$# 256 6 7 8@ 356 6 7@ 456 6@ 257 7 8@ 357 7@ 258 8@ 266 6# 7 8@ 366 6# 7@ 466 6#@ 267 7 8@ 367 7@ 268 8@ 277 7# 8@ 377 7#@ 278 8@ 288 8#@
#
は、一番大きい四面体図の「底辺」に 7 個、「斜辺」に 6 個あり、2番目に大きい四面体図の「底辺」に 5 個、「斜辺」に 4 個あり…となっているのだから、一つの四面体図にこだわらず全体を見渡せば、その総数は
T(7) = 28 となる。
@
は、一番大きい四面体図に 2T(3) 個、2番目に大きい四面体図に 2T(2) 個…となっているのだから、全体での総数は 2Δ(3) = 20 となる。
#@
は、一番小さい四面体図を除いて、全部の四面体図に一つずつあるのだから、全体での総数は 3 となる。
そうすると、無効要素の総数は、28 + 20 − 3 = 45 となる。
無効要素を含めた要素の総数は、Δ(7) + Δ(5) + Δ(3) + Δ(1) = 130。 結局、有効要素の総数は、130 − 45 = 85 となる。
このように考えて計算を進めた方が、見通しが良い。以下では、この発想に基づき、関連する全ての(一般には複数個の)四面体図に含まれる各種要素の総数を問題にする。
「い」によれば、一番大きな四面体図に含まれる物理的無効要素は (d − 2) + (d − 3) 個である。 2番目に大きな四面体図は辺の長さが 2 小さいのだから、そこに含まれる物理的無効要素は (d − 4) + (d − 5) 個である。 以下同様。最後に、一番小さな(1要素だけから成る)四面体図に含まれる物理的無効要素は、 1 + 0 個。 以上の物理的無効要素の総数を g1(d) とすれば:
ここで T(a) は a 番目の三角数を表す(§3.4)。
「う」によれば、一番大きな四面体図に含まれる意味的無効要素は 2T((d − 3)/2) 個である。 2番目に大きな四面体図は辺の長さが 2 小さいのだから、そこに含まれる意味的無効要素は 2T((d − 5)/2) 個である。 以下同様。 最後に、一番小さな(1要素だけから成る)四面体図に含まれる意味的無効要素は 0 個。 以上の意味的無効要素の総数を g2(d) とすれば:
ここで Δ(a) は a 番目の四面体数を表す(§3.4)。
さて、§6.3の考察によれば、物理的に無効であると同時に意味的にも無効である要素の総数は、「辺の長さが1より大きい四面体図」の数に等しい。 つまり、一番小さな(1要素だけから成る)四面体図以外は、全てこれに該当する。 その総数を g3(d) としよう。 一番大きな四面体図は一辺が d − 2 であり、以下、四面体図が小さくなるごとに辺の長さが 2 ずつ減少するのだから、 g3(d) とは、数列
…に含まれる項数にほかならず、簡単な計算によれば:
「た」「ち」「つ」を組み合わせると、無効要素の総数は、次のようになる。 これは、物理的無効要素の数と意味的無効要素の数の両方を含み、「物理的にも意味的にも無効である要素」について二重にカウントしないように補正してある値だ。
これで、(関連する四面体図全体での)無効要素の総数を確定できた。あとは、(関連する四面体図全体での)要素の総数を求めて、そこから上記の値を引き算すればいい。
§3.4と同様に考えれば、問題となる要素の総数は「奇数番四面体数」の和で表されることが分かる。ノナン骨格なら:
一般の d については:
ここで ΔoddΔ(a) は、奇数 a について、「1 番目から a 番目まで、奇数番の四面体数を足し合わせたもの」を表す。例えば:
ΔΔ(ダブルデルタ)は「四面体を並べたもの」を表すシンボルだと解釈してほしい。記号上は「ダブル」だが、意味上は、四面体を3個以上並べた場合や、1個や0個並べた場合も含むものとする。
四面体数の一般項の公式(§3.4)によれば:
そうすると:
「な」では、奇数の3乗和の公式を使った。 「に」から「ぬ」の変形では、a = −3 が3次式の零点であることを確かめた上で、割り算を行った。
「ね」を使うと「と」は:
関連する全ての四面体図を考える場合、それらに含まれる要素の総数は「の」、無効要素の総数は「て」だから、有効要素の総数は:
この最後の式は「せ」と同じだから、再び同じ解が得られたことになる。 ただし、今回のやり方では d = 3 のケースが最初から一般の場合に組み込まれていて、それを特別扱いする必要がなかった。 トリッキーな処理も紛らわしい関数もなく、淡々と計算を進めることができた。 それらの点は素晴らしいことだが、その代わり、“幾何学的”にやや分かりにくいパターンに取り組む必要があった。 その核心は、五胞体数(四面体数を4次元方向に並べて足し合わせた数)に似た数であり、
である。例えば、
は本物の五胞体数だが、奇数番目の項だけを抜き出して足せば:
いわば「インターレース五胞体数」だ。通常の五胞体数も4次元的でイメージしにくい点があるが、それをインターレース加工するのは、ますますイメージしにくい。再帰性を利用する計算の方が心理的ハードルは低いかもしれない。
けれど、四面体数の和を使う計算法の方が楽だし、見通しも良かった。実は少し発想を変えると、この計算はさらに簡単になる。
五胞体数については、第8回で扱う予定だ。ΔoddΔ(a) の幾何学的イメージの解明は、それまで保留とする。差し当たっては「複数個の四面体数を足し合わせた」という認識で十分であり、それで問題なく計算を実行できる。
われわれは奇数 k についての Δ(k) の和を ΔoddΔ と表記する。ΔΔodd の方が見た目がいいかもしれないが、それだと「インターレース四面体数 Δodd の和」と紛らわしい。次の二つの計算の違いに注意しよう:
総和記号に置き換えれば:
主鎖の長さを4以上の偶数 e とする。 例えば、オクタン骨格(e = 8)について、関連する全ての四面体図を並べると:
222 2# 3# 4# 5# 6# 7# 223 3 4 5 6 7 224 4 5 6 7 225 5 6 7 226 6 7 227 7$ 233 3# 4 5 6 7 333 3# 4# 5# 6# 234 4 5 6 7 334 4 5 6 235 5 6 7 335 5 6 236 6 7$ 336 6$ 237 7@ 244 4# 5 6 7 344 4# 5 6 444 4# 5# 245 5 6 7$ 345 5 6$ 445 5$ 246 6 7@ 346 6@ 247 7@ 255 5# 6 7@ 355 5# 6@ 455 5#@ 256 6 7@ 356 6@ 257 7@ 266 6# 7@ 366 6@# 267 7@ 277 7#@
これらの四面体図に含まれる物理的無効要素の総数は:
これは、主鎖の長さが奇数の場合の「た」と同一の計算だ。
さて、主鎖の長さが偶数の場合、主鎖の中央に当たる炭素が存在しない。c = e/2 と置くと、理論上の中央は
c 番炭素と c + 1 番炭素の中間にある。
従って、「峠」(§6.3)に当たる要素は (2,c,c+1,e−1)
である。一番大きな四面体図を構成する e − 2 個の三角図を (e − 2)/2 個ずつ「前半」「後半」に分けるとき、「峠」は「前半」の最後の三角図に含まれる。主鎖の長さが奇数の場合と異なり、この「峠」では第2の番号と第3の番号が等しくなく、第3の番号の方が一つ大きい。そのため「峠」の位置は三角図の右上の角ではなく、その一つ下となる。
「峠」の位置に注意して §6.3 と同様の考察をしよう。「後半」の臨界要素は全て意味的に無効であり、そこに @
が T((e − 2)/2) 個存在するが、「前半」の @
はそれより少なく、T((e − 4)/2) 個となる。2番目に大きい四面体図、3番目に大きい四面体図…でもこれらのパターンは同じだが、四面体図が小さくなるごとに辺の長さが 2 ずつ減少するのだから、意味的無効要素の総数は:
最後に、辺の長さが偶数の四面体図は、一辺の長さが 2 の最小の図を含めて、常に1個の #@
を含む。従って、#@
の総数は:
以上をまとめると、無効要素の総数は:
一方、有効要素・無効要素を含めた要素の総数は、「偶数番四面体数」の和
で表される。この値は、次の公式(後で証明する)によって計算される:
すなわち、「ひ」は:
有効要素の総数を求めるには、「へ」から「は」を引けばいい:
これで答えが得られた。「ほ」は、e = 2 に対しても、化学的に正しい結果を返す。
残された仕事は「ふ」の証明だが、これは §5.6 の「ね」とほとんど同様に行うことができる:
「ま」では、偶数の3乗和の公式「ケ」が使われた。
主鎖の長さが 4 以上の奇数 e の場合、一番大きな四面体図に含まれる要素の数は:
そのうち、物理的無効要素の数は:
意味的無効要素の数は:
辺の長さが偶数の四面体図は常に1個の #@
を含む。その点に注意すると、一番大きな四面体図が含む有効要素の総数は:
化学的考察によると、以下の計算では f(4) 以上の項だけを足し合わせればいい。 f(2) = 2 は化学的に意味のない値だが、計算上、次のように利用される:
「む」から「め」の変形では、次の公式が使われた。このうち最初の式は、偶数の3乗和の公式「コ」だ。
「め」と「も」の間の途中経過は省略したが、通分して普通に計算すればいい。
「も」から「や」の変形では、試行錯誤により零点 e = 2 を見つけて、因数分解を行った。 結果は、既に得た「み」と一致する。
todo
2乗和の公式と同様の方法で、3乗の和(立方和)の公式を導くことができる。
次の等式は簡単に確かめられる。
さて、次のような X と Y があったとしよう:
ひねくれた気分になって、「ウ」をわざわざ次のように書き直してみよう。
右辺第1項の 14 はただの 1 に等しいので、以下ではそう書くことにする。右辺の残りの項については、「ア」によって展開しよう。ちょっとゴチャゴチャするが、計算自体は難しくない:
「オ」から「イ」を引くと、右辺の4乗の項は全部消えてくれる:
左辺を見ると「ク」は Y − X に等しいが、「エ」によれば、 Y − X は (a + 1)4 に等しい。ということは…
「3乗和」の項だけ左辺に残すように移項すると:
両辺を 4 で割れば:
これで公式が得られた!
この右辺は、次の右辺のちょうど平方に当たる:
この関係はとても美しく記憶にも便利だが、このパターンは1乗和と3乗和の関係に特有のもので、残念ながら4乗和・5乗和…などにおいては、こんなふうにならない。
3乗和の公式により:
両辺を 23 倍すると:
a = 2n と置けば:
これで偶数の3乗和は分かった。奇数の3乗和は、単に普通の3乗和から偶数の3乗和を引けばいい。以下の a は奇数であり、従って偶数の3乗和の方は最後の項が (a − 1)3 になる:
奇数の2乗和・偶数の2乗和は同じ式で表されるのだった(§3.7)。 一方、「コ」と「シ」を比較すると、奇数の3乗和・偶数の3乗和の公式はよく似ているが少し異なることが分かる。 すなわち、偶数のときの公式の分子に −1 を付け加えると、奇数のときの公式が得られる。
c = (a + 1)/2 と置けば、「サ」を次のように書くこともできる:
要するに:
「ス」の左辺で足し合わされる項の数は、c に等しい。
奇数の3乗和は、完全数とも関係することが知られている。すなわち、6 を除く偶数の完全数は、「ス」の形で書き表される:
一般に、偶数の完全数 n については、
と書くことができる。ここで p は素数(Mersenne exponent)であり、2c2 − 1 = 2p − 1 も素数(メルセンヌ素数)になる。このとき n は、最初の c 個の「奇数の立方」の和に等しい。 言い換えれば、2c − 1 以下の正の奇数についての、立方和に当たる。最初の完全数
だけは「ス」の左辺の形で表現されないが、この場合、c2 = 2 なのだから、「ス」の右辺に強引に c = √2 を代入すれば:
…となって、つじつまは合う。完全数 6 は、いわば「√2 個の奇数」の立方の和だったのだ!
確かに 6 は 13 より大きいが、奇数立方数を 2 個足した 13 + 33 = 10 よりは小さく、それらの真ん中へんにある…。
ほとんどの素数は奇数だが、p = 2 だけは例外的に偶数。この例外性によって 2p − 1 が平方数にならず、その点が「セ」において問題を発生させ、6 を例外的な完全数にしている。