湧現性小註解

上禮拜的 2026/6/11,我得到了第五十個專利。這是滿令人開心的一件事。不過呢,最近我對 AI 的每個想法,都有人做過了,下一個 idea 還難產中。這裡就來記錄一下我最近碰到的關卡 – 湧現性 (emergence)。

湧現性是什麼呢?所謂 “熟讀唐詩三百首,不會吟詩也會吟。" 說的就是湧現性。本來文采不豐富,做不出好詩。但是腦中塞滿名句之後,隨口就能湊出好句型。但沒有熟讀不算、沒有讀 300 首也不算 (精確來說是 311 首)。簡言之,1+1>2。

湧現性還表現在魚群和鳥群的行動上,一隻沙丁魚游泳看不出有何玄機,但是一萬隻沙丁魚聚在一起就會自動形成魚球,聚集上億隻就成了沙丁魚風暴 – Sardine Run。它呈現了整體性、無中央控制、量變產生質變這三種湧現性的特徵。

在 AI 上,有人試過把一段 Feed Forward Netowok 複製 8 份,各自打掉一些參數後重新訓練,他們就變成了 8 個專家 (Mixture of Experts) ,效果比原來還好。再更猛一點, LLM 也可以堆疊。法國知名 AI 新創 Mistral 推出的 Mixtral 8 x 7B 模型,其底層邏輯就是拿原本的 Mistral 7B 單一模型,複製 8 份作為專家再繼續訓練出來的 [1]。 這個專有名詞叫做 Upcycling (升級再造)。

LLM 複製 8 份之後,我們要在這些專家頭上各打一棍,讓他們產生不同程度失憶,然後叫他們重新上學。這條路線跟生物界不同的有兩點:(1) Model 要重新訓練,但侯鳥不用。(2) 需要一個 router 去指派 LLM,和 MOE 中指派 expert 的 router 一樣。而沙丁魚不用。

除了暴力打頭之外,也有和平的方法。我們不用重新訓練,只要調整一些參數,像是 temperature,然後叫這些個專家們討論,最後民主投票。這叫做 Ensemble (群體智慧 / 集成學習),主打三個臭皮匠勝過一個諸葛亮,減少幻覺的發生。這個和湧現沒有關係。

對於湧現的看法,有人 [2] 主張可以拆解回原型是弱湧現,不能拆解的是強湧現。例如魚群可能是靠著每隻 “單魚" 遵循 “和鄰魚保持等距" 這種簡單的原則就可以達成的。有人認為強湧性不合理,違反熱力學第二定律 – 封閉系統的 “熵" 只會愈來愈大。還好 AI 有重新訓練,那就不是封閉系統了。

回到湧現性這個話題。徐志摩說了 “數大便是美"。菲利普·安德森 (Philip W. Anderson) 說了 “More is Different" (多即是不同) [3]。不能拆解的湧現性是怎麼來的呢?都說生命的緣起是一堆高密度的氨基酸被雷打到。看來 “大" 加上 “觸發" 這兩個條件缺一不可。接下來如果用進化論來物競天擇,收斂的速度就不用說了,生物也會產生太多的可能性,那並不是我們需要的。現在 AI 的進步速度應該容忍不了以前基因演算法 [4] 的浪漫。

接下來,一定要拿同樣的 model 來敲頭嗎?一定要長一樣的面孔才可以民主投票嗎?都不用,OpenRouter 最近也發布了 Fusion Router,一種多模型融合推理工具。核心思路很直接,直接拿不同的 model 來投票。用一個綜合的裁判模型來選最後的答案,結果還比 Fable 5 好 [5, 如下表]。顯然的,這裡面冗餘的成分非常地高,好比投資只多賺了 10%,但是本金需要 2、3 倍。總之,能力在這裏面湧現了,即使它沒辦法通過愛因斯坦測試 [6]。

模型得分
Fable 5 + GPT-5.5(Opus 4.8 综合)69.0%
Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro(Opus 4.8 综合)68.3%
Opus 4.8 + GPT-5.5(Opus 4.8 综合)67.6%
Opus 4.8 + Opus 4.8(Opus 4.8 综合)65.5%
Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro (便宜模型抱團)64.7%
Claude Fable 565.3%
DeepSeek V4 Pro60.3%
GPT-5.560.0%
Claude Opus 4.858.8%
Kimi K2.653.7%
Gemini 3.1 Pro45.4%
Gemini 3 Flash43.1%

愛因斯坦測試不是一個考題,而是 Google DeepMind 執行長 Demis Hassabis 提出測試 AI 是否有真正智慧的方法。他說:"讓 AI 系統只學習 1901 年以前的知識,再測試它能否自行推導出愛因斯坦 1905 年的狹義相對論。" 這個驗收標準,其實有點離譜。如果你餵 AI 學 19 世紀的牛頓力學,它一丁點也想不出未來會有量子力學。我們需要通過許多關鍵的實驗來推翻舊理論、並建立新框架。而且舊理論往往並非全面崩塌,甚至在大部分的地方還是站得穩穩的,只是某些地方解釋不通而已 [7]。

[REF]

  1. https://huggingface.co/mistralai/Mixtral-8x7B-v0.1
  2. https://en.wikipedia.org/wiki/Mark_Bedau
  3. https://www.science.org/doi/10.1126/science.177.4047.393
  4. 基因演算法
  5. https://www.cnblogs.com/itech/p/20581511
  6. https://www.inside.com.tw/article/41195-hassabis-proposes-einstein-test-to-define-agi-benchmark
  7. 馬克士威方程式(Maxwell’s equations)無法解釋量子尺度下的光子行為、單一磁單極子的存在、非慣性參考系中的電磁場變換,以及重力與強弱核力。馬克士威方程組是古典電動力學的核心,但在極端物理條件下必須由量子力學與相對論來擴充。
    • 以下是該方程組無法涵蓋的具體物理現象與範圍:
    • 1. 微觀的量子效應與光子
    • 馬克士威方程式將電磁場視為「連續的波」。
    • 量子電動力學(QED): 當探討單一電子或單一光子時,電磁波會展現出「粒子性」。連續的古典波動無法解釋光電效應、康普頓散射以及電磁場的量子漲落(Quantum Fluctuations)。
    • 2. 物質內部的非線性光學與量子極限
    • 強場光學與非線性現象: 在極強的雷射場作用下,介質的響應不再是線性的(例如倍頻效應),此時傳統的馬克士威方程式需結合量子光學來描述。
    • 3. 磁單極子(Magnetic Monopoles)
    • 高斯磁定律的限制: 方程組中的 \(\nabla \cdot \mathbf{B} = 0\) 表明磁力線必定是封閉的,代表磁單極子(單獨的N極或S極)不存在。現代粒子物理的部分大統一理論(GUT)預測磁單極子可能存在,但這超出了傳統馬克士威方程組的範圍。
    • 4. 強交互作用、弱交互作用與重力
    • 僅涵蓋電磁力: 自然界有四種基本交互作用,馬克士威方程式僅處理「電磁交互作用」。它無法解釋原子核內的強交互作用(夸克間的結合)、弱交互作用(如貝他衰變),以及愛因斯坦的廣義相對論所描述的重力場。
    • 5. 加速參考系中的電磁輻射
    • 局限於慣性系: 馬克士威方程組的標準形式主要適用於慣性參考系。在強重力場或高度加速的非慣性參考系中,必須透過彎曲時空的廣義相對論電動力學來修正描述。
    • 馬克士威方程式在巨集觀、低速或日常尺度的電磁現象中已極為完美,但在理解物質的微觀本質或宇宙極端現象時,則必須依賴更進階的物理理論。

我讀 «沙灘上的薛丁格,生活中的量子力學» 之測不準原理

quantique

這是本書的法文書名, 第一個字可想而知是指把貓弄得半死不活的物理學薛丁格, “La Physique Quantique" 望文生義是介係詞加量子物理. 沒有 “力學", 但不講量子力學, 一般人可能沒親切感. “dans un transat" 是在躺椅上, “la plage" 是介係詞加海灘. 所以譯者把它翻譯成生活中, 用意也是希望講得更親民吧? 本書作者是 Charles Antoine.

多少用心良苦, 都是因為正常人不會想知道量子力學. 我在誠品走一遭, 借用量子衍生出來的心靈學籍還有一兩本, 但是單純科普講量子的書就找不到了… 至於我為何想了解量子呢? 這又是因為它顯然是未來的趨勢之一. 比起科普元宇宙, 我更想科普量子.

量子物理還在發展當中, 它能夠更好地解釋一些事情, 但又還不能完全解釋. 想要用科學完整地描述這個世界, 是很多科學家一輩子都在努力的事. 當然宗教學家會說我早就有理論解釋整個宇宙了, 就連與世隔絕的部落巫師都可以信心十足地跟你打包票他什麼都知道. 另一些宗教家或是哲學家則說這不是你們人類該管的事, 一切都交神就對了. 總之大家立場不一致.

本書 240 頁說到, 最早能講出一套道理的是看到蘋果掉下來的牛頓. 他在 1687 年解釋了"萬有引力". 1864 年馬克斯威爾整合了電力、磁力和光.  1905 年愛因斯坦以狹義相對論整合了時間、空間和電磁學. 1910 年愛因斯坦又以廣義相對整合了狹義相對論和重力. 不過到此為止, 還是有不能解釋的事.

要知道量子物理在 1930~1970 年代就被陸續討論, 並且用來解釋一些物理現象. 不過本人求學時代的 1980 年代, 物理教科書還無法把這麼 “新" 的東西講清楚, 故我們只學習了宏觀且非常確定的部分 – 力學、光學、聲學都是如此. 至於 “測不準原理" [1] 雖然也會被老師輕輕帶過, 但是老師解釋測不準原理時, 讓我們覺得好像電子也會做布朗運動, 所以測不準也沒什麼大不了的.

However, 即使是 WIKI [1] 這麼科普的解釋, 都能顛覆我們的想像. 以一個中學生多年的訓練來說, 多測幾次, 求平均值, 結果應該是愈量愈準. 就算每次數據有點小飄移, 我們還是可以靠著大量量測得到更準的 mean, 和更小的 variance. 不過當我們去觀測的極微小的物體 – 電子時, 就必須用波長很短的光, 海森堡就是用咖瑪射線去觀察. 但咖瑪射線的能量對觀察物來說顯得太大, 被觀察物受到能量激發, 就直接跳到另外一個位置或是能階, 從原本的位置消失. 它不是遊走, 慢慢飄走那就不稀奇了, 那還是古典物理. 它是穿越, 彷彿不存在中間的路徑上. 想想高中升學到瞬移會有多 high 啊!

能夠從 A 直接跑到 B, 這個不是粒子的特性, 而是波的特性. 於是我有一個可以類比Gogolo 英文單字記憶法的突發奇想. 可以想像成原本 A 地方的電子是一個波, 被觀察時來了另外一個波, 兩波交互作用疊加之下,  A 地方的新波包可能不再是波峰, 新的波峰跑到 B 地去. 這樣看起來就像是物體從 A 瞬移到 B?

雖然本書 P.29 講過: “用一句話來概括量子力學的精隨: 萬物皆振動."  把電子當作波來解釋量子的瞬移, 這個想法應該也不能說沒根據吧. 說不定還可以變成 “萬波中正" [2] 學說. 不過, 咳咳…. Youtube 網紅和補教老師看來都不同意…., 他們一致認為收到能量的電子真的瞬移了. 那就言歸正傳啦. 哈!

再來看數學上的理解, 海森堡最初的論文 (1925) [3] 並沒有把公式的單位寫得很清楚, 只知道 X 是位置資訊, P 是擾動資訊. 甚至電子顯微鏡的發明, 根據 WIKI 所述是 1926 年 [4].  可以想見海森堡的儀器還是比較陽春的. 他的公式如下:

這式子怎麼來呢?  從古典物理也可以解釋. 首先根據 sampling theory, 要用兩倍頻率才能取樣一個頻率訊號, 同理, 用半個波長的光才能觀察一個波長的大小. 所以當物體有 Δx 的偏移, 觀察波要小於  λ/2. 故直覺可以得出 Δx < λ/2.

當這個觀察波打中被觀察物體, 被觀察位體吸收到這個能量 p 而偏移Δxp, 則Δx可想而知是 p 的水平分量, 這樣才能能量守恆.

Δx = p * sin(θ), Δx ~= p * θ,  θ 角是相對於垂直軸的逸散角度. 為何規定只能在水平軸移動呢? 這也是因為海森堡的模型就是從水平方向給予能量, 或許是不能對著眼睛打咖瑪射線吧? 因此 Δx 也變得只能考慮水平分量的投影. tan(θ)  = Δx / (λ/2)  => Δx = λ/2tan(θ) => Δx ~= λ/2θ. 附帶一提, 不是每個三角函數都是 xxx(θ) ~= θ 欸 [5].

根據以上瞎掰補完 wiki [1] 沒講的, Δx * Δx ~= p * θ * λ/2θ = p λ/2. 這樣就偷雞摸狗地把 θ 消掉了.

Δxp  Δx ~=  p λ/2

因為這裡的能量 p 是基本上和量子大小沒關係, 所以即使從古典物理得到測不準原理的佐證, 顯然還是不太夠. 本書 p.100 說到.  1924 年, 徳布羅意 (de Broglie)  “重新描述" 了愛因斯坦 “光子的動能即為光波波長" 的想法, 提出能力愈大, 責任就愈大. 動能有多大, 波就有多大. 故 λ = h/p.

其中 p 是動能, h 就是整本書中數一數二重要的普郎克常數. 有時候 λ 會寫成 λdB, 這不是指分貝那個 dB, 而是指de Broglie. 把 λ 帶回去上面的測不準公式. 測不準原理就量子化了.

Δxp  Δx ~=  p λ/2 = h/2.

如果同意徳布羅意的假說, 萬物有能量就有波動 – 這個波不是光波聲波, 而是物質波 (matter waves). 那就同意了萬物都有粒子和波的特性, 而不僅僅是光子而已. 後續的科學家也證實, 不只是光子, 就是電子、原子、分子也都有波粒雙重性 [6].

以上大致整理了我對測不準原裡的新認識. 謬誤之處可能在所難免. 主要是考量到在眾多科普書籍當中, 很少有針對學過普通物理的人給出手把手的指導. 不是難如登天, 一頭就栽入學問大海; 要不然就太扯, 馬上把量子物理轉換成靈修題材 (因為量子的現象的確顛覆了許多古典物理的認知). 所以我以我能瞭解的程度歸納一下.

這本書基本上也是一下子就跳太遠了, 我看完還是霧煞煞. 但是我想我可以針對學校教過一點皮毛的地方來切入. 如果有空的話, 下次我會從楊氏干涉入手. 同樣地, 當初學校教到這段我們也只是學到戲弄一下姓楊的同學而已, 沒有感受到量子在裡面的意義.

[Note]

  1. 不確定性原理 – 維基百科,自由的百科全書 (wikipedia.org)
  2. 万波 中正 | 球員介紹 | 北海道日本火腿鬥士隊 (fighters.co.jp)
  3. Über quantentheoretische Umdeutung kinematischer und mechanischer Beziehungen. | SpringerLink
  4. 電子顯微鏡 – 維基百科,自由的百科全書 (wikipedia.org)
  5. https://kknews.cc/news/jk2ly3l.html
  6. 物質波