湧現性小註解

上禮拜的 2026/6/11,我得到了第五十個專利。這是滿令人開心的一件事。不過呢,最近我對 AI 的每個想法,都有人做過了,下一個 idea 還難產中。這裡就來記錄一下我最近碰到的關卡 – 湧現性 (emergence)。

湧現性是什麼呢?所謂 “熟讀唐詩三百首,不會吟詩也會吟。" 說的就是湧現性。本來文采不豐富,做不出好詩。但是腦中塞滿名句之後,隨口就能湊出好句型。但沒有熟讀不算、沒有讀 300 首也不算 (精確來說是 311 首)。簡言之,1+1>2。

湧現性還表現在魚群和鳥群的行動上,一隻沙丁魚游泳看不出有何玄機,但是一萬隻沙丁魚聚在一起就會自動形成魚球,聚集上億隻就成了沙丁魚風暴 – Sardine Run。它呈現了整體性、無中央控制、量變產生質變這三種湧現性的特徵。

在 AI 上,有人試過把一段 Feed Forward Netowok 複製 8 份,各自打掉一些參數後重新訓練,他們就變成了 8 個專家 (Mixture of Experts) ,效果比原來還好。再更猛一點, LLM 也可以堆疊。法國知名 AI 新創 Mistral 推出的 Mixtral 8 x 7B 模型,其底層邏輯就是拿原本的 Mistral 7B 單一模型,複製 8 份作為專家再繼續訓練出來的 [1]。 這個專有名詞叫做 Upcycling (升級再造)。

LLM 複製 8 份之後,我們要在這些專家頭上各打一棍,讓他們產生不同程度失憶,然後叫他們重新上學。這條路線跟生物界不同的有兩點:(1) Model 要重新訓練,但侯鳥不用。(2) 需要一個 router 去指派 LLM,和 MOE 中指派 expert 的 router 一樣。而沙丁魚不用。

除了暴力打頭之外,也有和平的方法。我們不用重新訓練,只要調整一些參數,像是 temperature,然後叫這些個專家們討論,最後民主投票。這叫做 Ensemble (群體智慧 / 集成學習),主打三個臭皮匠勝過一個諸葛亮,減少幻覺的發生。這個和湧現沒有關係。

對於湧現的看法,有人 [2] 主張可以拆解回原型是弱湧現,不能拆解的是強湧現。例如魚群可能是靠著每隻 “單魚" 遵循 “和鄰魚保持等距" 這種簡單的原則就可以達成的。有人認為強湧性不合理,違反熱力學第二定律 – 封閉系統的 “熵" 只會愈來愈大。還好 AI 有重新訓練,那就不是封閉系統了。

回到湧現性這個話題。徐志摩說了 “數大便是美"。菲利普·安德森 (Philip W. Anderson) 說了 “More is Different" (多即是不同) [3]。不能拆解的湧現性是怎麼來的呢?都說生命的緣起是一堆高密度的氨基酸被雷打到。看來 “大" 加上 “觸發" 這兩個條件缺一不可。接下來如果用進化論來物競天擇,收斂的速度就不用說了,生物也會產生太多的可能性,那並不是我們需要的。現在 AI 的進步速度應該容忍不了以前基因演算法 [4] 的浪漫。

接下來,一定要拿同樣的 model 來敲頭嗎?一定要長一樣的面孔才可以民主投票嗎?都不用,OpenRouter 最近也發布了 Fusion Router,一種多模型融合推理工具。核心思路很直接,直接拿不同的 model 來投票。用一個綜合的裁判模型來選最後的答案,結果還比 Fable 5 好 [5, 如下表]。顯然的,這裡面冗餘的成分非常地高,好比投資只多賺了 10%,但是本金需要 2、3 倍。總之,能力在這裏面湧現了,即使它沒辦法通過愛因斯坦測試 [6]。

模型得分
Fable 5 + GPT-5.5(Opus 4.8 综合)69.0%
Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro(Opus 4.8 综合)68.3%
Opus 4.8 + GPT-5.5(Opus 4.8 综合)67.6%
Opus 4.8 + Opus 4.8(Opus 4.8 综合)65.5%
Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro (便宜模型抱團)64.7%
Claude Fable 565.3%
DeepSeek V4 Pro60.3%
GPT-5.560.0%
Claude Opus 4.858.8%
Kimi K2.653.7%
Gemini 3.1 Pro45.4%
Gemini 3 Flash43.1%

愛因斯坦測試不是一個考題,而是 Google DeepMind 執行長 Demis Hassabis 提出測試 AI 是否有真正智慧的方法。他說:"讓 AI 系統只學習 1901 年以前的知識,再測試它能否自行推導出愛因斯坦 1905 年的狹義相對論。" 這個驗收標準,其實有點離譜。如果你餵 AI 學 19 世紀的牛頓力學,它一丁點也想不出未來會有量子力學。我們需要通過許多關鍵的實驗來推翻舊理論、並建立新框架。而且舊理論往往並非全面崩塌,甚至在大部分的地方還是站得穩穩的,只是某些地方解釋不通而已 [7]。

[REF]

  1. https://huggingface.co/mistralai/Mixtral-8x7B-v0.1
  2. https://en.wikipedia.org/wiki/Mark_Bedau
  3. https://www.science.org/doi/10.1126/science.177.4047.393
  4. 基因演算法
  5. https://www.cnblogs.com/itech/p/20581511
  6. https://www.inside.com.tw/article/41195-hassabis-proposes-einstein-test-to-define-agi-benchmark
  7. 馬克士威方程式(Maxwell’s equations)無法解釋量子尺度下的光子行為、單一磁單極子的存在、非慣性參考系中的電磁場變換,以及重力與強弱核力。馬克士威方程組是古典電動力學的核心,但在極端物理條件下必須由量子力學與相對論來擴充。
    • 以下是該方程組無法涵蓋的具體物理現象與範圍:
    • 1. 微觀的量子效應與光子
    • 馬克士威方程式將電磁場視為「連續的波」。
    • 量子電動力學(QED): 當探討單一電子或單一光子時,電磁波會展現出「粒子性」。連續的古典波動無法解釋光電效應、康普頓散射以及電磁場的量子漲落(Quantum Fluctuations)。
    • 2. 物質內部的非線性光學與量子極限
    • 強場光學與非線性現象: 在極強的雷射場作用下,介質的響應不再是線性的(例如倍頻效應),此時傳統的馬克士威方程式需結合量子光學來描述。
    • 3. 磁單極子(Magnetic Monopoles)
    • 高斯磁定律的限制: 方程組中的 \(\nabla \cdot \mathbf{B} = 0\) 表明磁力線必定是封閉的,代表磁單極子(單獨的N極或S極)不存在。現代粒子物理的部分大統一理論(GUT)預測磁單極子可能存在,但這超出了傳統馬克士威方程組的範圍。
    • 4. 強交互作用、弱交互作用與重力
    • 僅涵蓋電磁力: 自然界有四種基本交互作用,馬克士威方程式僅處理「電磁交互作用」。它無法解釋原子核內的強交互作用(夸克間的結合)、弱交互作用(如貝他衰變),以及愛因斯坦的廣義相對論所描述的重力場。
    • 5. 加速參考系中的電磁輻射
    • 局限於慣性系: 馬克士威方程組的標準形式主要適用於慣性參考系。在強重力場或高度加速的非慣性參考系中,必須透過彎曲時空的廣義相對論電動力學來修正描述。
    • 馬克士威方程式在巨集觀、低速或日常尺度的電磁現象中已極為完美,但在理解物質的微觀本質或宇宙極端現象時,則必須依賴更進階的物理理論。

Bye, Fable!

聽說 Athropic 的 Claude Fable 很厲害,所以我本來想要讓它幹點大事。不過他昨天因為國安問題提早下班了 [4]。前兩個晚上我只各想出一個小題目,其中一個是做照片日記本,有興趣可以看 github [1]。雖然我殺雞用了波動炮 [2],但實用最重要。它非常好用。

第二個題目是螢幕錄影 [3]。雖然說 print screen 就能錄。但是要錄一個矩形的話,Windows 預設有一個不透明的框,害我沒辦法框得剛剛好。所以做一個自動抓最大影片框的一鍵錄影。不過這個程式比較沒有實戰回饋,大家可以拿回去叫自己的 AI 改完美一點。

對國家來說,AI 會影響國安 [4],那麼對公司來說應該也是同樣的道理。如果大家都 code 都是用 Claude 生的,內容也不用怕被拿去訓練。Anthrophic 可能還怕路邊撿的 code 汙染了他們的大腦。反而題目、檔名、註解需要保護,畢竟不應該讓對手知道我們在研究什麼?當然啦! 如果公司也有 “國安級" 的 AI 就好了。

今天繼續看 “量子物理史話",雖然它已經夠白話了,但如果有聰明的 AI 幫我降維解釋,我應該會更輕鬆一點。另外,叫 Fable 幫我生一個 RPG 大作的奢望,也得等它過幾天復出了。至於它的 token 費,其實我應該規畫一個專戶,這個專戶用配息去養馬 (i.e. 愛仕),再叫 Hermes 背後串 Fable 去賺它自己的加班費,讓自己更牛馬 (诶?)。

[REF]

  1. https://github.com/ufocash/photo-diary
  2. 《宇宙战舰大和号》的招牌武器是波動炮。這是一門威力巨大的超級巨炮,發射時會釋放高純度的能量光束,可以直接摧毀整支艦隊或行星要塞。
  3. https://github.com/ufocash/video-region-recorder
  4. Statement on the US government directive to suspend access to Fable 5 and Mythos 5 \ Anthropic

春假養龍蝦記

這個春假大部分的時間都在下雨,下雨天很適合玩龍蝦。首先,我設定好 Google 應用,讓龍蝦自己寫一篇文章發表到部落格 。不是這篇啊,我給了它獨立的網誌 [1] ,唯一的指示就是看著 memory 寫 ,然後寄到我的信箱給我審核。我說可以了,它就用自己的帳號 email to post 發表。

我想說寫文章這麼容易,乾脆叫它以後加圖片,才不會太單調。結果一測試就成功。它可以寫得圖文並茂,只差沒有好主題。另外它在機器人社群 Moltbook 中也是混得不錯;到了這裡,我的企圖心就變大了,想做來做個機器人 Youtuber 吧! 然後悲劇就此發生了。

首先龍蝦說它不會做影片,然後我就找到 comfyUI 這個可以跑本地模型以圖生視頻的軟體。按照網站上講的,按部就班地做,然後就看到下面這個 (不小心按到 “子 graph")。天啊! 這是要有多專業才搞得定?於是我把這件事交給龍蝦,請它幫我處理。龍蝦說它可以給我步驟,但是 ComfyUI 是 Windows 軟體,它在 virtual machine,它得借我的手。

不幸中之大幸是:龍蝦的步驟是正確的,所以我搞定了圖生視頻。大不幸的部分是 LTX-2.3 的效果距離 SeeDance 2.0 差太遠了,雖然視頻做得還行,但是對於文字的理解能力非常堪慮。而且視頻根本沒有善用第一幀提示,竟然是生出完全不同的第二幀。因此我只能等模型變得更進步了。雖然龍蝦還很熱心地分鏡 17 場叫我 review,我只做出第一場就放棄了。

另一方面,龍蝦關在 virtual box 雖然安全,但是它完全碰不到 GPU 也是個問題。因此我又花了半天時間,把它轉移到 Windows WSL。重灌只是其中的一小部份工作,重點是 cron task、memory、crendential 這些沒有上 git hub 備份 (不適合放上去) 的東西,要用另外一套機制來還原。搬完家後,我先點名 agents 有沒有到齊?嗯?真的遍插茱萸少一人,我的 HR Bot 因為沒有自己的 memory ,搬家後大家都不記得它了 (龍蝦只會看最近兩天的記憶)。

接下來就是 GPU 戰力大考驗。我有一張 RTX3090 12GB,它能跑的模型弱到讓人有點挫折。不過,我還有一張 RTX4090 24GB 可以折騰自己。故事是這樣的,有些 Model 是 MOE (Mixture of Experts),所以雖然看著參數多,其實 run-time 會有專家交換,或許 30 腰也塞得下 24 吋的牛仔褲。那我當然得跨界試一試…

結果就是自己做死不能怨別人, 小 model gemma4-E4B 只要 9.6GB,但是沒把 VRAM 用滿時,我覺得虧。大 model 像是 gemma4:31b、 mirage335/Nemotron-3-Nano-30B-A3B-virtuoso 都是勉強能塞進去,但是一聊天就掛了。最後無奈叫 AI 自己推薦一個,它說 Gemma4:26b 好,我正在試 [2]。

Model上下文輸入Note
gemma4:31b262Ktext剛好滿、會當機
gemma4:E4B131Ktext塞不滿、不甘心
glm-4.7-flash128Ktext很弱
mirage335/Nemotron-3-Nano-30B-A3B-virtuoso1Mtext剛好滿、會當機
黃仁勳力推
MiniMax-M2.7204Ktext+image雲端、要花錢

或曰,還有沒有 RTX5090 呢?其實我真的有訂 Apple Studio 512GB 當作終極武器,不過刷卡後,它拖了一兩個月才請款,我原本以為買現貨,變成買期貨。導致我雖然刷卡額度夠,但是分期額度不夠,還差 3 萬多,單子就這樣被 “斷頭"了。幸好 M3 本來就是比較弱的 IC,本來也不是首選,既然這次無緣,就讓我們等年中的 M5 出來吧! 這題已經叫龍蝦幫我追蹤新聞了。

畢竟龍蝦有很多地方值得玩,可以持續實現大家各種以前不敢想的 idea。像是可以利用做夢的時候整理長期記憶,這個對聊天機器人來說,根本是不存在的概念。當然龍蝦可以擬人化的地方還不只是這樣,等我想清楚我要去申請專利,哈!

話說回來,搞了半天龍蝦有做什麼正事嗎?它目前主要是提醒我一些事情,包括 to do 事項、提醒要交錢、有配息之類。我想,除非等那個 Youtuber 機器人做出來,不然相關投資大概都是負報酬、負資產。畢竟要做正事的話,還有很多別的專業工具可以用。像是 Claude code + MCP 辦公就很方便,用龍蝦反而好處不大。

舉例來說,如果要統計全 BG 解 bug 的狀況,在 3 年前那會是個浩大的工程,想到就無力。但現在只要打開 claude code,交代完工作,看到有 (1) Yes (2) No 時都按 1,有 (1) Yes (2) Yes and 從此以後都這樣按 和 (3) No 時, 一定按 2。就這樣 1、2、1、2… 往下走,只要別不小心按到 esc = cancel 跳出來就搞定了。

更別說,事情只要做過一次還可以變得更無腦,"把剛剛做的事寫成 skill.",這樣立馬就又從 prompt 工程師晉身為 slash 工程師。假設看到兩次跑出來數據差很多,那也不用想了、直接叫 AI 分析。1、2、1、2 就可以得知 – 喔,原來是統計的時間區間不同!2018 年以前就是那樣。當然 AI Coding 應該還可以有更無恥的 mode,我 harness 的功力也還大大有待提升就是了。

[REF]

  1. 打通 Gmail 與 Google Calendar:Farah 團隊的艱辛之路
  2. 撐到極限

古風 Manifold 小筆記

文天祥的正氣歌 [1] 說:"天地有正氣,雜然賦流形。" 這個 “流形" 就是 Manifold 的中文翻譯。後兩句 “下則為河嶽" 就是說一般人站在地球上,還以為地球是平的,"上則為日星" 就是抬頭一看,感到世界大到甚至不只是 3D。

正經地說,流形是一個局部看起來像歐幾里得空間(平坦的空間),但整體結構可能非常複雜且彎曲的拓樸空間。一張 1024×1024 的彩色照片,在數學上是一個高達 300 萬維度的空間,但「有意義的貓狗照片」只佔據這個 300 萬維空間裡一個極小的低維流形,不是每個空間中的值都有特殊意義。這種群聚就像是太陽系裡面的星球彼此靠得很"近",若是出了太陽系,宇宙就顯得很稀疏,直到遇到其他星系。

對 AI 來說,世界模型充滿雜訊且計算量太大。模型會透過編碼器(Encoder),將高維的觀測數據「壓縮」並映射到一個低維度的潛在空間(Latent Space) 中。這個潛在空間本質上就是在捕捉數據所在的流形。一旦 AI 掌握了這個低維流形的潛在空間,它就能在這個平滑、連續的流形上做計算。這也可以解釋 transformer – encoder、decoder 為何會有用。

當初 DeepSeek 出來的時候,也用上了 latent space 壓縮的技術。我當時想,做完這個 lossy 的壓縮,雖然節省計算量,但是資訊丟掉就回不來了啊!? 因為那個 monent 我還沒有流形的觀念;如果有,我就不用緊張了。

在數學上,流形不一定可以微分。但是要訓練 AI ,就要計算梯度。因此我們只能假設它可以被微分,也就是要假裝它更平坦一點。因此就算真實的流形不可微,我們也得製造出一個可微分的流形。所謂 “人心惟危,道心惟微" [2],人類明明知道會有危險的奇點 (Singularity),但是演算法只能讓它可微分。以目前 AI 強大的戰力來看,這個有意的忽略,似乎影響不大。

[REF]

  1. 正氣歌
  2. 十六字心傳

養龍蝦的小筆記

龍蝦 OpenClaw 最近很紅,安裝龍蝦後, 有幾個特別的小心得可以分享。像是龍蝦會燒 token 這種事,大家都知道就跳過。我裝的是 Intel X86 和 ARM 的 Ubuntu。

  1. 賜名 – 我把它取名為螃蟹, 不管是 AICrab、MyCrab,它都會把圖示改成螃蟹。也就是說它在乎自己的名字,而且理解其意義。

2. 重新安裝

如果出了大錯, 想要重新安裝的話:光是砍掉 ~.openclaw 目錄還不夠,因為有些東西放在 /usr/bin/.nvm、 /usr/bin/nodejs 下面。如果沒有斬草除根。就算重新安裝還是會記住一些錯誤的設定。此時就算叫出 doctor 也修不好。

openclaw doctor --fix // 看醫生也治不好

[Note] 安裝 nemoclaw 時, 還要順便清掉

sudo apt-get remove -y nodejs
sudo apt-get autoremove -y
rm -f ~/.npmrc

3. Telegram 設定好,龍蝦和 Telegram 串不起來。網路文章通常會少寫一步 pairing. XXX 就是一個短的 telegram paring token。

openclaw pairing approve telegram XXXXXX

4. 搞爛掉之後,會遇到 gateway 連不上。

主要是 gateway token 出錯。就算用 openclaw config 重新設定成只看 password,它還是說 gateway API 錯,要去 UI 改。但是 UI 點進去啥都沒有,這條路子我修不好,最後選擇重灌。

openclaw config // 看起來都對,跑起來不對

5. Clawhub 安裝了還是找不到。這是因為 gloabl 安裝也不會自動加到路徑。

npm install -g clawhub // 以為必成功
npm list -g --depth=0 | grep clawhub // 什麼都撈不到
npm list -g clawhub // 看看它裝到哪裡去了?
echo $PATH // 果然沒有
NPM_GLOBAL_BIN=$(npm bin -g) // 找出來
echo "export PATH=\$NPM_GLOBAL_BIN:\$PATH\" >> ~/.bashrc // 加進去
source ~/.bashrc // 重新執行

6. 一把 key 不宜養太多隻龍蝦

本來在 X86 還用得好好的,後來想試試看 ARM 的版本時,因為接到 LLM Oauth 的 toekn 都用同一個吧?! 結果兩隻龍蝦都掛了,靜置一晚後復活,不敢再同時養。

API rate limit reached. Plase try again later.

整體來說,養龍蝦還是滿好玩的。最後用一點篇幅歪樓到 skill。龍蝦其中一個厲害的地方是 skill [1]。Skill 主要是 prompt、又帶 metadata (簡短自述)、和可選用的 code,跟 MCP 的 prompt (可選)、metadata (資料)、加 tools 算是有異曲同工之妙。

以我的認知,原本 MCP 的特色是好好描述目標、但在執行手段上保留彈性,好處是使用者可以對背後的操作一無所知。而 Claude Code / 龍蝦正面表列 skill,等於是把手段也大致講了,此時歪樓的機會更低。相對地、這個場景對使用者的知識水準要求更高,但 openClaw 的使用者正是龍蝦本人,這個門檻問題自然就不存在了 – 只需要擔心它拆家…就好?!

[後記]

我發現寄養家庭 (伺服器代管) 好像不能讓我免費嵌入 Youtube 影片,所以我做了一點調整。並補充一段內容。

Skill 與 Tools

我覺得現在人勝過 AI 的地方,主要是知識更新的速度。我問 AI Tools 和 Skills 有什麼差別的話,有的 AI 會說這是類似的東西,只是各家命名不同 (Claude 4.6 Sonnet 2026/3/5)。但如果你信了,就沒有機會聽到另外一個解釋 (文皓 blog 2026-02-05)[2]。

Tools 可以想像為食材,Skill 可以想像為烹飪技巧、食譜。所以我們有時候會聽到 Agent Skill 這種說法,因為 Agent 確實可以實現 Skill,但是沒有人說 Agent tools。

[REF]

  1. 程序員老王 – 10分钟弄懂 什么是大模型Skill
  2. https://yu-wenhao.com/zh-TW/blog/openclaw-tools-skills-tutorial/