我讀 «輝達之道»

這個年假原本打算讀兩本書、 校稿兩篇專利 (?)、 準備一些美金看美股有沒有便宜可以撿、最後再看一下同事介紹的 DeepSeek 在幹啥?

不料就在年假的第一個周末, DeepSeek AI 突然直接攻佔各種新聞版面, 變得幾乎無人不知無人不曉. 週一晚上的美股 – 尤其是輝達價格大跳水! 這下我的好幾件事都連結在一起了. 因為我想讀的其中一本書就是 “輝達之道".

這本書原名 “The Nvidia Way", 作者是金泰 (Tae Kim), 譯者是洪世民和鍾玉玨. 本書非常值得推薦, 雖然翻譯有幾處比較不通順 – 不知道副詞子句是在講主詞還是受詞, 但整體可讀性沒問題. 每個人看這本書的觀點可能有些不同, 它可以是勵志的新創公司成功記、可以是黃仁勳發跡故事的側寫、或是一本 GPU 簡史. 對我來說, 它就是 Q&A. 解惑了我好幾個問題.

Q1. Nvidia 為何沒有變成一代拳王? MTK 蔡明介想過這個問題, 黃仁勳也想過. 兩個人遇到的狀況不同, 解法也不一樣. 黃仁勳認為會有一代拳王的是因為大家技術差不多, 但開發一顆 IC 要一年半的時間. 所以當你暫時領先, 對手的新產品就會比你厲害! 假設產品規格並沒有太大的改變, 只要規格疊得高, 那一代新人換舊人就是理所當然的.

黃仁勳解決這個問題的方法是成立不同 project, 開發週期彼此交錯, 共用資源和資訊, 隨時調整規格, 並且準時交貨. 從外界來看, Nvidia 推出產品的時間自然而然就縮短了, 對手很難在兩代產品交接的空檔中找到切入點! 當然這是在 graphic card 大混戰的時代才適用的策略. 如果大勢已定呢? MTK 理所當然去找下一個明星產品, 而老黃則是直接把現在的產品調整到直指未來.

他怎麼做到的呢? 當然就不是兩三句話那麼簡單. 總之我認為他好好地接受了不平凡的建議, 又壓榨出了驚人的成果. 像是光追, tensor, CUDA, NPU, GPU (替代 graphic card) 這些都是底下的人想出來, 再透過老黃鋼鐵的意志實現它. 底下會提到 Nvidia 發明了 GPU 這個名詞來和 graphic card 區隔.

Q2. 為何要叫做 GPU? Nvidia 的產品經理認為他們 graphic card 可以同時處理 4 個 pixel, 能做圖形的旋轉平移, 這些都取代了原本的 CPU 程式, 所以應該叫做 GPU. 於是老黃就在 1988 年 8 月宣稱他們的 GeForce 256 是全世界第一顆 GPU, 即使那顆 GPU 還是要下 register 才能叫它做事, 還不能真的寫高階程式語言.

Q3. 為何雲端運算需要 GPU? 這要先從高速運算說起. Nivia 的團隊在設計 Geforce 3 時, 為了解決 render 上較複雜的計算, 開發者藏了一些可編程的運算單元在圖形處理之中. 當然這代表 GPU 就有了一些浮點矩陣運算的能力. 即便只能用 OpenGL 或是 Nvidia 的 Cg (C for graphic) 來 coding, 至少硬體非常強大.

高速運算原本是 CPU 的市場, 強大的 CPU array 就是超級電腦. 當學者或研究單位擁有超級電腦, 就可以快速地完成複雜的計算. 但沒有被分配到這類珍貴資源的學者, 就算有很好的想法也無法領先發表論文, 輸家就永遠是輸家. 久而久之就形成了學術壟斷.

2002 年, 有位馬克哈里斯 (Mark Harris) 研究員發現許多科學家開始用 GPU 做 “非圖形" 的研究. 狀況就跟現在很多公司、大學都用 RTX4090 而不是 DGX B200 做 AI 實驗是一樣的道理 [1]. 所以他就架了一個 GPGPU.org (generla purpose GPU) 的網站, 幫助大家活用 GPU 來代替買不起的超級電腦. 接著 Nvidia 發現了這個網站, 招募哈里斯加入 NV50 (G80) 團隊.

G80 的 GPGPU 能力比過去更強大, 不再使用 Cg, 而是推出了 CUDA (Compute Unified Device Architecture). CUDA 呼叫 GPU 的 PTX 指令集, 讓大家不需要特別去學這個架構的組合語言, 而是有專屬的 compiler 可用. 黃仁勳說: “CUDA 讓我們的成本大為增加". 但是他們達到了目的: (1) 讓所有的人都可以用 CUDA, (2) 讓 CUDA 適用於所有領域. 於是有愈來愈多人發掘出 GPU 的用途, 從模擬新藥、挖礦 (虛擬貨幣) 到訓練 AI.

當然 Nvidia 的故事也不是都這麼正面. 他們發現科學家工程師只買電腦版 500 USD 的 GPU, 而不買他們更貴的伺服器版 2,000 USD 的 Tesla (p. 378). 於是 Nvidia 自己宣稱他們 PC 版的 floating 不太準, 伺服器版才準. 在被沃克教授證實並沒有不準後, Nvidia 改為在不影響圖形輸出的程度下把它改成不準. 沃克和它的團隊又再把它 patch 回來! 並且在他在藥廠的新工作中,買了成千上萬的電腦級 GPU 來建立 data center.

Q4. 為何大家都用 Nvidia 的 GPU 訓練 AI? 別家的卻不行? 這個問題一半的答案就是 CUDA, 它不是一張繪圖卡或是遊戲卡, 而是算力卡. 若只是要畫出滿屏的圖形, Intel 自己就可以做到了. Nvidia 預先看到這一點, 因此用 GPU 和圖形輸出做出區隔. 並且賣得超級貴. 別人的產品都是 ASP (平均銷售單價) 愈來愈低, Nvidia 主打愈賣愈高, “買愈多省愈多"!

回歸 AI 這個主題. 過去的 Machine Learning 都是先找特徵, 然後統計特徵值, 根據統計原理做分類. 直到 AlexNet 出現, 才有不找特徵, 讓系統根據 label 過的資料, 自己找出規則的 Deep Learning. 當然這就不得不歸功於當初 labeling 這些 database 的先驅李飛飛. 發明 AlexNet 的多倫多大學團隊 (當然包括其中一個學生叫做 Alex) 就是使用輝達的 GeForce 500 做訓練, 他們在第三屆 ImageNet 大賽, 成果遙遙領先其他舊演算法 10% 以上 (p.425).

從此以後, 大家都知道要用 GPU 做 Deep Learning (DL). Nvidia 也看到這個 AI 商機特別大. 因此再推出 CuDNN (CUDA Deep Neural Network) 強化對 AI 的支持度. 對於一般高速運算的市場, 硬體需要支援 FP32 或 FP64 (浮點 bit 數). 但是對於 Neural Network 的訓練來說, FP16 就夠用了. 因此 Nvidia 的 GPU 從 2016 年開始都支援 FP16. 而且還加入了 Tensor Core. 書上提到老黃臨時在 tape out 前幾個月說要加 Tensor, 大家怎麼趕工達標. 這個不是本文的重點就先略過.

Tensor Core 有什麼好處呢? 因為 DL model 裡面都是矩陣運算, 而 CUDA Core 只是浮點乘加器, 需要 CUDA compiler 來優化計算流程. 假如矩陣運算有特別的硬體, 那麼採用 CuDNN 來編 code 就可以更加地優化. P.433 說到,有 Tensor 快 3 倍. 這就解釋了為何大家都愛用 Nvidia 的 GPU 來開發 AI 軟體, 而不用市售的 NPU. 市售的 NPU 對於常用運算子的軟硬體優化差了 Nvidia 一大截. 所以做某些推論應用 (inference) 還可以, 整體而言是事倍倍功半半.

Q5. Nvidia 怎麼搭上 DPU? Mellanox 這家公司把 InfiniBand 這個標準做成高速網卡, 在數據中心可以 offload CPU 對網路封包處理的算力消耗. 雖然生意不錯, 但這家公司太小, 負擔不起高昂的研發費用, 最後只好賣公司. Nvidia, Intel, Xilinx 三家競標之下, Nvidia 看到它在數據中心的綜效, 因此花了每股 125 美元 (共 69 億美金) 標下股價 76.9 的 Mellanox.

接下來, 老黃又出來說我們發明了第一個 DPU. 當然, Nvidia 敢這樣講, 就是他們又投資了更多加速的軟硬體, 跟一般的 SmartNIC 做出區隔. 想要再重演一次“GPU 不等於繪圖卡”的劇本。

這本書的內容當然不只於此。或許可以用創業和經營事業的觀點再重新詮釋一次。像是保持扁平團隊,保証訊息一致,還有老黃偏執地好學等等。這部分就等我看完張忠謀自傳再來匯整好了。畢竟兩大管理者可以互相輝映。

[REF]

  1. https://www.cool3c.com/article/218920

我讀《別把錢留到死》

本書原名“Die With Zero”, 翻譯成‘’別把錢留到死‘’算是相當傳神。正如其名,作者 Bill Perins 的中心思想就是:我很有錢了,你也趕快把錢在生前花光光,不要再想著賺錢了!

聽起來對於世界上 99% 的人都不適用。但是他的想法確實很有意思,值得我們深思。所以在瞭解他的思路之餘,我也把我的共鳴之處記錄下來。

本書只有356頁,推薦序各界好評等內容就占了二十多頁,附錄也差不多長。基本上本書非常地精簡。中心思想已經講完了。主要的篇幅是在釋疑。

1. 作者說若要把給子女的錢就要適時給出去, 例如兒女已經 30 歲且成熟到能善用這筆錢的時候就該給。等自己 80~90 歲死掉留下遺產時,子女也老到 50~60 歲無法盡情享受了。扣掉這些錢,就可以把自己的錢在死前花光!

2. 快死了才把錢捐出去不算慷慨。因為這些錢對自己的價值幾乎就是零。也就沒有什麼捨不得了。生前就捐贈的人更為無私。真的想捐,捐掉之後就可以安心地規劃 die with zero 了.

3. 健康,時間,金錢是三個生活品質的要素。其中健康因素,或者說是年紀,通常容易被忽略。我們以為自己可以依照慣性永遠用時間換錢。理財書籍通常教我們忍耐, 晚點再吃棉花糖的效益更高。但忍耐大半輩子,  已經老到不想吃棉花糖的時候,這個選擇就沒有意義了。不如趁早該吃的吃,該玩的玩。

正因為我們會衰老,因此要考慮何時該忍耐? 何時該盡興? 假如明知四十歲會比二十歲有錢,那麼該吃棉花糖的是二十歲 (多冒險、多享受),該忍耐的反倒是四十歲 (慎重工作),這樣才能把錢留到六十歲。至於八十歲的人,給他錢也不能幹嘛,除了看病和被詐騙也花不了大錢。

4. 假如同意了作者的看法。剩下的問題是何時該放下工作或是半退休?作者認為大部份的(美國)人都够有錢了,統計起來愈老愈有錢,而不是更窮。所以錢夠用了之後, 選擇一個退休日就可以全力體驗人生了, 不需要特定指定一個可以退休的金額, 那個數字對成功的人只會愈定愈高, 對失敗的人愈定愈低.

 

請注意這裡指的是淨資產。包括房地產和退休基金的自然增長。所以當事人本身不會覺得錢變多,薯條可以加大再加大。換個角度來看,既然死後也用不到房子,不如選個黃道吉日, 把房子逆房貸抵押給銀行變現, 接著就可以好好享受人生了。

考慮到上述的不動產和基金增長能夠抗通膨,作者計算出淨資產只要達到一年花費 × 預計生存年數 × 0.7 就够用一輩子了。例如年花300萬×45年×0.7=9450萬。差不多是一個億吧!

對照到台灣人平均的淨資產有479萬 [1],年齡中位數 45 歲左右[2],若立馬退休並活個 45 年,則每年只有 15.21 萬可以花, 比基本工資還低,顯然這是很難生活的。這也代表絕大多數的台灣人都還在拼生存基金。根本沒有達到可以參考本書的境界!

不過呢,根據同一個統計資料 [2],台灣也有七萬多人淨資產超過 1.5 億。他們確實當下就可以退休,並且以 450 萬的年開銷,爽花 45年。總之,本書是給少於一半的台灣人看的。也因為這樣,請綠角大來寫推薦序不會讓他太為難。畢竟人要先富起來, 才能考慮花到死,而不是花光了等死。

5. 有些人就是熱愛工作不想退休呢?作者說我們應該最大化人生體驗,而不是最大化資產。如果工作也可以優化人生體驗,那麼這些也可以加入計算。這部份是純屬主觀的,無法有統一的標準。基本上,作者會一直洗腦說你老了就不能OOXX, 所以不退休也要儘量花才不會後悔,特別需要體力的那些。

花錢也要花得妙才是增加體驗, 像是找人來打掃房屋, 搭商務艙旅行都是善用金錢. 但是吃頓 CP 值很低的大餐, 對人生體驗就沒啥幫助!

本書的宗旨大概就是這樣了。書中提到作者本來不是要寫書,而是要做 APP。APP放在 diewithzerobook.com,但是我還沒下載成功。

另外要吐槽一下。書中多次提到‘’蚱蜢與螞蟻’’這個寓言。說我們要平衡工作和享樂。不過螞蟻的壽命只有七個月左右,牠沒有辦法找到享樂的機會。螞蟻的壽命只有兩個月,牠沒有機會過冬,因此也不用儲存糧食。牠的糧食都是給後蟻和蟻后(可活五年)用的。這個寓言是好的,但不太科學。

[Ref]

  1. https://www.storm.mg/lifestyle/5219863
  2. https://pop-proj.ndc.gov.tw/Custom_Fast_Statistics_Search.aspx?d=H11&m=84&n=231&sms=10361

我讀 «大腦超載時代的思考學» – 8

本書接著講文件收納的歷史, 簡單地說在上個世紀前半段, 厲害的檔案櫃是可以參展和申請專利的. 主要就是文件的收納提升了超長期或者海量記憶提取的效率. 時值今日, 我們要考慮的是如何高效率地取用和備份檔案.

最後第七章還講了一段 Shannon Theory. 好懷念啊, 大二通訊原理的天條! 總之, 這段對我太簡單了, 對我老婆又太難, 跳過不描述. 比較少聽到的是柯爾莫葛洛夫 (Andrey Kolmogorov) 的概念 – “沒有辦法以縮寫的形式描述或是表現, 那麼一個序列就是隨機序列." (p. 320).

我把重點放在一心多用這個主題. 作者提到一心多用違反大腦運作的原理, 並且實驗證明有這種習慣的人在各種 (企圖多用的) 領域都表現地很糟. 反之, 當我們只做一件事的時候, 大腦的白日夢網路和相關連結都會受益, 並且能預防阿茲海默症 (p. 312). 年長者如果做了五次一小時的專注訓練, 腦部活動模式就會接近年輕人 (p. 313).

我本人以前是喜歡專注做一件事的. 但是看書看不下去的時候, 就會想看電視. 當年就是一面看電視, 一面把整本 Oppenheim (DSP) 的奇數習題做完, 才能夠一次考過資格考. 反之, 看金庸就沒有這個困擾, 我記得機率期中考前一天, 不知誰給了我幾本鹿鼎記, 我靠著宿舍走廊昏暗的光線, 笑到半夜 3 點多才捨得睡~~~

言歸正傳. 作者說到一心多用時, 主要是因為多巴胺 – 腎上腺素的刺激, 才會讓我們覺得同時忙好幾件事時很有成就感, 誤以為這樣才厲害. 作者從演化的觀點來解釋這個現象. 現在網路發達, 我們的確看到有人可以厲害到邊唱歌邊心算多數位的連加法. 即使不講左右腦同時開工, 也是有人可以同時寫兩個字、手腳同時演奏不同樂器之類的. 不過這是少數人, 而且他們沒佔到甚麼太大的便宜, 所以沒有變成大家的祖先 (根據進化論).

另一方面, 專注久了難免會累. 為了修復心智. 作者鼓勵減少工時並常常短暫休息. “十分鐘的小睡相當於幾個晚上多睡一個半小時", “員工多休假十小時, 主管評價上升 8%"…等等 (p. 311). 重點大概是這樣.

另外不是重點但也值得一提的還有兩點:

  1. 資訊不是愈多愈好. 大概取得中等的資訊量, 就可以做出最佳的決定了. 通常消費者也會對於商品產生負載效應 (load effect). 比較到一定數量之後就會做決定. 像是買車、看房子都是.
  2. 如果資訊太多, 自己要斷捨離. 因為 “人們無法忽略跟自己不相關的資訊" (p. 317), 廣告的原理應該就是這樣.

我讀 «大腦超載時代的思考學» – 7

雖然我也很想分享過年期間股票漲很多, 不過還是等整季過去再結算吧! 說不定到時候還虧了也說不定. 根據 BusinessFocus [1] 所述, 老巴都逢高賣 1% 蘋果了….說實在的, 現在美國科技股很瘋狂, 我看到矽谷資深女工程師 Lucy 的臉書覺得超爆笑. 不過, 人生苦短, 讓我們忘記穿越 + all in, 來研究更實際的事吧.

研究指出, 如果讓一般員工了解他們工作的意義, 有助於提升他們的使命感. 無論這位員工是專業人士或是警衛. 成功的管理者應該讓他的員工獲得這樣訊息, 這樣才能讓他們自主地往團隊目標邁進, 而不需要時時刻刻耳提面命. (p.292, p.298)

然而, 有些員工的生產力就是比其他人高. 書上說這個差異來自於個性、工作倫理和其他個人特徵 (在基因和神經認知的基礎上) (p. 293). 一般而言, 大家都知道主管對員工的目標設定要合理又有挑戰性, 員工的生產力跟工作滿意度相關, 後者我把它翻譯成個人自我實現程度在工作成果上的投影量. 一定有有點成果才能投影嘛!

那麼挑戰性怎麼反映在解剖學上呢? 大腦的前額葉有一個 47 區 (p.294). 這個區域位於太陽穴後方, 雖然沒有小指頭大, 但它負責預測的工作. 如果 47 區跑一下模擬後, 覺得這個事情可以徹底被分析完, 就會認為很無聊, 沒意思! 反之, 就會覺得有挑戰性. 而這也取決於創造力. 音符就那麼幾個, 貝多芬和莫札特可以變化出交響樂. 音癡怎麼看都覺得是豆芽菜.

另外一個影響生產力的關鍵因素是控制源 (locus of control, locus = 軌跡), 意思是說人們怎麼看待他們的自主性和力量. 有內在控制源的人相信, 他們能為自己的命運和人生負責 (或至少產生影響力). 擁有外在控制源的人, 則認為一切都是命運或環境, 自己只是顆棋子. 因此前者常常成為領導人, 而後者常常是聽命行事 (或聽天由命) 的普羅大眾.

遇到失敗時, 內控型的人認為自己努力不夠, 外控型的人認為是運氣不佳或是阿共的陰謀. 減肥時, 內控型的人更關注纖瘦的模特兒, 外控型的人比較不相信自己會成功, 所以對大尺碼模特兒有更多的回應. 賭博時, 外控型的人更敢於冒險, 因為反正機會總會到來.

以上說到的特質, 也被認明是一種穩定的特性. 1972 年一場超大颶風摧毀了許多獨立的商店. 其中超過一百位受訪店主們根據測驗結果被分類為內控或是外控型. 經過三年之後, 有些人生意又做起來了, 有些人則以破產作終. 但無論事業成敗與否, 店主的測試分類沒有改變, 即使是內控型的老闆潦倒了, 或是外控型的老闆發財了, 他們也沒有改變信念. 甚至內控的更內控, 外控的更外控.

前面提到內控型的人更容易成為管理者, 但他們本身的服從性偏低, 不易管理. 更大的問題是, 這些人如果努力沒有得到回報, 會比內控型更容易失去動力 (然後去找更有趣的事做?). 書上說要讓他們做事時更有自主性, 有很多人即使被安排不需要創意的工作, 也會創造發明 [2]. 外控型的人本來就對自己沒有太高的期待, 因此比較不會抱怨. 適合讓他們做規範較嚴謹的工作.

根據本書長久的洗腦. 我感覺到不同性格的人, 往往只是某個基因對化學湯 (各種激素) 的處理方式不同, 造成大腦某些區域的強化或是弱化. 要憑後天的訓練改造一個人, 就要把資料洗得很乾淨 (e.g. 觀眾都是西瓜), 讓容積莫爾濃度不管怎麼變, 提取出來的生理反應都是想要的. 如果實在調不出來正確的處方, 我們就說他本性難移. 哈!

[REF]

  1. https://www.facebook.com/businessfocus.io
  2. 砂紙銷售員理查魯德發明了紙膠帶, 幫 3M 賺大錢.

我讀 «大腦超載時代的思考學» – 4

一天為什麼是 24 小時? 古埃及將一天分為十等分, 但是每個季節中的白天長度都變化, 因此前後更增加一個等分, 以涵蓋白天和夜晚的長度的消長. 巴比倫人和古希臘人也都是將一天分為 24 等分 (p.172). 換言之, “日出而作, 日末而息" 代表一種不太精準的規律生活.

為何本書第五章要講地球科學呢? 其實它是要講時間對生物的重要性. 比方說有人認為生物的壽命有限是因為要避免物種繁衍過剩後互相競爭.然而, 自然界中能夠活到自然死亡的生物不多, 幾乎所有的生物都在嚴酷的物競天擇中 “先走一步"了. 也就是說即使有物競天擇存在, 也只篩選到這個基因能否繁衍出有競爭力的下一代. 沒有一個社會會因為某個老人比多數人容易生病, 回頭把他的子孫殺掉避免這個基因留下來. 因此壽命有限這件事還是取決於海弗利克極限 (Hayflick limit) – 人類細胞群在細胞分裂停止之前分裂的次數. (p.176)

既然人類必死, 活著的時間有限, 當然就值得探討一下人類如何運用時間. 作者提到假如一個人的前額葉皮質受損, 他會無法做某些決定, 或者不能按照正確的步驟做事. 即使他的智力很高也沒有用, 只要前額葉皮質受損, 他就會一直表現地像喝醉酒一樣. 像是咱們公司昨天尾牙, 明明有那麼多獎, 我卻抽不到 (還好 QQQ 創新高), 反倒是成功被勸酒~~~ 前額葉皮質受損的徵象跟酒醉相同, 患者會忘記自己做了什麼? 因此不能正確地按部就班.

或曰. 喝醉酒的人很多. 但是前額葉皮質受損的人很少吧!? 誰會沒事把自己的額頭弄受傷呢? 其實呢, 人類的前額葉皮質在成人之前都持續在發展, 故青少年就處在一個前額葉皮質不發達的狀況. 我們會把年輕人容易衝動視為不成熟的狀態, 確實成熟的前額葉皮質並不與大腦的其他區域密集溝通. 相反地, 他們不太溝通. 或者說成人的大腦故意抑制這種溝通 (p.177).

那麼可以推測前額葉皮質在發育成熟的過程中, 需要和大腦其他部位大量交流, 訓練出一個 ChatGPT 3.0. 等到發育成熟之後, 交流就減少了, 只有睡覺的時候才會重新 training 最新數據, 進階到 ChatGPT 4.0. 大腦就像一個 NPU, 只占體重的 2% 重量, 卻消耗身體 20% 的能量, 相當耗 “電".

腦細胞之間靠神經元傳遞電子訊息, 而控制神經元則是靠化學作用 – 各種激素的化學湯. 顯然這會讓每個人做事的方式會有微妙的不同. 此外人類的基因也影響如何做事. 先前有提過多巴胺會提升專注力, 去甲腎上腺素會令人亢奮. 但對不同的基因來說, 平衡兩者的方式也不一樣 (Cash: 大概容積摩爾濃度有限制吧?). 名為 COMT 的基因 (HEL-S-98n) 有兩個版本.

Val58Met 型, 前額葉皮質得到比較少多巴胺, 更有創造力, 可以多工切換工作. Val-Val 型, 多巴胺水準高, 表現更循規蹈矩, 更專注, 更像好員工 (p. 182). 雖然這只在統計學上成立, 不能一概而論. 但是個性可以用基因來解釋, 這樣還滿說得通的.

[note] 神經元是可以新陳代謝的細胞, 靠著葡糖糖獲取能量. 單個靜止的神經元輸出電壓 70mV, 當人類放鬆的時候每小時消耗 15 Watt. 閱讀的時候消耗約 60 Watt (42 cal), 上課時消耗 65 cal. 神經元的傳遞速度 300 mile/Hr, 每秒運作幾百次 (p. 178).

講到切換工作, 雖然說某些基因的人更適合切換大腦 (timing sharing, TDM), 但是學者認為切太細會兩樣都做不好. 反倒是把大塊的工作切成幾個小單元來進行, 卻是社會上普遍認同的工作技巧. 為什麼呢? 因為人類做事需要獎勵機制, 貪玩也是人類的天性, 聰明人懂得做計劃, 暫時忍耐. 忍不住的人就會沉溺於快速的回饋, 先吃點東西再說, 先玩個遊戲再說,… 最後事情會做不完.

當我們把工作切成幾個小單元, 至少正事上每次獲得了一點回饋, 中間穿插一些玩樂, 又得到一些回饋. 這樣累積起來, 正事也不耽誤, 休閒也得到了. 像我練習 Python 一樣, 自修時真的很無聊, 難免要玩一下遊戲. 結果洛基他娘的骨灰都已經撒在九界最高的山頂上了 [1], 我還沒學完 Openpyxl…不過總算上個禮拜天結業了, 這個禮拜剛好可以推銷小程式給 PM.

Chapter 5 後半段強調睡眠的重要性. 睡覺的時候做 3 件大事: 整合、同化、提取. 整合的意思是把好幾段記憶接在一起. 例如我們學一個劇本, 可以一幕一幕的排練, 最後才順排也沒問題. 睡覺的時候, 大腦會把一首曲子的每個小節連在一起. 不至於要從頭練一遍才記得住, 一段一段練就永遠記不住.

同化的意思是說, 把新學到的東西和舊的東西結合起來. 例如我們只學過 “this is a book.", 也能自動理解 “this is a notebook."

提取的意思發現隱藏規則, 例如小朋友會犯下邏輯正確文法錯誤的拼字, 像是 “he swimmed", 而非"he swam". 不只是語言, 在數學、邏輯、空間推理方面也是如此.

為何我們不在英語國家的不容易說好英語也是這個原因. 當我們在英語國家發生的每一件事都能為我們學到的單字、句子產生複雜的人事時地物連結, 從而固化這個記憶. 作夢的時候, 更是反映出各種雙關語、同音異字、正反對稱性的固化過程. 如果這個資訊很單薄, 跟什麼都無關, 就是一筆硬記的東西, 當然就很不容易融入 database. 寫不進去就會很快遺忘. 睡覺這部分講得很有意思, 因為篇幅有限, 有機會再補充.

[REF]

  1. 戰神