我讀 «持續買進» – 2

第十章說到, 為何要投資? 其實作者要表達的是不投資、只儲蓄, 會讓購買力快速下滑. 通膨 2% 的情況下, 購買力半衰期是 35 年, 通膨 5% 的話, 半衰期只有 14 年. 因此我們要在年老力衰之前, 累積足夠的資本.

第十一章討論該投資什麼標的? 這不外乎股票、債券、房地產, 再來就是創業、加盟、特許營業、加密貨幣、黃金、藝術品等等. 我認為主要是增加本書的篇幅與完整性, 正常人選擇其中幾樣就忙不完了.

第十二章主要告訴讀者不要賭個股. 2018 年的研究指出" 1926~2016 年間, 僅僅 4% 的股票創造出高於國債的報酬率". 問題是: 這少許的股票會隨時間變化, 與其每次都看對, 不如買大盤.

第十三章說現在就投資最好! 因為平均而言, 每 20 天真的有一天會可撿便宜, 但是再撿到下一次便宜的平均時間是 31 個交易日, 也就是 1.5 個月. 但也有可能再也沒出現過更低. 例如 2009 年 3 月 9 日道瓊收在 6,547 點, 上次出現這個數字是 1997 年 4 月 14 日. 等待 12 年才投資一次不切實際.

另外, 平均而言. 定期定額比單筆 all in 的績效還差 4%. 原因是 all in 時投資已經開始了, 同樣的錢, 定期定額分批買, 後面的錢才進市場沒多久, 不足以產生回報. 當然, 如果單筆剛好在 2008 年金融海嘯前買進, 會倒輸定期定額 30%. 這種事情也會發生沒錯. 定期定額除了績效差一點, 還有波動比較小的優勢.

講到這裡, 感覺作者好像沒有立場堅持推薦 all in. 但是他還是講到, 如果怕波動大, 可以做更保守的投資, 像是買 40% 債券. 我覺得都無所謂啊, 反正本書是說持續買進, 要多賺 4% all in, 還是比較想要避險都可以. 總之不要嫌貴、 想再等等看, 那樣會一直進不了場.

第十四章還是講一樣的事, 只是放了更多統計資料. 1996~2019 年和 1928~1957 年, 逢低買進勝過平均買進. 在 1975 年之後的所有 40 年投資時間裡, 平均買進都優於逢低買進. 當然, 40 年是一個很大很大的 window, 說要框住一個人終身的投資期限, 又嫌短了一點, 我感覺有點湊實驗數據.

總之, 作者結論到: 平均買進和逢低買進都敵不過運氣好! 1922~1961 年的 40 年投資 (40 年 x 12 個月 x 100 元), 經過通膨調整, 會成長到 500,000 元. 遠勝過 1942~1981 年的 40 年投資, 只能成長到 153,000 元, 相差 226%.

第十五章說, 運氣好重要啊! 但你還是不要太在意它吧! 第十六章說你不應該害怕波動. 1950 年以後的 S&P500 指數, 平均內年最大跌幅是 13.7%, 中位數是 10.6%. 反正就常常會下跌. 如果每次在下跌 15% 的那幾年, 每次都精準地由股轉債, 那投資績效比 buy and hold 高 10 倍! 哇! 但這個錢很難賺~~~

第十七章說要在危機入市. 基於每次跌到谷底都能反彈回來, 我們可以反推谷底上漲的百分比遠高於掉下去的百分比. 如 100 跌到 50 是掉 50%, 但是彈回來 100 是漲 100%. 所以谷底買進的部分報酬驚人.

第十八章討論到賣出. 投資最後都要當生活費, 終究要賣. 作者建議只為了生活費、再平衡、和換 (爛) 股而賣. 至於怎樣做好再平衡呢? 作者說沒有任何一個週期是最好的, 所以就抓一年一次吧. 如果不做再平衡, 很容易最後變成股票佔 95%. 但這樣表示債券本來就不是很好的投資標的, 只是保本而已.

假如大家懶得做再平衡, 作者也推薦用新資金再平衡就好. 例如股票原本規劃佔 60%, 不知不覺變成佔 75% 了, 那就買債券去平衡它. 這麼做的前提是持續有收入或者至少有結餘.

第十九章主要講美國退休帳戶 401 (K), 我想除非川普總統要送金卡給我, 不然我不會去美國上班. 這邊就略過了. 第二十章, 告訴大家你比想像中有錢, 不要氣餒 !!! 這邊出現本書最大 bug, 但是圖還是畫得不錯, 大家瞭解一下.

這邊也提到, 有沒有錢也要跟相對年齡和教育程度的人比. 如果沒上過高中, 在 35 歲以下, 有 34.1 萬美元就算是 PR99. 如果大學畢業, 在 65~74 歲, 有 3,050 萬美元才是 PR99.

第 21 章說最重要的資產是時間. 印度有位愚公 Dashrath Manjhi, 因為老婆在家門前的山上摔傷了, 就用一把鑿子挖了 22 年, 開出下面這條山路. 如果你還年輕, 投資還不晚.

年輕人也許對未來期望很高, 最後失望很大, 在 50 歲的時候幸福感達到谷底. 但是沒有關係. 書上說, 老了就習慣了. 以後期望會降低, 生活滿意度反而會上升! 雖然我喜歡作者旁徵博引, 不過本書沒有什麼太堅定的中心思想, 哈! 持續買進就對了.

我讀 «持續買進» – 1

持續買進:資料科學家的投資終極解答,存錢及致富的實證方法 (Just Keep Buying: Proven Ways to Save Money And Build Your Wealth) – 讀這本書的時間拖得比較長, 看到後面對前面的印象都模糊了. 就讓我抓重點整理吧!

首先如書名所說, 作者 尼克.馬朱利  (Nick Maggiulli) 建議持續地買進股票、債券這些資產, 不要等待天降良機, 買在最低點. 根據書上大量的統計, 除非你一生就只有一筆錢一次投資機會、否則就算被你剛好抓到百年來最低點 all in, 後面也還是逃不過未來的波動! 相對地不擇時分批買, 就算掉進谷底也還爬得出來!

也許有人會說日本失落的 30 年不就是反證嗎? 作者也提到. 即使剛好 1980 年買日本股市被套牢, 只要每天持續買進 1 美元, 過了 40 年也會是正報酬!! 下圖那條斜線就是持續買進的成本基礎, 曲線就是大盤市值. 雖然這個說服力不太強, 但至少作者也給了交代.

另外有一個觀點最近很多人都提到, 那就是生活成本佔窮人的收入比重比富人高. 所以薪資看起來只差一倍, 可儲蓄的金額卻差了不只一倍. 因此致富的前提是先要增加收入, 這樣才有餘裕投資 (p. 15~p.17). 另外根據邊際效用遞減, 有錢人就算所得高了 14 倍, 開銷只多了 3.3 倍 (p.18). 這點在台灣是否成立我不太清楚. 我覺得竹科的同事看起來都很有錢, 用得東西也比我高級多了…

第五章說, 假如某人的收入增加了, 理論上他可以過更好的生活. 但是他的儲蓄比例要隨之提高. 不能賺多少花多少, 否則增加的收入都直接變成了開銷, 對於存錢買股票毫無幫助. 作者說你加薪 X 元, 就要存 X/2 元 (p.24).

如果適度舉債也有幫助, 特別是貸款讀個好學歷, 這個投資通常值得 (p.27). 最新新聞剛好提到最近美國高中生比較不愛讀大學了, 因此學費很貴,白領工作又沒有比較好找. 作者也提到買房, 他認為通常買房會賺錢, 因此他建議有錢 (20% 房價) 時再買, 以免要把資金全部被套牢 (p.30).

在存錢買房的過程中, 買債券好還是抱現金好呢? 因為債券也是會跌價的, 作者認為如果要存 3 年以下, 不如保留現金, 要存超過 3 年可以放債券 (p.34). 當然也可以選立刻存股, 作者認為這樣比較有風險, but 現在年輕人應該會先投資再說吧!? 老人才會買儲蓄險什麼的.

第九章說, 何時可以退休? 作者用了 4% 法則, 也就是存到 25 年的生活費就可以退休 (p.37). 另外, 理財達人怪老子在節目上說過跟作者同樣的觀點, 考慮到大家還有退休金. 預期生活費再扣掉月退, 反推出的 25 倍還會更低! 更何況, 根據書上的研究, 老人比較無力消費, 大概會低個 15~25%.

當然作者都寫書了, 不能只出一招. 他又提到跨越點法則 (Crossover Point Rule). 如果你的投資收益大於你的支出, 你就可以退休了 (p.38) ! 這看起來好像是廢話, 不過這個計算方式更容易導致過度儲蓄. 這幾天綠角大大在臉書上也提到這件事. 假如我只買 QQQ, 配息要配出每個月 5 萬元生活費, 本金大概要 1.5 億以上, 比拿去定存都還少. ^^

<< 待續>>

我讀 «張忠謀自傳» – 2

雖然前面講得好像張老的主管都是科技白癡, 但他們都有自己的想法. 海格底的失誤在於他看好自動化測試, 所以遲遲不願意在海外建立測試據點降低成本 – 很多年後還是建了. 夏伯特認為每個家庭都需要家庭電腦, 但這個想法超出當時 TI 的技術能力至少十年以上.

張老接手的消費者集團主要有三個產品: 消費者計算機 – 原本看起來可以賺大錢, 但是被金寶這些台灣公司打趴了; 科技計算機 – 能賺錢但量很小; 電子錶 – 虧損, 完全是惡性競爭. 開發中的產品則是教育玩具和家庭電腦.

張老說: “假使我那時 (1978 年) 有我現在的勇氣, 我會說取消家庭電腦案!" (p. 241) 1979 年 TI 的家庭電腦 TI-99/4 推出時, 售價 1,150 美元. 但沒有什麼 APP 可以用. 即使是 PC 的Windows 3.1 – 第一個比較堪用的版本也是 1992 年才問世. 回推 13 年的科技水準是怎麼樣呢? 1978 年最紅的電腦是王安電腦的文字處理機, 就是能編輯檔案而已.

家庭電腦賣不好, 敲響了張老在 TI 仕途的喪鐘. 1980 年張老改任 “品質與生產力總監". 此時張老 50 歲. 夏伯特在佈達的時候, 還是很給面子地說 “在品質上. Morris 代表我" (p.250). 於是乎張老就開始努力學品質. 他去跟當時的幾位品質大師上課. 像是戴明, 這位現在應該還有人記得.

畢竟他都代表總裁管理品質了, 當然是先花錢找大師學藝, 總不能直接跑去產線盯品質. 不過這段經歷確實影響了後來台積電的作風. 張老講的都是顛撲不破的大道理, 但另外一方面, GG 的人又公開但打馬賽克地吐槽產線文化, 彷彿是兩個平行宇宙. 哈!

總之, 張老送了上萬人去參加 Joseph Juran (裘蘭) 的品質課程. 雖然我不知道 TI 的良率因此提升了多少? 但 TI 的文件實在做得很厲害! 老闆彪夏也說張老已經放在對的位置上.

1981 年 TI 日本廠開始生產記憶體, 良率直接衝到 4~50%, 而休士頓廠只有 20% 多. 總裁夏伯特大感震驚, 叫張老想辦法改進良率. 張老研究之後, 認為日本廠學歷較高, 多數是大學畢業. 但美國廠招不到本科系的學生, 經歷也通常是修車之類的. 夏伯特對這個答案很不滿, “我要的是可以立刻改進良率的方案, 你的分析對我毫無用處." (p. 257)

夏伯特自己想到一招, 就是把日本廠長找來美國當廠長. 不過日本團隊適應不良, 最後紛紛請求調回日本. 這事大概讓張老再記一支小過. 但後來台積電都是這麼幹, 連廠線也要找高學歷本科系的. “諷刺地, 它成為我幾年後創辦台積電的靈感和憑藉." (p. 257)

1982 年 9 月, 張老已經把老闆得罪完了. 他的職級從 42 級降到 38 級. 於是張老決定要離職. 1983 年 10 月, 被綁的股票承購權已經拿到, 張老正式遞出辭呈, 當然老闆也不會留. 我們護國神山的大老, 在 51 歲時為了五斗米折腰, 真是英雄氣短xm,. 那包承購權大約 1~2M USD, 換算今天的購買力大概是 6~7M USD (Monica 說的), 真的很難不要.

略過細節不提, 張老下一份工作是 1984 年 1 月去通用器材當董事暨總經理暨營運長. 雖然入職時也是風風光光. 但 1985 年 8 月公司業績逆轉, 董事長 Frank G. Hickey (歇基) 找了前副總喬治來分散張老的管轄權. 後來雙方 (另一方兩個人) 矛盾愈來愈大, 歇基發新聞稿逼張老 “被辭職".

1983 年, 李國鼎政委曾力邀張老到台灣幫忙. 等到張老拿到他的 stock option, 台灣反而失聯了. 倒是 1985 年張老二度失業時, 李政委又來邀他當工研院院長. P. 304 說: “為什麼這次李政委冷淡, 對我至今是一個謎." 我猜可能是沒缺吧! 哈! 歷經幾番曲折, 張老當上了工研院院長.

張老在工研院院長任內, 打算推 3 大改革: (1) 十年內一半經費來自民間企業, (2) 衍生公司, 把人也移過去, (3) 每年考績最低 3% 員工留職查看. 當然, 這些政策不受官員和院民歡迎, 改革失敗! 我們李前總統不太喜歡他, 陳履安 (經濟) 部長不喜歡他, 底下的主力助手胡定華因為被俞國華院長認定張老需要留人, 所以不讓胡定華當交大校長. 胡定華知道了後憤而離職. 愈院長認為這是張老不擅處理人事, 對他評價不佳. 張老這次又差不多把人得罪光了, 1988 年決定請辭院長. 轉任無實權的董事長.

However, 張老剛接工研院的時候就負責設立台積電, 因此他就是官股的台積電董事長. 當時台積電前途未卜, 還沒有人想要搶這個位置. 何況成立台積電時很多人 (官) 就不看好, 民間也不願意投資. 如果不是飛利浦願意認股 27.6%, 恐怕都辦不起來. 在退無可退之下, 張老按照他的意志, 順利地把 TSMC 做成了台灣的第一. 1994 年台積電上市, 張老也辭去工研院董事長的職務.

我覺得自傳下冊, 張老走下坡又逆轉的這段故事最精彩. 以我的印象, 忘了是哪一頁. 書上有提到 TSMC 才是他可以自由發揮的空間. 上面不再有董事長指揮或怪罪, 官股民股都恨不得趕快套現脫手, 所以張老才能獲得經營上的自由. 台積電這部分當然占全書不少篇幅, 有機會大家可以自己去了解. 因為 TSMC 這麼出名, 除了本書之外, 各類訊息想必非常多又容易取得. 倒是張老一生曾有這麼多不順遂, 真是大大出乎我意料之外, 所以特別為它做個筆記.

我讀 «張忠謀自傳» – 1

我這才發現, 其實我沒有為本書的上冊寫過心得. 當時可能是想等下冊讀完一起寫吧?! 誰知這一等可不得了, 從 2018 等到 2024 年才出版. 等我有空讀它又已經是 2025 年了! 基本上, 下冊真的比較刺激, 來談談下冊吧!

在大家的印象中, 張老原本就是高材生, 以華人身分在美國頂級公司做到二把手. 然後又被政府請回來領導台積電, 後來變成護國神山. 這樣的人生勝利組好像不太能給我們什麼啟發? 就是讓我們羨慕和崇拜而已. However,…

如果看了自傳下冊就不會這樣想了. 張老自述他的職涯並不是一帆風順. 反倒是認為自己除了台積電之外, 幾乎每個工作都黯然收場. 若不是真有一身本事, 早就消失在世人眼中了. 所以我就專門談他的職涯吧, 且不談他的管理理念.

張老大學是讀機械, 應徵了福特汽車和希凡尼亞半導體. 前者開價月薪 479 美元, 後者開價 480 美元. 張老本想去福特, 不過這薪水比人家少 1 塊, 於是他打電話希望福特多少加 10~20 元. 但是福特對他的要求很不客氣, 叫他 “袂爽麥來". 所以張老只好憤而進入半導體業. [1]

因為隔行如隔山, 張老在希凡尼亞自修半導體三年. 不過這家公司的總經理自己說: “賣得出的東西我們做不出,我們做得出的東西我們賣不出。" [2]. 顯然這家公司也沒辦法待一輩子. 張老在 27 歲跳槽到 TI.

從 1958 年起的前 15 年, 是張老的上坡路. 其中 1961~1964 年, TI 送他去史丹佛全職全薪進修, 並取得電機工程博士學位. 雖然返回公司後, 原本的同事都高升了, 張老還是從鍺電晶體部研發經理做起, 一路立功晉升, 在 1972 年做到 TI 集團副總裁兼全球半導體事業集團總經理. 這年張老 41 歲.

張老從鍺部研發經理升官的關鍵是完成一個 IBM 的案子. 先前的研發處長和鍺電晶體總經理都搞不定. 拖了一年多. 張老學成述職後, 就收到這個大禮包. 真所謂是福不是禍, 是禍躲不過. 張老找一位他看好的助手 (在別的計畫), 在 2 個月內就做到可以量產.

於是, 張老最服氣的老闆 – 助理副總裁 James Reese (呂斯) 就宣布張老接任鍺部總經理, 管 3,000 人. 本書稱呂斯做 “最好的上司". 只不過這位老闆在 1967 年被罷黜, 他的上司換成 J. Fred Bucy (彪希). 張老不太喜歡這位主管, 這位也不欣賞張老.

張老對彪希的評價是, 對方在擔任半導體集團總經理前, 並沒有半導體經驗, 又不刻意努力學習. 對方能夠升上執行副總, 還不是靠張老在下面救了積體電路部. 嗯, 看起來兩人有點過節. 身為讀者而已, 我們就順便回顧一下張老的另一頁功勞簿.

積體電路的前負責人是 Statt (史厥特), 他原本是張老的下屬. 張老去唸書回來, 他已連升三級, 比張老高一階. 積體電路部的防守範圍是 bipolar (雙極), 雖然別家也做得風生水起, 但 TI 就是輸給摩托羅拉等對手. 於是這位長官也下了台, 換張老做做看.

張老怎麼做呢? 首先提升士氣, 然後 (1) 提升技術. 把 IC 設計工程師從 2~30 人增加到 4~50 人. (2) 提高良率. 當時業界的良率大概是 20% 左右. 張老覺得達拉斯晶圓廠環境亂糟糟的, 於是開了另外一個直接對他負責的休士頓廠和舊廠 PK. 結果新廠的良率直接上 40%, 舊廠也發憤圖強有顯著的進步. (3) 接 ASIC 生意提高單價, (4) 宣布每季減價.

由上面幾招看來, 張老的確是一步一腳印地做出貢獻. 那長官沒有輔導的功勞嗎? 下冊 p. 159 明確說到: “…我每天早上開技術會議, 有時彪希也來參加, 但他可以說完全不懂半導體技術, 所以在我們會議加忙遠勝過幫忙."

1972 年, 張老登上 TI 的事業高峰. 1972~1978 年則是他的高原期. 張老不認同 TI 做消費者產品 (和客戶競爭) 和記憶體, 但老闆興致勃勃. 張老升任半導體事業集團總經理後, 開發記憶體當然就是他的防守範圍. 由於公司主力分散兵力在 “消費者產品集團" 做計算機 (calculator), 所以記憶體部門人手有些不足, 1K 的記憶體始終做不出來.

張老上任後選擇跳過 1K, 直接做 4K. 結果兩年後 (1974) 做出來了, 並且達到市占率 50%. 張老把下一個目標定在 16K, 打算甩開對手. 結果不幸地 16K 難產, Mostek 搶走市場. 彪希和董事長 Mark Shepherd (夏伯特) 開始懷疑張老的能力, 1976 年決定成立另外一個團隊抄 Mostek. 1977 年, 負責抄對手的團隊已經可以量產, 但張老這邊還是卡關, 於是他就開始黑了.

黑歸黑, 張老還是帶領他的團隊再直攻 64k 雪恥. 最後不但領先對手, 而且產生許多強大的專利. P. 205 寫道: “64K 的成功來得太晚, 第一批成功的樣品出來時, 我已被調任消費者產品總經理, 但我收到一封 64K 團隊連署的非常溫暖的信, 告訴我第一批樣品已做出, 全信語氣把我視為與他們同在一條陣線上的戰友, 而不只是前任上司, 這是最使我感動的一刻."

書上提到: 張老認為 TI 開發自己的技術是對的. 若不是用自己的技術做出 64K, TI 在 80、90 年代業績不振時, 哪有辦法靠收專利授權過活? 即使他非常不看好 TI 做記憶體, 他還是奉命執行了, 做不好再怪他, 張老也心存埋怨.

1978~1980 年被張老視為下山驛站. 他在 16 K 記憶體失利後, 長官們認為他策略錯誤. 彪夏在張老出差時, 對他的下屬批評張老領導不夠強力. 而更上級的夏伯特則是在聽完整天簡報後, 問他 “你們真的在做 64K 嗎?" 言下之意是懷疑張老做不出 16K, 所以弄個假議題維持人力吧. 既然上面兩層主管都不挺, 張老在 1977 年底自請離職.

彪夏和夏伯特討論之後, 給張老兩個選擇. 一是做消費者產品集團總經理, 另一個是 “公司成長" 資深副總裁. 由於張老不喜歡當幕僚, 所以選了他不看好的消費者產品主管. 不喜歡怎麼能做得好呢? 於是後面果然就一路向下了.

[REF]

  1. 張忠謀赴台大演講 親曝自己當年第1份工作為何選希凡尼亞!不選福特汽車
  2. 張忠謀曝當年挫折:股東客戶都覺得我做得好,卻仍被迫離職

我讀 «輝達之道»

這個年假原本打算讀兩本書、 校稿兩篇專利 (?)、 準備一些美金看美股有沒有便宜可以撿、最後再看一下同事介紹的 DeepSeek 在幹啥?

不料就在年假的第一個周末, DeepSeek AI 突然直接攻佔各種新聞版面, 變得幾乎無人不知無人不曉. 週一晚上的美股 – 尤其是輝達價格大跳水! 這下我的好幾件事都連結在一起了. 因為我想讀的其中一本書就是 “輝達之道".

這本書原名 “The Nvidia Way", 作者是金泰 (Tae Kim), 譯者是洪世民和鍾玉玨. 本書非常值得推薦, 雖然翻譯有幾處比較不通順 – 不知道副詞子句是在講主詞還是受詞, 但整體可讀性沒問題. 每個人看這本書的觀點可能有些不同, 它可以是勵志的新創公司成功記、可以是黃仁勳發跡故事的側寫、或是一本 GPU 簡史. 對我來說, 它就是 Q&A. 解惑了我好幾個問題.

Q1. Nvidia 為何沒有變成一代拳王? MTK 蔡明介想過這個問題, 黃仁勳也想過. 兩個人遇到的狀況不同, 解法也不一樣. 黃仁勳認為會有一代拳王的是因為大家技術差不多, 但開發一顆 IC 要一年半的時間. 所以當你暫時領先, 對手的新產品就會比你厲害! 假設產品規格並沒有太大的改變, 只要規格疊得高, 那一代新人換舊人就是理所當然的.

黃仁勳解決這個問題的方法是成立不同 project, 開發週期彼此交錯, 共用資源和資訊, 隨時調整規格, 並且準時交貨. 從外界來看, Nvidia 推出產品的時間自然而然就縮短了, 對手很難在兩代產品交接的空檔中找到切入點! 當然這是在 graphic card 大混戰的時代才適用的策略. 如果大勢已定呢? MTK 理所當然去找下一個明星產品, 而老黃則是直接把現在的產品調整到直指未來.

他怎麼做到的呢? 當然就不是兩三句話那麼簡單. 總之我認為他好好地接受了不平凡的建議, 又壓榨出了驚人的成果. 像是光追, tensor, CUDA, NPU, GPU (替代 graphic card) 這些都是底下的人想出來, 再透過老黃鋼鐵的意志實現它. 底下會提到 Nvidia 發明了 GPU 這個名詞來和 graphic card 區隔.

Q2. 為何要叫做 GPU? Nvidia 的產品經理認為他們 graphic card 可以同時處理 4 個 pixel, 能做圖形的旋轉平移, 這些都取代了原本的 CPU 程式, 所以應該叫做 GPU. 於是老黃就在 1988 年 8 月宣稱他們的 GeForce 256 是全世界第一顆 GPU, 即使那顆 GPU 還是要下 register 才能叫它做事, 還不能真的寫高階程式語言.

Q3. 為何雲端運算需要 GPU? 這要先從高速運算說起. Nivia 的團隊在設計 Geforce 3 時, 為了解決 render 上較複雜的計算, 開發者藏了一些可編程的運算單元在圖形處理之中. 當然這代表 GPU 就有了一些浮點矩陣運算的能力. 即便只能用 OpenGL 或是 Nvidia 的 Cg (C for graphic) 來 coding, 至少硬體非常強大.

高速運算原本是 CPU 的市場, 強大的 CPU array 就是超級電腦. 當學者或研究單位擁有超級電腦, 就可以快速地完成複雜的計算. 但沒有被分配到這類珍貴資源的學者, 就算有很好的想法也無法領先發表論文, 輸家就永遠是輸家. 久而久之就形成了學術壟斷.

2002 年, 有位馬克哈里斯 (Mark Harris) 研究員發現許多科學家開始用 GPU 做 “非圖形" 的研究. 狀況就跟現在很多公司、大學都用 RTX4090 而不是 DGX B200 做 AI 實驗是一樣的道理 [1]. 所以他就架了一個 GPGPU.org (generla purpose GPU) 的網站, 幫助大家活用 GPU 來代替買不起的超級電腦. 接著 Nvidia 發現了這個網站, 招募哈里斯加入 NV50 (G80) 團隊.

G80 的 GPGPU 能力比過去更強大, 不再使用 Cg, 而是推出了 CUDA (Compute Unified Device Architecture). CUDA 呼叫 GPU 的 PTX 指令集, 讓大家不需要特別去學這個架構的組合語言, 而是有專屬的 compiler 可用. 黃仁勳說: “CUDA 讓我們的成本大為增加". 但是他們達到了目的: (1) 讓所有的人都可以用 CUDA, (2) 讓 CUDA 適用於所有領域. 於是有愈來愈多人發掘出 GPU 的用途, 從模擬新藥、挖礦 (虛擬貨幣) 到訓練 AI.

當然 Nvidia 的故事也不是都這麼正面. 他們發現科學家工程師只買電腦版 500 USD 的 GPU, 而不買他們更貴的伺服器版 2,000 USD 的 Tesla (p. 378). 於是 Nvidia 自己宣稱他們 PC 版的 floating 不太準, 伺服器版才準. 在被沃克教授證實並沒有不準後, Nvidia 改為在不影響圖形輸出的程度下把它改成不準. 沃克和它的團隊又再把它 patch 回來! 並且在他在藥廠的新工作中,買了成千上萬的電腦級 GPU 來建立 data center.

Q4. 為何大家都用 Nvidia 的 GPU 訓練 AI? 別家的卻不行? 這個問題一半的答案就是 CUDA, 它不是一張繪圖卡或是遊戲卡, 而是算力卡. 若只是要畫出滿屏的圖形, Intel 自己就可以做到了. Nvidia 預先看到這一點, 因此用 GPU 和圖形輸出做出區隔. 並且賣得超級貴. 別人的產品都是 ASP (平均銷售單價) 愈來愈低, Nvidia 主打愈賣愈高, “買愈多省愈多"!

回歸 AI 這個主題. 過去的 Machine Learning 都是先找特徵, 然後統計特徵值, 根據統計原理做分類. 直到 AlexNet 出現, 才有不找特徵, 讓系統根據 label 過的資料, 自己找出規則的 Deep Learning. 當然這就不得不歸功於當初 labeling 這些 database 的先驅李飛飛. 發明 AlexNet 的多倫多大學團隊 (當然包括其中一個學生叫做 Alex) 就是使用輝達的 GeForce 500 做訓練, 他們在第三屆 ImageNet 大賽, 成果遙遙領先其他舊演算法 10% 以上 (p.425).

從此以後, 大家都知道要用 GPU 做 Deep Learning (DL). Nvidia 也看到這個 AI 商機特別大. 因此再推出 CuDNN (CUDA Deep Neural Network) 強化對 AI 的支持度. 對於一般高速運算的市場, 硬體需要支援 FP32 或 FP64 (浮點 bit 數). 但是對於 Neural Network 的訓練來說, FP16 就夠用了. 因此 Nvidia 的 GPU 從 2016 年開始都支援 FP16. 而且還加入了 Tensor Core. 書上提到老黃臨時在 tape out 前幾個月說要加 Tensor, 大家怎麼趕工達標. 這個不是本文的重點就先略過.

Tensor Core 有什麼好處呢? 因為 DL model 裡面都是矩陣運算, 而 CUDA Core 只是浮點乘加器, 需要 CUDA compiler 來優化計算流程. 假如矩陣運算有特別的硬體, 那麼採用 CuDNN 來編 code 就可以更加地優化. P.433 說到,有 Tensor 快 3 倍. 這就解釋了為何大家都愛用 Nvidia 的 GPU 來開發 AI 軟體, 而不用市售的 NPU. 市售的 NPU 對於常用運算子的軟硬體優化差了 Nvidia 一大截. 所以做某些推論應用 (inference) 還可以, 整體而言是事倍倍功半半.

Q5. Nvidia 怎麼搭上 DPU? Mellanox 這家公司把 InfiniBand 這個標準做成高速網卡, 在數據中心可以 offload CPU 對網路封包處理的算力消耗. 雖然生意不錯, 但這家公司太小, 負擔不起高昂的研發費用, 最後只好賣公司. Nvidia, Intel, Xilinx 三家競標之下, Nvidia 看到它在數據中心的綜效, 因此花了每股 125 美元 (共 69 億美金) 標下股價 76.9 的 Mellanox.

接下來, 老黃又出來說我們發明了第一個 DPU. 當然, Nvidia 敢這樣講, 就是他們又投資了更多加速的軟硬體, 跟一般的 SmartNIC 做出區隔. 想要再重演一次“GPU 不等於繪圖卡”的劇本。

這本書的內容當然不只於此。或許可以用創業和經營事業的觀點再重新詮釋一次。像是保持扁平團隊,保証訊息一致,還有老黃偏執地好學等等。這部分就等我看完張忠謀自傳再來匯整好了。畢竟兩大管理者可以互相輝映。

[REF]

  1. https://www.cool3c.com/article/218920