Jan 15, 2026

為什麼我們需要光子計算？

光子加速器之所以常被拿來講「最強線性運算」（矩陣乘、卷積），核心原因其實很樸素：光在傳播與干涉的物理過程中，天然就在做「加權相加」。而現代 AI/訊號處理裡最吃資源的部分，偏偏就是大量的矩陣乘與卷積（本質上都是 MAC：multiply-accumulate）。下面用工程角度把「為什麼要用光」與「優缺點」拆開講清楚。

1) 為什麼要用光子？現有技術的瓶頸在哪裡

先抓住一句話：現在的瓶頸，很多時候不是算不動，而是「搬不動」（資料搬運/記憶體能耗/頻寬）。

1.1 電子式加速器（GPU/TPU/NPU）的主要問題

電子運算做矩陣乘很成熟，但在大模型與高吞吐推論/訓練下，遇到幾個硬牆：

記憶體牆（Memory Wall）
矩陣乘需要反覆讀權重、讀 activation、寫回結果。即使算力很強，只要資料進不來（HBM/DRAM 頻寬受限），算單元就會「餓肚子」。

能耗主要花在資料移動，不在乘加本身
在先進製程裡，做一次乘加的能量未必是最大宗；跨層級搬資料（SRAM↔DRAM↔ 跨封裝互連）常常才是功耗與延遲的大頭。

互連與封裝（scale-out）的瓶頸
大模型需要多卡/多節點並行，瓶頸變成 chip-to-chip / node-to-node 通訊（頻寬、延遲、功耗）。

熱密度與散熱
電子在金屬線裡跑、電容充放電，熱就是硬限制；頻率/電壓再拉高，散熱與可靠度先崩。

1.2 那光子加速器想解哪一題？

光子方案通常瞄準兩件事：

把「線性運算」用光的物理過程直接做掉（矩陣乘/卷積）
降低資料搬運與互連的能耗（尤其是 chip-to-chip、甚至板級/機櫃級連結）

換句話說：光子不是來取代所有運算，而是想在「最耗的線性部分」用更低能耗、更高頻寬的方式處理。

2) 光子的優點、缺點（用矩陣乘/卷積的視角）

2.1 光子為什麼特別適合「線性運算」

矩陣乘與卷積本質上是線性系統：

矩陣乘：很多個「加權相加」
卷積：可視為滑動的加權相加；也常用 FFT/濾波器等線性操作表達

而光學裡最擅長的就是線性：

干涉（interference）= 加法/疊加
光場振幅是可疊加的，天然把多路訊號「加起來」。

相位/振幅調制 + 光學網路 = 權重（乘法係數）
用調制器、相位器、干涉器網路（例如 MZI 網格）可以實現一個線性映射（近似矩陣）。

在傳播速度與高載波頻率下，頻寬非常高
光通道可做高頻寬傳輸，多波長（WDM）可並行。

2.2 光子的主要優點

下面是「為什麼大家覺得它很香」的幾個工程級優點。

(A) 高頻寬、天然並行（時間/空間/波長）

WDM（多波長）：同一條波導/光纖上跑多個波長，等於多條並行通道。
空間並行：多路光束、多波導陣列，同時計算多個向量/通道。
結果是：做大型線性映射時，吞吐量很容易做得很高（特別是批次推論、濾波、通訊等場景）。

(B) 低互連功耗潛力（尤其長距離/跨晶片）

電互連跨距離功耗高、訊號衰減與串擾麻煩；光互連在板級/機櫃級非常成熟。
光子加速器常見的策略是：用光把「算」和「傳」合在一起，降低 I/O 與互連能耗。

(C) 線性運算可以「類比物理」直接完成

在某些架構裡，矩陣乘不必拆成一堆數位乘法器加法器；而是讓光學網路本身就是那個線性轉換。
這帶來一個關鍵好處：能量/延遲的成長不一定跟數位乘加同樣方式擴張（當然仍受雜訊與校正限制，見缺點）。

2.3 光子的主要缺點與現實代價

光子加速器很強，但它的「難」也很硬核，而且多數問題集中在：非線性、精度、可編程性、與系統整合。

(A) 不擅長非線性與控制流程（ReLU/GELU/softmax/分支）

神經網路除了線性層，還有：

activation（ReLU/GELU）
normalization
softmax、top-k
控制流程、稀疏性處理

這些通常還是得靠電子數位邏輯做。於是常見結果是：

光做線性（matmul/conv），電做非線性與控制
系統效能很吃「光電轉換」與資料搬運設計

(B) 精度、雜訊、漂移、校正成本

很多光子矩陣乘走的是類比/混合訊號路線，會遇到：

光源噪聲、探測器噪聲、熱噪聲
製程誤差導致權重不準
溫度漂移造成相位變動（矽光特別敏感），需要熱調諧/校正迴路
量化與動態範圍限制

所以在高精度需求（例如 FP16/FP32 等級）上，通常要付出更多代價；較常見的是走低/中精度推論或「容錯性高」的工作負載。

(C) 權重儲存與可重配置速度

如果你要做通用矩陣乘，權重必須可寫可改。光子權重常見方式：

相位器（thermo-optic / electro-optic）
可調耦合器
甚至搭配外部記憶體/電路

問題在於：

熱調諧功耗可能不小（而且慢）
高密度可調元件會帶來控制複雜度與漂移
大模型權重規模很大，如何把「權重更新/載入」做得快、省電，是系統級難題

(D) 光電轉換（O/E、E/O）是系統瓶頸候選

就算光學核心線性運算很省，資料若頻繁在光/電之間轉來轉去：

轉換器功耗、延遲、面積會吃掉收益
架構上需要仔細設計資料流，盡量減少轉換次數

(E) 生態系與量產成熟度

相比 GPU/TPU 的軟硬體生態：

編譯器、算子映射、誤差模型、可測試性（DFT）、可靠度方法學都還在成長
量產良率、封裝、測試成本也更具挑戰

把它收斂成一句工程結論

光子加速器最適合的定位通常是：把「線性層」當成高吞吐、低互連功耗的專用引擎；但整體系統仍需要電子電路負責非線性、控制與精度管理。它的成敗往往不是「光學矩陣乘能不能做」，而是整套資料流、校正、光電介面與可編程性能不能把收益守住。

快速對照表：優點 vs 缺點

優點：線性運算天然、並行度高、頻寬高、互連功耗潛力佳
缺點：非線性要靠電子、精度與漂移需校正、權重可編程與控制複雜、光電轉換可能吃掉紅利、量產與軟體生態仍在發展