為什麼我們需要光子計算?


光子加速器之所以常被拿來講「最強線性運算」(矩陣乘、卷積),核心原因其實很樸素:光在傳播與干涉的物理過程中,天然就在做「加權相加」。而現代 AI/訊號處理裡最吃資源的部分,偏偏就是大量的矩陣乘與卷積(本質上都是 MAC:multiply-accumulate)。下面用工程角度把「為什麼要用光」與「優缺點」拆開講清楚。


1) 為什麼要用光子?現有技術的瓶頸在哪裡

先抓住一句話:現在的瓶頸,很多時候不是算不動,而是「搬不動」(資料搬運/記憶體能耗/頻寬)。

1.1 電子式加速器(GPU/TPU/NPU)的主要問題

電子運算做矩陣乘很成熟,但在大模型與高吞吐推論/訓練下,遇到幾個硬牆:

記憶體牆(Memory Wall)
矩陣乘需要反覆讀權重、讀 activation、寫回結果。即使算力很強,只要資料進不來(HBM/DRAM 頻寬受限),算單元就會「餓肚子」。

能耗主要花在資料移動,不在乘加本身
在先進製程裡,做一次乘加的能量未必是最大宗;跨層級搬資料(SRAM↔DRAM↔ 跨封裝互連)常常才是功耗與延遲的大頭。

互連與封裝(scale-out)的瓶頸
大模型需要多卡/多節點並行,瓶頸變成 chip-to-chip / node-to-node 通訊(頻寬、延遲、功耗)。

熱密度與散熱
電子在金屬線裡跑、電容充放電,熱就是硬限制;頻率/電壓再拉高,散熱與可靠度先崩。

1.2 那光子加速器想解哪一題?

光子方案通常瞄準兩件事:

  1. 把「線性運算」用光的物理過程直接做掉(矩陣乘/卷積)
  2. 降低資料搬運與互連的能耗(尤其是 chip-to-chip、甚至板級/機櫃級連結)

換句話說:光子不是來取代所有運算,而是想在「最耗的線性部分」用更低能耗、更高頻寬的方式處理。


2) 光子的優點、缺點(用矩陣乘/卷積的視角)

2.1 光子為什麼特別適合「線性運算」

矩陣乘與卷積本質上是線性系統:

  • 矩陣乘:很多個「加權相加」
  • 卷積:可視為滑動的加權相加;也常用 FFT/濾波器等線性操作表達

而光學裡最擅長的就是線性:

干涉(interference)= 加法/疊加
光場振幅是可疊加的,天然把多路訊號「加起來」。

相位/振幅調制 + 光學網路 = 權重(乘法係數)
用調制器、相位器、干涉器網路(例如 MZI 網格)可以實現一個線性映射(近似矩陣)。

在傳播速度與高載波頻率下,頻寬非常高
光通道可做高頻寬傳輸,多波長(WDM)可並行。


2.2 光子的主要優點

下面是「為什麼大家覺得它很香」的幾個工程級優點。

(A) 高頻寬、天然並行(時間/空間/波長)

  • WDM(多波長):同一條波導/光纖上跑多個波長,等於多條並行通道。
  • 空間並行:多路光束、多波導陣列,同時計算多個向量/通道。
  • 結果是:做大型線性映射時,吞吐量很容易做得很高(特別是批次推論、濾波、通訊等場景)。

(B) 低互連功耗潛力(尤其長距離/跨晶片)

  • 電互連跨距離功耗高、訊號衰減與串擾麻煩;光互連在板級/機櫃級非常成熟。
  • 光子加速器常見的策略是:用光把「算」和「傳」合在一起,降低 I/O 與互連能耗。

(C) 線性運算可以「類比物理」直接完成

  • 在某些架構裡,矩陣乘不必拆成一堆數位乘法器加法器;而是讓光學網路本身就是那個線性轉換。
  • 這帶來一個關鍵好處:能量/延遲的成長不一定跟數位乘加同樣方式擴張(當然仍受雜訊與校正限制,見缺點)。

2.3 光子的主要缺點與現實代價

光子加速器很強,但它的「難」也很硬核,而且多數問題集中在:非線性、精度、可編程性、與系統整合。

(A) 不擅長非線性與控制流程(ReLU/GELU/softmax/分支)

神經網路除了線性層,還有:

  • activation(ReLU/GELU)
  • normalization
  • softmax、top-k
  • 控制流程、稀疏性處理

這些通常還是得靠電子數位邏輯做。於是常見結果是:

  • 光做線性(matmul/conv),電做非線性與控制
  • 系統效能很吃「光電轉換」與資料搬運設計

(B) 精度、雜訊、漂移、校正成本

很多光子矩陣乘走的是類比/混合訊號路線,會遇到:

  • 光源噪聲、探測器噪聲、熱噪聲
  • 製程誤差導致權重不準
  • 溫度漂移造成相位變動(矽光特別敏感),需要熱調諧/校正迴路
  • 量化與動態範圍限制

所以在高精度需求(例如 FP16/FP32 等級)上,通常要付出更多代價;較常見的是走 低/中精度推論 或「容錯性高」的工作負載。

(C) 權重儲存與可重配置速度

如果你要做通用矩陣乘,權重必須可寫可改。光子權重常見方式:

  • 相位器(thermo-optic / electro-optic)
  • 可調耦合器
  • 甚至搭配外部記憶體/電路

問題在於:

  • 熱調諧功耗可能不小(而且慢)
  • 高密度可調元件會帶來控制複雜度與漂移
  • 大模型權重規模很大,如何把「權重更新/載入」做得快、省電,是系統級難題

(D) 光電轉換(O/E、E/O)是系統瓶頸候選

就算光學核心線性運算很省,資料若頻繁在光/電之間轉來轉去:

  • 轉換器功耗、延遲、面積會吃掉收益
  • 架構上需要仔細設計資料流,盡量減少轉換次數

(E) 生態系與量產成熟度

相比 GPU/TPU 的軟硬體生態:

  • 編譯器、算子映射、誤差模型、可測試性(DFT)、可靠度方法學都還在成長
  • 量產良率、封裝、測試成本也更具挑戰

把它收斂成一句工程結論

光子加速器最適合的定位通常是:把「線性層」當成高吞吐、低互連功耗的專用引擎;但整體系統仍需要電子電路負責非線性、控制與精度管理。它的成敗往往不是「光學矩陣乘能不能做」,而是 整套資料流、校正、光電介面與可編程性能不能把收益守住。


快速對照表:優點 vs 缺點

  • 優點:線性運算天然、並行度高、頻寬高、互連功耗潛力佳
  • 缺點:非線性要靠電子、精度與漂移需校正、權重可編程與控制複雜、光電轉換可能吃掉紅利、量產與軟體生態仍在發展