GeForce RTX 50系列計算性能問題根源：英偉達放棄對32位OpenCL和CUDA支持

英偉達在CUDA 12.0（以及更高版本）中停止對32位CUDA的支持之後，圍繞這個平台構建的技術，比如PhysX，也隨之結束了。最近PassMark的一份報告顯示，英偉達在新一代基於Blackwell架構GPU上放棄對32位OpenCL和CUDA的支持，是導致GeForce RTX 50系列顯示卡計算性能低下的一個重要原因，因為與現有測試工具和應用程式可能會存在兼容性問題。

贊助商廣告

GeForce RTX 50系列計算性能問題根源：英偉達放棄對32位OpenCL和CUDA支持

NVIDIA GeForce RTX 5090

據TomsHardware報道，英偉達並不是突然選擇這麼做，過去幾年裡傳統的CUDA支持已經通過連續的更新逐漸被淘汰。使用32位CUDA編寫的程序仍然可以在RTX 40系列或者更早的硬體上運行，但是換到RTX 50系列上時，會回退到CPU，這要比GPU的並行處理速度要慢得多。這有可能是軟體限制，可以通過32位到64位的翻譯層解決，但是不能指望英偉達會提供官方資訊或者解決方案。

按照PassMark的說法，英偉達終止對32位CUDA兼容的決定也影響了遺留的OpenCL代碼。雖然英偉達官方沒有對此發表公告，但是普遍認為已經徹底放棄了對32位OpenCL的支持。事實上，英偉達的OpenCL開發人員文檔仍然提供了為32位環境編寫的代碼示例，在RTX 40系列上仍然運行良好，不過在RTX 50系列就會出現錯誤。如果不對源代碼進行必要的更改，這些過時的OpenCL程序應該不能在Blackwell架構及未來的GPU上運行。

雖然PassMark的主要性能測試與現代系統兼容，但是仍然包含幾個不需要64位地址空間的子基準測試。為了讓基準測試正確地衡量性能，PassMark可能需要在64位模式下重新編譯。這事情說起來容易做起來難，需要考慮32位環境裡累積的大量問題，其中涉及海量的工作，預計要花不少時間。好消息是，過去多年裡，大多數開發人員已經慢慢地遷移到64位代碼。