宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

GeForce RTX 50系列計算性能問題根源:英偉達放棄對32位OpenCL和CUDA支持

2025年03月04日 首頁 » 其他

英偉達在CUDA 12.0(以及更高版本)中停止對32位CUDA的支持之後,圍繞這個平台構建的技術,比如PhysX,也隨之結束了。最近PassMark的一份報告顯示,英偉達在新一代基於Blackwell架構GPU上放棄對32位OpenCL和CUDA的支持,是導致GeForce RTX 50系列顯卡計算性能低下的一個重要原因,因為與現有測試工具和應用程序可能會存在兼容性問題。

GeForce RTX 50系列計算性能問題根源:英偉達放棄對32位OpenCL和CUDA支持

NVIDIA GeForce RTX 5090

據TomsHardware報道,英偉達並不是突然選擇這麼做,過去幾年裡傳統的CUDA支持已經通過連續的更新逐漸被淘汰。使用32位CUDA編寫的程序仍然可以在RTX 40系列或者更早的硬體上運行,但是換到RTX 50系列上時,會回退到CPU,這要比GPU的並行處理速度要慢得多。這有可能是軟體限制,可以通過32位到64位的翻譯層解決,但是不能指望英偉達會提供官方資訊或者解決方案。

按照PassMark的說法,英偉達終止對32位CUDA兼容的決定也影響了遺留的OpenCL代碼。雖然英偉達官方沒有對此發表公告,但是普遍認為已經徹底放棄了對32位OpenCL的支持。事實上,英偉達的OpenCL開發人員文檔仍然提供了為32位環境編寫的代碼示例,在RTX 40系列上仍然運行良好,不過在RTX 50系列就會出現錯誤。如果不對源代碼進行必要的更改,這些過時的OpenCL程序應該不能在Blackwell架構及未來的GPU上運行。

雖然PassMark的主要性能測試與現代系統兼容,但是仍然包含幾個不需要64位地址空間的子基準測試。為了讓基準測試正確地衡量性能,PassMark可能需要在64位模式下重新編譯。這事情說起來容易做起來難,需要考慮32位環境裡累積的大量問題,其中涉及海量的工作,預計要花不少時間。好消息是,過去多年裡,大多數開發人員已經慢慢地遷移到64位代碼。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新