美國現任總統川普(Donald Trump)在今年1月撤銷了前任總統拜登(Joe Biden)的AI行政命令,並制定新的AI行政命令,要求各界在3月15日以前提出建議,OpenAI與Google雙雙在周四(3/13)提出意見,明示或暗示地希望美國應讓AI模型訪問受版權保護的數據。
不管是OpenAI的GPT大型語言模型,或者是Google Imagen的文本轉圖像模型,都經常被指控侵犯版權,特別是OpenAI。除了在2023年就採取行動的紐約時報(The New York Times)之外,去年還有8家報紙聯手控告OpenAI及微軟侵權,包括The New York Daily News、Chicago Tribune及Denver Post等。
然而,OpenAI在提交給英國上議院通信暨數字特別委員會的一份文件中,曾經說明該公司對版權的看法,除了OpenAI的大型語言模型都是通過網路上的公開內容、取得第三方授權的資訊,以及用戶及人工訓練人員所提供的資訊所開發的,而如今的版權幾乎涵蓋了所有類型的人類表達方式,不管是博客、照片、論壇、程序代碼片段或是政府文件,而這也意味著如果不使用受到版權保護的數據,就不可能訓練目前領先的AI模型。
當時OpenAI還強調,該公司遵守包括版權法在內的所有法令,卻也認為版權法在法律上並不禁止訓練。
儘管如此,隨後OpenAI還是與不同語言的媒體集團、金融時報(Financial Times,FT)、Reddit及News Corp等眾多的內容平台完成與內容授權有關的合作協議。
這一次,面對難以預料的川普,OpenAI大膽提出了一項版權策略,希望在保障內容創作者權益的同時,也能確保美國在AI領域的領導地位與國家安全。OpenAI呼籲聯邦政府應該保障美國人從AI中學習的自由,並確保美國的AI模型能夠繼續從受版權保護的材料中學習,以防止美國在AI競爭中落後。
至於Google的說法則相對隱晦,表示聯邦政府應該要擁抱那些保障數據可被公平學習使用的政策框架。
Google對美國AI政策的其他意見,還包括希望聯邦與地方政府能夠推動政策改革,以應對AI基礎設施不斷增加的能源需求;執行出口管制以在保護國家安全及於海外提供服務間取得平衡;並希望各州能夠創建一致的前沿AI政策以避免混亂。