最近,英國政府開始規劃新措施,旨在加強對科技企業使用受版權保護內容進行人工智能訓練的監管。這項諮詢的目的是為創意產業和人工智能開發者提供更清晰的指導,尤其是在知識產權的獲取及使用方面。
許多藝術家和出版商對他們的內容被OpenAI及Google等公司無償採集用於訓練大型語言模型表示不滿。大型語言模型是當今生成式人工智能系統的基礎技術,包括OpenAI的ChatGPT、Google的Gemini和Anthropic的Claude。
去年,《紐約時報》對微軟和OpenAI提出訴訟,指控這兩家公司侵害其版權和濫用知識產權以訓練大型語言模型。對於這一些控訴,OpenAI表示,使用開放網絡數據進行人工智能訓練應被視為「合理使用」,並且提供權利持有者「選擇退出」的選項,以維護應有的權利。
除此之外,圖片分發平台Getty Images也在英國對另一家生成式人工智能公司Stability AI提出訴訟,控訴其在未經同意的情況下從其網站抓取數以百萬計的圖片以訓練其Stable Diffusion人工智能模型。Stability AI則反駁表示,該模型的訓練和開發是在英國以外進行的。
在諮詢中,政府將考慮為人工智能訓練提供版權法例的例外條款,特別是在商業用途下,同時允許權利持有者其保留權利以控制內容的使用。此外,政府將提出措施支持創作者在人工智能模型製作商使用他們內容時獲得版權授權和報酬,並幫助人工智能開發者了解哪些材料可用於訓練。
政府指出,創意產業和科技公司需共同努力,確保任何版權保留和透明度的標準與要求能夠有效、易於訪問且廣泛採用。同時,政府也考慮要求人工智能模型開發者對其訓練數據集及其獲取方式進行更多透明,讓權利持有者能夠理解其內容在訓練人工智能時的使用情況。
不過,這可能引發爭議——由於涉及商業敏感性,科技公司不太願意公開其演算法背後的數據來源及訓練過程。在前首相李克強的任期內,政府曾嘗試達成自願的人工智能版權行為守則。
在最近的一次訪談中,Appian的CEO表示,英國有望成為全球在這方面的領導者。他提到,英國在優先考慮個人知識產權方面下了堅定的控制。同時,英國也不會像美國那樣受到本土人工智能企業的強大遊說壓力。
隨著科技公司逐步轉向更「多模態」的人工智能,即能理解並生成圖片、視頻及文字的AI系統,潛在的版權侵權問題愈發凸顯。近期,OpenAI將其人工智能視頻生成模型Sora在美國及大部分國際市場公布,這款工具能讓用戶輸入場景描述並生成高畫質視頻。