Google 最近推出了其最新的人工智能模型家族——Gemini 2.0。這一版本包括名為Gemini 2.0 Flash的聊天版模型,面向全球用戶開放。同時,針對開發者的實驗性多模態版本則具備文字轉語音和圖像生成功能。
Google 首席執行官 Sundar Pichai 表示,與第一代模型Gemini 1.0集中於信息的組織和理解不同,Gemini 2.0旨在更有效地發揮這些信息的實用價值。
根據市場回報,Gemini 2.0在多數用戶請求的使用領域中都有所提升,尤其在代碼生成和提供正確事實響應方面更顯優越。不過,在評估較長文本內容的能力上,Gemini 2.0則略遜於Gemini 1.5 Pro。
用戶可在桌面和移動web的模型下拉菜單中選擇訪問優化的chat版Flash 2.0,該功能不久將在Gemini移動應用中推出。
關於Gemini Flash 2.0的多模態版本,將通過Google的AI Studio和Vertex AI開發者平台供應。根據公司的計劃,該多模態版本的通用版本預計將在明年一月推出,並將隨著更多Gemini 2.0模型尺寸的增加而發布。至2025年初,Google還計劃將Gemini 2.0擴展至更多Google產品。
Gemini 2.0的推出是Google在競爭激烈的科技業AI競賽中的最新步驟。該公司正與Microsoft、Meta以及初創企業OpenAI等科技巨頭展開角逐。
除了新Flash模型的發布,Google還推出了其他研究原型,旨在發展出更具“主動性”的AI模型和體驗。根據公司的說法,主動模型能夠更全面地理解周圍世界,提前思考多步並在用戶的監督下採取行動。
上週,Pichai在《紐約時報》的DealBook峰會上與安德魯·羅斯·索金進行對話,挑戰Microsoft的AI進展,並表達出他希望隨時進行兩家公司模型的直接比較。