今日谷歌在其I/O大會(huì)期間,宣布了自家AI大模型矩陣的更新以及迭代情況,主要信息如下:
新增Gemini 1.5 Flash
谷歌表示,1.5 Flash是目前速度最快的Gemini模型,它專門針對(duì)大規(guī)模的大批量、高頻任務(wù)進(jìn)行了優(yōu)化,服務(wù)更具成本效益。
據(jù)悉,1.5 Flash基于Gemini 1.5 Pro“distillation”(譯為蒸餾)訓(xùn)練而來,它能將較大模型中最重要的知識(shí)和技能轉(zhuǎn)移到更小、更高效的模型中。
1.5 Flash的負(fù)載要比1.5 Pro小得多,但是在內(nèi)容生成方面同樣有不俗的質(zhì)量表現(xiàn)。1.5 Flash擅長(zhǎng)摘要、聊天應(yīng)用程序、圖像和視頻字幕、從長(zhǎng)文檔和表格中提取數(shù)據(jù)等。
1.5 Pro性能提升
目前1.5 Pro最為顯著的提升在于它的信息處理能力由100萬token提升至了200萬token。
此外,谷歌表示該大模型還進(jìn)一步提升了其代碼生成、邏輯推理和規(guī)劃、多輪對(duì)話以及音頻和圖像理解能力,目前可以執(zhí)行更加復(fù)雜和細(xì)致的指令。
其他方面,Gemini API和Google AI Studio中新增了音頻理解能力,可以對(duì)上傳視頻的圖像和音頻進(jìn)行推理。當(dāng)然,現(xiàn)如今1.5 Pro也更為緊密地與谷歌旗下產(chǎn)品結(jié)合在了一起。(這也是本次I/O大會(huì)核心展示部分)
Gemini Nano
Gemini Nano是一款適用于智能手機(jī)等設(shè)備的端側(cè)大模型,早些時(shí)候該大模型只支持純文本處理,現(xiàn)如今已經(jīng)進(jìn)一步升級(jí)圖像處理功能。Gemini Nano目前已經(jīng)應(yīng)用于Pixel等手機(jī)產(chǎn)品當(dāng)中。
開放模型Gemma 2
推出開放大模型Gemma 2,該模型采用全新架構(gòu),相較老版本性能以及效率有所升級(jí),并且新增了不同尺寸版本。
Project Astra
Project Astra旨在成為下一代AI助理,具有多模態(tài)能力,用戶能夠與之進(jìn)行復(fù)雜的對(duì)話。谷歌在I/O大會(huì)期間展示了基于Project Astra所構(gòu)建的體驗(yàn)視頻,里面包含了Project Astra與AR眼鏡相集成的用例。
來源:谷歌
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息