推廣

谷歌展示多個(gè)AI大模型更新

發(fā)布時(shí)間：2024-05-15 15:44 | 標(biāo)簽：谷歌 AI Project Astra

微信掃一掃：分享

微信里點(diǎn)“發(fā)現(xiàn)”，掃一下
二維碼便可將本文分享至朋友圈

今日谷歌在其I/O大會(huì)期間，宣布了自家AI大模型矩陣的更新以及迭代情況，主要信息如下：

新增Gemini 1.5 Flash

谷歌表示，1.5 Flash是目前速度最快的Gemini模型，它專門針對(duì)大規(guī)模的大批量、高頻任務(wù)進(jìn)行了優(yōu)化，服務(wù)更具成本效益。

據(jù)悉，1.5 Flash基于Gemini 1.5 Pro“distillation”（譯為蒸餾）訓(xùn)練而來，它能將較大模型中最重要的知識(shí)和技能轉(zhuǎn)移到更小、更高效的模型中。

1.5 Flash的負(fù)載要比1.5 Pro小得多，但是在內(nèi)容生成方面同樣有不俗的質(zhì)量表現(xiàn)。1.5 Flash擅長(zhǎng)摘要、聊天應(yīng)用程序、圖像和視頻字幕、從長(zhǎng)文檔和表格中提取數(shù)據(jù)等。

1.5 Pro性能提升

目前1.5 Pro最為顯著的提升在于它的信息處理能力由100萬token提升至了200萬token。

此外，谷歌表示該大模型還進(jìn)一步提升了其代碼生成、邏輯推理和規(guī)劃、多輪對(duì)話以及音頻和圖像理解能力，目前可以執(zhí)行更加復(fù)雜和細(xì)致的指令。

其他方面，Gemini API和Google AI Studio中新增了音頻理解能力，可以對(duì)上傳視頻的圖像和音頻進(jìn)行推理。當(dāng)然，現(xiàn)如今1.5 Pro也更為緊密地與谷歌旗下產(chǎn)品結(jié)合在了一起。（這也是本次I/O大會(huì)核心展示部分）

Gemini Nano

Gemini Nano是一款適用于智能手機(jī)等設(shè)備的端側(cè)大模型，早些時(shí)候該大模型只支持純文本處理，現(xiàn)如今已經(jīng)進(jìn)一步升級(jí)圖像處理功能。Gemini Nano目前已經(jīng)應(yīng)用于Pixel等手機(jī)產(chǎn)品當(dāng)中。

開放模型Gemma 2

推出開放大模型Gemma 2，該模型采用全新架構(gòu)，相較老版本性能以及效率有所升級(jí)，并且新增了不同尺寸版本。

Project Astra

Project Astra旨在成為下一代AI助理，具有多模態(tài)能力，用戶能夠與之進(jìn)行復(fù)雜的對(duì)話。谷歌在I/O大會(huì)期間展示了基于Project Astra所構(gòu)建的體驗(yàn)視頻，里面包含了Project Astra與AR眼鏡相集成的用例。