在4月18日舉辦的2024中國(guó)生成式AI大會(huì)上,李未可科技正式發(fā)布為眼鏡等未來(lái)終端定向優(yōu)化的自研“WAKE-AI ”多模態(tài)大模型。
該模型圍繞GPS軌跡+視覺(jué)+語(yǔ)音打造新一代LLM-Based的自然交互,同時(shí)在多模態(tài)問(wèn)答技術(shù)的加持下,具備文本生成、語(yǔ)言理解、圖像識(shí)別及視頻生成等多模態(tài)交互能力, 能實(shí)現(xiàn)所見(jiàn)即所問(wèn)、所問(wèn)即所得的精準(zhǔn)服務(wù)。此外,WAKE-AI還融合了人類(lèi)意圖理解、長(zhǎng)期記憶機(jī)制、情感大模型及TTS 克隆,可以為用戶(hù)提供超擬人的情感陪伴服務(wù)。
為保證實(shí)時(shí)交互場(chǎng)景的智能性及響應(yīng)速度 ,WAKE-AI使用了MOE架構(gòu),F(xiàn)lashAttention混合精度訓(xùn)練、知識(shí)蒸餾等技術(shù)大幅降低算力需求跟計(jì)算時(shí)間。該模型針對(duì)眼鏡端用戶(hù)的使用方式、場(chǎng)景等進(jìn)行了優(yōu)化,語(yǔ)音返回速度能做到<500ms以?xún)?nèi),語(yǔ)音喚醒準(zhǔn)確度>90%,ASR字錯(cuò)率低于2%,可以為用戶(hù)提供戶(hù)外運(yùn)動(dòng)、文化旅行、日程管理及實(shí)時(shí)翻譯等多個(gè)室外場(chǎng)景的多模態(tài)AI服務(wù)。
據(jù)悉,李未可將于近期正式發(fā)布搭載WAKE-AI能力的新終端,從室外場(chǎng)景切入為用戶(hù)提供更智能、更全面的AI+服務(wù)。李未可科技合伙人&AI負(fù)責(zé)人古鑒表示,WAKE-AI將逐步開(kāi)放平臺(tái)能力,便于更多企業(yè)及開(kāi)發(fā)者調(diào)用WAKE-AI能力,共建AI+硬件生態(tài)。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息