文/VR陀螺 冉啟行
在 iOS 18.2 Beta 2 上,蘋果 Visual Intelligence(視覺智能)正式登場。
作為 Apple Intelligence 的一部分,Visual Intelligence 是 iPhone 16 系列上的「獨(dú)占」功能。主要通過 iPhone 16系列上新增的相機(jī)按鈕,利用攝像頭捕捉物理世界的對(duì)象,并通過大模型分析有關(guān)該物體的「深度和有用信息」。
例如,拍攝餐廳的照片,用戶可以立即獲得其營業(yè)時(shí)間、評(píng)價(jià)和菜單等詳細(xì)信息;拍攝活動(dòng)傳單的照片,該工具可以提取并整理重要詳細(xì)信息,例如活動(dòng)的名稱、日期和地點(diǎn)。
Visual Intelligence 配合 iPhone 16 系列的相機(jī)按鈕,具有免解鎖、一鍵 AI 的特性,相對(duì)之前的 iPhone 或其他設(shè)備而言,具有更高效率。
基于 Visual Intelligence ,蘋果也為接下來的 AI、AR 眼鏡做了足夠的技術(shù)鋪墊、場景探索與用戶習(xí)慣的養(yǎng)成。Ray-Ban Meta 已經(jīng)證明了 AI 眼鏡技術(shù)路徑的可行性,蘋果也于近日啟動(dòng)了代號(hào)為「Atlas」的智能眼鏡項(xiàng)目,一場巨變正在醞釀。
相對(duì)文字形式,圖形圖像屬于典型的空間數(shù)據(jù),是人們?nèi)粘+@取信息最主要的方式。Visual Intelligence 的出現(xiàn),讓這種信息獲取現(xiàn)在有了更數(shù)字化的方式。
海外媒體在 iOS 18.2 Beta 的評(píng)測信息顯示,當(dāng) Visual Intelligence 界面打開時(shí),只需點(diǎn)擊相機(jī)快門按鈕即可拍照。然后,用戶可以點(diǎn)擊屏幕上的按鈕向 ChatGPT 詢問圖片,也可以按搜索按鈕啟動(dòng) Google 搜索。用戶可以選擇在沒有帳戶的情況下使用 ChatGP;如果不登錄,請(qǐng)求將保持匿名。
從下方的三張圖中,分別展示了利用 Visual Intelligence 進(jìn)行「識(shí)別物體」,「計(jì)算食物卡路里」,以及「提取重要信息」的場景,不管是利用「物體圖片進(jìn)行檢索文字信息」,還是利用「圖片上的文字檢索更深度的圖片、文字信息」,Visual Intelligence 都能很好地給出答案。
不同的是,一些是顯而易見的基礎(chǔ)信息,一些是需要網(wǎng)絡(luò)數(shù)據(jù)的挖掘匹配,還有一些是需要持續(xù)對(duì)話進(jìn)行挖掘。當(dāng)然,這些取決于前置的 Prompt,如果有更完善的 AI 工作流設(shè)定,相信它會(huì)基于每種不同的物體,甚至不同的用戶,給出千人千面的答案。如:當(dāng)識(shí)別圖片物體為「食物」時(shí),自動(dòng)去分析它的「卡路里」以及相關(guān)營養(yǎng)信息,而不僅僅是告訴我,它是什么,將會(huì)進(jìn)一步提升效率。
圖源:CNET
圖源:Future
圖源:Apple
雖然 Visual Intelligence 與 Google Lens,或者百度的 AI 識(shí)圖十分相似,但 Visual Intelligence 的與眾不同之處在于它直接在 iPhone 上處理所有內(nèi)容,而不是將數(shù)據(jù)發(fā)送到云端。
蘋果軟件工程高級(jí)副總裁 Craig Federighi 指出,Visual Intelligence 使用設(shè)備內(nèi)處理技術(shù)結(jié)合蘋果自己的服務(wù)。這意味著用戶的照片將保持私密,不會(huì)上傳到外部服務(wù)器。
iOS 18.2 預(yù)計(jì)將于 12 月份第一周面向美國地區(qū)正式推送。Visual Intelligence 是一個(gè)非常高效率的工具,將帶來更好的 AI 交互提升與應(yīng)用變革。
對(duì)于 AI 圖像圖形識(shí)別來說,目前智能手機(jī)無疑是最方便的電子產(chǎn)品,不過從交互維度來說,帶攝像頭的 AI/AR 眼鏡或是更好的載體,至少讓用戶可以空出雙手,不用一直握持 iPhone。
圖源:tomsguide
據(jù)外媒消息,有知情人士透露,蘋果于近日開啟了一項(xiàng)全新的內(nèi)部研究,該研究重點(diǎn)聚焦于智能眼鏡的開發(fā)。
據(jù)稱,這個(gè)新項(xiàng)目的代號(hào)為 Atlas。蘋果收集了員工對(duì)于智能眼鏡的看法,負(fù)責(zé)該計(jì)劃的團(tuán)隊(duì)也向部分選定的員工發(fā)送了電子郵件,以此確認(rèn)了在這一領(lǐng)域的產(chǎn)品研究情況。
當(dāng)蘋果計(jì)劃推出新的品類產(chǎn)品時(shí),通常會(huì)組建秘密小組。公司傾向于收集員工而非客戶的反饋,目的在于保持計(jì)劃的保密性。這些情況充分表明,蘋果有意大力推進(jìn)開發(fā)自己的智能眼鏡的想法。
值得注意的是,報(bào)道稱這項(xiàng)研究由蘋果硬件工程部門的產(chǎn)品系統(tǒng)質(zhì)量團(tuán)隊(duì)領(lǐng)導(dǎo),其中并未提及蘋果的 Vision 部門,這意味著蘋果這款智能眼鏡是不帶光機(jī)的 AI 音頻眼鏡,與 Ray-Ban Meta 類似。結(jié)合早前蘋果決定推遲 AR 眼鏡的研發(fā)信息來看,具有較高可信度。
相對(duì)于 AR 智能眼鏡而言,AI 音頻眼鏡不僅技術(shù)門檻相對(duì)更低,且供應(yīng)鏈也十分成熟,體積重量上也普遍能做到 50g 以內(nèi)的輕薄佩戴體驗(yàn)。不少業(yè)內(nèi)人士認(rèn)為 AI 音頻眼鏡是未來全彩 AR 眼鏡重要的過渡產(chǎn)品,在目前消費(fèi)市場中具備較高的市場競爭力。
蘋果擁有一整套最強(qiáng)的生態(tài)聯(lián)動(dòng),正如 AirPods 與 iPhone 連接的高效率表現(xiàn)。蘋果如果將 AI 眼鏡定義為 iPhone 的「配件」,內(nèi)置攝像頭與麥克風(fēng),利用 iPhone 的 AI 算力,連接 Visual Intelligence 與加強(qiáng)版 Siri,充分利用自身的硬件生態(tài),那將會(huì)是一個(gè)更加驚艷的硬件。
在所有可穿戴設(shè)備中,AI 眼鏡擁有諸多先天產(chǎn)品設(shè)計(jì)上的優(yōu)勢,可配備第一人稱視角的攝像頭,所見即所得;近嘴的麥克風(fēng),更好地拾音效果;近耳的揚(yáng)聲器,更好地人機(jī)交互??梢哉f,目前蘋果在 iOS 上所儲(chǔ)備的 Visual Intelligence 與加強(qiáng)版 Siri 等 AI 技術(shù)都能在 AI 眼鏡上得到更好的實(shí)現(xiàn)。
一直以來,蘋果的消費(fèi)級(jí)硬件都以「技術(shù)創(chuàng)新」和「場景創(chuàng)新」聞名,在 AI 眼鏡上,我們也可以期待一下,蘋果是否能做出一款真正超越 Ray-Ban Meta 的 AI 眼鏡產(chǎn)品,滿足一些額外的消費(fèi)需求。
當(dāng)然,與 Ray-Ban Meta 等第三方設(shè)備相比,從使用效率、連接體驗(yàn)上來看,手機(jī)廠商自身的硬件生態(tài)組合本身就會(huì)有一些明顯優(yōu)勢,即使前者具備先發(fā)優(yōu)勢。
眼鏡品類在目前的消費(fèi)市場的確是一個(gè)大眾產(chǎn)品,但也并非完完全全是一個(gè)生活「必需品」。對(duì)于無需近視矯正、戶外遮陽的用戶來說,佩戴眼鏡事實(shí)上是一件非常困難的事。就個(gè)人而言,在沒有養(yǎng)成眼鏡佩戴習(xí)慣之前,即使 20-30g 的眼鏡長時(shí)間佩戴也是一件非常困難的事,除非它真的能給我?guī)韮r(jià)值增量,就像 AirPods 和 Apple Watch 那樣。
在古希臘神話中,Atlas(阿特拉斯)是擎天巨神,屬于泰坦神族,他被宙斯降罪用雙肩支撐蒼天。從命名上來看,蘋果對(duì)于這款硬件寄予厚望。然而,蘋果的 AI 眼鏡系列,能否真正支撐其蘋果智能穿戴、甚至計(jì)算平臺(tái)的下一個(gè)十年呢?
答案留給時(shí)間。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文為VR陀螺原創(chuàng),任何第三方未經(jīng)授權(quán)不得轉(zhuǎn)載。如需轉(zhuǎn)載請(qǐng)聯(lián)系微信:vrtuoluo233 申請(qǐng)授權(quán),并在轉(zhuǎn)載時(shí)保留轉(zhuǎn)載來源、作者以及原文鏈接信息,不得擅自更改內(nèi)容,違規(guī)轉(zhuǎn)載法律必究。文中有圖片、視頻素材來自互聯(lián)網(wǎng)或無法核實(shí)出處,如涉及版權(quán)問題,請(qǐng)聯(lián)系本網(wǎng)站協(xié)商處理。
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息
上一篇: 第九屆金陀螺獎(jiǎng) | 優(yōu)質(zhì)VR/AR參評(píng)項(xiàng)目:雷鳥創(chuàng)新-雷鳥X3 Pro
下一篇: 第九屆金陀螺獎(jiǎng) | 優(yōu)質(zhì)VR/AR參評(píng)項(xiàng)目:番石榴(廈門)科技有限公司-維愛智VR專注力測訓(xùn)系統(tǒng)