Microsoft 正在測試 Windows 版 Copilot 應(yīng)用的新更新,允許用戶與 AI 助手共享屏幕或應(yīng)用。Copilot Vision 原本僅限于 Edge 瀏覽器,現(xiàn)在擴展到 PC 上的所有應(yīng)用。它可以指導(dǎo)用戶使用 Photoshop 功能,分析照片和網(wǎng)頁。新功能還包括文件搜索,支持多種文件格式。這些功能將在未來幾周或幾個月內(nèi)向所有 Windows 11 用戶推出。
Google 推出的 Gemini Live 不僅能進(jìn)行對話,還能通過攝像頭識別物體。這項功能可以幫助用戶在日常生活中獲取更多信息,如識別藝術(shù)品、導(dǎo)航等。它比簡單的圖像識別更強大,能與用戶進(jìn)行自然對話。目前該功能已開始在部分手機上推出,有望改變我們與周圍世界互動的方式。
微軟將 Copilot Vision 功能擴展至 Windows 和移動設(shè)備,超越網(wǎng)頁應(yīng)用范疇。用戶可通過移動設(shè)備攝像頭實時分析視頻,獲得植物護(hù)理和家居裝飾建議。Windows 版本即將推出,支持全系統(tǒng) AI 輔助,如指導(dǎo) Photoshop 操作和分析照片、網(wǎng)頁等。此次更新還包括記憶、個性化、網(wǎng)絡(luò)操作和播客創(chuàng)建等多項新功能。
Google 正式向用戶推出 Gemini Live 的新 AI 功能,讓用戶能夠通過手機屏幕或攝像頭實時與 AI 進(jìn)行交互。這項源自 "Project Astra" 的技術(shù),可以實時解讀視頻內(nèi)容并回答相關(guān)問題。目前該功能已向 Google One AI Premium 計劃的 Gemini Advanced 訂閱用戶開放,展現(xiàn)了 Google 在 AI 助手領(lǐng)域的領(lǐng)先地位。
一款名為 "Touch Grass" 的 iOS 應(yīng)用采用獨特方式限制用戶使用手機:用戶必須走到戶外拍攝真實的草地照片,才能解鎖受限應(yīng)用。該應(yīng)用使用計算機視覺 AI 技術(shù)識別真實草地,防止用戶使用室內(nèi)植物作弊。這個既幽默又實用的應(yīng)用程序,旨在幫助人們減少屏幕使用時間,培養(yǎng)更健康的生活方式。
Nvidia 發(fā)布了 Cosmos-Transfer1 人工智能模型,可生成高度逼真的仿真環(huán)境,用于訓(xùn)練機器人和自動駕駛汽車。該模型采用自適應(yīng)多模態(tài)控制系統(tǒng),能更精細(xì)地控制生成環(huán)境,顯著提高仿真度和實用性。它解決了物理 AI 開發(fā)中模擬訓(xùn)練與現(xiàn)實應(yīng)用之間的差距,為機器人和自動駕駛技術(shù)的發(fā)展帶來重大突破。
人工智能正在改變體育運動的評判方式。在花樣滑冰中,AI可以通過卷積神經(jīng)網(wǎng)絡(luò)和姿態(tài)估計等技術(shù),精確分析運動員的動作和團(tuán)隊配合。這不僅有助于減少人為偏見,提高評分的公平性,還可以用于教練指導(dǎo)和自我反饋。盡管面臨數(shù)據(jù)稀缺等挑戰(zhàn),但AI在花樣滑冰等體育項目中的應(yīng)用前景廣闊。
Snapchat 首次推出由自研生成視頻模型驅(qū)動的 AI 視頻濾鏡。這三款新濾鏡僅向付費用戶開放,每月訂閱費 15.99 美元。Snap 此舉旨在保持競爭力,為用戶提供獨特功能。公司計劃每周增加新濾鏡,目前包括"浣熊"、"狐貍"和"春花"三款。用戶可通過鏡頭輪盤訪問并保存生成的 AI 視頻。
研究人員發(fā)現(xiàn),廉價的貼紙可以有效欺騙自動駕駛汽車的交通標(biāo)志識別系統(tǒng)。他們還發(fā)現(xiàn)這些系統(tǒng)會"記憶"標(biāo)志位置,即使標(biāo)志被遮擋也會假定其存在,導(dǎo)致攻擊成功率低于預(yù)期。研究人員測試了多種攻擊方法,包括使標(biāo)志"消失"或制造虛假標(biāo)志。這項研究填補了商業(yè)自動駕駛系統(tǒng)漏洞研究的空白,為提高系統(tǒng)安全性提供了重要信息。
Tavus Inc.是一家人工智能研究初創(chuàng)公司,專注于開發(fā)能夠模擬與他人對話體驗的實時AI技術(shù)。今天,該公司宣布推出一系列突破性的AI模型,旨在構(gòu)建人機互動的操作系統(tǒng),通過“對話視頻界面”使AI能夠自然地感知、理解和回應(yīng)。Tavus的使命是讓AI理解面部表情、語調(diào)和肢體語言,并能夠用自己的表情和語調(diào)做出反應(yīng)。
Prompt AI公司推出的Seemour平臺為家庭安防攝像頭帶來了前所未有的AI功能。除了常見的物體識別和動作分析外,它還能學(xué)習(xí)識別寵物名字、識別特定個人并從視頻中移除他們,以及回答問題如"我的鑰匙放哪了?"等。這些創(chuàng)新功能將家庭安防AI推向了新的高度,但也需要用戶對這家初創(chuàng)公司給予足夠的信任。
Nvidia 推出了一款名為 Signs 的創(chuàng)新 AI 工具,旨在幫助人們學(xué)習(xí)美國手語 (ASL)。該平臺提供手語詞匯庫、3D 虛擬教師和實時反饋功能,用戶可以通過網(wǎng)絡(luò)攝像頭獲得簽名評估。Nvidia 計劃擴展詞匯庫并開放數(shù)據(jù)集,以促進(jìn)無障礙 AI 工具的開發(fā),為聽障兒童家庭提供早期溝通渠道。
UVeye開發(fā)了一種基于人工智能的智能車輛檢測系統(tǒng),可在幾秒內(nèi)檢測車輛外部和機械故障。該公司最近完成1.91億美元D輪融資,由豐田汽車旗下Woven Capital領(lǐng)投。UVeye計劃利用這筆資金擴大全球系統(tǒng)部署,提高制造能力,并建立更多戰(zhàn)略合作伙伴關(guān)系。
OpenAI推出名為Operator的人工智能代理,能夠自主使用網(wǎng)絡(luò)瀏覽器完成各種在線任務(wù)。這項功能目前僅向ChatGPT Pro訂閱用戶開放,可以執(zhí)行多步驟的復(fù)雜任務(wù),如預(yù)訂餐廳或購買音樂會門票。雖然具有一定的自動化能力,但其可靠性和準(zhǔn)確性仍有待提高。
本周科技圈風(fēng)云激蕩:TikTok 面臨美國最高法院裁決,或?qū)⒈黄韧_\;Meta 在美國終止事實核查,引發(fā)爭議;ChatGPT 推出全新任務(wù)功能,為用戶提供智能日程管理;Beat Saber 在 Quest 平臺銷量突破千萬,AI 電影制作技術(shù)展現(xiàn)驚人潛力。
當(dāng)你來到這個世界睜開眼睛的第一刻,沒有學(xué)會語言的時候,靠的就是你的眼睛。 我們先看到光影、顏色,才逐漸分辨出父母的面孔,屋子的空間,那時沒有詞匯、沒有句子,只有模糊的光影與輪廓。
領(lǐng)先的神經(jīng)擬態(tài)視覺傳感公司普諾飛思(Prophesee)今日宣布推出高速、經(jīng)濟(jì)高效且緊湊的評估套件(EVK),以滿足計算機視覺開發(fā)人員想要基于堆棧式事件視覺傳感器IMX646 HD開發(fā)應(yīng)用的需求。
中科英泰智能稱重解決方案采用英特爾處理器打造,能夠以低功耗提供強大的計算性能、安全性和可靠性。這些能力對于運行邊緣人工智能工作負(fù)載至關(guān)重要。該系統(tǒng)還使用英特爾OpenVINO工具套件來幫助優(yōu)化圖像識別應(yīng)用程序。
2021年10月11-17日,兩年一度的計算機視覺領(lǐng)域頂級學(xué)術(shù)會議 ICCV (International Conference on Computer Vision) 將在加拿大蒙特利爾召開。