Runway發布代號"Whisper Thunder"的4.5版本AI視頻生成模型,展現出強大的視頻生成能力。該模型能夠創建高質量的人物和動物奔跑、形態變換等復雜場景視頻,在文本轉視頻排行榜上表現卓越。新模型支持多種風格控制,包括寫實、動畫和電影風格,具備快速生成、無水印等特點。Runway作為AI視頻領域的黑馬公司,獲得了英偉達等知名投資方支持,其CEO表示希望防止AI技術被少數公司壟斷。
AI初創公司Runway和深度求索今日發布兩款新基礎模型,聲稱性能超越科技巨頭算法。Runway的Gen-4.5提供文本轉視頻功能,在人工智能分析文本轉視頻基準測試中創下新紀錄,能更好地遵循提示并生成更逼真的視頻內容。深度求索發布的V3.2版本在編程和數學任務方面表現更優,采用新的注意力機制實現DSA,降低硬件使用率。兩款模型均針對不同應用場景進行了優化。
OpenAI因服務器需求激增對Sora視頻生成服務實施限制,免費用戶每日僅可生成6個視頻。Sora負責人稱"GPU正在融化",希望讓更多用戶能夠使用服務。谷歌也對其AI模型實施類似限制,免費用戶圖像生成數量減少至每日2張。報告顯示,OpenAI數據中心合作伙伴為支持AI服務需求已累積近千億美元債務,凸顯了大規模提供生成式AI服務的巨大成本壓力。
SkyReels是專為營銷人員、設計師和社交媒體內容創作者打造的多模態生成式AI視頻平臺。該平臺整合了Google Veo 3.1、Sora 2等頂級AI模型,支持文本轉圖像、圖像轉視頻等多種工作流程。平臺特色包括智能創意助手Expert Agent,通過結構化問答指導創作流程,以及150多個針對服裝、消費品等領域的專業模板。SkyReels專注于TikTok、Instagram等社交平臺的快速內容制作需求。
經過嚴格測試,OpenAI的Sora 2在AI視頻生成領域略勝谷歌Veo 3一籌。雖然兩者都能生成高質量的帶音頻AI視頻,但Sora在動作流暢度、音頻匹配和減少幻覺方面表現更佳。Sora目前免費使用,而Veo 3需每月20美元。測試顯示,盡管兩款工具都令人印象深刻,但它們也引發了關于深度偽造和現實與AI內容區分的重要擔憂。
OpenAI推出全新Sora應用,打造完全由AI生成視頻的社交媒體平臺。美國、加拿大、日本和韓國用戶現可直接下載使用,無需邀請碼,但該開放政策僅限時提供。其他地區用戶仍需等待更廣泛的開放或通過Discord等渠道獲取邀請碼。用戶可使用ChatGPT賬戶登錄,立即開始觀看、分享和創建AI視頻內容。
OpenAI Sora負責人Bill Peebles在X平臺預告了視頻應用的重大更新。三項新功能包括:角色客串功能將很快推出,界面將實時顯示熱門客串內容;視頻編輯功能首先支持多片段拼接,更強大的編輯工具即將到來;頻道/群組功能讓用戶與朋友分享內容,支持體育俱樂部、大學、公司等特定群體。此外還將優化應用性能、減少審核限制,Android版本也即將發布。
Netflix在最新財報中表示將"全力投入"生成式AI技術,認為AI能夠有效提升創作效率。CEO薩蘭多斯強調AI不會取代創意,而是為創作者提供更好的工具。Netflix已在《永恒者》等作品中使用AI技術制作特效場景。盡管娛樂業對AI存在爭議,擔心影響就業,Netflix仍堅持AI將幫助創作伙伴更好更快地講述故事。
聊天機器人和圖像生成器的時代已過,現在是AI視頻生成器的時代。近兩年來,幾乎所有主要科技公司都推出了某種AI視頻模型,標志著生成式AI技術的新浪潮。從Sora到谷歌的Veo 3再到Midjourney,市場競爭日趨激烈。本文匯總了所有主要模型供您參考,包括定價、隱私政策以及親身測試體驗。
谷歌發布Veo 3.1 AI視頻生成模型更新,顯著改進了提示詞遵循能力和圖像轉視頻功能。新版本可同時生成視頻和音頻,并在Flow視頻編輯器中新增"幀到視頻"功能,用戶可上傳首尾幀自動生成中間內容。雖然在真實感方面仍不如OpenAI的Sora 2,但谷歌專注于為專業視頻工作者提供實用工具的策略值得認可。
OpenAI推出的AI視頻生成應用Sora在不到五天內下載量突破100萬次,增長速度超過ChatGPT。該應用類似TikTok,提供無限垂直視頻流,但所有視頻均由AI生成。用戶只需輸入提示詞即可創建10秒視頻,還可通過Cameo功能制作個人視頻。盡管目前僅在北美地區開放且需要邀請碼使用,但已引發版權爭議和娛樂行業反彈。
OpenAI發布了音視頻生成模型Sora 2,同時推出配套社交應用Sora,用戶可生成包含自己的視頻并在類似TikTok的信息流中分享。Sora 2在物理定律遵循方面有顯著改進,視頻更加真實。應用提供"客串"功能,允許用戶將自己植入生成場景中,并可與朋友分享形象使用權限。該iOS應用目前在美加地區采用邀請制,ChatGPT Pro用戶可直接體驗。
據報道,OpenAI正準備發布一款由即將推出的Sora 2視頻模型驅動的獨立社交應用。該應用與TikTok高度相似,采用垂直視頻信息流和滑動滾動導航。不過,該應用僅支持AI生成的內容,用戶無法從手機相冊上傳照片或視頻。Sora 2在應用內生成的視頻時長限制為10秒或更短。應用還包含身份驗證工具,允許用戶使用自己的肖像生成視頻,其他用戶可以標記并在重新混合視頻時使用他們的肖像。
Meta公司推出名為"Vibes"的全新信息流功能,專門展示由創作者使用AI技術制作的視頻內容。該功能將人工智能生成的視頻內容進行整合和分類,為用戶提供更加個性化的AI視頻瀏覽體驗,標志著Meta在AI內容分發領域的又一重要布局。
Meta AI應用推出名為Vibes的新功能,專門展示AI生成的短視頻內容。用戶可以瀏覽他人創作的AI視頻,也能從零開始制作或改編現有視頻。創建的視頻支持私信分享或轉發至Instagram和Facebook。CEO扎克伯格表示這是新產品方向的早期探索,Meta超級智能實驗室將與Midjourney等公司合作開展AI項目。
YouTube在年度Made on YouTube活動中發布多項更新,包括Studio新增"相似度"檢測和唇同步配音功能,YouTube Live支持迷你游戲和雙格式同步直播,Shorts集成Veo 3 AI視頻生成模型。此外還推出播客AI剪輯工具、新的貨幣化選項如品牌合作和購物標簽功能,以及YouTube Music的粉絲互動新特性。
人工智能初創公司Luma AI發布Ray3文本轉視頻AI模型,專為專業影像制作設計。該模型具備思維鏈推理能力,能夠理解場景描述并遵循創意專業人士的指令。Ray3可評估自身輸出并優化結果,支持復雜場景規劃。模型能生成真正的高動態范圍視頻,支持專業ACES2065-1 EXR標準。用戶可從文本和圖像生成長達10秒的視頻片段。Luma AI與Adobe合作將Ray3集成到Firefly應用中,并獲得電通數碼等企業采用。
Luma AI發布首個AI推理視頻模型Ray3,該模型能夠在生成視頻前進行"思考"。與傳統AI視頻生成器不同,Ray3采用推理技術,能夠花費更多計算時間處理請求并檢查結果,從而創建更復雜的動作序列視頻。新功能包括16位HDR生成、可視化注釋工具和草稿模式,用戶可在20秒內快速測試創意,然后升級至高清分辨率。
YouTube在其直播活動中發布了多項面向Shorts創作者的生成式AI工具,包括定制版Veo 3 Fast視頻生成模型、新的混音工具和AI編輯功能。Veo 3 Fast能以480p分辨率低延遲生成帶聲音的視頻片段,支持圖像動畫化、視頻風格轉換等功能。新的語音轉歌曲混音工具可將對話轉為配樂,AI編輯功能則能將原始素材自動制作成初稿。這些工具將陸續在多個市場推出。
Google Photos現已集成Veo 3人工智能技術,用戶可以免費將相冊中的靜態照片轉換為動畫效果。這項新功能利用先進的AI算法,能夠自動識別照片內容并生成流暢的動畫效果,為用戶的回憶增添生動的視覺體驗。該功能完全免費提供,用戶只需在Google Photos應用中選擇相應照片即可一鍵生成動畫。