谷歌推出升級版圖像生成模型Nano Banana Pro,基于最新Gemini 3語言模型構建。新模型支持更高分辨率(2K/4K)、準確文本渲染、網絡搜索功能,并提供專業級圖像控制能力,包括攝像角度、場景光照、景深等。雖然質量更高但成本也相應增加,1080p圖像費用為0.139美元。模型已集成到Gemini應用、NotebookLM等多個谷歌AI工具中,并通過API向開發者開放。
瑞士蘇黎世大學古代史教授Felix K. Maier與計算語言學家Phillip Strobel合作開發了名為"Re-Experiencing History"的AI圖像生成器。該平臺通過近300張精心策劃的學術圖像和70篇研究文獻訓練,能夠生成歷史上合理的古羅馬和希臘場景。系統可為教育工作者、研究人員和博物館提供可視化歷史假設,促進對歷史的深度理解。
Canva宣布收購生成式AI內容創作初創公司Leonardo.ai,交易條款未披露,但采用現金加股票的混合方式。Leonardo.ai的120名員工將全部加入Canva。Leonardo.ai成立于2022年,擁有1900萬注冊用戶,其工具已創建超過10億張圖像。該公司將繼續獨立運營,專注于快速創新和研發。此次收購旨在幫助Canva擴展其Magic Studio生成式AI套件功能。
中國生數科技旗下AI產品Vidu發布新版本更新,推出"參考圖像生成"功能,用戶可上傳最多7張參考圖片,通過AI模型的語義理解技術將多張圖像合成為高度一致的新圖像。該功能支持快速編輯照片、替換物體、調整光照等操作,為攝影師、營銷人員提供便捷的AI圖像編輯工具,在保持視覺一致性方面與谷歌等競品形成競爭。
谷歌發布Gemini 2.5 Flash Image升級版,支持語音和文本提示生成圖像,可替換照片中的人物、更改服裝或合并真實圖像與新背景。該工具目前僅在Gemini移動應用中提供。測試顯示其處理速度極快,能在幾秒內完成復雜的圖像編輯任務,包括自動補全缺失的身體部位和衣物細節。谷歌集成了SynthID水印技術識別AI生成圖像,并設置了內容安全防護措施。
Adobe 正在為 Photoshop 內置 AI 助手,簡化多步操作流程,同時升級 Firefly 應用,整合圖像、視頻、音頻及矢量生成工具,并引入第三方模型,加強創意設計的效率與精準度。
OpenAI 宣布 ChatGPT 的圖像生成功能現已向所有免費用戶開放。該功能近期因用戶大量生成吉卜力風格圖像而備受關注,導致服務器負載激增。免費用戶每天可生成 3 張圖像,付費用戶則無限制。此舉加劇了 AI 技術公司間的競爭,也引發了對 AI 圖像生成技術影響的討論。
ChatGPT的新圖像生成器現已免費向所有人開放,備受歡迎。本文介紹了5種利用ChatGPT新功能在圖像中生成文字的提示方法,包括社交媒體宣傳、復古打字機效果、定制T恤、書籍封面和個性化賀卡。這些方法可以幫助用戶創建包含精美文字的高質量圖像,適用于商業或個人用途。
OpenAI 推出的 4o 圖像生成器引發了一場 AI 動畫熱潮。這一發展不僅展示了 AI 輔助視覺創作的能力和局限性,還引發了版權問題的討論。與之前主要聚焦于藝術詮釋和風格轉換的 Dall.E 模型不同,4o 圖像生成器似乎旨在解決特定的專業痛點,尤其是在文本渲染和多圖像一致性方面。隨著各大 AI 平臺開發出各自的專長,這一領域變得日益擁擠,同時也揭示了生成式 AI 的進展和持續挑戰。
OpenAI 本周為 ChatGPT 添加了 AI 圖像生成功能,用戶可直接在對話中創建圖像。由于使用量激增,CEO Sam Altman 表示公司的 GPU "正在融化",不得不臨時限制使用頻率。新功能支持工作相關圖像創建,如信息圖表等,但在圖像編輯精確度等方面仍存在限制。值得注意的是,大量用戶正在使用該功能創作吉卜力動畫風格的圖像。
ChatGPT 新推出的 AI 圖像生成器在社交媒體上掀起熱潮,大量用戶生成吉卜力風格的圖像引發關注。這一現象凸顯了 AI 模型訓練過程中的版權問題:如果這些公司使用受版權保護的作品進行訓練,是否構成侵權?目前這個問題仍處于法律灰色地帶,需要等待法院的進一步裁決。
來自加州帕洛阿爾托的 AI 初創公司 Reve AI 正式發布了 Reve Image 1.0 文本生成圖像模型。該模型在提示詞遵循度、美學效果和文字渲染方面表現出色,目前可在 preview.reve.art 免費體驗。作為該公司的首個產品,Reve Image 憑借其卓越的性能已躍居第三方基準測試榜首,超越了包括 Midjourney v6.1 和 Google Imagen 3 在內的多個競品。
OpenAI CEO Sam Altman 宣布 ChatGPT 的圖像生成能力獲得一年來首次重大升級。通過 GPT-4o 模型,ChatGPT 現可原生創建和修改圖像。該功能目前已向 Pro 訂閱用戶開放,并將陸續向 Plus 和免費用戶推出。新功能不僅可生成更精確和詳細的圖像,還支持編輯現有圖片,包括人物圖像的轉換和細節修改。
Google 最新版 Gemini 2.0 Flash AI 模型展現出令人擔憂的能力,包括精準移除圖片水印。這款輕量級本地 AI 模型不僅可以根據文字提示生成圖片,還能進行對話式圖像編輯。它在移除復雜水印方面表現出色,甚至可以添加真實人物圖像。雖然目前僅向開發者開放,但其缺乏防護措施的特性引發了廣泛關注。
Canva最新推出的Dream Lab是一款AI驅動的文本到圖像生成器,能夠快速創建數字情緒板。它集成在Canva生態系統中,為創意人員、小企業主和藝術愛好者提供了便捷的設計工具。Dream Lab可以根據文字描述生成圖像,并輕松組合成情緒板,激發創意靈感。
Napkin AI 是一家創新的 AI 圖形設計公司,通過模擬傳統設計機構的不同崗位職能,利用 AI 代理快速生成高質量的定制圖形。該產品自推出以來獲得了 200 萬用戶,受到專業人士的歡迎。Napkin AI 獨特的代理驅動方法和對用戶需求的專注,使其在垂直 AI 應用領域脫穎而出。
中國字節跳動推出的悟空AI模型,憑借先進的圖像和視頻生成能力,對OpenAI和美國等試圖控制AI技術的政府構成了新的挑戰。這一開源模型降低了企業創造價值的門檻,但也帶來了深度偽造等風險。要把握AI帶來的機遇,企業領導者必須優先提升AI素養,重視AI的實際應用和整合。