商湯推首個「可控人物」視頻大模型可生成1分鐘短片

2024-07-04 14:54

商湯推首個「可控人物」視頻大模型可生成1分鐘短片

商湯（020）今日（4日）於2024世界人工智能大會（WAIC 2024），推出首個可控人物視頻生成大模型Vimi，並已在官網開放預約，以及會於明日（5日）披露更多有關細節。商湯表示，該模型只需一張任何風格的照片就能生成和目標動作一致的人物類短片，並支持多種驅動方式，通過已有人物影片、動畫、聲音、文字等多種元素進行驅動。

Vimi可穩定生成長達1分鐘的單鏡頭人物類短片

Vimi可穩定生成長達1分鐘的單鏡頭人物類短片

生成自然的光影

生成頭髮的飄動

生成一致的運鏡

生成唱歌互動

生成舞蹈互動

Vimi提供唯美寫真風、奇幻風等多種生成風格

Vimi提供唯美寫真風、奇幻風等多種生成風格

可控制表情及上半身肢體動作

商湯指出，現時市面上相關技術仍存在挑戰，包括無法精準控制人物動作與表情動作、人物外貌與背景效果變幻莫測，以及時長有限等問題；Vimi則不但可實現精準的人物表情控制，還可控制照片中人物上半身的自然肢體動作，並自動生成與人物相符的頭髮、服飾及背景變化。

商湯又指，光影變化方面Vimi也能做到合理生成，讓人物動作和視覺效果流暢自然，更可穩定生成長達1分鐘的單鏡頭人物類短片，畫面效果不會隨時間變化而降低品質或失真。

創作者可自由剪輯及二次創作

現時Vimi將完全向廣大用戶開放使用，用戶只需上傳不同角度的高清人物照片，即可自動生成數字分身和不同風格的寫真短片；而生成的短片人物更能搭配手勢、肢體動作、頭髮等，形成更完整動作，讓創作者進行剪輯和二次創作。

此外，針對喜愛自拍及使用表情包的用戶，Vimi支援聊天、唱歌、舞動等多種娛樂互動場景，並可通過單張圖片驅動生成各種人物表情包。Vimi亦提供唯美寫真風、奇幻風等多種生成風格，讓用戶仿佛穿越不同次元，享受沉浸式視覺體驗。

關鍵字

傳港鐵今年最多加薪6.15% 全體員工額外獲發0.45個月薪獎金

最新回應

關鍵字

相關新聞

商湯日日新為新企業用戶推免費服務贈5000萬Token包

商湯日日新為新企業用戶推免費服務贈5000萬Token包

2024-06-27 17:29:53

商湯傳配股集資最多20.5億 CEO徐立早已預告上市3年蝕逾115億人幣

商湯傳配股集資最多20.5億 CEO徐立早已預告上市3年蝕逾115億人幣

2024-06-20 20:48:43

商湯：中國不缺人才 AI晶片製造商正加快「追落後」

商湯：中國不缺人才 AI晶片製造商正加快「追落後」

2024-05-28 11:32:31

商湯目標明年收支平衡現在不會考慮配股稱「股價太低」

商湯目標明年收支平衡現在不會考慮配股稱「股價太低」

2024-04-29 08:40:25

商湯稱不知悉股價波動原因明起復牌發佈「日日新5.0」後升三成致停牌

商湯稱不知悉股價波動原因明起復牌發佈「日日新5.0」後升三成致停牌

2024-04-24 17:54:42

商湯推「日日新5.0」揚言部份功能已超GPT-4 Turbo

商湯推「日日新5.0」揚言部份功能已超GPT-4 Turbo

2024-04-23 17:32:23

商湯AI數據分析工具辦公小浣熊向港澳用戶開放

商湯AI數據分析工具辦公小浣熊向港澳用戶開放

2024-02-20 16:57:16

You are currently at: 187235123.xyz

Skip This Ads