Sora震撼科技界 恐顛覆影視業

2024-02-22 00:00

Sora按文字提示生成的短片,可見一名時尚女性在霓虹燈光四射的東京街道行走,穿黑皮外套和連衣紅裙。
Sora按文字提示生成的短片,可見一名時尚女性在霓虹燈光四射的東京街道行走,穿黑皮外套和連衣紅裙。

美國人工智能(AI)公司OpenAI上周四宣布推出由文本轉為影片的生成式AI模型Sora,可讓用戶透過簡單的文字指令立即創造出逼真的影片,隨即震撼中外高科技界,連日引發熱議。Sora可根據文本指令創建近似現實且富有想像力的場景,生成多種風格的高清影片,最長為一分鐘,恐顛覆影視產業。
創造聊天機械人ChatGPT和圖像生成器DALL-E的OpenAI稱,Sora(名字源於日文的天空)使用Transformer架構,可根據文字指令生成逼真影片,還能夠根據靜態圖像生成影片,或對現有影片進行擴展或填充缺失的幀。現時Sora未向公眾開放,僅主要給一些設計師和電影製作人等特定人群試用。但其橫空出世已經在中外互聯網和科技圈掀起熱議。沒有導演、演員的參與,Sora卻能快速生成出高度細緻的影片。有中國網民驚歎,就算失業也無話可說。

OpenAI官網的其中一段示範影片,顯示一名穿深藍色外套和紅色連身裙的女子,走在東京繁華的街道上。除了商店文字有瑕疵外,女人的動作、四周環境都高度逼真,難以找出破綻。

AI在影片生成領域的巨大發展前景,為塑造影視產業新業態打開大門的同時,恐將顛覆現存影視產業。荷里活去年遭遇63年來首次編劇和演員全行業罷工,原因之一便是擔憂該行業的部分工作被AI取代。Sora面世讓這一威脅變得更逼近和真切。 
業界:為深偽技術推波助瀾

雖不是第一間涉足文本轉影片領域的公司,但Sora的推出使OpenAI在這一賽道取得領先。OpenAI稱,Sora對語言有深刻的理解,不僅了解用戶文本提示,還了解所述事物在物理世界中的存在方式。「我們正在教授AI理解和模擬運動中的物理世界,目標是訓練模型幫助人們解決需要與現實世界交互的問題。」 

OpenAI行政總裁奧爾特曼邀請用戶在社交平台X提出指令建議,幾分鐘後在這個平台上張貼頗具說服力的影片生成結果,其中包括兩隻黃金獵犬在山上開串流Podcast、老奶奶在廚房教烹飪、動物在海上騎腳踏車,以及珠光寶氣的動物園等。還有另一段影片顯示「半鴨半龍的生物飛馳在美麗的暮色中,背上騎着一隻身着探險裝備的倉鼠」。

不過,OpenAI警告,「目前的模型存有弱點」,影片中可能包含不合邏輯的圖像,混淆左右等空間細節,難以準確模擬複雜場景的物理原理和因果關係實例等。例如,一個人咬了一口餅乾,餅乾上卻沒有咬痕。不過,隨着模型改進,人們可能會在短期內獲得更加完善的影片生成功能。 

不少業內人士擔心,Sora將為「深偽」技術推波助瀾。加州大學柏克萊分校訊息學院副院長法里德就表示:「當新聞、圖像、音頻、視頻——任何事情都可以偽造時,那麼在那個世界裏,就沒有甚麼是真實的。」針對造假顧慮,OpenAI稱在真正面向公眾推出產品時,將確保生成影片包含來源元數據,並推出檢測視頻真偽的工具。

關鍵字

最新回應

相關新聞

You are currently at: 187235123.xyz
Skip This Ads
close ad
close ad