• |
  • 極速報價
  • |
  • etnet專輯
    etnet專輯
  • 會員
  • 產品服務 / 串流版
  • 設定

23/02/2024

OpenAI Sora|一句話變60秒影片!OpenAI Sora生成電影級短片,將衝擊數碼娛樂產業,加劇深偽假片泛濫?

  • 加入最愛專欄
  • 收藏文章
  • 方展策

    方展策

    少年時,曾研習 Geographic Information System,可惜學無所成,僥倖畢業。成年後,誤打誤撞進入傳媒圈子,先後在印刷、電子、網絡媒體打滾,略有小成。中年後,修畢資訊科技碩士,眼界漸擴,決意投身初創企業,窺探不同科技領域。近年,積極鑽研數據分析與數碼策略,又涉足 Location Intelligence 開發項目;有時還會抽空執教鞭,既可向他人分享所學,亦可鞭策自己保持終身學習。

    智城物語

  一名身穿黑色皮樓、紅色長裙與黑色皮靴的女子,戴著太陽眼鏡,在掛滿霓虹燈招牌的東京街頭漫步。這段看似平平無奇的短片,甫推出即引起轟動,全因它是由OpenAI新推出的影片生成模型「Sora」產製出來。用戶只需輸入提示詞,它就可以生成包含精細場景、複雜運鏡的1分鐘電影級短片,躍居業界標竿。但如此逼真的AI生成影片效果,卻可能對數碼娛樂產業帶來一定衝擊,甚至加劇深偽假影片的泛濫。

 

影片呈現細膩場景、複雜運鏡手法

 

  目前市場上的影片生成AI模型,頂多只能產製構圖簡單、鏡頭固定的十幾秒短片,例如較多人使用的Runway可以輸出4至18秒影片。OpenAI於2024年2月15日發表全新AI模型「Sora」,可根據用戶輸入的文字提示詞或靜態圖片,生成長達60秒的連貫流暢影片,猶如一石激起千重浪,震撼整個AI業界。

 

OpenAI在官網上架設了Sora專頁,講解該模型的運作原理,並展示40多段由Sora產製的演示影片。(圖片來源:翻攝OpenAI官網)

利用Sora所生成的東京女子街頭漫步短片,輸入AI提示詞為「A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.」

(圖片來源:翻攝OpenAI演示影片)

 

  Sora的厲害之處在於,所輸出的1080p影片呈現出細膩精緻場景、生動角色表情,並加入複雜運鏡手法,產生有動態視角變化的畫面;當拍攝角度變換時,影片人物和事物皆能在立體空間中連貫移動。

 

  即使影片中的人物與事物被擋住或移出畫面,Sora仍能保持這些人與事存在於畫面範圍以外,當拍攝視角轉換到能看到時,就會將這些人與事重新呈現出來,並保持外觀和風格一致。科技網媒《Wired》盛讚,Sora生成的影片非常逼真,這是從未在其他AI模型作品中看過的真實感。

 

Sora生成的模擬航拍影片:一對情侶在櫻花道上行走,航拍機緊隨其後拍攝,視角產生多樣變化,而畫面一直保持著連貫性,影像逼真流暢。(圖片來源:翻攝OpenAI演示影片)

 

生成影像符合現實世界物理定律

 

  OpenAI表示,Sora能夠深入理解人類的語言,不但能準確地呈現提示詞所描述的各種事物,還可知曉這些事物是如何存在於現實世界,並要遵循那些物理規律。輝達(NVIDIA)資深研究科學家Jim Fan以咖啡杯內海盜船大戰的Sora影片為例,指出AI模擬兩艘海盜船在杯內互相追逐和對戰的場景,呈現出符合流體力學原理的咖啡液體流動。因此,他直言Sora是一個以數據驅動的物理引擎,能夠模擬真實或虛擬世界。

 

Sora生成的咖啡杯內海盜船大戰短片,對咖啡液體流動與光影變化處理均十分逼真,完全符合物理規律。(圖片來源:翻攝OpenAI演示影片)

 

  不過OpenAI坦承,Sora尚有不少待改進之處。它無法完全模擬複雜場景裏的物理規律,而且不太理解具體事例的因果關係,例如影片中人物吃了一口餅乾,惟餅乾卻依然完整無缺。再者,它有時會搞混了提示詞所述的空間細節,譬如左右不分,並且難以精確呈現隨著時間變化的事物。

 

降影片製作門檻人人皆可做導演

 

  儘管如此,Sora已大幅降低影片製作的門檻了。就算閣下沒有拍攝器材,又不懂得拍片和剪片技巧,只要用文字寫出你的想法,Sora即可將之轉化成短片,邁向「全民皆可做導演」的黃金年代。市調機構ABI Research高級分析師里斯·海登(Reece Hayden)認為,Sora這種影片生成模型將對數碼娛樂產業造成重大影響。

 

  若說Sora真正威脅到電影製作行業,可能還有一段很長的路要走。因為即使輸入完全相同的提示詞,AI每次生成的影片內容總會有所差異,所以不可能簡單地把120段1分鐘短片拼接起來,就可以合併成一齣劇情和畫面連貫的電影。

 

YouTuber擔憂被Sora完全取代

 

  觀乎Sora可以生成1分鐘短片的能耐,它很有機會成為顛覆社交媒體平台的新工具。近年Instagram Reels、YouTube Shorts、TikTok等短視頻格式相繼冒起,成為年輕網民最喜歡在社交媒體上收看的新類型內容。現在有了Sora,任何人都能用AI技術生成高質短片,這將進一步加快短視頻的普及。海登指出,未來針對不同受眾的客製化短片,將會在不同數碼渠道上廣泛傳播。

 

  然而,這樣卻令不少YouTuber和內容創作者擔憂,自己可能會否被AI完全取代。擁有逾1,800萬名訂戶的科技YouTuber馬克斯·布朗里(Marques Brownlee)表示,看到AI正在做他的工作,讓他感到恐懼,並覺得受到威脅。

 

OpenAI正開發AI影片檢測工具

 

  更嚴重的是,AI愈來愈逼真的影片生成能力,可能會令以深偽(Deepfake)技術製作的假影片變得更多,兼且更難以辨別。有鑑於此,逾400名來自學術界、政界、演藝界的知名人士聯署一封公開信,呼籲加強對深偽製品的監管,包括:要求AI公司預防其工具被用來生成有害的深偽成品、把深偽兒童色情製品全面定為犯罪、以及對任何故意生成或促進散播有害深偽作品的個人判處刑罰。

 

  正因為Sora可能會帶來巨大的潛在風險,所以OpenAI只將該模型定為研究預覽版本,暫未全面開放給公眾使用。除攻擊模擬團隊(Red Team)與有關AI專家外,目前Sora僅提供給少數受邀藝術家、設計師與電影製作人試用。

 

  OpenAI現正積極開發能夠檢驗AI生成影片的工具,並擬在Sora輸出影片中加入C2PA後設資料(Metadata),以便查證影片生成來源和相關資料。同時,Sora也會像圖片生成工具Dall-E般拒絕產製暴力、性或仇恨內容,以及名人相關影像。由此可見,OpenAI應該會在做好防範措施後,始會全面推出Sora服務。

 

 

 《經濟通》所刊的署名及/或不署名文章,相關內容屬作者個人意見,並不代表《經濟通》立場,《經濟通》所扮演的角色是提供一個自由言論平台。

【etnet 30周年】多重慶祝活動一浪接一浪,好禮連環賞! ► 即睇詳情

我要回應

你可能感興趣

版主留言

放大顯示
風水蔣知識
最緊要健康
精選文章
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ