Sora,是「世界模擬器」還是「工位替代者」?

半個月前,美國人工智能研究公司Open AI發布了一個文生視頻模型Sora,雖然仍只是在內測階段,卻像之前的自動駕駛、ChatGPT一樣,再次引起一片嘩然。

Sora,是「世界模擬器」還是「工位替代者」?

半個月前,美國人工智能研究公司Open AI發布了一個文生視頻模型Sora,雖然仍只是在內測階段,卻像之前的自動駕駛、ChatGPT一樣,再次引起一片嘩然。

對於一些「吃瓜群眾」來說,這也許只是一個類似那種輸入口令便會給出一個結果的小游戲,但對於業內人士來說,他們卻表現出了明顯的「震驚」——

據說一位好萊塢製片人本已選好地址,准備投資幾千萬搭建攝影棚拍攝一部新的動畫片,一看到Sora的生成效果後,便立刻撤資,決定靜待Sora的下一步發展——既然只需要在一台電腦上輸入幾句關鍵詞就能生成如此逼真、靈動的動態畫面,還要花那麼多錢搭攝影棚干什麼?

接受本報獨家采訪的國內一家獨立創意機構F5的首席創意官、戛納國際創意節評委范耀威也表示:好萊塢的編劇們去年才因為ChatGPT的出現而鬧「大罷工」,反對用AI代替人類編劇的工作,現在或許又該輪到拍攝製作的團隊集體鬧「罷工」了。

他認為,Sora的出現,肯定會給國內外的科技界、廣告界、影視界、新聞界等文化產業與資本市場帶來巨大沖擊,尤其是對創意產業,帶來的將是一場「科學革命」。

Sora,是「世界模擬器」還是「工位替代者」?

文生視頻的突破進展——更高保真且畫面流暢

Sora其實只是OpenAI公司的第一款文生視頻工具,在此之前,文生視頻這件事已經有很多公司推出過初始模型。

比如去年11月份,旗下運營着社交網站臉書的美國Meta公司便發布了視頻生成模型Emu Video;接着,美國人工智能初創公司Stability.ai也發布了開源視頻生成模型Stable Video Diffusion(SVD)。但這些模型均只是通過簡單的文字輸入生成動態圖片。

很快,去年11月18日,旗下有「抖音」「今日頭條」等知名品牌產品的字節跳動公司推出了文生視頻模型PixelDance;阿里公司緊隨其後也上線了Animate Anyone模型;這些模型已開始有了生成更豐富動態性的視頻的能力。

百度發布的文生視頻工具「度加剪輯」,據稱還可以一鍵獲取最新熱點,交由AI生成文案,再一鍵生成視頻。

可以說,去年年底至今年年初是文生視頻AI模型的一個爆發期。

而Sora內測的消息之所以如此震驚各行各業,主要還是它的效果太令人驚艷。它不僅能創作出長達1分鍾的高保真視頻,效果還十分逼真且畫面流暢。難怪Open AI官網公開的Sora研究論文中,甚至自稱Sora是「世界模擬器」。

如果把之前那些模型生成的視頻看成是多個真實圖片的一種「流動性組合」,那麼Sora最驚艷的突破就是它的一致性和連貫性,它真正實現了AI理解和模擬現實世界的雙重能力。

創作更自由——聽得懂「人話」,還能發揮「想象」

仔細看看Sora生成視頻的過程,不難發現,它其實不僅僅是一個視頻製作工具,更像是一個全能的創意夥伴——似乎只要你有想法,它就能將其變為現實。基於它理解現實和模擬現實世界的雙重能力,意味着它不僅聽得懂「人話」,還能發揮「想象」去創作。

你可以給它一段具體的文字去形容一個現實場景讓它來生成,也可以給它一張圖片,讓它根據圖片去創造相應場景再生成一段視頻。它能夠根據所掌握的大數據為你提供一些視頻瞬間的細節變化,也能夠向前或向後去類推相應的場景,將你提供的這段想象空間進行延伸、擴展——這大大擴展了你創作的可能性,同時也極大地提高了工作效率。

Sora,是「世界模擬器」還是「工位替代者」?

由此可見,Sora應該已經有能力重塑我們對「智能助手」的認知,並不僅僅是回答「明天天氣怎樣」這種簡單的問題。

我們不妨想象一下Sora會帶來哪些科學變革或行業變革。無論你想用Sora做些什麼,它都註定要為我們的生活掀起一場「革命」。至少,短視頻的製作會變得更加簡單,有了更多的可能。

據說目前在國內,已經有電商服務機構向帶貨主播推出「AI根據熱梗自動撰寫視頻腳本」的服務。

還有一些微短劇的製作,不僅細節逼真,而且自帶特效,在內容方面都能有不錯的創意提供,甚至是科幻題材也不在話下。而且,無需支付演員片酬,也省下了拍攝場景搭建支出等,這些優點在提高成品效率的同時也大大降低了成本。

警惕用Sora兜售焦慮——它仍需「右腦人」提供創意

不論如何,Sora何時結束內測,面向大眾公開,仍然是科技行業內關注的焦點。其他公司的視頻生成模型也都在突飛猛進。像AI繪畫、自動駕駛的出現一樣,Sora也不可避免地帶來「工位被替代」的焦慮。

事實上,Sora已經讓國內創意產業圈產生了不小的動盪。圈內人之前還在熱烈討論:AI繪畫大行其道後,創意產業到底是「科學」還是「藝術」?現在則已升級為「創意從業者何去何從」。

還有一些人則是純粹在利用Sora「兜售焦慮」。比如他們會把這些新潮的科技產品放在你面前不停地秀,然後說:「看看,這些高科技產品你再不會用就是落伍了!」然後開始兜售各種學習課程,或者直接拿出一些可能並不成熟的所謂「AIGC(文生內容)頂級產品」,讓你覺得可以用這些簡單的方式以逸待勞地跟上科技的腳步。

對此,站在創意產業前沿的范耀威接受采訪時說,真正需要用到這些模型去生成視頻的,主要還是從事電影行業和生產視頻內容的專業人士,普通人似乎並沒有必要去為此而焦慮。大眾可以去了解一下基本信息,用部分公開使用的簡單的文生視頻、圖生視頻工具體驗一下,但並不一定要立刻去掌握這些技術。

至於AI如此高速度發展,最後是否會取代了人類的工作能力,范耀威則說,美國的未來學家丹尼爾·平克曾認為未來社會看重六種能力:故事力、設計感、整合力、共情力、娛樂感、意義感。縱觀這六樣,其實都是人類右腦的擅長項,擁有這些能力的我們稱之為「右腦人」。

目前來看,Sora模型可以通過人類提供的一段文本去生成長達一分鍾的視頻,視頻甚至可以呈現出多角色、特定類型的運動、精確的主題和復雜的背景細節等,但它顯然仍需要右腦發達(即創意十足、想象力爆棚、能講好故事、寫好文本)的「右腦人」來提供創意文本。

他提到,真正好的技術或產品是用來解決問題的,而不是製造問題。所以,在Sora正式開放之前,我們完全可以保持一份從容和理性——功利主義哲學家彼得·辛格認為,行動的正確性取決於它們是否有助於最大化幸福或快樂、最小化痛苦。他強調,科技開發者們在考慮行動後果時,也應該考慮所有受影響個體的利益。

其實,Sora與目前很多尚不完善的高新科技產品一樣,仍存在很多問題有待人類去解決。

比如視頻中常常會出現違背常理的畫面,像蝴蝶在海水裡飛、男主角的襯衫與皮膚一般「貼身」、女主角多出了一隻手或手和身體不在同一個空間維度,還有飛馳在沙土地上的汽車只有後輪會出現沙塵,前輪卻沒有一點沙塵揚起,諸如此類的問題仍沒有得到適當的解決。因此還有人提出,如果讓AI繼續「打造世界」,我們最需要的能力或許不是學習,而是分辨真偽。

Sora,是「世界模擬器」還是「工位替代者」?

在等待Sora真正亮相的前夜,我們其實更應該保持批判性思維方式,也要保持好奇心與包容心。遲早你會發現,Sora不過是科技發展中的一小步,科技的發展,每一次都像是一段冒險旅程。

(部分資料參考:OpenAI官網、果殼網澎湃新聞、文案與美術公眾號)

Sora,是「世界模擬器」還是「工位替代者」?

文 | 陳曉楠

搜虎頭條, 发布者:搜虎頭條,轉載請註明出處:https://www.sohunews.net/youxi/243415.html

讚! (0)
Previous 2024年3月14日 上午3:18
Next 2024年3月14日 上午3:19

相关推荐