Sora，是「世界模擬器」還是「工位替代者」？

半個月前，美國人工智能研究公司Open AI發布了一個文生視頻模型Sora，雖然仍只是在內測階段，卻像之前的自動駕駛、ChatGPT一樣，再次引起一片嘩然。

對於一些「吃瓜群眾」來說，這也許只是一個類似那種輸入口令便會給出一個結果的小游戲，但對於業內人士來說，他們卻表現出了明顯的「震驚」——

據說一位好萊塢製片人本已選好地址，准備投資幾千萬搭建攝影棚拍攝一部新的動畫片，一看到Sora的生成效果後，便立刻撤資，決定靜待Sora的下一步發展——既然只需要在一台電腦上輸入幾句關鍵詞就能生成如此逼真、靈動的動態畫面，還要花那麼多錢搭攝影棚干什麼？

接受本報獨家采訪的國內一家獨立創意機構F5的首席創意官、戛納國際創意節評委范耀威也表示：好萊塢的編劇們去年才因為ChatGPT的出現而鬧「大罷工」，反對用AI代替人類編劇的工作，現在或許又該輪到拍攝製作的團隊集體鬧「罷工」了。

他認為，Sora的出現，肯定會給國內外的科技界、廣告界、影視界、新聞界等文化產業與資本市場帶來巨大沖擊，尤其是對創意產業，帶來的將是一場「科學革命」。

文生視頻的突破進展——更高保真且畫面流暢

Sora其實只是OpenAI公司的第一款文生視頻工具，在此之前，文生視頻這件事已經有很多公司推出過初始模型。

比如去年11月份，旗下運營着社交網站臉書的美國Meta公司便發布了視頻生成模型Emu Video；接着，美國人工智能初創公司Stability.ai也發布了開源視頻生成模型Stable Video Diffusion(SVD)。但這些模型均只是通過簡單的文字輸入生成動態圖片。

很快，去年11月18日，旗下有「抖音」「今日頭條」等知名品牌產品的字節跳動公司推出了文生視頻模型PixelDance；阿里公司緊隨其後也上線了Animate Anyone模型；這些模型已開始有了生成更豐富動態性的視頻的能力。

百度發布的文生視頻工具「度加剪輯」，據稱還可以一鍵獲取最新熱點，交由AI生成文案，再一鍵生成視頻。

可以說，去年年底至今年年初是文生視頻AI模型的一個爆發期。

而Sora內測的消息之所以如此震驚各行各業，主要還是它的效果太令人驚艷。它不僅能創作出長達1分鍾的高保真視頻，效果還十分逼真且畫面流暢。難怪Open AI官網公開的Sora研究論文中，甚至自稱Sora是「世界模擬器」。

如果把之前那些模型生成的視頻看成是多個真實圖片的一種「流動性組合」，那麼Sora最驚艷的突破就是它的一致性和連貫性，它真正實現了AI理解和模擬現實世界的雙重能力。

創作更自由——聽得懂「人話」，還能發揮「想象」

仔細看看Sora生成視頻的過程，不難發現，它其實不僅僅是一個視頻製作工具，更像是一個全能的創意夥伴——似乎只要你有想法，它就能將其變為現實。基於它理解現實和模擬現實世界的雙重能力，意味着它不僅聽得懂「人話」，還能發揮「想象」去創作。

你可以給它一段具體的文字去形容一個現實場景讓它來生成，也可以給它一張圖片，讓它根據圖片去創造相應場景再生成一段視頻。它能夠根據所掌握的大數據為你提供一些視頻瞬間的細節變化，也能夠向前或向後去類推相應的場景，將你提供的這段想象空間進行延伸、擴展——這大大擴展了你創作的可能性，同時也極大地提高了工作效率。

由此可見，Sora應該已經有能力重塑我們對「智能助手」的認知，並不僅僅是回答「明天天氣怎樣」這種簡單的問題。

我們不妨想象一下Sora會帶來哪些科學變革或行業變革。無論你想用Sora做些什麼，它都註定要為我們的生活掀起一場「革命」。至少，短視頻的製作會變得更加簡單，有了更多的可能。

據說目前在國內，已經有電商服務機構向帶貨主播推出「AI根據熱梗自動撰寫視頻腳本」的服務。

還有一些微短劇的製作，不僅細節逼真，而且自帶特效，在內容方面都能有不錯的創意提供，甚至是科幻題材也不在話下。而且，無需支付演員片酬，也省下了拍攝場景搭建支出等，這些優點在提高成品效率的同時也大大降低了成本。

警惕用Sora兜售焦慮——它仍需「右腦人」提供創意

不論如何，Sora何時結束內測，面向大眾公開，仍然是科技行業內關注的焦點。其他公司的視頻生成模型也都在突飛猛進。像AI繪畫、自動駕駛的出現一樣，Sora也不可避免地帶來「工位被替代」的焦慮。

事實上，Sora已經讓國內創意產業圈產生了不小的動盪。圈內人之前還在熱烈討論：AI繪畫大行其道後，創意產業到底是「科學」還是「藝術」？現在則已升級為「創意從業者何去何從」。

還有一些人則是純粹在利用Sora「兜售焦慮」。比如他們會把這些新潮的科技產品放在你面前不停地秀，然後說：「看看，這些高科技產品你再不會用就是落伍了！」然後開始兜售各種學習課程，或者直接拿出一些可能並不成熟的所謂「AIGC（文生內容）頂級產品」，讓你覺得可以用這些簡單的方式以逸待勞地跟上科技的腳步。

對此，站在創意產業前沿的范耀威接受采訪時說，真正需要用到這些模型去生成視頻的，主要還是從事電影行業和生產視頻內容的專業人士，普通人似乎並沒有必要去為此而焦慮。大眾可以去了解一下基本信息，用部分公開使用的簡單的文生視頻、圖生視頻工具體驗一下，但並不一定要立刻去掌握這些技術。

至於AI如此高速度發展，最後是否會取代了人類的工作能力，范耀威則說，美國的未來學家丹尼爾·平克曾認為未來社會看重六種能力：故事力、設計感、整合力、共情力、娛樂感、意義感。縱觀這六樣，其實都是人類右腦的擅長項，擁有這些能力的我們稱之為「右腦人」。

目前來看，Sora模型可以通過人類提供的一段文本去生成長達一分鍾的視頻，視頻甚至可以呈現出多角色、特定類型的運動、精確的主題和復雜的背景細節等，但它顯然仍需要右腦發達（即創意十足、想象力爆棚、能講好故事、寫好文本）的「右腦人」來提供創意文本。

他提到，真正好的技術或產品是用來解決問題的，而不是製造問題。所以，在Sora正式開放之前，我們完全可以保持一份從容和理性——功利主義哲學家彼得·辛格認為，行動的正確性取決於它們是否有助於最大化幸福或快樂、最小化痛苦。他強調，科技開發者們在考慮行動後果時，也應該考慮所有受影響個體的利益。

其實，Sora與目前很多尚不完善的高新科技產品一樣，仍存在很多問題有待人類去解決。

比如視頻中常常會出現違背常理的畫面，像蝴蝶在海水裡飛、男主角的襯衫與皮膚一般「貼身」、女主角多出了一隻手或手和身體不在同一個空間維度，還有飛馳在沙土地上的汽車只有後輪會出現沙塵，前輪卻沒有一點沙塵揚起，諸如此類的問題仍沒有得到適當的解決。因此還有人提出，如果讓AI繼續「打造世界」，我們最需要的能力或許不是學習，而是分辨真偽。

在等待Sora真正亮相的前夜，我們其實更應該保持批判性思維方式，也要保持好奇心與包容心。遲早你會發現，Sora不過是科技發展中的一小步，科技的發展，每一次都像是一段冒險旅程。

（部分資料參考：OpenAI官網、果殼網、澎湃新聞、文案與美術公眾號）

文 | 陳曉楠

Sora，是「世界模擬器」還是「工位替代者」？

相关推荐

中新電競對話Suk：不相信自己是最強選手，憑什麼拿冠軍？

官方出乎意料地恢復了《瓦羅蘭特》微風島嶼地圖重做的大改動

已經退役的LPL職業選手中，誰是你心中的意難平？

減少了沉默時間，亞瑟絕活哥不太適應，策劃表示強度爆炸

蛋仔派對：我懷疑，羊蜜是故意跳舞，給浪哥看的！