行業(yè)資訊
文生視頻亮相,人工智能開辟新方向
原標(biāo)題:文生視頻亮相,人工智能開辟新方向
近日,OpenAI在其官網(wǎng)發(fā)布了首個(gè)文生視頻模型——Sora,可生成最長1分鐘的視頻,超過Gen-2、SVD-XT、Pika等主流產(chǎn)品。
為配合中國的龍年春節(jié),Sora生成的一處人們慶賀龍年的場景,大街上擠滿了舞龍燈的人和觀賞者,人山人海。而且,人物的行為舉止各有風(fēng)貌,有舞龍者的輕松和喜悅,有追著舞龍觀看的好奇兒童,還有兩旁和后面摩肩接踵的男女老幼,更有不少人掏出手機(jī)邊跟邊拍……這些場景幾乎就是現(xiàn)實(shí)場景的翻拍。另一段視頻是一位時(shí)尚女性走在雨后的東京街道上,城市的霓虹燈和動畫城市標(biāo)牌街景與其穿著的黑色皮夾克、紅色長裙和黑色靴子互相映照,特寫畫面不只突出了她戴著太陽鏡,涂著猩艷的口紅,更凸顯了她臉上的雀斑和作為歲月印記的皺紋。
OpenAI公布的細(xì)節(jié)表明,Sora不只是根據(jù)文字提示可以生成視頻和圖片,還可以圖生視頻,即用一張圖片的提示生成視頻,準(zhǔn)確地把一張平面圖的內(nèi)容和細(xì)節(jié)轉(zhuǎn)變成動態(tài)視頻,同時(shí)還可以獲取現(xiàn)有視頻并對其進(jìn)行擴(kuò)展或填充缺失的幀,豐富和完善原有視頻。因此,Sora是三棲產(chǎn)品,從這個(gè)意義上看,Sora的創(chuàng)新是里程碑式的。
現(xiàn)在,OpenAI的首席執(zhí)行官奧特曼已經(jīng)在線接單,也有一些視覺藝術(shù)家、設(shè)計(jì)師和電影制作人獲得了Sora訪問權(quán)限。
Sora的出現(xiàn)表明,通用人工智能(AGI)不僅離現(xiàn)實(shí)應(yīng)用更近了一步,而且可以在更多的領(lǐng)域?qū)崿F(xiàn)突破。2023年年底,《自然》雜志的一篇文章預(yù)測2024年的10大科學(xué)進(jìn)展,包括了人工智能和聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器(ChatGPT)的突破,具有代表性的是,GPT-5將會問世,而且可能會比其前身GPT-4展示出更先進(jìn)的功能。還有深度思考(DeepMind)人工智能公司將在2024年發(fā)布人工智能工具阿爾法折疊(AlphaFold)的新版本,將以原子精度模擬蛋白質(zhì)、核酸和其他分子之間的相互作用,將為藥物設(shè)計(jì)和發(fā)現(xiàn)開辟新的可能性。
但是,意想不到的是,AI的創(chuàng)新者們轉(zhuǎn)了一個(gè)方向,推出了文生視頻,而且質(zhì)量上乘。文生視頻的效果逼真意味著,影視、多頻道網(wǎng)絡(luò)(MCN)、動畫、美術(shù)、藝術(shù)等的從業(yè)人員的嚴(yán)冬來臨了,因?yàn)槲纳曨l的速度和效果可以迅速取代影視行業(yè)更多從業(yè)者的工作,創(chuàng)作的內(nèi)容和產(chǎn)品更豐富多彩,產(chǎn)品和產(chǎn)值也會成倍增加。另一方面,行業(yè)的準(zhǔn)入門檻將變得更低,讓演藝行業(yè)更為內(nèi)卷。就連相關(guān)網(wǎng)站,如素材網(wǎng)站也將變得無關(guān)緊要,甚至?xí)P(guān)門大吉。當(dāng)然,文生視頻并不完美,很多畫面也與現(xiàn)實(shí)難以融入和銜接。因此,影視行業(yè)、MCN要使用成熟和逼真的文生視頻還可能有一定時(shí)間。
盡管文生視頻有著廣闊的前景,但是其出現(xiàn)也意味著人工智能對社會的威脅更近了一步。諸如Sora一類的生成式AI產(chǎn)品會讓更多的人認(rèn)為其看到的圖像、音頻和視頻是真實(shí)的,也因而讓偽造和欺騙變得更簡單更易行。例如,許多人工智能生成的與以色列-哈馬斯沖突有關(guān)的“深度偽造”圖像和音頻在網(wǎng)絡(luò)上大行其道,美國一些公眾也接到了“深度偽造”的美國總統(tǒng)拜登的電話,知名歌手泰勒·斯威夫特AI虛假“不雅照”更是在網(wǎng)上瘋傳。
這意味著,每當(dāng)人工智能新產(chǎn)品出現(xiàn),社會的監(jiān)管就多了一分責(zé)任。既要讓研發(fā)公司遵守人工智能的倫理規(guī)范,也需要監(jiān)管技術(shù)的突破。前者,已經(jīng)有聯(lián)合國的《人工智能倫理問題建議書》和各國的人工智能規(guī)則,后者則需要同步的技術(shù)制衡。
一個(gè)最簡單的原則是,如果是人工智能生成的產(chǎn)品,就應(yīng)當(dāng)在向全社會發(fā)布時(shí)注明是AI產(chǎn)品,讓人們知曉這并非現(xiàn)實(shí)和原創(chuàng),而是人工智能的產(chǎn)物。另一方面,在研發(fā)AI產(chǎn)品并發(fā)布時(shí),要求生成式AI研發(fā)人員在模型的輸出中嵌入隱藏信號,從而生成水印,以便識別是人工智能產(chǎn)品還是原創(chuàng)。
這些方式或許能讓人們既享受到人工智能生成產(chǎn)品帶給人們的效率和便捷,另一方面也盡量減少人工智能對人和社會的威脅。(張?zhí)锟?
來源:南方都市報(bào)