日本韩国亚洲欧美在线-亚洲久悠悠色悠在线播放-最好看的中文字幕国语2019-四虎永久在线观看免费网站网址-青青草原精品国产亚洲AV-台湾佬电影网-久久精品国产AV一区二区三区-野战CHINESEVIDEO

行業(yè)門戶
NEWS CENTRE
首頁
>
新聞中心
>
這是AI生成的!
這是AI生成的!
2024-02-17 閱讀:553

重磅!OpenAI首個視頻生成模型發(fā)布,1分鐘流暢高清,效果炸裂

據(jù)OpenAI官網(wǎng),OpenAI首個視頻生成模型Sora發(fā)布,完美繼承DALL·E3的畫質(zhì)和遵循指令能力,能生成長達(dá)1分鐘的高清視頻。

AI想象中的龍年春節(jié),紅旗招展人山人海。

有緊跟舞龍隊伍抬頭好奇觀望的兒童,還有不少人掏出手機(jī)邊跟邊拍,海量人物角色各有各的行為。

一位時髦女士漫步在東京街頭,周圍是溫暖閃爍的霓虹燈和動感的城市標(biāo)志。

一名年約三十的宇航員戴著紅色針織摩托頭盔展開冒險之旅,電影預(yù)告片呈現(xiàn)其穿梭于藍(lán)天白云與鹽湖沙漠之間的精彩瞬間,獨特的電影風(fēng)格、采用35毫米膠片拍攝,色彩鮮艷。

豎屏超近景視角下,這只蜥蜴細(xì)節(jié)拉滿:

OpenAI表示,公司正在教授人工智能理解和模擬運(yùn)動中的物理世界,目標(biāo)是訓(xùn)練出能夠幫助人們解決需要與現(xiàn)實世界互動的問題的模型。在此,隆重推出文本到視頻模型——Sora。Sora可以生成長達(dá)一分鐘的視頻,同時保證視覺質(zhì)量和符合用戶提示的要求。

如今,Sora正面向部分成員開放,以評估關(guān)鍵領(lǐng)域的潛在危害或風(fēng)險。同時,OpenAI也邀請了一批視覺藝術(shù)家、設(shè)計師和電影制作人加入,期望獲得寶貴反饋,以推動模型進(jìn)步,更好地助力創(chuàng)意工作者。OpenAI提前分享研究進(jìn)展,旨在與OpenAI以外的人士合作并獲取反饋,讓公眾了解即將到來的AI技術(shù)新篇章。

Sora模型能夠生成包含多個角色、特定類型運(yùn)動和主體及背景精確細(xì)節(jié)的復(fù)雜場景。該模型不僅能理解用戶在提示中所要求的內(nèi)容,還能理解這些事物在現(xiàn)實世界中的存在方式。該模型對語言有深刻理解,能準(zhǔn)確解讀提示,并生成表達(dá)豐富情感的引人入勝的角色。Sora還能在單個生成的視頻中創(chuàng)建多個鏡頭,使角色和視覺風(fēng)格保持準(zhǔn)確一致。

比如一大群紙飛機(jī)在樹林中飛過,Sora知道碰撞后會發(fā)生什么,并表現(xiàn)其中的光影變化。

一群紙飛機(jī)在茂密的叢林中翩翩起舞,在樹林中穿梭,就像候鳥一樣。

Sora還可以在單個視頻中創(chuàng)建多個鏡頭,并依靠對語言的深入理解準(zhǔn)確地解釋提示詞,保留角色和視覺風(fēng)格。

對于Sora當(dāng)前存在的弱點,OpenAI也不避諱,模型在準(zhǔn)確模擬復(fù)雜場景的物理特性方面可能會遇到困難,也可能無法理解具體的因果關(guān)系實例。例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,狼的數(shù)量會變化,一些憑空出現(xiàn)或消失。

此外,模型還可能會混淆提示的空間細(xì)節(jié),例如左右不分,并且在處理隨時間發(fā)生事件的精確描述方面也可能存在困難,比如跟蹤特定的攝像機(jī)軌跡。

如提示詞“籃球穿過籃筐然后爆炸”中,籃球沒有正確被籃筐阻擋。

技術(shù)方面,目前OpenAI透露的不多,簡單介紹如下:

Sora是一種擴(kuò)散模型,從噪聲開始,能夠一次生成整個視頻或擴(kuò)展視頻的長度,

關(guān)鍵之處在于一次生成多幀的預(yù)測,確保畫面主體即使暫時離開視野也能保持不變。

與GPT模型類似,Sora使用了Transformer架構(gòu),有很強(qiáng)的擴(kuò)展性。

在數(shù)據(jù)方面,OpenAI將視頻和圖像表示為patch,類似于GPT中的token。

通過這種統(tǒng)一的數(shù)據(jù)表示方式,可以在比以前更廣泛的視覺數(shù)據(jù)上訓(xùn)練模型,涵蓋不同的持續(xù)時間、分辨率和縱橫比。

Sora建立在過去對DALL·E和GPT模型的研究之上。它使用DALL·E3的重述提示詞技術(shù),為視覺訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)注,因此能夠更忠實地遵循用戶的文本指令。

除了能夠僅根據(jù)文本指令生成視頻之外,該模型還能夠獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻,準(zhǔn)確地讓圖像內(nèi)容動起來并關(guān)注小細(xì)節(jié)。

該模型還可以獲取現(xiàn)有視頻并對其進(jìn)行擴(kuò)展或填充缺失的幀。

Sora是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ),OpenAI相信這一功能將成為實現(xiàn)AGI的重要里程碑。

來源:環(huán)球時報

    13560189272
    地址:廣州市天河區(qū)黃埔大道西201號金澤大廈808室
    COPYRIFHT ? 2010-2020 廣州市名聯(lián)網(wǎng)絡(luò)科技有限公司 ALL RIGHTS RESERVED 粵ICP備10203057號
    • 這里是二維碼
    最新va在线播放| 小黄片一区二区三区四区| 最近中文字幕2019视频1| 日韩av被操| 久久久久青| 国产91资源在线| 久久综合55| 视频1区2区| 丁香花五月天激情| 五月婷婷激情四季| 色五月丁香激情| 99性爱视频网站| 深爱五月天| 国产大片线上免费观看| 富二代官网免费看| 国产全是老熟女太爽了| 国产婷婷色综合AV蜜臀AV | 老熟女乱伦老熟女乱伦| 黄色片成人| 久久涩视频| 日韩黄色网络| 99久久99视频只有精品| 激情视频91| 五月色情婷婷| 丁香五月之久操视频| 亚洲精品久久久久久久久久飞鱼| 免费观看2018www黄色操逼网站| 东北婷婷五月天| 看欧美一级黄片,c0m三| 久久丁香五月|