Copyright 2018-2025 汽車星 版權(quán)所有 京ICP備2019162790號(hào)
2月16日,OpenAI發(fā)布首款文生視頻大模型Sora,可以快速生成60秒、準(zhǔn)確反映用戶提示的視頻,其具有60秒超長長度、多角度視頻一致性、對(duì)物理世界理解等特性。
Sora可生成60秒超長視頻。相較于Runway MLGen-2、Pika等文生視頻大模型,Sora可以生成60秒一鏡到底的視頻,視頻邏輯順暢、主人物及背景的行人均非常穩(wěn)定,文生視頻大模型能力進(jìn)一步提升。
不過Sora模型還是存在一些問題,許多人認(rèn)為,雖然Sora在視頻畫質(zhì)、細(xì)節(jié)、光影和色彩等方面表現(xiàn)出色,但在涉及鏡頭運(yùn)動(dòng)角度和更精細(xì)內(nèi)容調(diào)控方面仍存在不足。在Sora視頻內(nèi)容中,如一分鐘的東京街頭女郎漫步場(chǎng)景中,女郎走路過程中存在腿部變形、腿部交叉換位時(shí)錯(cuò)亂等錯(cuò)誤。針對(duì)目前Sora存在的不成熟之處,OpenAI方面表示承認(rèn)并正在積極改進(jìn)。
當(dāng)?shù)貢r(shí)間周日晚間,特斯拉CEO馬斯克在X平臺(tái)上發(fā)帖稱,特斯拉的視頻生成技術(shù)是世界上最好的,甚至超過OpenAI的Sora。此前一天馬斯克暗示,特斯拉早在一年前就掌握了類似OpenAI的視頻生成技術(shù)。