隨著大型模型技術(shù)的持續(xù)發(fā)展,視頻生成技術(shù)正逐步走向成熟。以Sora、Gen-3等閉源視頻生成模型為代表的技術(shù),正在重新定義行業(yè)的未來(lái)格局。而近幾個(gè)月,國(guó)產(chǎn)的AI視頻生成模型也是層出不窮,像是快手可靈、字節(jié)即夢(mèng)、智譜清影、Vidu、PixVerse V2 等。就在近日,智譜AI秉承以先進(jìn)技術(shù),服務(wù)全球開發(fā)者的理念,宣布將與清影同源的視頻生成模型——CogVideoX開源,以期讓每一位開發(fā)者、每一家企...
AI視頻生成賽道風(fēng)起云涌,國(guó)內(nèi)外新穎的文生、圖生視頻產(chǎn)品層出不窮。在各大廠商的內(nèi)卷之下,當(dāng)下的視頻生成模型各方面已經(jīng)接近以假亂真的效果。例如,OpenAI 的 Sora 和國(guó)內(nèi)的 Vidu、可靈等模型,通過(guò)利用 Diffusion Transformer 的擴(kuò)展特性,不僅能夠滿足各種分辨率、尺寸和時(shí)長(zhǎng)的預(yù)測(cè)要求,同時(shí)生成的視頻更符合物理世界的表現(xiàn)。但與此同時(shí),大部分視頻生成模型的準(zhǔn)確程度、遵循指令...
在人工智能領(lǐng)域,每一天都可能發(fā)生顛覆性的變革。就在Midjourney剛剛進(jìn)行大更新的第二天,開源圖像生成領(lǐng)域就迎來(lái)了一匹令人矚目的黑馬——FLUX.1。這個(gè)突如其來(lái)的新玩家不僅在性能上聲稱大幅超越了DALL·E3、Midjourney V6等閉源模型,還將開源的SD3系列全線秒殺,瞬間引爆了AI圈。出道即巔峰專找最硬的打,有點(diǎn)喬峰橫掃聚賢莊的意思。原來(lái)剛成立的FLUX.1的創(chuàng)始人是大名鼎鼎的Ro...
在最近的大模型戰(zhàn)爭(zhēng)中,OpenAI似乎很難維持霸主地位。雖然沒(méi)有具體的數(shù)據(jù)統(tǒng)計(jì),但Claude3.5出現(xiàn)后,只是看網(wǎng)友們的反響,就能感覺到OpenAI訂閱用戶的流失:既然Claude3.5比GPT-4o好用,為什么我們不去訂閱Claude呢?而這長(zhǎng)達(dá)數(shù)月的批評(píng)聲中,OpenAI似乎盡顯頹勢(shì),除了GPT-4o mini這個(gè)小模型以外,似乎再也沒(méi)有什么創(chuàng)新點(diǎn)。甚至就在前幾日,GPT-4o還被開源的大模...
這可能會(huì)是AI技術(shù)形態(tài)的一個(gè)轉(zhuǎn)折點(diǎn),大模型的下一個(gè)形態(tài),不再是人和模型一輪一輪的即時(shí)問(wèn)答了。當(dāng)?shù)貢r(shí)間 7 月 29 日,在美國(guó)丹佛舉行的第 51 屆 SIGGRAPH 計(jì)算機(jī)圖形學(xué)會(huì)議上,英偉達(dá)創(chuàng)始人、CEO 黃仁勛與 Meta 創(chuàng)始人、CEO 馬克?扎克伯格進(jìn)行了一場(chǎng)全球矚目的爐邊談話。這場(chǎng)對(duì)話主要圍繞生成式 AI 技術(shù),及其在各種領(lǐng)域上的應(yīng)用展開。會(huì)議中,面向全球領(lǐng)先的機(jī)器人制造商、AI 模型...