摘要:不僅如此,與它同臺(tái)競(jìng)技的,還都是世界級(jí)選手等等。為此,智源研究院在年月便推出了智源學(xué)者計(jì)劃。同時(shí),智源研究院重視重大科研任務(wù)的沿途下蛋,截至年月,其已經(jīng)申請(qǐng)中國(guó)專利件,獲得發(fā)明專利授權(quán)件,登記軟件著作權(quán)項(xiàng)。
一家AI研究院的“打開方式”,是這樣的;
國(guó)際頂會(huì)發(fā)表文章1470多篇
8個(gè)月打造全球最大的超大規(guī)模智能模型“悟道”
年年都有圖靈獎(jiǎng)得主前來(lái)參會(huì)
匯聚世界級(jí)AI科學(xué)家94人,人才團(tuán)隊(duì)近260人
……
或許你會(huì)說,這就是一個(gè)研究院該有的樣子。
但如果我說它僅僅成立了3年呢?
而且就拿打造大模型這事來(lái)說,放眼國(guó)內(nèi)外,它還是全球唯一不是背靠大廠的那種民辦非企業(yè)機(jī)構(gòu)。
不僅如此,與它同臺(tái)競(jìng)技的,還都是“世界級(jí)選手”——DeepMind、OpenAI等等。
即便是在這種高手林立的大模型賽道上,這家研究院還做到了實(shí)力上的碾壓,更是引發(fā)了國(guó)內(nèi)外科研圈、媒體的關(guān)注。
甚至吳恩達(dá)對(duì)此評(píng)價(jià)道:
悟道的發(fā)布改變了科研模式。
至此,圍繞這家如此年輕卻又“戰(zhàn)績(jī)斐然”的研究院,便產(chǎn)生了不少的疑問:
它是誰(shuí)?
又是怎么做到的?
這家研究機(jī)構(gòu),名叫北京智源人工智能研究院?(簡(jiǎn)稱智源研究院)。
或許它現(xiàn)在的名氣倒是不小,但講真,若是放到三年前提起這個(gè)名字,很多人都是不知道的。
關(guān)于智源研究院的成立,其實(shí)是由一場(chǎng)2018年的會(huì)議開始。
當(dāng)時(shí),原微軟亞太研發(fā)集團(tuán)首席技術(shù)官張宏江博士、原國(guó)家自然科學(xué)基金委員會(huì)主任楊衛(wèi)院士、清華大學(xué)藥學(xué)院魯白教授,他們?nèi)藸款^并組織了這場(chǎng)會(huì)議。
而且可以說是“振臂一呼”,當(dāng)時(shí)在北京AI圈里“有頭有臉”的人物都來(lái)了:
像孫茂松、陳云霽、王海峰、周博文、馬維英等等,都是當(dāng)時(shí)乃至現(xiàn)在AI圈里的“名人”。
參會(huì)的專家可以說是橫跨的產(chǎn)業(yè)、高校以及研究機(jī)構(gòu)。
這些人聚在一起,要商討的一個(gè)問題便是:
如何在人工智能基礎(chǔ)設(shè)施建設(shè)、科研組織模式、數(shù)據(jù)開放、場(chǎng)景開放、人才培養(yǎng)、國(guó)際合作等方面,推動(dòng)北京人工智能創(chuàng)新工作的發(fā)展。
在經(jīng)過長(zhǎng)達(dá)數(shù)小時(shí)的激烈討論,他們達(dá)成了以下的六項(xiàng)建議:
建設(shè)“北京智源”等人工智能軟硬件計(jì)算平臺(tái)
建立“產(chǎn)學(xué)研用”聯(lián)合創(chuàng)新的人工智能基礎(chǔ)研究模式
積極推動(dòng)政府?dāng)?shù)據(jù)和企業(yè)數(shù)據(jù)開放共享
開放人工智能應(yīng)用場(chǎng)景和加大基礎(chǔ)保障
加大人才培養(yǎng)、引進(jìn)和完善保障措施
加大國(guó)際交流力度
而要實(shí)現(xiàn)上述的目標(biāo),就需要一個(gè)“載體”來(lái)統(tǒng)籌規(guī)劃。
于是,他們一致決定成立北京人工智能領(lǐng)域的新型研發(fā)機(jī)構(gòu)——北京智源人工智能研究院。
但也正如一般創(chuàng)業(yè)公司那般,智源研究在成立之初可以說是舉步維艱:一間辦公、幾個(gè)人,就這樣開始了新一段人工智能的征程。
但在智源研究院成立之初,雖說艱難,但它還是立下了這樣一個(gè)flag:
十年內(nèi),成為國(guó)際排名前三的著名人工智能研究機(jī)構(gòu),取得三項(xiàng)以上具有重大國(guó)際影響或重大產(chǎn)業(yè)價(jià)值的科研成果。
支撐北京在2028年率先成為國(guó)際領(lǐng)先的人工智能創(chuàng)新中心,位列國(guó)際人工智能城市綜合創(chuàng)新排名全球前三。
為此,一個(gè)名叫“頂天”和“立地”的科研布局圖,就此誕生。
從布局圖中不難看出,主要分為了“學(xué)術(shù)自由探索”和“目標(biāo)導(dǎo)向的重大科研任務(wù)”兩大方向。
結(jié)合科研布局的名稱來(lái)看,可以推測(cè)出,就是不僅要在最前沿技術(shù)上做研究,還要讓研究能夠真真切切的用起來(lái)。
而要完成這些個(gè)目標(biāo),人才,成為了首要解決的問題。
為此,智源研究院在2019年4月便推出了“智源學(xué)者計(jì)劃”。
三年時(shí)間來(lái),已遴選智源學(xué)者94人,其中38歲以下的青年科學(xué)家就有40位。
主要涉及的研究方向包括人工智能的數(shù)理基礎(chǔ)、人工智能的認(rèn)知神經(jīng)基礎(chǔ)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、智能信息檢索與挖掘、智能系統(tǒng)架構(gòu)與芯片等。
“智囊團(tuán)”組建完畢,智源研究院鎖定了三大人工智能的可行路徑——“信息、生命和物理”,前后分別研發(fā)了超大規(guī)模模型。
例如在信息方面,智源研究院發(fā)布了以中國(guó)首個(gè)、全球最大的超大規(guī)模預(yù)訓(xùn)練模型“悟道”為核心的大規(guī)模預(yù)訓(xùn)練模型系列——“悟道2.0”。
悟道”模型的參數(shù)規(guī)模達(dá)到1.75萬(wàn)億,是GPT-3的10倍,打破了之前由Google Switch Transformer預(yù)訓(xùn)練模型創(chuàng)造的1.6萬(wàn)億參數(shù)記錄。
同時(shí),它還是首個(gè)在100%國(guó)產(chǎn)超算上訓(xùn)練的萬(wàn)億模型,“悟道2.0”系列模型在國(guó)際公認(rèn)benchmark取得9項(xiàng)精準(zhǔn)記錄,達(dá)到世界先進(jìn)智能水平。
不僅僅是在參數(shù)量,更是在模型架構(gòu)方面取得了突破,智源研究院提出的GLM2.0,首次打破BERT和GPT壁壘,以單一模型同時(shí)實(shí)現(xiàn)自然語(yǔ)言理解與生成任務(wù)。
在生命方面,智源研究院發(fā)布的“天演”生命智能模型,可以說是推動(dòng)信息科學(xué)從計(jì)算范式到仿腦范式的跨越。
截至目前,天演建成領(lǐng)域內(nèi)第一個(gè)基于精細(xì)神經(jīng)元的深度學(xué)習(xí)系統(tǒng),相比較傳統(tǒng)的深度學(xué)習(xí)系統(tǒng)更逼近真實(shí)大腦。
它還發(fā)布了超大規(guī)模小鼠紋狀體重建模型,該模型具有真實(shí)形態(tài)學(xué)特征,百萬(wàn)精細(xì)神經(jīng)元(11.968億突觸),這個(gè)規(guī)模是歐盟腦計(jì)劃已發(fā)表模型的6倍。
而且還將運(yùn)行精細(xì)神經(jīng)元模型的效率,與主流NEURON平臺(tái)(歐盟腦計(jì)劃開發(fā)的高精度大腦仿真軟件)相比,提高了足足2個(gè)量級(jí)。
除了重大科研任務(wù)外,智源研究院學(xué)術(shù)探索中也是成績(jī)斐然。
三年來(lái),自由探索和目標(biāo)導(dǎo)向相結(jié)合的體制機(jī)制展現(xiàn)出勃勃生機(jī),實(shí)現(xiàn)科研成果的量質(zhì)并重,智源研究院發(fā)表或支持發(fā)表國(guó)際AI頂會(huì)頂刊論文1470余篇,其中,被AAAI、CVPR、ACL、ICLR、NIPS、SIGIR、TPAMI等國(guó)際頂級(jí)會(huì)議期刊收錄論文約1060篇,占比逾七成,形成多個(gè)國(guó)際首創(chuàng)、首發(fā)重大成果。
同時(shí),智源研究院重視重大科研任務(wù)的“沿途下蛋”,截至2021年10月,其已經(jīng)申請(qǐng)中國(guó)專利78件,獲得發(fā)明專利授權(quán)44件,登記軟件著作權(quán)24項(xiàng)。
而學(xué)術(shù)生態(tài),是智源研究院“狠抓”的另外一個(gè)重要方向。
通過建設(shè)智源社區(qū)、青源會(huì)等線上線下相結(jié)合的社區(qū)組織,每年舉辦一屆北京智源大會(huì),邀請(qǐng)全球人工智能領(lǐng)域頂尖專家,共同探討人工智能前沿研究進(jìn)展及產(chǎn)業(yè)發(fā)展熱點(diǎn)。
就連眾多圖靈獎(jiǎng)得主也會(huì)“慕名而來(lái)”,共同探討人工智能發(fā)展的前沿方向。
……
而上述的這些,還只是智源研究院所取得成績(jī)的一隅,更多相關(guān)內(nèi)容可以點(diǎn)擊這里查看。
但放在三年的時(shí)間線上來(lái)看,它的效率和質(zhì)量著實(shí)有些快得驚人。
那么接下來(lái)的一個(gè)問題便是:
在智源研究院之前,國(guó)內(nèi)同時(shí)期或者更早,也成立了不少類似的研究機(jī)構(gòu)。
但站在現(xiàn)在這個(gè)時(shí)間節(jié)點(diǎn)回頭來(lái)看,它們可以說是“雷聲大雨點(diǎn)小”,甚至是越發(fā)模糊于人群的視線。
而印象中的智源研究院,似乎從成立之初開始,便每年都會(huì)發(fā)布讓業(yè)界矚目的科研成果,其規(guī)模也是朝著不斷壯大的趨勢(shì)在發(fā)展。
那么智源研究院,與其它的科研機(jī)構(gòu)到底又有怎樣的區(qū)別?為什么能做到如此的“快準(zhǔn)狠”?
就在剛剛,它在“宇宙中心”五道口的智源大廈新址,舉辦了三周歲的“生日宴”。
而在這場(chǎng)活動(dòng)中,與之相關(guān)的諸多謎底都得到了解釋。
還是以悟道大模型為例,它的速度可以說是非常之快:
從立項(xiàng)到發(fā)布,只花了8個(gè)月時(shí)間。
而后的2次更新迭代,也各花費(fèi)了3個(gè)月時(shí)間。
這種智源速度背后,一個(gè)非常重要的因素就是眾智。
換言之,就是通過智源的“號(hào)召力”,把產(chǎn)學(xué)研各界的力量集中到了一起。
在短短時(shí)間內(nèi),智源便把來(lái)自10個(gè)不同機(jī)構(gòu)近120人“聚”到了一起,匯聚資金、數(shù)據(jù)與算力。
而目標(biāo)非常的明確且清晰,就是集中力量辦大事——把這個(gè)大模型給搞出來(lái)。
而這種眾智的背后,體現(xiàn)的正是智源研究院的獨(dú)有模式——智源模式:
自由探索和目標(biāo)導(dǎo)向。
自由探索,是指智源研究院能夠賦予科學(xué)家最大的技術(shù)路線決定權(quán)和經(jīng)費(fèi)使用權(quán)。
換言之,就是只要在智源搞項(xiàng)目,那就大膽干、放心干,其它任何的顧慮都有智源在背后擔(dān)著。
而剛才提到的“集中力量辦大事”,便是目標(biāo)導(dǎo)向的核心含義,即同時(shí)快速組建跨機(jī)構(gòu)、大協(xié)作、高強(qiáng)度的科研團(tuán)隊(duì),快速推進(jìn)。
或許你會(huì)產(chǎn)生疑問:
智源研究院做的事情,為什么聽著像是做一個(gè)“大雜燴”的事情?
但實(shí)則并不是如此,智源研究院所做的事情不是“N+1”,也就是在眾多已有研究院的情況再來(lái)一個(gè)。
更符合實(shí)際的情況,應(yīng)當(dāng)是“1+X”,是將所有原有的研究?jī)?yōu)勢(shì)匯聚成一個(gè)協(xié)同的聯(lián)合體,為下一代人工智能的發(fā)展做一套新體系。
這是“智源模式”科研組織模式的展現(xiàn),之于在人才發(fā)展模式上,智源研究院所支持的模式,便是“青年人才挑大梁當(dāng)主角”。
大方向、大問題會(huì)由頂尖科學(xué)家來(lái)制定,而后由智源研究院的院務(wù)會(huì)快速做決策,有甚者五分鐘就能拍板決定。
項(xiàng)目在啟動(dòng)之后,便是由真正的主角——青年學(xué)者來(lái)領(lǐng)銜了,在項(xiàng)目進(jìn)行的過程中也是非常靈活,可以隨時(shí)進(jìn)行“微調(diào)”,而且不會(huì)有任何“門戶之分”。
而這也正是智源研究院能夠吸引眾多年輕科研工作者的原因,畢竟誰(shuí)又會(huì)拒絕一個(gè)自由且有權(quán)利的科研環(huán)境呢?
正如在智源研究院工作的一位算法工程師就曾這樣描述:
智源是包容更開放的,不強(qiáng)調(diào)單一文化,就像一座動(dòng)物園。可以包容任何一種性格的人,在這里找到自己感到舒服的姿勢(shì),做出貢獻(xiàn)。
而且在智源研究院所做的成果,并不是一時(shí)的,而是要?jiǎng)?chuàng)造經(jīng)得起時(shí)間檢驗(yàn)的代表作,屬于智源,更是屬于年輕人自己的那種。
張宏江在“生日宴”現(xiàn)場(chǎng)還立下了這樣一個(gè)flag:
智源研究院,永遠(yuǎn)要做最年輕的研究院。
最后一個(gè)重要的區(qū)別,便是智源研究院是開源、開放的。
智源研究院從注冊(cè)開始,其單位性質(zhì)便是民辦非企業(yè)單位,而且還會(huì)堅(jiān)持非盈利的這種狀態(tài)。
截至目前,大部分智源研究院所取得的科研成果,包括大模型等,均已全面向產(chǎn)學(xué)研各界開放使用。
正如張宏江所表述:
未來(lái),大模型就像一個(gè)世紀(jì)前的發(fā)電廠一樣,它會(huì)形成類似于電網(wǎng)一樣的基礎(chǔ)設(shè)施,在推動(dòng)各行業(yè)智能化升級(jí)上發(fā)揮重要作用,具有非常廣泛的應(yīng)用前景。
智源的大模型更像是Linux,而像紅帽所做的商業(yè)性工作,就交給其它大模型來(lái)吧。
而在我們來(lái)看,智源研究院所要做的事情,是要把自己也打造成一個(gè)“大模型”。
這種“大模型”是要匯聚中國(guó)的人口數(shù)據(jù)等紅利、中國(guó)的人工智能頂尖人才、中國(guó)的最前沿技術(shù)。
而后智源要形成并找到一種最佳的“算法”——科研系統(tǒng)。
……
早在智源研究院成立之初便提出過一個(gè)觀點(diǎn):
世界AI看北京。
而站在三年后的現(xiàn)在來(lái)看,智源已然用創(chuàng)新的科研方式成功讓AI探索走進(jìn)“北京時(shí)間”。
但現(xiàn)在它目光所及,應(yīng)當(dāng)是要從北京走向全國(guó)乃至世界。
至于“智源模式”在接下來(lái)的過程中是否還是依舊正確,依舊具備創(chuàng)新性和價(jià)值性,就需要時(shí)代的發(fā)展來(lái)給出正解了。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/123567.html
摘要:第二次則是今年初,論文被深度學(xué)習(xí)盛會(huì)拒絕。表示遺憾乃至憤怒的人不在少數(shù)。他認(rèn)為,使從其他學(xué)術(shù)實(shí)驗(yàn)室中脫穎而出的,是它的跨領(lǐng)域文化。騰訊也在籌建人工智能實(shí)驗(yàn)室,近期消息就會(huì)正式公布。 牛津大學(xué)和 DeepMind 的研究人員合作,開發(fā)出一款能夠閱讀唇語(yǔ)的系統(tǒng),這個(gè)名叫 Watch, Attend and Spell(WAS)的軟件在實(shí)際表現(xiàn)中遠(yuǎn)遠(yuǎn)超越了人類專家的水平。研究人員使用計(jì)算機(jī)視覺和機(jī)...
摘要:阿里巴巴歐洲云業(yè)務(wù)主管解釋說,拓展歐洲業(yè)務(wù)對(duì)于電商的發(fā)展也是有利的,對(duì)中國(guó)擴(kuò)張也有利。阿里云業(yè)務(wù)增速很快,截止月日的一個(gè)季度,營(yíng)收達(dá)到億元,同比增長(zhǎng)。中國(guó)第一亞太第二全球第四的阿里云能否更上一層樓,可拭目以待。12月10日,在歐洲,阿里巴巴與亞馬遜打了起來(lái),戰(zhàn)場(chǎng)不只有電商,還有云計(jì)算。亞馬遜是世界最大云計(jì)算玩家,歐洲成為了阿里巴巴與亞馬遜的新戰(zhàn)場(chǎng)。阿里巴巴歐洲云業(yè)務(wù)主管Yeming Wang...
摘要:對(duì)中國(guó)而言,一次自我突破意識(shí)服務(wù)形態(tài)顯得尤為重要。據(jù)研究統(tǒng)計(jì),當(dāng)前中國(guó)廠商號(hào)稱的數(shù)量已經(jīng)超過了家。根據(jù)研究觀察,目前中國(guó)市場(chǎng)中的大部分集中于領(lǐng)域,雖也有一定數(shù)量廠商,但沒有公司進(jìn)入到領(lǐng)域。在本系列的前兩篇中,我們分別討論了中國(guó)SaaS CRM和SaaS ERP,有網(wǎng)友大膽預(yù)測(cè)了下一篇我們會(huì)寫SaaS的一個(gè)大門類—協(xié)同OA。但是不好意思,讓很多朋友失望了,在我們看來(lái),OA這樣一個(gè)在中國(guó)市場(chǎng)別出...
摘要:日前,思否聯(lián)合宣布達(dá)成戰(zhàn)略合作,將更好地推進(jìn)的發(fā)展,一起攜手推動(dòng)開發(fā)者社區(qū)建設(shè),引導(dǎo)和投資更多人在未來(lái)基于生態(tài)進(jìn)行開發(fā)。本次黑客馬拉松也受到眾多投資機(jī)構(gòu)的關(guān)注,戰(zhàn)略合作有曲速科技合約資本幣新等機(jī)構(gòu)平臺(tái)。 showImg(https://segmentfault.com/img/remote/1460000014875236?w=1280&h=720); 日前,SegmentFault ...
閱讀 1300·2023-04-26 02:20
閱讀 3414·2021-11-22 14:45
閱讀 4322·2021-11-17 09:33
閱讀 1080·2021-09-06 15:00
閱讀 1551·2021-09-03 10:30
閱讀 4021·2021-07-26 22:01
閱讀 1064·2019-08-30 15:54
閱讀 598·2019-08-30 15:43