中國AI企業(yè)深度求索公司在今年年初發(fā)布了基于強(qiáng)化學(xué)習(xí)的DeepSeek-R1推理大模型,因其用極低的訓(xùn)練成本實(shí)現(xiàn)了媲美美國最先進(jìn)大模型OpenAI o1的性能且開源,震驚了全球。應(yīng)廣大職工的要求,2月21日,戰(zhàn)略院前沿所和院工會(huì)聯(lián)合邀請(qǐng)中證金融研究院邵宇研究員來院做《DeepSeek的技術(shù)原理與全球AI發(fā)展趨勢(shì)》專題學(xué)術(shù)報(bào)告。報(bào)告會(huì)由前沿所許曄副所長(主持)主持,工會(huì)主席邵學(xué)清參加會(huì)議,戰(zhàn)略院各所研究人員和21世紀(jì)中心相關(guān)人員參加了此次活動(dòng),并積極參與討論。
報(bào)告會(huì)上,邵宇研究員首先介紹了大模型建模、大模型微調(diào)和強(qiáng)化學(xué)習(xí)等基礎(chǔ)概念,通過生動(dòng)的圖片演示了訓(xùn)練參數(shù)質(zhì)量對(duì)大模型表現(xiàn)力的影響。接著,又深入淺出地講解DeepSeek-R1的技術(shù)原理,強(qiáng)調(diào)DeepSeek所有模型架構(gòu)上的創(chuàng)新均是圍繞“降本增效”這一目標(biāo),即在基本不損害性能前提下,盡可能通過優(yōu)化算法和提升硬件訓(xùn)練和解碼效率來提高速度。邵宇研究員總結(jié)了R1大模型的創(chuàng)新點(diǎn),并指出大模型訓(xùn)練是一個(gè)相當(dāng)復(fù)雜的軟硬一體的工程,而DeepSeek的出現(xiàn)也是技術(shù)發(fā)展的必然并就未來5年、10年后的AI技術(shù)發(fā)展趨勢(shì)進(jìn)行了研判,指出AI將推動(dòng)科學(xué)發(fā)展,在生物醫(yī)療、金融分析和新材料研發(fā)等領(lǐng)域發(fā)揮重要作用。
通過此次學(xué)術(shù)報(bào)告會(huì),與會(huì)人員對(duì)DeepSeek企業(yè)和大模型有了更加深入了解,并對(duì)我國創(chuàng)新型企業(yè)的研發(fā)能力和競爭能力更加充滿信心。
地址:中國 北京市海淀區(qū)玉淵潭南路8號(hào) 郵編(ZIP):100038
電話(Tel):86-10-58884543 咨詢:webmaster@casted.org.cn 新聞與信息:xxxz@casted.org.cn
版權(quán)所有 中國科學(xué)技術(shù)發(fā)展戰(zhàn)略研究院 備案號(hào)/經(jīng)營許可證備號(hào):京ICP備10036465號(hào)-11
技術(shù)支持:中研網(wǎng)