戰(zhàn)略院舉辦DeepSeek專題學(xué)術(shù)報(bào)告會(huì)

日期：2025-02-27 來源：www.sjdmyh.top

中國AI企業(yè)深度求索公司在今年年初發(fā)布了基于強(qiáng)化學(xué)習(xí)的DeepSeek-R1推理大模型，因其用極低的訓(xùn)練成本實(shí)現(xiàn)了媲美美國最先進(jìn)大模型OpenAI o1的性能且開源，震驚了全球。應(yīng)廣大職工的要求，2月21日，戰(zhàn)略院前沿所和院工會(huì)聯(lián)合邀請(qǐng)中證金融研究院邵宇研究員來院做《DeepSeek的技術(shù)原理與全球AI發(fā)展趨勢(shì)》專題學(xué)術(shù)報(bào)告。報(bào)告會(huì)由前沿所許曄副所長（主持）主持，工會(huì)主席邵學(xué)清參加會(huì)議，戰(zhàn)略院各所研究人員和21世紀(jì)中心相關(guān)人員參加了此次活動(dòng)，并積極參與討論。

報(bào)告會(huì)上，邵宇研究員首先介紹了大模型建模、大模型微調(diào)和強(qiáng)化學(xué)習(xí)等基礎(chǔ)概念，通過生動(dòng)的圖片演示了訓(xùn)練參數(shù)質(zhì)量對(duì)大模型表現(xiàn)力的影響。接著，又深入淺出地講解DeepSeek-R1的技術(shù)原理，強(qiáng)調(diào)DeepSeek所有模型架構(gòu)上的創(chuàng)新均是圍繞“降本增效”這一目標(biāo)，即在基本不損害性能前提下，盡可能通過優(yōu)化算法和提升硬件訓(xùn)練和解碼效率來提高速度。邵宇研究員總結(jié)了R1大模型的創(chuàng)新點(diǎn)，并指出大模型訓(xùn)練是一個(gè)相當(dāng)復(fù)雜的軟硬一體的工程，而DeepSeek的出現(xiàn)也是技術(shù)發(fā)展的必然并就未來5年、10年后的AI技術(shù)發(fā)展趨勢(shì)進(jìn)行了研判，指出AI將推動(dòng)科學(xué)發(fā)展，在生物醫(yī)療、金融分析和新材料研發(fā)等領(lǐng)域發(fā)揮重要作用。

通過此次學(xué)術(shù)報(bào)告會(huì)，與會(huì)人員對(duì)DeepSeek企業(yè)和大模型有了更加深入了解，并對(duì)我國創(chuàng)新型企業(yè)的研發(fā)能力和競爭能力更加充滿信心。

聯(lián)系我們

地址：中國北京市海淀區(qū)玉淵潭南路8號(hào) 郵編(ZIP)：100038

電話(Tel)：86-10-58884543 咨詢：webmaster@casted.org.cn 新聞與信息：xxxz@casted.org.cn

版權(quán)所有　中國科學(xué)技術(shù)發(fā)展戰(zhàn)略研究院　備案號(hào)/經(jīng)營許可證備號(hào)：京ICP備10036465號(hào)-11 　　技術(shù)支持：中研網(wǎng)　

一区二区三区四区免费视频|亚洲综合成人网|一级毛suv好看一国产免费 |欧美爱爱网

戰(zhàn)略院舉辦DeepSeek專題學(xué)術(shù)報(bào)告會(huì)

聯(lián)系我們