战略院举办DeepSeek专题学术报告会

日期：2025-02-27 来源：www.casted.org.cn

中国AI企业深度求索公司在今年年初发布了基于强化学习的DeepSeek-R1推理大模型，因其用极低的训练成本实现了媲美美国最先进大模型OpenAI o1的性能且开源，震惊了全球。应广大职工的要求，2月21日，战略院前沿所和院工会联合邀请中证金融研究院邵宇研究员来院做《DeepSeek的技术原理与全球AI发展趋势》专题学术报告。报告会由前沿所许晔副所长（主持）主持，工会主席邵学清参加会议，战略院各所研究人员和21世纪中心相关人员参加了此次活动，并积极参与讨论。

报告会上，邵宇研究员首先介绍了大模型建模、大模型微调和强化学习等基础概念，通过生动的图片演示了训练参数质量对大模型表现力的影响。接着，又深入浅出地讲解DeepSeek-R1的技术原理，强调DeepSeek所有模型架构上的创新均是围绕“降本增效”这一目标，即在基本不损害性能前提下，尽可能通过优化算法和提升硬件训练和解码效率来提高速度。邵宇研究员总结了R1大模型的创新点，并指出大模型训练是一个相当复杂的软硬一体的工程，而DeepSeek的出现也是技术发展的必然并就未来5年、10年后的AI技术发展趋势进行了研判，指出AI将推动科学发展，在生物医疗、金融分析和新材料研发等领域发挥重要作用。

通过此次学术报告会，与会人员对DeepSeek企业和大模型有了更加深入了解，并对我国创新型企业的研发能力和竞争能力更加充满信心。

联系我们

地址：中国北京市海淀区玉渊潭南路8号

邮编(ZIP)：100038

电话(Tel)：86-10-58884543

咨询：webmaster@casted.org.cn

新闻与信息：xxxz@casted.org.cn