战略院举办DeepSeek专题学术报告会

日期:2025-02-27 来源:www.casted.org.cn

中国AI企业深度求索公司在今年年初发布了基于强化学习的DeepSeek-R1推理大模型,因其用极低的训练成本实现了媲美美国最先进大模型OpenAI o1的性能且开源,震惊了全球。应广大职工的要求,2月21日,战略院前沿所和院工会联合邀请中证金融研究院邵宇研究员来院做《DeepSeek的技术原理与全球AI发展趋势》专题学术报告。报告会由前沿所许晔副所长(主持)主持,工会主席邵学清参加会议,战略院各所研究人员和21世纪中心相关人员参加了此次活动,并积极参与讨论。

报告会上,邵宇研究员首先介绍了大模型建模、大模型微调和强化学习等基础概念,通过生动的图片演示了训练参数质量对大模型表现力的影响。接着,又深入浅出地讲解DeepSeek-R1的技术原理,强调DeepSeek所有模型架构上的创新均是围绕“降本增效”这一目标,即在基本不损害性能前提下,尽可能通过优化算法和提升硬件训练和解码效率来提高速度。邵宇研究员总结了R1大模型的创新点,并指出大模型训练是一个相当复杂的软硬一体的工程,而DeepSeek的出现也是技术发展的必然并就未来5年、10年后的AI技术发展趋势进行了研判,指出AI将推动科学发展,在生物医疗、金融分析和新材料研发等领域发挥重要作用。

通过此次学术报告会,与会人员对DeepSeek企业和大模型有了更加深入了解,并对我国创新型企业的研发能力和竞争能力更加充满信心。