为紧跟技术前沿,拓宽知识视野,进一步推动人工智能领域的学术交流与技术探讨,我院于3月6日在时代凌宇报告厅举办“Deepseek从入门到精通”专题讲座。本次讲座邀请北京大学大数据分析与应用技术国家工程实验室产品工程部副部长、算法专家黄晶老师作为主讲嘉宾。
黄晶老师首先介绍了大语言模型的发展历程,从OpenAI的ChatGPT到国内各种大模型的百花齐放,尤其是deepseek的崛起。她对比了大语言模型与传统人工智能的差异,指出传统AI局限于特定领域,而大语言模型具备通用性,可处理常识问答、代码生成等多样化任务。接着,她将大语言模型的训练比作“炼丹”,强调GPU、数据和算法的重要性,并指出高质量、多样化的训练语料是关键。
黄晶老师分析了DeepSeek 爆火三大核心:开源生态、极致性价比及首个低成本实现 OpenAl O1 推理能力。现场对比展示了 V3 与 R1 版本差异,演示了联网检索、文件上传等实用功能。重点分享了提示语工程三大核心技巧 —— 精准指令设计、正反例需求澄清及迭代优化方法论,并通过代码生成、会议纪要整理、学术论文分析等场景,生动呈现了该模型在垂直领域的强大落地能力。
本次“Deepseek从入门到精通”讲座,为同学们提供了一次系统了解现代AI技术的机会,启发了对新时代科技智能的深入思考。
(责编:王钰健)