时间: 2025-03-04 | 次数: |
计算机学院在信管中心的大力支持下,克服分布式推理、K8S集群管理配置、数据隐私安全保护等技术难题,在学院算力平台上成功完成国产大语言模型DeepSeek-R1完整版的本地化部署,并基于此在教育、医疗、煤矿等多个垂直领域开展人工智能应用研究。
DeepSeek-R1是由杭州深度求索人工智能基础技术研究有限公司开发的一款通用大语言模型,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上的性能可以比肩OpenAI o1模型正式版。 DeepSeek-R1采用MIT许可协议,支持免费商用、任意修改和衍生开发等,在各个垂直领域具有极大的应用价值。
基于DeepSeek-R1的本地化和上下文记忆能力,利用有监督微调、强化学习微调和知识蒸馏等技术,计算机学院正在开展人工智能垂直领域应用研究,并迅速推进场景化落地。在智慧教育领域,开发面向个性化学习的AI助教,已经应用在《高级语言程序设计》课程教学中。在智慧医疗领域,结合学院“智慧医疗”团队多年研究成果,与学校一附院合作开发基于多模态大模型的医疗辅助诊疗系统,取得了初步成果。在煤矿生产场景,开发煤矿领域垂直AI模型和AI智能体,并应用于煤矿安全生产培训中。
为持续推动技术辐射效应,推进跨院系合作,计算机学院未来会向校内师生开放框架接口与算力资源,共同推动基于DeepSeek等人工智能大模型的垂直领域应用开发,和国产AI框架生态建设。