北京大学《DeepSeek内部研讨系列》(PDF文件)- AI教程资料

2025-04-02 0 348

北京大学推出的《DeepSeek内部研讨系列》主要介绍人工智能模型及应用。《DeepSeek原理与落地应用》阐述DeepSeek模型的原理、发展历程和技术突破,包括在推理能力、多模态支持和开源特性上的优势。同时展示DeepSeek在教育、学术、知识付费等多个领域的应用场景,如教学设计、作业批改、论文辅助写作等,强调低成本、高性能的特点。《DeepSeek 私有化部署和一体机》聚焦DeepSeek的私有化部署,包括个人用户在本地电脑上的部署方法、企业级的高性能部署方案,及针对计算资源受限场景的低成本部署策略。同时介绍DeepSeek一体机的配置、性能数据及应用场景,为不同用户提供从模型选型到落地实践的全场景解决方案。

获取《DeepSeek原理与落地应用和《DeepSeek 私有化部署和一体机》

PDF原文件,扫码关注回复: 20250225

《DeepSeek原理与落地应用》

《DeepSeek原理与落地应用》是北京大学青鸟人工智能研究院、计算机学院元宇宙技术研究所和教育学院学习科学实验室联合推出的内部手册。详细介绍DeepSeek技术的原理及其在各领域的落地应用。展示DeepSeek在教育领域的广泛应用,如教学设计、教学活动、作业批改、个性化教案、医学专业病理诊断、论文全流程辅助、学术研究、知识付费和作业辅导等,提供具体的提示词示例,帮助用户更好地基于DeepSeek提升工作效率和学习效果。探讨DeepSeek在推理密集型任务、文档分析与长上下文理解、开放领域问答与写作等方面的应用潜力,为AI技术的普惠化和国产化生态繁荣提供了有力支持。

人工智能概念辨析

  • 大模型相关术语:介绍多模态(文本、图片、音频、视频)、AI工具(如DeepSeek、豆包等)、通用模型(大语言模型、视觉模型等)和行业模型(教育、医疗、金融等)的概念。
  • 大模型的前世今生:从人工智能的发展历程出发,介绍运算推理、知识工程、机器学习、人工神经网络、深度神经网络、Transformer架构、编码器和解码器等技术的发展脉络,及生成式人工智能(GenAI)和Diffusion架构等内容。
  • 大模型的发展阶段:对比生成模型和推理模型的特点,如OpenAI GPT-4o(生成模型)和OpenAI o1(推理模型)在模型定位、推理能力、多模态支持、应用场景和用户交互体验等方面的差异。
  • 生成模型与推理大模型的对比:生成模型适合通用任务和多模态交互,推理模型在复杂逻辑和专业任务中表现更强,但交互节奏较慢且多模态支持有限。

DeepSeek R1

  • 公司背景与发展历程:DeepSeek由幻方量化孕育而生,是一家专注于人工智能基础技术研究与开发的创新型科技企业。介绍DeepSeek的成立背景、投资者背景、市场定位及发展历程。
  • DeepSeek模型系列:对比DeepSeek生成模型(V3)和推理模型(R1)的设计初衷、性能展现、应用范围。推理模型(R1)在复杂推理任务中表现出色,如DROP任务F1分数达到92.2%,AIME 2024通过率为79.8%。
  • 为什么火:强调DeepSeek R1的三大优势——开源、低成本、国产化,及其在推理能力上的突破,成为全球大模型赛道的重要领跑者。
  • DeepSeek的算法和算力突破:介绍DeepSeek R1的训练技术,如混合专家(MOE)、多头潜在注意力(MLA)、强化学习(GRPO)等,及其对AI行业的重大影响,包括打破垄断、价格下调、推动创新等。
  • 对AI行业的重大影响:DeepSeek-R1基于低成本和开源特性打破垄断,降低价格,推动AI行业创新。
  • 使用方式:介绍DeepSeek的三种使用方式——调用官方API、模型微调、直接使用,提供官网、API、手机APP及第三方通道等多种接入方式。
  • 私有化部署:介绍模型的私有化部署方式,包括Ollama部署、vLLM部署等,列举不同版本的DeepSeek-R1模型及其特点。

模型原理

  • GPT工作原理:详细介绍GPT的工作原理,包括概率预测、文字接龙、Transformer架构、预训练、监督微调、人类反馈强化学习等环节,及数据来源、模型参数和上下文窗口大小等内容。
  • 生成模型的优势与劣势:对比生成模型的优势(如语言理解和生成能力、世界知识能力、一定的推理能力)和劣势(如幻觉、知识库有限、上下文窗口限制)。
  • 推理模型(DeepSeek-R1)工作原理:介绍DeepSeek R1模型的推理机制,包括思维链(Chain of Thought)、蒸馏(Distillation)和强化学习(Reinforcement Learning)等技术,提供相关论文链接。

落地应用

  • DeepSeek的对话能力:强调DeepSeek让人类与AI对话更加简单,基于提示词技巧提升对话质量,适合各层级使用者快速上手。
  • DeepSeek提示词技巧:列举多种提示词技巧,如真诚+直接、通用公式、说人话、反向PUA、善于模仿、擅长锐评、激发深度思考等,帮助用户更好地利用DeepSeek进行任务处理。
    • 真诚 + 直接:明确任务目标,直接表达需求,避免模糊表述。
    • 通用公式:按“我要(做),要给用,希望达到效果,但担心问题”的公式组织提示词,帮助DeepSeek全面理解任务。
    • 说人话:要求DeepSeek用通俗易懂的语言回答,避免过于专业或官方的表述。
    • 反向PUA:提出挑战性问题(如反对理由、批评角度),激发DeepSeek的深度思考和全面回答。
    • 善于模仿:指定模仿对象或风格,让DeepSeek生成符合特定风格或语气的内容。
    • 擅长锐评:用特定句式或表达方式(如“笑死”等),激发DeepSeek的批判性思维和锐评能力。
    • 激发深度思考:在提示词中加入“复盘”“批判性思考”等要求,提升回答的深度和质量。
  • DeepSeek官方提示词解读:介绍DeepSeek官方文档中的提示词分类,如代码类、内容分类、结构化输出、角色扮演、创作类、翻译类、提示词生成等,并提供了链接。
  • 应用场景:列举DeepSeek R1的应用场景,包括推理密集型任务(如编程任务、数学问题求解)、教育与知识应用(如教学设计、教学活动、作业批改、个性化教案、医学专业病理诊断、论文全流程辅助)、开放领域问答与写作等。
  • 教育与学术赋能:详细介绍DeepSeek在教育领域的应用,如教学设计、教学活动、作业批改、个性化教案、医学专业病理诊断、论文全流程辅助、学术研究、知识付费、作业辅导等,提供具体的提示词示例。
    • 教学设计:设计课程大纲,明确课程内容和设计思路。
    • 教学活动:设计变式题、问题支架、课后作业和分组演练话术。
    • 作业批改:为客观题添加解析,为编程题提供思路。
    • 个性化教案:设计不同难度习题组,标注难度系数。
    • 医学专业病理诊断:生成疾病诊断列表,排序、提检查建议。
    • 论文全流程辅助:辅助选题、大纲生成、文献综述、内容扩写、润色查重。
    • 学术研究:辅助文献速读、参考文献整理、学术翻译、研究方法设计、数据分析报告撰写。
    • 知识付费:设计课程大纲、直播脚本、社群运营话术、付费问答脚本。
    • 作业辅导:从知识点锚定到能力拓展,设计辅导流程。

《DeepSeek 私有化部署和一体机》

《DeepSeek 私有化部署和一体机》是北大青鸟人工智能研究院和北大计算机学院元宇宙技术研究所推出的关于 DeepSeek 模型部署的指导手册。详细介绍 DeepSeek 模型的私有化部署方法,包括个人用户和企业级用户的部署方案。涵盖从模型选型到具体部署的全过程,提供针对不同硬件环境和业务需求的优化建议。重点介绍 DeepSeek 一体机,一种集成高性能硬件和预装模型的设备,为企业和教育机构提供开箱即用的 AI 解决方案。提供不同配置的一体机的详细规格和性能数据,帮助企业根据自身需求选择合适的型号。

人工智能与DeepSeek

  • 大模型相关术语:介绍多模态、AI工具(如DeepSeek、豆包等)、通用模型(包括大语言模型、生成模型、推理模型等)以及行业模型(如教育、医疗、金融等领域的模型)。
  • 大模型的前世今生:回顾人工智能的发展历程,包括运算推理、知识工程、机器学习、人工神经网络、深度神经网络、Transformer架构等,及生成式人工智能(GenAI)的兴起,列举国内外多种大模型。
  • 大模型的发展阶段:对比生成模型与推理模型的定位、推理能力、多模态支持、应用场景和用户交互体验。
  • 生成模型与推理大模型的对比:生成模型擅长多模态内容生成和通用任务,适合大众化应用;推理模型在复杂逻辑推理和专业领域表现出色,适合高精度推理需求。
  • 自2024年起,AI肖睿团队便接入DeepSeek V2:介绍AI肖睿团队对DeepSeek技术体系的研究和应用,包括V2(MoE架构)、V3(MTP)和R1(推理模型)的演进,及知识蒸馏在各版本中的应用。
  • DeepSeek快速出圈:讲述DeepSeek V3和R1模型的发布及其对行业的影响,DeepSeek公司和R1模型在2025年春节后的“出圈”现象。
  • 公司简介:介绍DeepSeek公司的成立背景、团队分布、模型系列及与其他中国大模型企业的关系。
  • 模型的演进历史和特点:对比DeepSeek V2、V3和R1三个主要模型的核心架构、训练方法、关键特性和性能表现。
  • DeepSeek模型优势:总结DeepSeek模型的特点,如开源生态、模型蒸馏支持、低成本训练等。
  • DeepSeek模型特点总结:详细介绍DeepSeek模型的基础架构(如MoE、MLA、RL等)、训练及框架(如FP8混合精度训练、TTC等)和社会价值。
  • DeepSeek-R1全家桶:列举DeepSeek-R1的各个蒸馏模型及其来源和特点。
  • 蒸馏模型-概念:解释模型蒸馏的定义、原理、优势以及在DeepSeek中的应用。
  • DeepSeek-R1蒸馏模型-能力对比:提供蒸馏模型的选择经验,包括不同参数量模型的适用场景和性能表现。
  • DeepSeek模型应用场景:介绍DeepSeek在边缘计算、复杂数学与编程任务、中文场景等领域的应用优势。
  • 使用方式:总结DeepSeek的多种使用方式,包括直接使用官方服务、第三方服务与API调用、个人部署和企业部署。

个人部署DeepSeek

  • 模型部署
    • 硬件配置-推荐:提供不同参数量模型的推荐硬件配置,包括CPU、内存、显存和硬盘空间要求。
    • 硬件配置-最低:提供不同参数量模型的最低硬件配置要求。
    • 硬件选择建议:根据需求、预算和性能平衡,给出了硬件选择的建议。
    • Ollama功能特点:介绍Ollama工具的特点,如开源免费、简单易用、模型丰富等。
    • 软件安装步骤:详细说明Ollama客户端和Docker的安装方法。
    • 环境变量配置:解释Ollama环境变量的配置方法和建议。
    • 网络配置:介绍如何访问Ollama服务,包括本地部署和远程部署的网络配置注意事项。
  • 环境准备
    • Ollama常用命令:列举Ollama的常用命令,如下载模型、运行模型、查看模型信息等。
    • 使用Ollama命令下载模型:介绍下载模型的命令格式、下载过程监控和下载失败处理方法。
    • 使用Ollama命令运行模型:介绍运行模型的命令格式、运行状态检查和停止运行模型的方法。
    • 模型运行效果:展示模型运行后的效果。
    • Ollama常见问题:讨论Ollama常见的安全漏洞、未经授权访问风险以及模型升级后性能退化问题的解决方案。
  • 前端展示
    • 前端展示:介绍PageAssist、Chatbox、OpenWebUI等前端展示工具的特点、适用场景和使用方法。
    • 三款界面总结:对比PageAssist、Chatbox和OpenWebUI的特点和适用场景。

企业部署DeepSeek

  • Transformers简介:介绍Transformers库的功能和特点,包括支持的模态任务、框架互操作性等。
  • Transformers部署模型:详细说明使用Transformers部署DeepSeek模型的步骤,包括安装依赖包、加载模型、运行模型和其他框架调用。
  • 生成时常用参数:列举模型生成时常用的参数及其含义和注意事项。
  • vLLM简介:介绍vLLM框架的特点,如PagedAttention技术、性能提升、与Transformers的无缝集成等。
  • vLLM部署模型:说明使用vLLM部署DeepSeek模型的步骤,包括安装依赖包、加载并启动模型。
  • vLLM参数说明:详细解释vLLM启动命令中的各个参数及其作用。
  • vLLM实际并发性能测试:提供vLLM在不同设备和模型配置下的并发性能测试数据。
  • vLLM常见问题及解决方案:讨论vLLM在部署过程中可能遇到的注意力机制兼容性问题及其解决方案。
  • 企业级70B模型部署案例分享:分享企业级70B模型部署案例,包括服务器配置、部署方案和经验总结。
  • 部署方案简介:介绍DeepSeek R1满血版模型的部署方案,包括硬件需求和成本分析。
  • 方案实现:详细说明硬件环境配置、模型下载和三种低成本部署方案(llama.cpp、KTransformers、Unsloth动态量化)的实现步骤。
  • 方案一、llama.cpp:介绍llama.cpp项目的背景、安装步骤、推理步骤和测试结果。
  • 方案二、KTransformers:介绍KTransformers项目的背景、安装步骤、运行模型方法和单并发实测效果。
  • 方案三、Unsloth动态量化+Ollama:介绍如何基于llama.cpp工具合并Unsloth动态量化模型的权重文件,借助Ollama工具进行模型注册与调用。
  • 性能测评总结:对比三种低成本部署方案在不同硬件配置下的性能表现。
  • 部署方案总结:对三种低成本部署方案的适用性、优势和局限性进行总结。

DeepSeek一体机

  • DeepSeek一体机:介绍DeepSeek一体机的概念、优势和适用场景。
  • 国产DeepSeek一体机厂商一览表:列举截止至2025年2月的国产DeepSeek一体机厂商及其产品特点。
  • DeepSeek国产一体机671B推荐配置:提供不同配置的DeepSeek一体机的硬件规格和适用场景。
  • DeepSeek一体机数据分享:分享DeepSeek一体机在不同配置下的性能数据,包括并发能力和用户支持数量。
  • 北大青鸟AI实验室案例分享:介绍北大青鸟为院校提供的AI实验室建设方案,包括DeepSeek一体机的配置和应用场景。
  • 北大青鸟AI实验室建设方案:详细说明AI实验室建设方案的系统层、容器层、业务层、监控层和应用层的特点和功能。
  • 北大青鸟AI实验室(DeepSeek一体机):分别介绍DeepSeek基础版、标准版和旗舰版一体机的详细配置和性能报价。

获取《DeepSeek内部研讨系列》和《DeepSeek 私有化部署和一体机》

PDF原文件,扫码关注回复: 20250225

若非本站原创的文章,特别作如下声明:
本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。
不承担任何由于内容的合法性及真实性所引起的争议和法律责任。
凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。
如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!

AI老司机 AI行业动态 北京大学《DeepSeek内部研讨系列》(PDF文件)- AI教程资料 https://www.ailsj.cn/1231.html

相关文章

发表评论
暂无评论