DeepSeek 入门简介课程之一


DeepSeek 是一款 AI 大模型,类似于 ChatGPT、豆包、Kimi 等 AI 工具。用户可以通过网页版和 APP 端使用。

其“深度思考”模式(R1)使其在市场上脱颖而出。相比普通 AI 模型仅机械地复述信息,DeepSeek 能够像学霸一样进行推导、分析和检查,展现出真正的智能思考能力。

  1. DeepSeek 公司,全称为杭州深度求索人工智能基础技术研究有限公司,成立于 2023 年 7 月 17 日,位于杭州,是幻方量化旗下的子公司。开发团队由一群年轻且富有才华的高校毕业生组成,创始人梁文锋是量化投资领域的资深专家,拥有丰富的量化投资经验和 AI 技术背景。团队成员多来自清华大学、北京大学和浙江大学等国内顶尖高校。

  2. DeepSeek 的迅速崛起主要归因于其以极低成本开发出能与海外巨头媲美的 AI 大模型。尽管公司成立时间较短,但其应用成果和行业影响显著。2024 年 5 月,DeepSeek 发布 DeepSeek-V2,宣布中国大模型价格战,其 API 价格仅为 GPT-4o 的 2.7%,随后国内厂商纷纷跟进降价。2024 年 12 月,DeepSeek 推出 DeepSeek-V3,以不到 600 万美元的训练成本实现了与 GPT-4o 和 Claude Sonnet 3.5 等顶尖模型相媲美的性能,震惊业界。2025 年 1 月,DeepSeek 推出 DeepSeek-R1,该模型不仅成本低,技术上也大幅提升,仅用十分之一的成本达到了 GPT-o1 级别的表现,API 定价仅为国内外其他头部 AI 厂商的几十分之一。DeepSeek R1 的出现如同一匹黑马,迅速在 AI 圈内引起巨大反响,甚至导致英伟达市值一夜蒸发超 1 万亿美元。

  3. 此外,DeepSeek 采用开源策略,DeepSeek-V3 和 DeepSeek-R1 模型全部开源。这种策略促进了技术生态的发展,降低了企业使用成本,推动了 AI 大模型的普及。开源还促使其他国内外大厂迅速跟进,开发类 DeepSeek 模型。同时,软件公司和个人开发者可以对 DeepSeek 进行二次开发,目前已有许多大厂接入 DeepSeek。相比 OpenAI 的 GPT-4o 模型,DeepSeek 仅用了几百万美元便开发出性能接近的模型。其对中文的理解极佳,回答更自然,不像其他 AI 过于“模板化”,这也是其受欢迎的原因之一。



DeepSeek 作为一种先进的 AI 大模型,具有广泛的应用场景,主要体现在以下几个方面:

1. 高效信息处理与学习支持

DeepSeek 能够在多领域提供高效的信息处理与学习支持,具体包括:

  • 知识问答:快速解答科学、技术、文化等跨领域问题,为用户提供即时准确的信息。
  • 学术研究:辅助进行文献综述、术语解释、数据解读等,帮助研究者提升工作效率。
  • 语言学习:提供语法纠正、翻译练习以及多语言对话训练,助力用户提升语言能力。
  • 2. 专业领域辅助

    DeepSeek 在多个专业领域中发挥重要作用,具体功能包括:

    • 编程开发:支持代码生成、调试建议和算法优化,降低开发者学习成本,提高开发效率。
    • 数据分析:指导数据清洗、统计方法选择以及提供可视化建议,帮助非技术用户快速上手数据分析。
    • 商业决策:生成市场分析框架、竞品对比模板等,辅助企业进行初步调研,为商业决策提供支持。
    • 3. 创意与内容生产

      DeepSeek 在创意与内容生产方面提供强大支持,具体功能包括:

      • 文案创作:输出广告语、社交媒体内容、剧本大纲等结构化创意内容,为内容创作者提供灵感和帮助。
      • 设计灵感:提供用户画像分析、产品命名建议、艺术风格参考等,激发设计师的创意。
      • 4. 日常效率工具

        DeepSeek 作为日常效率工具,能够帮助用户更好地管理时间和任务,具体功能包括:

        • 日程管理:拆分复杂任务、生成待办清单,并提供时间管理建议,帮助用户更好地规划和管理时间。
        • 个性化助手:定制旅行攻略、健身计划、饮食方案等,满足用户的个性化需求。
        • 5. 常用 AI 使用场景

          对于大多数用户而言,DeepSeek 在以下几个场景中应用广泛:

          • 文案创作:适合自媒体、营销人员,输入需求后,AI 自动生成高质量文案,用户只需适当调整即可发布。
          • 论文辅助:适合学生、研究人员,输入论文大纲,AI 协助扩写内容或润色语言。
          • 代码生成与优化:适合程序员,输入需求后,AI 提供完整代码或优化建议。
          • PPT 大纲生成:适合职场人士,输入主题后,AI 生成清晰的结构化大纲。
          • 6. 多工具协同应用

            DeepSeek 可结合其他 AI 工具,实现更高效的应用效果,例如:

            • 文案与配图:使用 DeepSeek 生成文案,结合 AI 配图工具(如 Midjourney、即梦)制作配图。
            • 代码生成与优化:使用 DeepSeek 生成代码,结合 ChatGPT 优化代码逻辑。
            • 通过上述功能和应用场景,DeepSeek 为用户提供了全面的 AI 支持,显著提升了工作效率和创意生产力。

              7.指令型AI

              指令型AI 是基于预设规则和指令的AI模型,按照给定的任务指令执行工作。它的特点是任务明确、结构化,并依赖于固定规则来输出结果。指令型AI模型通常用于文本生成、图片创作、视频制作等任务,常见的代表工具有ChatGPT、文心一言、通义千问、豆包、Kimi等。主流的大型语言模型,如GPT,都是指令型AI。

              在使用指令型AI时,需要提供清晰、具体的指令,并提供结构化的数据或信息,便于模型理解和处理。为了得到准确的结果,指令提示必须精确。提问时通常遵循四个步骤:

              1. 角色设定:明确AI所扮演的角色和身份。
              2. 任务说明:具体说明需要AI执行的任务,如翻译、分类、总结等。
              3. 完成步骤:指示任务的执行顺序。
              4. 输出格式:明确要求AI以何种形式输出结果,如文字、图片、代码等。
              5. 指令型AI要求用户详细交代任务流程,因此也催生了大量的提示词模板和提示词工程师。


                8.推理型AI

                推理型AI 是基于数据分析和逻辑推理的AI模型,能从数据中提取知识,进行自主学习和决策。推理型AI侧重于从已知信息中发掘规律和关系,适用于需要推理和决策的场景。代表工具如DeepSeek。与指令型AI不同,推理型AI不需要复杂的指令模板,用户只需简单描述问题,AI便会根据其推理能力得出结果。

                简而言之,指令型AI通过明确指令执行任务,而推理型AI则依赖数据分析和推理来进行学习和决策。两者在应用上有不同的侧重点和使用方式。


                ice 2025年2月23日 15:23 收藏文档