推荐阅读

大家好,我是佛系工程师☆恬静的小魔龙☆,不定时更新Unity开发技巧,觉得有用记得一键三连哦。

一、前言

最近AI相当的火,记得最开始AI就是一个对话工具,回答的很智能很有调理,做开发的一般是最早基础到的AI(因为一开始还需要翻墙),用AI去写代码,告诉它详细的需求,它就能帮你把代码写出来,比如:
在这里插入图片描述
后面又出现了很多写代码的工具Trae CN、Cursor呀,再接入一些大模型,效果要好的很多。

扯远了,回归了本篇文章的主题:从头认识AI,这是一篇AI扫盲内容,意思就是一开始没接触过AI、或者只是用AI对话的人可以了解一下最近最好的AI到底是什么。

二、正文

2-1、AI大模型的发展史

这篇文章就不从AI概念什么时候提出,什么图灵测试,什么黄金和低谷日期。

就从2022年的ChatGPT开始说起,因为我觉得这才是能让普通人都能开始使用AI的开始点。

2018年美国的一家公司OpenAI,发布了第一代生成式预训练模型,奠定了后续所有模型的技术基础。

  • GPT-1 (2018):证明了“预训练+微调”范式的可行性,但能力有限。
  • GPT-2 (2019):增加了参数量,展示了更强的文本生成能力。
  • GPT-3 (2020):参数量爆炸式增长,具备了强大的通用能力。
  • GPT-3.5 / GPT-4:在 GPT-3 的基础上,加入了人类反馈强化学习 (RLHF)​ 技术,使其更符合人类对话习惯。
  • ChatGPT (2022):基于 GPT-3.5​ 或 GPT-4​ 模型,并针对对话交互进行了专门优化,最终形成了我们熟知的聊天机器人。

引爆时刻2022年:

  • 2022年11月30日:ChatGPT(OpenAI)发布,基于GPT-3.5,引发全球生成式AI热潮。

2023年百模大战(大模型):

  • 2023年3月:GPT-4(OpenAI)发布,支持多模态输入,大幅提升推理能力。
  • 2023年7月:Llama 2(Meta)开源,激活全球开发者生态。
  • 2023年8月:通义千问(Qwen)(阿里巴巴)首发开源模型系列。
  • 2023年12月:Gemini 1.0(Google)发布,原生多模态大模型。

2024年:多模态与推理突破

  • 2024年2月:Sora(OpenAI)发布,实现高质量文生视频。
  • 2024年5月:GPT-4o(OpenAI)发布,实现文本、图像、语音的实时交互。
  • 2024年12月:o系列推理模型(OpenAI)发布,引入“慢思考”思维链。

💥 2025年:智能体崛起与生态重构

  • 2025年1月:DeepSeek R1(深度求索)发布,开源推理模型性能比肩GPT-o1
    这里重点说一下DeepSeek,这个也是大家熟知的大模型,DeepSeek的出现,代表中国AI大模型从“追赶者”转变为“规则改写者”。

DeepSeek出现之前,对AI大模型的普遍认知就是需要通过硬件算力(GPU)去提升大模型的能力,但是DeepSeek证明算法和架构创新可以弥补硬件算力的不足。

DeepSeek开创性地通过群组相对策略优化(GRPO)​ 直接激发基础模型的推理能力,简化了训练流程,让推理能力不再是闭源巨头的专利。

通过混合专家模型(MoE)​ 和多头潜在注意力机制(MLA)​ 等创新架构,在保持高性能的同时,将训练和推理成本降至行业极低水平,打破了“高算力=高智能”的固有认知。

  • 2025年3月:文心大模型4.5/X1(百度)发布,支持工具调用。
  • 2025年4月:Qwen3系列(阿里巴巴)全面开源,采用MoE架构。
  • 2025年5月:盘古Ultra MoE(华为)发布,全流程国产化闭环。
  • 2025年7月:Kimi K2(月之暗面)发布,万亿参数登顶开源榜。
  • 2025年8月:GPT-5(OpenAI)发布,具备高级思考与任务完成能力。
  • 2025年10月:混元世界模型1.1(腾讯)发布并开源,支持3D世界生成。
  • 2025年11月:Kimi K2 Thinking(月之暗面)发布,原生掌握工具调用能力。
  • 2025年12月:豆包大模型1.8(字节跳动)发布,面向多模态Agent场景优化。

说完了AI大模型的发展史,我们来了解一下AI助手的发展史。

2-2、AI助手(AI Agent)的发展史

AI大模型AI助手,这是很多人搞不清楚的一个点,都是AI它们有什么区别吗。

打个简单的比方,AI大模型就是引擎,AI助手就是汽车,引擎拥有强大的动力(算力),是让汽车跑起来的核心,但是只有一个引擎肯定嘛用没有。

AI助手就是汽车,汽车把方向盘、座椅、轮胎和外壳都装好了,普通人不需要懂引擎原理,只要会开车(输入指令),就能享受引擎带来的便利。

AI大模型是底层技术,AI助手是上层应用。我们平时使用的ChatGPT文心一言等,都是“搭载了GPT引擎的汽车”。

了解完AI大模型AI助手,那么接下来看一下AI助手的发展史:

  • ChatGPT (2022年11月30日):基于GPT-3.5架构,首次将大语言模型以对话形式呈现给普通用户。它打破了传统搜索引擎的“关键词检索”模式,实现了自然语言交互,成为史上增长最快的消费级应用,标志着AI从实验室走向大众视野。
  • GPT-4 (2023年3月14日):首个真正意义上的多模态大语言模型,支持文本和图像输入,在复杂问题解答、创意写作等方面表现出色,大幅提升了大模型在自然语言处理任务中的基准线。
  • Claude(2023年3月21日):主打安全性和有用性,提供更长的上下文窗口,强调Constitutional AI训练方法,注重与人类价值观的对齐。
  • 文心一言 (2023年):大型语言模型,擅长文本生成与理解,可聊天、问答、画图识图、撰写文案、阅读文档等,重点优化中文语境理解。
  • 通义千问 (2023年):通用AI模型,支持多模态任务(文本、图像等),核心功能包括文档阅读、联网搜索、写作总结。
  • Cursor(2023年):AI编程的“破局者”。基于VS Code深度定制,主打“AI结对编程”,让开发者通过自然语言指令直接生成、重构代码,极大提升了开发效率,是早期AI编程工具的代表。
  • 豆包 (2023年8月):在国内正式开启公测,重点打磨生活化场景,放弃“全能型”定位,强调“有用比高大上更重要”,新增方言理解功能。
  • GPT-4o (2024年5月13日):首个真正的多模态AI,原生跨文本、图像和音频训练,实现实时语音对话能力,成本降低50%,速度提升2倍,大幅降低了企业集成成本。
  • Claude 3系列 (2024年3月):包含Opus、Sonnet、Haiku三个版本,在多项基准测试中超越GPT-4,推理能力和安全性并重。
  • o1系列推理模型 (2024年9月):专注复杂推理,在数学、科学、编程等领域表现卓越,引入“慢思考”模式,通过思维链(Chain of Thought)过程来增强推理能力。
  • Cherry Studio (2024年12月):全场景AI生产力平台。一款跨平台桌面客户端,整合了30+主流云端与本地模型,内置300+行业专属助手,覆盖编程、写作、设计等多元场景,主打“多模型聚合”。
  • DeepSeek R1 (2025年1月20日):推理能力专项突破,专注复杂问题解决,开创MLA多尺度注意力架构,为“思考型”模型确立新路径,在基准测试中达到顶尖水平,实现高效推理。
  • Trae CN (2025年3月):字节跳动的“AI原生IDE”。国内首个AI原生集成开发环境,内置智能体系统,支持多任务并行和深度代码分析,旨在成为开发者的“AI搭档”。
  • GPT-5 (2025年8月7日):整合最先进的推理和多模态能力,内置思维功能,面向所有用户,成为默认模型。
  • Claude 4 (2025年5月22日):能搜索网络完成任务,实现推理和工具使用间的智能切换,混合推理能力达到新高度。
  • Claude Code(2025年2月):AI从“聊天”到“动手”的转折点。它不再只是回答问题,而是可以直接在终端执行命令、修改文件,标志着AI开始具备“行动能力”,是智能体(Agent)的雏形。
  • AI Skills(2025年10月):AI的“标准化工具箱”。将复杂的指令和资源打包成可复用的模块,让AI能像调用函数一样执行特定任务,解决了长提示词(Prompt)难以维护的问题,是AI走向工程化的重要一步。
  • OpenClaw(2026年1月):人AI助手的“终极形态”。一款开源的个人AI代理,不仅能聊天,还能直接操作电脑、管理文件、自动化任务,真正实现了“AI帮你干活”,是当前AI应用落地的标杆。

其他的一些AI助手
在这里插入图片描述
数不胜数,百花齐放,各种AI工具层出不穷,但是我们只需要了解AI大模型是啥,怎么用这些AI工具就够了。

2-3、MCP是啥

MCP也是AI里面一个重要概念,那么MCP是啥呢。

MCP,全称Model Context Protocol,是一个协议,用于连接AI助手和数据存储系统。

MCP(Model Context Protocol)以更简单、更可靠的方式将LLM智能体连接到包括外部数据、工具和服务在内的各类资源。MCP的高度标准化有效解决了不同基础LLM和工具提供商带来的系统分散问题,显著提升了系统集成能力。同时,MCP的标准化也为LLM智能体的工具使用带来了极强的可扩展性,使它们能更容易地集成各种新工具。

MCP(Model Context Protocol)的出现,就是为了给AI装上眼睛和手。它是一个标准接口,让AI能够安全地连接到本地工具、数据库和API。有了它,AI不再是只会纸上谈兵的聊天机器人,而是能直接读取文档、查询数据、甚至执行部署的工程师。

MCP主要作为本地服务运行,未来可能支持远程服务。通过MCPAI助手可以直接访问你的本地文件系统、数据库,甚至与浏览器交互,实现自动化操作。例如,你可以让AI助手读取本地的CSV文件,分析数据,甚至在浏览器中自动填写表单。

简单说就是原来AI助手不能操作本地的文件,现在加入MCP后AI助手可以操作的权限更大,功能更强大了。

2-4、还需要翻墙吗

针对于很多人问的现在大模型还需要翻墙吗,我的理解是:可以翻也可以不翻。

(1)首先说一下不翻的情况:

因为国内已经形成国产大模型+合规中转的模式,用户可以直接使用国内主流厂商的大模型。

国内主流厂商的大模型也可以调用海外大模型。

也可以通过合规渠道比如中转服务商(DataEyes、weelinking)访问海外大模型。
(2)需要翻的情况:
确实有这个需求,那么就要面对海外大模型的网络封锁、手机号验证、支付限制三大门槛。

需要准备三件套:

  • 网络环境:必须使用稳定的海外代理(科学上网),建议选择美国、日本或新加坡节点,全程保持IP稳定,避免频繁切换。
  • 海外邮箱:推荐使用 Gmail​ 或 Outlook。国内邮箱(QQ、163等)可能无法接收验证邮件或容易被风控。
  • 海外手机号:Claude/OpenAI不支持+86号码。需通过接码平台(如PingMe、hero-sms)临时租用美国号码接收验证码。

然后就是访问这些大模型的官网,进行注册、验证、支付了。

其他的话可以购买成品号或者找第三方代充。

2-5、大模型收费情况

平台/模型 订阅计划 价格 核心特点
字节跳动 (豆包/方舟)​ 方舟 Coding Plan ¥40/月​ (首月¥8.9) 支持豆包、DeepSeek、Kimi、GLM等多厂商模型自由切换,性价比高
阿里巴巴 (通义千问)​ 百炼 Coding Plan ¥40/月​ (首月¥7.9) 每月最高9万次请求,额度充足,适合高强度开发
稀宇科技 (MiniMax)​ MiniMax Coding Plan ¥29/月​ 极致性价比,支持最新M2.5模型,对标Claude体验
月之暗面 (Kimi)​ Kimi Code ¥49/月​ 主打256K超长上下文和极速响应,价格仅为Claude的20%
智谱 (GLM)​ GLM Coding Plan ¥49/月​ (包季9折) 国内最早推出,支持20+编程工具,生态成熟

很多国内大模型平台都有一些免费试用的额度,可以自行了解一下

海外模型通常按Token(每百万)收费,适合企业级应用或对成本敏感的开发场景。

模型 输入价格 ($/1M) 输出价格 ($/1M) 备注
Claude Opus 4.6​ $3.00 $15.00 代码与长文本推理天花板,OpenClaw首选
Claude Sonnet 4.6​ $1.50 $7.50 中端模型,性价比高
Claude Haiku 4.5​ $0.20 $1.00 超轻量,极速响应,适合简单对话
GPT-5.2​ $1.75 $14.00 旗舰模型,复杂推理能力强
GPT-5.2 Mini​ $0.25 $2.00 轻量版,性价比高
Gemini 2.5 Pro​ $1.50 $12.00 长上下文能力突出
Gemini 2.5 Flash​ $0.15 $1.20免费版可用,适合低优先级任务

三、后记

如果觉得本篇文章有用别忘了点个关注,关注不迷路,持续分享更多Unity干货文章。


你的点赞就是对博主的支持,有问题记得留言:

博主主页有联系方式。

博主还有跟多宝藏文章等待你的发掘哦:

专栏 方向 简介
Unity3D开发小游戏 小游戏开发教程 分享一些使用Unity3D引擎开发的小游戏,分享一些制作小游戏的教程。
Unity3D从入门到进阶 入门 从自学Unity中获取灵感,总结从零开始学习Unity的路线,有C#和Unity的知识。
Unity3D之UGUI UGUI Unity的UI系统UGUI全解析,从UGUI的基础控件开始讲起,然后将UGUI的原理,UGUI的使用全面教学。
Unity3D之读取数据 文件读取 使用Unity3D读取txt文档、json文档、xml文档、csv文档、Excel文档。
Unity3D之数据集合 数据集合 数组集合:数组、List、字典、堆栈、链表等数据集合知识分享。
Unity3D之VR/AR(虚拟仿真)开发 虚拟仿真 总结博主工作常见的虚拟仿真需求进行案例讲解。
Unity3D之插件 插件 主要分享在Unity开发中用到的一些插件使用方法,插件介绍等
Unity3D之日常开发 日常记录 主要是博主日常开发中用到的,用到的方法技巧,开发思路,代码分享等
Unity3D之日常BUG 日常记录 记录在使用Unity3D编辑器开发项目过程中,遇到的BUG和坑,让后来人可以有些参考。
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐