【AI】从头认识AI-AI扫盲篇
最近AI相当的火,记得最开始AI就是一个对话工具,回答的很智能很有调理,做开发的一般是最早基础到的AI(因为一开始还需要翻墙),用AI去写代码,告诉它详细的需求,它就能帮你把代码写出来,比如:后面又出现了很多写代码的工具呀,再接入一些大模型,效果要好的很多。扯远了,回归了本篇文章的主题:从头认识AI,这是一篇AI扫盲内容,意思就是一开始没接触过AI、或者只是用AI对话的人可以了解一下最近最好的AI
推荐阅读
大家好,我是佛系工程师☆恬静的小魔龙☆,不定时更新Unity开发技巧,觉得有用记得一键三连哦。
一、前言
最近AI相当的火,记得最开始AI就是一个对话工具,回答的很智能很有调理,做开发的一般是最早基础到的AI(因为一开始还需要翻墙),用AI去写代码,告诉它详细的需求,它就能帮你把代码写出来,比如:
后面又出现了很多写代码的工具Trae CN、Cursor呀,再接入一些大模型,效果要好的很多。
扯远了,回归了本篇文章的主题:从头认识AI,这是一篇AI扫盲内容,意思就是一开始没接触过AI、或者只是用AI对话的人可以了解一下最近最好的AI到底是什么。
二、正文
2-1、AI大模型的发展史
这篇文章就不从AI概念什么时候提出,什么图灵测试,什么黄金和低谷日期。
就从2022年的ChatGPT开始说起,因为我觉得这才是能让普通人都能开始使用AI的开始点。
2018年美国的一家公司OpenAI,发布了第一代生成式预训练模型,奠定了后续所有模型的技术基础。
GPT-1 (2018):证明了“预训练+微调”范式的可行性,但能力有限。GPT-2 (2019):增加了参数量,展示了更强的文本生成能力。GPT-3 (2020):参数量爆炸式增长,具备了强大的通用能力。GPT-3.5 / GPT-4:在 GPT-3 的基础上,加入了人类反馈强化学习 (RLHF) 技术,使其更符合人类对话习惯。ChatGPT (2022):基于 GPT-3.5 或 GPT-4 模型,并针对对话交互进行了专门优化,最终形成了我们熟知的聊天机器人。
引爆时刻2022年:
- 2022年11月30日:
ChatGPT(OpenAI)发布,基于GPT-3.5,引发全球生成式AI热潮。
2023年百模大战(大模型):
- 2023年3月:
GPT-4(OpenAI)发布,支持多模态输入,大幅提升推理能力。 - 2023年7月:
Llama 2(Meta)开源,激活全球开发者生态。 - 2023年8月:
通义千问(Qwen)(阿里巴巴)首发开源模型系列。 - 2023年12月:
Gemini 1.0(Google)发布,原生多模态大模型。
2024年:多模态与推理突破
- 2024年2月:
Sora(OpenAI)发布,实现高质量文生视频。 - 2024年5月:
GPT-4o(OpenAI)发布,实现文本、图像、语音的实时交互。 - 2024年12月:o系列推理模型
(OpenAI)发布,引入“慢思考”思维链。
💥 2025年:智能体崛起与生态重构
- 2025年1月:
DeepSeek R1(深度求索)发布,开源推理模型性能比肩GPT-o1。
这里重点说一下DeepSeek,这个也是大家熟知的大模型,DeepSeek的出现,代表中国AI大模型从“追赶者”转变为“规则改写者”。
在DeepSeek出现之前,对AI大模型的普遍认知就是需要通过硬件算力(GPU)去提升大模型的能力,但是DeepSeek证明算法和架构创新可以弥补硬件算力的不足。
DeepSeek开创性地通过群组相对策略优化(GRPO) 直接激发基础模型的推理能力,简化了训练流程,让推理能力不再是闭源巨头的专利。
通过混合专家模型(MoE) 和多头潜在注意力机制(MLA) 等创新架构,在保持高性能的同时,将训练和推理成本降至行业极低水平,打破了“高算力=高智能”的固有认知。
- 2025年3月:
文心大模型4.5/X1(百度)发布,支持工具调用。 - 2025年4月:
Qwen3系列(阿里巴巴)全面开源,采用MoE架构。 - 2025年5月:
盘古Ultra MoE(华为)发布,全流程国产化闭环。 - 2025年7月:
Kimi K2(月之暗面)发布,万亿参数登顶开源榜。 - 2025年8月:
GPT-5(OpenAI)发布,具备高级思考与任务完成能力。 - 2025年10月:
混元世界模型1.1(腾讯)发布并开源,支持3D世界生成。 - 2025年11月:
Kimi K2 Thinking(月之暗面)发布,原生掌握工具调用能力。 - 2025年12月:
豆包大模型1.8(字节跳动)发布,面向多模态Agent场景优化。
说完了AI大模型的发展史,我们来了解一下AI助手的发展史。
2-2、AI助手(AI Agent)的发展史
AI大模型和AI助手,这是很多人搞不清楚的一个点,都是AI它们有什么区别吗。
打个简单的比方,AI大模型就是引擎,AI助手就是汽车,引擎拥有强大的动力(算力),是让汽车跑起来的核心,但是只有一个引擎肯定嘛用没有。
AI助手就是汽车,汽车把方向盘、座椅、轮胎和外壳都装好了,普通人不需要懂引擎原理,只要会开车(输入指令),就能享受引擎带来的便利。
AI大模型是底层技术,AI助手是上层应用。我们平时使用的ChatGPT、文心一言等,都是“搭载了GPT引擎的汽车”。
了解完AI大模型和AI助手,那么接下来看一下AI助手的发展史:
ChatGPT(2022年11月30日):基于GPT-3.5架构,首次将大语言模型以对话形式呈现给普通用户。它打破了传统搜索引擎的“关键词检索”模式,实现了自然语言交互,成为史上增长最快的消费级应用,标志着AI从实验室走向大众视野。GPT-4(2023年3月14日):首个真正意义上的多模态大语言模型,支持文本和图像输入,在复杂问题解答、创意写作等方面表现出色,大幅提升了大模型在自然语言处理任务中的基准线。Claude(2023年3月21日):主打安全性和有用性,提供更长的上下文窗口,强调Constitutional AI训练方法,注重与人类价值观的对齐。文心一言(2023年):大型语言模型,擅长文本生成与理解,可聊天、问答、画图识图、撰写文案、阅读文档等,重点优化中文语境理解。通义千问(2023年):通用AI模型,支持多模态任务(文本、图像等),核心功能包括文档阅读、联网搜索、写作总结。Cursor(2023年):AI编程的“破局者”。基于VS Code深度定制,主打“AI结对编程”,让开发者通过自然语言指令直接生成、重构代码,极大提升了开发效率,是早期AI编程工具的代表。豆包(2023年8月):在国内正式开启公测,重点打磨生活化场景,放弃“全能型”定位,强调“有用比高大上更重要”,新增方言理解功能。GPT-4o(2024年5月13日):首个真正的多模态AI,原生跨文本、图像和音频训练,实现实时语音对话能力,成本降低50%,速度提升2倍,大幅降低了企业集成成本。Claude 3系列 (2024年3月):包含Opus、Sonnet、Haiku三个版本,在多项基准测试中超越GPT-4,推理能力和安全性并重。o1系列推理模型(2024年9月):专注复杂推理,在数学、科学、编程等领域表现卓越,引入“慢思考”模式,通过思维链(Chain of Thought)过程来增强推理能力。Cherry Studio(2024年12月):全场景AI生产力平台。一款跨平台桌面客户端,整合了30+主流云端与本地模型,内置300+行业专属助手,覆盖编程、写作、设计等多元场景,主打“多模型聚合”。DeepSeek R1(2025年1月20日):推理能力专项突破,专注复杂问题解决,开创MLA多尺度注意力架构,为“思考型”模型确立新路径,在基准测试中达到顶尖水平,实现高效推理。Trae CN(2025年3月):字节跳动的“AI原生IDE”。国内首个AI原生集成开发环境,内置智能体系统,支持多任务并行和深度代码分析,旨在成为开发者的“AI搭档”。GPT-5(2025年8月7日):整合最先进的推理和多模态能力,内置思维功能,面向所有用户,成为默认模型。Claude 4(2025年5月22日):能搜索网络完成任务,实现推理和工具使用间的智能切换,混合推理能力达到新高度。Claude Code(2025年2月):AI从“聊天”到“动手”的转折点。它不再只是回答问题,而是可以直接在终端执行命令、修改文件,标志着AI开始具备“行动能力”,是智能体(Agent)的雏形。AI Skills(2025年10月):AI的“标准化工具箱”。将复杂的指令和资源打包成可复用的模块,让AI能像调用函数一样执行特定任务,解决了长提示词(Prompt)难以维护的问题,是AI走向工程化的重要一步。OpenClaw(2026年1月):人AI助手的“终极形态”。一款开源的个人AI代理,不仅能聊天,还能直接操作电脑、管理文件、自动化任务,真正实现了“AI帮你干活”,是当前AI应用落地的标杆。
其他的一些AI助手:
数不胜数,百花齐放,各种AI工具层出不穷,但是我们只需要了解AI大模型是啥,怎么用这些AI工具就够了。
2-3、MCP是啥
MCP也是AI里面一个重要概念,那么MCP是啥呢。
MCP,全称Model Context Protocol,是一个协议,用于连接AI助手和数据存储系统。
MCP(Model Context Protocol)以更简单、更可靠的方式将LLM智能体连接到包括外部数据、工具和服务在内的各类资源。MCP的高度标准化有效解决了不同基础LLM和工具提供商带来的系统分散问题,显著提升了系统集成能力。同时,MCP的标准化也为LLM智能体的工具使用带来了极强的可扩展性,使它们能更容易地集成各种新工具。
MCP(Model Context Protocol)的出现,就是为了给AI装上眼睛和手。它是一个标准接口,让AI能够安全地连接到本地工具、数据库和API。有了它,AI不再是只会纸上谈兵的聊天机器人,而是能直接读取文档、查询数据、甚至执行部署的工程师。
MCP主要作为本地服务运行,未来可能支持远程服务。通过MCP,AI助手可以直接访问你的本地文件系统、数据库,甚至与浏览器交互,实现自动化操作。例如,你可以让AI助手读取本地的CSV文件,分析数据,甚至在浏览器中自动填写表单。
简单说就是原来AI助手不能操作本地的文件,现在加入MCP后AI助手可以操作的权限更大,功能更强大了。
2-4、还需要翻墙吗
针对于很多人问的现在大模型还需要翻墙吗,我的理解是:可以翻也可以不翻。
(1)首先说一下不翻的情况:
因为国内已经形成国产大模型+合规中转的模式,用户可以直接使用国内主流厂商的大模型。
国内主流厂商的大模型也可以调用海外大模型。
也可以通过合规渠道比如中转服务商(DataEyes、weelinking)访问海外大模型。
(2)需要翻的情况:
确实有这个需求,那么就要面对海外大模型的网络封锁、手机号验证、支付限制三大门槛。
需要准备三件套:
- 网络环境:必须使用稳定的海外代理(科学上网),建议选择美国、日本或新加坡节点,全程保持IP稳定,避免频繁切换。
- 海外邮箱:推荐使用 Gmail 或 Outlook。国内邮箱(QQ、163等)可能无法接收验证邮件或容易被风控。
- 海外手机号:Claude/OpenAI不支持+86号码。需通过接码平台(如PingMe、hero-sms)临时租用美国号码接收验证码。
然后就是访问这些大模型的官网,进行注册、验证、支付了。
其他的话可以购买成品号或者找第三方代充。
2-5、大模型收费情况
| 平台/模型 | 订阅计划 | 价格 | 核心特点 |
|---|---|---|---|
| 字节跳动 (豆包/方舟) | 方舟 Coding Plan | ¥40/月 (首月¥8.9) | 支持豆包、DeepSeek、Kimi、GLM等多厂商模型自由切换,性价比高 |
| 阿里巴巴 (通义千问) | 百炼 Coding Plan | ¥40/月 (首月¥7.9) | 每月最高9万次请求,额度充足,适合高强度开发 |
| 稀宇科技 (MiniMax) | MiniMax Coding Plan | ¥29/月 | 极致性价比,支持最新M2.5模型,对标Claude体验 |
| 月之暗面 (Kimi) | Kimi Code | ¥49/月 | 主打256K超长上下文和极速响应,价格仅为Claude的20% |
| 智谱 (GLM) | GLM Coding Plan | ¥49/月 (包季9折) | 国内最早推出,支持20+编程工具,生态成熟 |
很多国内大模型平台都有一些免费试用的额度,可以自行了解一下
海外模型通常按Token(每百万)收费,适合企业级应用或对成本敏感的开发场景。
| 模型 | 输入价格 ($/1M) | 输出价格 ($/1M) | 备注 |
|---|---|---|---|
| Claude Opus 4.6 | $3.00 | $15.00 | 代码与长文本推理天花板,OpenClaw首选 |
| Claude Sonnet 4.6 | $1.50 | $7.50 | 中端模型,性价比高 |
| Claude Haiku 4.5 | $0.20 | $1.00 | 超轻量,极速响应,适合简单对话 |
| GPT-5.2 | $1.75 | $14.00 | 旗舰模型,复杂推理能力强 |
| GPT-5.2 Mini | $0.25 | $2.00 | 轻量版,性价比高 |
| Gemini 2.5 Pro | $1.50 | $12.00 | 长上下文能力突出 |
| Gemini 2.5 Flash | $0.15 | $1.20免费版可用,适合低优先级任务 |
三、后记
如果觉得本篇文章有用别忘了点个关注,关注不迷路,持续分享更多Unity干货文章。
你的点赞就是对博主的支持,有问题记得留言:
博主主页有联系方式。
博主还有跟多宝藏文章等待你的发掘哦:
| 专栏 | 方向 | 简介 |
|---|---|---|
| Unity3D开发小游戏 | 小游戏开发教程 | 分享一些使用Unity3D引擎开发的小游戏,分享一些制作小游戏的教程。 |
| Unity3D从入门到进阶 | 入门 | 从自学Unity中获取灵感,总结从零开始学习Unity的路线,有C#和Unity的知识。 |
| Unity3D之UGUI | UGUI | Unity的UI系统UGUI全解析,从UGUI的基础控件开始讲起,然后将UGUI的原理,UGUI的使用全面教学。 |
| Unity3D之读取数据 | 文件读取 | 使用Unity3D读取txt文档、json文档、xml文档、csv文档、Excel文档。 |
| Unity3D之数据集合 | 数据集合 | 数组集合:数组、List、字典、堆栈、链表等数据集合知识分享。 |
| Unity3D之VR/AR(虚拟仿真)开发 | 虚拟仿真 | 总结博主工作常见的虚拟仿真需求进行案例讲解。 |
| Unity3D之插件 | 插件 | 主要分享在Unity开发中用到的一些插件使用方法,插件介绍等 |
| Unity3D之日常开发 | 日常记录 | 主要是博主日常开发中用到的,用到的方法技巧,开发思路,代码分享等 |
| Unity3D之日常BUG | 日常记录 | 记录在使用Unity3D编辑器开发项目过程中,遇到的BUG和坑,让后来人可以有些参考。 |
更多推荐



所有评论(0)