【AI】从头认识AI-AI扫盲篇

最近AI相当的火，记得最开始AI就是一个对话工具，回答的很智能很有调理，做开发的一般是最早基础到的AI（因为一开始还需要翻墙），用AI去写代码，告诉它详细的需求，它就能帮你把代码写出来，比如：后面又出现了很多写代码的工具呀，再接入一些大模型，效果要好的很多。扯远了，回归了本篇文章的主题：从头认识AI，这是一篇AI扫盲内容，意思就是一开始没接触过AI、或者只是用AI对话的人可以了解一下最近最好的AI

恬静的小魔龙

446人浏览 · 2026-03-06 11:55:11

恬静的小魔龙 · 2026-03-06 11:55:11 发布

推荐阅读

CSDN主页

GitHub开源地址

Unity3D插件分享

QQ群：398291828

小红书

小破站

大家好，我是佛系工程师☆恬静的小魔龙☆，不定时更新Unity开发技巧，觉得有用记得一键三连哦。

一、前言

最近AI相当的火，记得最开始AI就是一个对话工具，回答的很智能很有调理，做开发的一般是最早基础到的AI（因为一开始还需要翻墙），用AI去写代码，告诉它详细的需求，它就能帮你把代码写出来，比如：
在这里插入图片描述
后面又出现了很多写代码的工具Trae CN、Cursor呀，再接入一些大模型，效果要好的很多。

扯远了，回归了本篇文章的主题：从头认识AI，这是一篇AI扫盲内容，意思就是一开始没接触过AI、或者只是用AI对话的人可以了解一下最近最好的AI到底是什么。

二、正文

2-1、AI大模型的发展史

这篇文章就不从AI概念什么时候提出，什么图灵测试，什么黄金和低谷日期。

就从2022年的ChatGPT开始说起，因为我觉得这才是能让普通人都能开始使用AI的开始点。

2018年美国的一家公司OpenAI，发布了第一代生成式预训练模型，奠定了后续所有模型的技术基础。

GPT-1 (2018)：证明了“预训练+微调”范式的可行性，但能力有限。
GPT-2 (2019)：增加了参数量，展示了更强的文本生成能力。
GPT-3 (2020)：参数量爆炸式增长，具备了强大的通用能力。
GPT-3.5 / GPT-4：在 GPT-3 的基础上，加入了人类反馈强化学习 (RLHF) 技术，使其更符合人类对话习惯。
ChatGPT (2022)：基于 GPT-3.5 或 GPT-4 模型，并针对对话交互进行了专门优化，最终形成了我们熟知的聊天机器人。

引爆时刻2022年：

2022年11月30日：ChatGPT（OpenAI）发布，基于GPT-3.5，引发全球生成式AI热潮。

2023年百模大战（大模型）：

2023年3月：GPT-4（OpenAI）发布，支持多模态输入，大幅提升推理能力。
2023年7月：Llama 2（Meta）开源，激活全球开发者生态。
2023年8月：通义千问（Qwen）（阿里巴巴）首发开源模型系列。
2023年12月：Gemini 1.0（Google）发布，原生多模态大模型。

2024年：多模态与推理突破

2024年2月：Sora（OpenAI）发布，实现高质量文生视频。
2024年5月：GPT-4o（OpenAI）发布，实现文本、图像、语音的实时交互。
2024年12月：o系列推理模型（OpenAI）发布，引入“慢思考”思维链。

💥 2025年：智能体崛起与生态重构

2025年1月：DeepSeek R1（深度求索）发布，开源推理模型性能比肩GPT-o1。
这里重点说一下DeepSeek，这个也是大家熟知的大模型，DeepSeek的出现，代表中国AI大模型从“追赶者”转变为“规则改写者”。

在DeepSeek出现之前，对AI大模型的普遍认知就是需要通过硬件算力（GPU）去提升大模型的能力，但是DeepSeek证明算法和架构创新可以弥补硬件算力的不足。

DeepSeek开创性地通过群组相对策略优化（GRPO）直接激发基础模型的推理能力，简化了训练流程，让推理能力不再是闭源巨头的专利。

通过混合专家模型（MoE）和多头潜在注意力机制（MLA）等创新架构，在保持高性能的同时，将训练和推理成本降至行业极低水平，打破了“高算力=高智能”的固有认知。

2025年3月：文心大模型4.5/X1（百度）发布，支持工具调用。
2025年4月：Qwen3系列（阿里巴巴）全面开源，采用MoE架构。
2025年5月：盘古Ultra MoE（华为）发布，全流程国产化闭环。
2025年7月：Kimi K2（月之暗面）发布，万亿参数登顶开源榜。
2025年8月：GPT-5（OpenAI）发布，具备高级思考与任务完成能力。
2025年10月：混元世界模型1.1（腾讯）发布并开源，支持3D世界生成。
2025年11月：Kimi K2 Thinking（月之暗面）发布，原生掌握工具调用能力。
2025年12月：豆包大模型1.8（字节跳动）发布，面向多模态Agent场景优化。

说完了AI大模型的发展史，我们来了解一下AI助手的发展史。

2-2、AI助手（AI Agent）的发展史

AI大模型和AI助手，这是很多人搞不清楚的一个点，都是AI它们有什么区别吗。

打个简单的比方，AI大模型就是引擎，AI助手就是汽车，引擎拥有强大的动力（算力），是让汽车跑起来的核心，但是只有一个引擎肯定嘛用没有。

AI助手就是汽车，汽车把方向盘、座椅、轮胎和外壳都装好了，普通人不需要懂引擎原理，只要会开车（输入指令），就能享受引擎带来的便利。

AI大模型是底层技术，AI助手是上层应用。我们平时使用的ChatGPT、文心一言等，都是“搭载了GPT引擎的汽车”。

了解完AI大模型和AI助手，那么接下来看一下AI助手的发展史：

ChatGPT (2022年11月30日)：基于GPT-3.5架构，首次将大语言模型以对话形式呈现给普通用户。它打破了传统搜索引擎的“关键词检索”模式，实现了自然语言交互，成为史上增长最快的消费级应用，标志着AI从实验室走向大众视野。
GPT-4 (2023年3月14日)：首个真正意义上的多模态大语言模型，支持文本和图像输入，在复杂问题解答、创意写作等方面表现出色，大幅提升了大模型在自然语言处理任务中的基准线。
Claude(2023年3月21日)：主打安全性和有用性，提供更长的上下文窗口，强调Constitutional AI训练方法，注重与人类价值观的对齐。
文心一言 (2023年)：大型语言模型，擅长文本生成与理解，可聊天、问答、画图识图、撰写文案、阅读文档等，重点优化中文语境理解。
通义千问 (2023年)：通用AI模型，支持多模态任务（文本、图像等），核心功能包括文档阅读、联网搜索、写作总结。
Cursor（2023年）：AI编程的“破局者”。基于VS Code深度定制，主打“AI结对编程”，让开发者通过自然语言指令直接生成、重构代码，极大提升了开发效率，是早期AI编程工具的代表。
豆包 (2023年8月)：在国内正式开启公测，重点打磨生活化场景，放弃“全能型”定位，强调“有用比高大上更重要”，新增方言理解功能。
GPT-4o (2024年5月13日)：首个真正的多模态AI，原生跨文本、图像和音频训练，实现实时语音对话能力，成本降低50%，速度提升2倍，大幅降低了企业集成成本。
Claude 3系列 (2024年3月)：包含Opus、Sonnet、Haiku三个版本，在多项基准测试中超越GPT-4，推理能力和安全性并重。
o1系列推理模型 (2024年9月)：专注复杂推理，在数学、科学、编程等领域表现卓越，引入“慢思考”模式，通过思维链（Chain of Thought）过程来增强推理能力。
Cherry Studio (2024年12月)：全场景AI生产力平台。一款跨平台桌面客户端，整合了30+主流云端与本地模型，内置300+行业专属助手，覆盖编程、写作、设计等多元场景，主打“多模型聚合”。
DeepSeek R1 (2025年1月20日)：推理能力专项突破，专注复杂问题解决，开创MLA多尺度注意力架构，为“思考型”模型确立新路径，在基准测试中达到顶尖水平，实现高效推理。
Trae CN (2025年3月)：字节跳动的“AI原生IDE”。国内首个AI原生集成开发环境，内置智能体系统，支持多任务并行和深度代码分析，旨在成为开发者的“AI搭档”。
GPT-5 (2025年8月7日)：整合最先进的推理和多模态能力，内置思维功能，面向所有用户，成为默认模型。
Claude 4 (2025年5月22日)：能搜索网络完成任务，实现推理和工具使用间的智能切换，混合推理能力达到新高度。
Claude Code（2025年2月）：AI从“聊天”到“动手”的转折点。它不再只是回答问题，而是可以直接在终端执行命令、修改文件，标志着AI开始具备“行动能力”，是智能体（Agent）的雏形。
AI Skills（2025年10月）：AI的“标准化工具箱”。将复杂的指令和资源打包成可复用的模块，让AI能像调用函数一样执行特定任务，解决了长提示词（Prompt）难以维护的问题，是AI走向工程化的重要一步。
OpenClaw（2026年1月）：人AI助手的“终极形态”。一款开源的个人AI代理，不仅能聊天，还能直接操作电脑、管理文件、自动化任务，真正实现了“AI帮你干活”，是当前AI应用落地的标杆。

其他的一些AI助手：
在这里插入图片描述
数不胜数，百花齐放，各种AI工具层出不穷，但是我们只需要了解AI大模型是啥，怎么用这些AI工具就够了。

2-3、MCP是啥

MCP也是AI里面一个重要概念，那么MCP是啥呢。

MCP，全称Model Context Protocol，是一个协议，用于连接AI助手和数据存储系统。

MCP（Model Context Protocol）以更简单、更可靠的方式将LLM智能体连接到包括外部数据、工具和服务在内的各类资源。MCP的高度标准化有效解决了不同基础LLM和工具提供商带来的系统分散问题，显著提升了系统集成能力。同时，MCP的标准化也为LLM智能体的工具使用带来了极强的可扩展性，使它们能更容易地集成各种新工具。

MCP（Model Context Protocol）的出现，就是为了给AI装上眼睛和手。它是一个标准接口，让AI能够安全地连接到本地工具、数据库和API。有了它，AI不再是只会纸上谈兵的聊天机器人，而是能直接读取文档、查询数据、甚至执行部署的工程师。

MCP主要作为本地服务运行，未来可能支持远程服务。通过MCP，AI助手可以直接访问你的本地文件系统、数据库，甚至与浏览器交互，实现自动化操作。例如，你可以让AI助手读取本地的CSV文件，分析数据，甚至在浏览器中自动填写表单。

简单说就是原来AI助手不能操作本地的文件，现在加入MCP后AI助手可以操作的权限更大，功能更强大了。

2-4、还需要翻墙吗

针对于很多人问的现在大模型还需要翻墙吗，我的理解是：可以翻也可以不翻。

（1）首先说一下不翻的情况：

因为国内已经形成国产大模型+合规中转的模式，用户可以直接使用国内主流厂商的大模型。

国内主流厂商的大模型也可以调用海外大模型。

也可以通过合规渠道比如中转服务商（DataEyes、weelinking）访问海外大模型。
（2）需要翻的情况：
确实有这个需求，那么就要面对海外大模型的网络封锁、手机号验证、支付限制三大门槛。

需要准备三件套：

网络环境：必须使用稳定的海外代理（科学上网），建议选择美国、日本或新加坡节点，全程保持IP稳定，避免频繁切换。
海外邮箱：推荐使用 Gmail 或 Outlook。国内邮箱（QQ、163等）可能无法接收验证邮件或容易被风控。
海外手机号：Claude/OpenAI不支持+86号码。需通过接码平台（如PingMe、hero-sms）临时租用美国号码接收验证码。

然后就是访问这些大模型的官网，进行注册、验证、支付了。

其他的话可以购买成品号或者找第三方代充。

2-5、大模型收费情况

平台/模型	订阅计划	价格	核心特点
字节跳动 (豆包/方舟)	方舟 Coding Plan	¥40/月 (首月¥8.9)	支持豆包、DeepSeek、Kimi、GLM等多厂商模型自由切换，性价比高
阿里巴巴 (通义千问)	百炼 Coding Plan	¥40/月 (首月¥7.9)	每月最高9万次请求，额度充足，适合高强度开发
稀宇科技 (MiniMax)	MiniMax Coding Plan	¥29/月	极致性价比，支持最新M2.5模型，对标Claude体验
月之暗面 (Kimi)	Kimi Code	¥49/月	主打256K超长上下文和极速响应，价格仅为Claude的20%
智谱 (GLM)	GLM Coding Plan	¥49/月 (包季9折)	国内最早推出，支持20+编程工具，生态成熟

很多国内大模型平台都有一些免费试用的额度，可以自行了解一下

海外模型通常按Token（每百万）收费，适合企业级应用或对成本敏感的开发场景。

模型	输入价格 ($/1M)	输出价格 ($/1M)	备注
Claude Opus 4.6	$3.00	$15.00	代码与长文本推理天花板，OpenClaw首选
Claude Sonnet 4.6	$1.50	$7.50	中端模型，性价比高
Claude Haiku 4.5	$0.20	$1.00	超轻量，极速响应，适合简单对话
GPT-5.2	$1.75	$14.00	旗舰模型，复杂推理能力强
GPT-5.2 Mini	$0.25	$2.00	轻量版，性价比高
Gemini 2.5 Pro	$1.50	$12.00	长上下文能力突出
Gemini 2.5 Flash	$0.15	$1.20免费版可用，适合低优先级任务

三、后记

如果觉得本篇文章有用别忘了点个关注，关注不迷路，持续分享更多Unity干货文章。

你的点赞就是对博主的支持，有问题记得留言：

博主主页有联系方式。

博主还有跟多宝藏文章等待你的发掘哦：

专栏	方向	简介
Unity3D开发小游戏	小游戏开发教程	分享一些使用Unity3D引擎开发的小游戏，分享一些制作小游戏的教程。
Unity3D从入门到进阶	入门	从自学Unity中获取灵感，总结从零开始学习Unity的路线，有C#和Unity的知识。
Unity3D之UGUI	UGUI	Unity的UI系统UGUI全解析，从UGUI的基础控件开始讲起，然后将UGUI的原理，UGUI的使用全面教学。
Unity3D之读取数据	文件读取	使用Unity3D读取txt文档、json文档、xml文档、csv文档、Excel文档。
Unity3D之数据集合	数据集合	数组集合：数组、List、字典、堆栈、链表等数据集合知识分享。
Unity3D之VR/AR（虚拟仿真）开发	虚拟仿真	总结博主工作常见的虚拟仿真需求进行案例讲解。
Unity3D之插件	插件	主要分享在Unity开发中用到的一些插件使用方法，插件介绍等
Unity3D之日常开发	日常记录	主要是博主日常开发中用到的，用到的方法技巧，开发思路，代码分享等
Unity3D之日常BUG	日常记录	记录在使用Unity3D编辑器开发项目过程中，遇到的BUG和坑，让后来人可以有些参考。