什么是AI

让机器执行需要人类智能的任务
阶段:
早期阶段:专家系统 依赖人设定的规则
机器学习时代:数据参数训练
深度学习时代:用神经网络模拟人脑复杂结构 比如图像识别和处理
大模型时代:以规模数据和大算力为基础

AI的分类

1 分析式AI:核心任务是决策
2 生成式AI:做写作 画图等创造性工作

1 大语言模型LLM

基于海量文本数据训练 如 ChatGpt DeepSeek QWen
示例:智能客服 内容创建

2 生图、生视频模型

如Sora liblib.art jimeng

3 视觉识别模型

如视觉识别出产品外观瑕疵,分析X光或CT扫描的病灶点 如 YOLO ResNet,可做图像分类 物体检测

4 自动驾驶模型

如 辅助驾驶 无人配送

ChatGPT是如何训练出来的

1 收集数据 死记硬背 比如背下香蕉是什么
2 强化学习 问香蕉是什么 AI答出4个答案 人工给这4个答案排序 把工作交给AI 领导点评
3 强化学习优化模型 写一个水獭的故事
Rank List标注平台,给机器的回答排序

K2的参数量已达到上万亿

不同大模型的token是如何定义的

tiktokenizer.vercel.app
分词

Temperatrue、Top P的原理与作用

高 temperature: 使得生成结果更具有创造性 可能出现极小概率的答案
低 temperateur: 结果更保守

top P(概率)
Top P(设为0.9) 容易生成高质量的文本 不会出现极小概率的答案

AI大模型聊天产品的超能力

1 联网搜索 function call的能力 比如查询影响黄金价格的因素
2 读取文件 读取企业内部的有价值的文档
3 记忆能力 LLM是无状态的 每次对话时 把最近几轮问答作为背景信息一起发送给LLM;
需长期记忆的关键信息如用户名字 偏好等画像做个提取

2025年年初全球AI模型:
外国推荐的:GPT-4o, Claude 4 Sonnet, Gemini 2.5 Flash
国内推荐的:DeepSeek的 R1 V3,阿里巴巴的 Qwen3, Kimi K2(kimi.com) Qwen-tur?

前沿领域的H20

运行调用API

pip 配置上清华镜像

安装 anacoda3
jupyter 可以运行 .ipynb 文件

system
user
assitant

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐