在这里插入图片描述

【作者主页】Francek Chen
【专栏介绍】 ⌈ ⌈ 人工智能与大模型应用 ⌋ ⌋ 人工智能(AI)通过算法模拟人类智能,利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络(如ChatGPT),经海量数据训练后能完成文本生成、图像创作等复杂任务,显著提升效率,但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合,未来需平衡技术创新与伦理风险,推动可持续发展。


在这里插入图片描述

前言

数字化时代,大模型迅速崛起并重塑生活、工作和社会运行逻辑,为各行业带来变革与机遇。DeepSeek 以出色自然语言理解能力,推动人机交互迈向新高度。本文探讨蓝耘 MaaS(Model as a Service)平台与深度学习的关系,阐述与 DeepSeek-V3.2 模型融合亮点,应用 Chatbox 拓展实例。

一、Chatbox 概述

Chatbox 是一款多平台支持的 AI 客户端软件,凭借其强大的功能、简洁的界面设计以及对用户隐私的高度重视,迅速成为办公学习领域的热门工具。Chatbox 不仅仅是一个简单的 AI 聊天工具,它是一款功能丰富、适用于多种场景的智能 AI 助手,涵盖从日常办公到专业开发的广泛需求。

Chatbox 的核心功能如下。

  1. 全平台支持:Chatbox 支持 Windows、MacOS、Linux、Android、iOS 以及网页版,用户可以在任何设备上无缝切换使用,实现跨平台数据同步。
  2. 智能文档与图片交互:支持与各类文档(包括 PDF 文件、Word 文档、Excel 表格、TXT 文本)和图片进行智能交互,AI 可以理解内容并提供智能分析和响应。
  3. AI 编程助手:提供智能代码生成与预览、代码审查与重构建议、程序调试与安全检查等功能,支持多种编程语言。
  4. 实时联网搜索:通过 AI 联网搜索功能,帮助用户获取最新的事实、新闻和数据,支持 URL 分析、内容摘要以及事实核查。
  5. AI 生成的图表与可视化:能够生成清晰、可定制的图表,帮助用户理解复杂的概念和数据。
  6. 图像生成与渲染:支持用户通过描述生成高质量的图片,满足创意表达和设计需求。
  7. LaTeX 与 Markdown 支持:内置 LaTeX 和 Markdown 渲染功能,帮助用户清晰表达复杂公式和想法。
  8. 数据隐私与安全:高度重视用户数据的隐私,所有数据默认存储在本地,确保用户完全掌控自己的信息。

Chatbox 官网主页:https://chatboxai.app/zh

在这里插入图片描述

图1 Chatbox官网主页

二、DeepSeek-V3.2 版本更新概述

2025 年 9 月 29 日,DeepSeek-V3.2-Exp 正式发布,这是模型的实验版本。作为迈向下一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力,这是一种稀疏注意力机制,旨在探索和验证长上下文场景中训练和推理效率的优化。

这个实验性版本代表了我们对更高效的变压器架构的持续研究,特别是在处理扩展文本序列时提高计算效率。

在这里插入图片描述

图2 V3.2-Exp和V3.1-Terminus的算力消耗对比

DeepSeek 稀疏注意力(DSA)首次实现了细粒度稀疏注意力,在长上下文训练和推理效率方面提供了实质性的改进,同时保持了几乎相同的模型输出质量。为了严格评估引入稀疏注意力的影响,特意将 DeepSeek-V3.2-Exp 的训练配置与 V3.1-Terminus 对齐。在各个领域的公共基准测试中,DeepSeek-V3.2-Exp 展示了与 V3.1-Terminus 相当的性能。

2025 年 12 月 1 日,DeepSeek 正式发布两款全新模型:DeepSeek-V3.2 标准版与 DeepSeek-V3.2-Speciale 增强版,分别面向日常应用与极致推理场景。

在这里插入图片描述

图3 DeepSeek-V3.2与主流模型性能对比

DeepSeek-V3.2 标准版聚焦于日常任务与通用智能体需求,在推理能力与输出效率间取得出色平衡。它在多项公开推理基准测试中与顶级模型表现相当,同时显著降低了计算成本与响应时间,输出精炼高效,具备优秀的实用性与性价比。

DeepSeek-V3.2-Speciale 则致力于突破推理能力的边界,作为长思考增强版,它在高难度数学证明、逻辑验证等任务上展现出卓越性能,已在 IMO、CMO 等顶级竞赛中取得金牌级成绩。该版本暂不支持工具调用且计算消耗较高,目前主要面向研究用途。

二、蓝耘 MaaS 平台使用 DeepSeek-V3.2 模型

(一)注册蓝耘智算平台账号

点击注册链接:https://cloud.lanyun.net//#/registerPage?promoterCode=0131

输入手机号获取验证码,设置密码,点击注册。如图4所示。

在这里插入图片描述

图4 注册蓝耘智算平台账号

新用户福利:注册后可领取免费试用时长(20元代金券,可直接当余额来使用)。

若已经注册过帐号,点击下方“已有账号,立即登录”即可。

(二)进入蓝耘 MaaS 模型广场

登录后进入首页,点击“MaaS平台”。接着进入 MaaS 平台的模型广场。在这里,用户可以看到多种来自不同供应商的模型,如 DeepSeek、通义等。页面详细列出了模型名称、类型(如文本生成)、上下文长度等信息,还提供了 API 示例、查看详情和立即体验等操作选项。图5中展示的是蓝耘元生代 MaaS 平台的模型广场页面。

在这里插入图片描述

图5 蓝耘MaaS平台模型广场

然后,找到 DeepSeek-V3.2 大模型,点击“立即体验”。如图6所示。

在这里插入图片描述

图6 蓝耘MaaS平台模型广场→DeepSeek-V3.2模型

图7中展示的是蓝耘元生代 MaaS 平台的对话界面。左侧是功能导航栏,包含模型广场、文本模型等选项。对话框上方是模型选择区域,点击可展开选择如 DeepSeek-V3.2、QwQ-32B 等多种模型。下方是对话输入区,用户可输入问题,有“深度思考”“联网搜索”“知识库”等功能按钮,输入框显示 token 限制。这里选择的是“DeepSeek-V3.2”模型。

在这里插入图片描述

图7 蓝耘MaaS平台对话界面

(三)使用 DeepSeek-V3.2 模型生成代码

生成有关机器学习聚类的代码,提示词如下:

帮我生成一段关于机器学习聚类的代码,要求使用scikit-learn库。

输出结果如图8所示。升级的 DeepSeek-V3.2 模型思考效率较 R1 有了很大的提升,本次对话仅用了 1.5 秒的思考时间!

在这里插入图片描述

图8 DeepSeek-V3.2 模型生成代码结果

此次对话输出2244tokens,总耗时14.2s,共消耗2265tokens。该对话token消耗的数量=输入token数+输出token数。

输出代码如下:

# 导入必要的库
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans, DBSCAN, AgglomerativeClustering
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import silhouette_score
from sklearn.decomposition import PCA
import warnings
warnings.filterwarnings('ignore')

# 1. 创建示例数据集
print("=== 创建数据集 ===")
# 生成300个样本,4个中心点(聚类)
X, y_true = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=42)

# 数据标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

print(f"数据集形状: {X.shape}")
print(f"前5个样本:\n{X[:5]}")

# 2. 使用KMeans聚类
print("\n=== KMeans聚类 ===")
kmeans = KMeans(n_clusters=4, random_state=42)
kmeans_labels = kmeans.fit_predict(X_scaled)
kmeans_centers = kmeans.cluster_centers_

print(f"聚类中心:\n{kmeans_centers}")
print(f"轮廓系数: {silhouette_score(X_scaled, kmeans_labels):.4f}")

# 3. 使用DBSCAN聚类(基于密度)
print("\n=== DBSCAN聚类 ===")
dbscan = DBSCAN(eps=0.3, min_samples=10)
dbscan_labels = dbscan.fit_predict(X_scaled)

# 计算DBSCAN的轮廓系数(排除噪声点)
if len(np.unique(dbscan_labels)) > 1:
    dbscan_silhouette = silhouette_score(X_scaled[dbscan_labels != -1], 
                                        dbscan_labels[dbscan_labels != -1])
    print(f"聚类数量: {len(np.unique(dbscan_labels[dbscan_labels != -1]))}")
    print(f"轮廓系数: {dbscan_silhouette:.4f}")
else:
    print("DBSCAN只找到了1个聚类")

# 4. 使用层次聚类
print("\n=== 层次聚类 ===")
agg_clustering = AgglomerativeClustering(n_clusters=4)
agg_labels = agg_clustering.fit_predict(X_scaled)
print(f"轮廓系数: {silhouette_score(X_scaled, agg_labels):.4f}")

# 5. 可视化结果
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 原始数据
axes[0, 0].scatter(X[:, 0], X[:, 1], c=y_true, cmap='viridis', s=50, alpha=0.8)
axes[0, 0].set_title('原始数据(真实标签)')
axes[0, 0].set_xlabel('特征1')
axes[0, 0].set_ylabel('特征2')

# KMeans结果
axes[0, 1].scatter(X[:, 0], X[:, 1], c=kmeans_labels, cmap='viridis', s=50, alpha=0.8)
axes[0, 1].scatter(kmeans_centers[:, 0] * scaler.scale_[0] + scaler.mean_[0],
                   kmeans_centers[:, 1] * scaler.scale_[1] + scaler.mean_[1],
                   c='red', s=200, marker='X', label='聚类中心')
axes[0, 1].set_title('KMeans聚类结果')
axes[0, 1].set_xlabel('特征1')
axes[0, 1].set_ylabel('特征2')
axes[0, 1].legend()

# DBSCAN结果
unique_labels = np.unique(dbscan_labels)
colors = plt.cm.viridis(np.linspace(0, 1, len(unique_labels)))
for k, col in zip(unique_labels, colors):
    if k == -1:
        col = 'gray'  # 噪声点为灰色
    class_member_mask = (dbscan_labels == k)
    xy = X[class_member_mask]
    axes[1, 0].scatter(xy[:, 0], xy[:, 1], c=[col], s=50, alpha=0.8)
axes[1, 0].set_title('DBSCAN聚类结果')
axes[1, 0].set_xlabel('特征1')
axes[1, 0].set_ylabel('特征2')

# 层次聚类结果
axes[1, 1].scatter(X[:, 0], X[:, 1], c=agg_labels, cmap='viridis', s=50, alpha=0.8)
axes[1, 1].set_title('层次聚类结果')
axes[1, 1].set_xlabel('特征1')
axes[1, 1].set_ylabel('特征2')

plt.tight_layout()
plt.show()

# 6. 确定最佳聚类数(肘部法则)
print("\n=== 确定最佳聚类数 ===")
inertia = []
silhouette_scores = []
K_range = range(2, 11)

for k in K_range:
    kmeans = KMeans(n_clusters=k, random_state=42)
    kmeans.fit(X_scaled)
    inertia.append(kmeans.inertia_)
    
    if k > 1:  # 轮廓系数至少需要2个聚类
        silhouette_scores.append(silhouette_score(X_scaled, kmeans.labels_))

# 绘制肘部法则图
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 4))

ax1.plot(K_range, inertia, 'bo-')
ax1.set_xlabel('聚类数量')
ax1.set_ylabel('SSE(误差平方和)')
ax1.set_title('肘部法则')
ax1.grid(True)

ax2.plot(K_range[1:], silhouette_scores, 'ro-')
ax2.set_xlabel('聚类数量')
ax2.set_ylabel('轮廓系数')
ax2.set_title('轮廓系数评估')
ax2.grid(True)

plt.tight_layout()
plt.show()

# 7. 实战示例:聚类新数据
print("\n=== 实战示例 ===")
# 创建新的测试数据
new_data = np.array([[0, 2], [8, -4], [-5, 3]])
new_data_scaled = scaler.transform(new_data)

# 使用训练好的KMeans模型预测新数据的聚类
new_predictions = kmeans.predict(new_data_scaled)
print(f"新数据: {new_data}")
print(f"预测的聚类标签: {new_predictions}")

# 8. 高维数据的聚类(使用PCA降维可视化)
print("\n=== 高维数据聚类示例 ===")
# 创建高维数据集
X_high_dim, _ = make_blobs(n_samples=500, n_features=10, centers=5, random_state=42)

# 标准化
X_high_dim_scaled = StandardScaler().fit_transform(X_high_dim)

# 使用KMeans聚类
kmeans_high = KMeans(n_clusters=5, random_state=42)
labels_high = kmeans_high.fit_predict(X_high_dim_scaled)

# 使用PCA降维到2维进行可视化
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_high_dim_scaled)

plt.figure(figsize=(8, 6))
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=labels_high, cmap='tab20', s=50, alpha=0.7)
plt.xlabel('PCA 主成分1')
plt.ylabel('PCA 主成分2')
plt.title('高维数据聚类结果(PCA可视化)')
plt.colorbar(label='聚类标签')
plt.show()

print("代码执行完成!")

四、使用 Chatbox 接入蓝耘 DeepSeek-V3.2 API

(一)添加配置 DeepSeek-V3.2 模型

  • API 域名:https://maas-api.lanyun.net/v1
  • API 路径:/chat/completions

在这里插入图片描述

图9 配置蓝耘的API域名和路径

  • API 密钥:回到蓝耘 MaaS 平台获取专属 API KEY,如图10所示。
  • 模型:/maas/deepseek-ai/DeepSeek-V3.2(图6中所示的模型名称)

在这里插入图片描述

图10 获取蓝耘平台API密钥

配置完成,点击保存。

(二)新建对话测试验证

新建对话,验证蓝耘 DeepSeek-V3.2 模型对话。提示词如下:

300字简单概述一下DeepSeek-V3.2大模型的升级点

在这里插入图片描述

图11 测试验证DeepSeek-V3.2对话

小结

数字化时代,大模型崛起带来变革与机遇,本文探讨蓝耘 MaaS 平台与深度学习关系及 DeepSeek-V3.2 模型融合亮点。Chatbox 是多平台支持、功能丰富、重视隐私的智能 AI 助手,涵盖多种场景需求。2025 年 9 月 29 日,DeepSeek-V3.2-Exp 发布,引入稀疏注意力机制优化长上下文场景训练和推理效率,与 V3.1-Terminus 性能相当;12 月 1 日,DeepSeek 发布 DeepSeek-V3.2 标准版与 DeepSeek-V3.2-Speciale 增强版,分别聚焦日常任务与极致推理场景。在蓝耘 MaaS 平台,用户注册账号后进入模型广场,可体验 DeepSeek-V3.2 模型,该模型生成代码思考效率提升,如生成机器学习聚类代码仅用 1.5 秒。此外,用户还可在 Chatbox 中接入蓝耘 DeepSeek-V3.2 API,添加配置信息(包括 API 域名、路径、密钥和模型名称)后新建对话测试验证。

欢迎 点赞👍 | 收藏⭐ | 评论✍ | 关注🤗

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐