MaxCompute SQL AI 全新上线,一句SQL就能用上大模型,零门槛让数据分析师秒变AI高手。

在大模型能力飞速进化、推理成本持续下降的今天,AI 正从“可选项”变为大数据处理流水线中的“必选项”。越来越多的场景——无论是文本摘要、实体抽取,还是多模态的图像识别、金融风控中的行为分析——都开始用模型推理替代传统的规则逻辑,实现更智能、更精准的数据处理。

MaxCompute SQL AI 的出现,正是为了把强大的AI能力交到每一位开发者的手中。作为MaxCompute的SQL开发人员,你将无需切换开发环境、无需学习新框架,只需用熟悉的 SELECT 语句,就能完成端到端的 AI 增强计算。借助大模型对结构化与非结构化数据的深度理解能力,你的SQL也将不再只是操作表格的工具,而是能直接调用 AI 进行语义理解、内容生成和智能转换的统一语言。

MaxCompute 模型三大优势,让 AI 更高效融入数据处理

  • 统一管理,安全合规

模型在 MaxCompute 中可以像数据一样被对待——支持权限控制、版本管理,全面满足企业对安全性与合规性的要求,让模型在受控环境中高效落地。

  • 多引擎无缝协同

无论是习惯写 SQL 的数据分析师,还是依赖 Python 的数据科学家,MaxCompute 都为你打通了路径:通过 SQL 或借助 MaxFrame 的分布式 Python 能力均可直接对接MaxCompute模型,全角色覆盖。

  • 简化运维

告别“导出-计算-回传”的繁琐流程!模型调用可以直接在MaxCompute内执行,既避免了数据外泄风险,又省去了传输成本与延迟,安全、高效、一步到位。

MaxCompute 模型类型全面,覆盖各类使用场景

模型是在 MaxCompute 中注册的、可以用于进行预测或生成任务的部署对象。主要目的是将诸如大语言模型、机器学习模型提供的AI 计算能力,无缝地集成到用户数据所在的同一个平台(MaxCompute)中。

MaxCompute的提供了不同类型的模型,覆盖用户使用过程中的各类场景:

模型类型

能力描述

公共模型

MaxCompute内置了开箱即用多种的开源大模型,支持用户无须自行创建和管理模型对象,即可灵活使用AI Function调用模型,降低了用户使用门槛。

支持模型如下:

  • Qwen3-0.6B-GGUF
  • Qwen3-1.7B-GGUF
  • Qwen3-4B-GGUF
  • Qwen3-8B-GGUF
  • Qwen3-14B-GGUF
  • DeepSeek-R1-Distill-Qwen-1.5B
  • DeepSeek-R1-Distill-Qwen-7B
  • DeepSeek-R1-Distill-Qwen-14B
  • DeepSeek-R1-0528-Qwen3-8B

远程模型

支持对接 PAI-EAS上已经部署好的模型,指定对应访问Endpoint和token,注册成为MaxCompute远端模型,从而直接使用AI Function调用模型。

内部训练模型

支持用户使用MaxCompute Maxframe进行传统机器学习模型训练,执行 to_odps_model将其保存成为MaxCompute内部训练模型。

导入模型

实际业务场景中,内置公共模型可能无法完全满足业务需求,支持用户将微调模型导入至MaxCompute,在后续推理中使用。

用户可以在MaxCompute产品控制台随时查看公共模型和用户模型信息。

MaxCompute SQL AI 实践示例

MaxCompute 提供了 基于SQL语言的 SQL AI Function,支持指定 MaxCompute 模型对象进行推理调用,包括内置提供的公共大语言模型,用户导入模型及远程模型,让SQL开发者可以用熟悉的SQL语言轻松驾驭大模型!

示例 1:一句话问答,快速获取信息

调用 MaxCompute 内置的轻量级公共模型 Qwen3-0.6B-GGUF,直接生成答案:

SET odps.sql.using.public.model=true;
SELECT AI_GENERATE(
  bigdata_public_modelset.default.Qwen3-0.6B-GGUF,
  DEFAULT_VERSION,
  'What is the capital of China?'
);
  • 返回结果:

"The capital of China is **Beijing**."

示例 2:批量情感分析,洞察用户声音

使用更强的 Qwen3-1.7B-GGUF 模型,对多条用户评论自动进行情感分类(仅输出“正面”“负面”或“中性”):

SET odps.sql.using.public.model=true;
SELECT 
    prompt,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请对以下评论进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的评论:', prompt)
    ) AS generated_text
FROM (
    VALUES 
        ('今天天气真好,心情很不错!阳光明媚,适合出去散步。 /no_think'),
        ('今天天气真好,心情很不错!阳光明媚 /no_think'),
        ('科技发展日新月异,人工智能改变生活。 /no_think'),
        ('疫情防控措施很到位,为医护人员点赞! /no_think'),
        ('这个商品质量很差 /no_think')
) t (prompt);
  • 返回结果:

prompt

generated_text

今天天气真好,心情很不错!阳光明媚,适合出去散步…

正面

今天天气真好,心情很不错!阳光明媚

正面

科技发展日新月异,人工智能改变生活。

正面

疫情防控措施很到位,为医护人员点赞!

正面

这个商品质量很差

负面

MaxCompute SQL AI 能力已经正式上线,无论你是想快速验证一个 AI 想法,还是构建企业级智能数据流水线,现在都可以用最熟悉的 SQL 语言轻松实现。

🔥 立即体验:登陆控制台,创建并连接你的MaxCompute项目,开始调用大模型吧!

📚 深入学习:查看官网文档《模型与AI Function》章节,查看更多语法细节及场景示例。

AI 并不遥远,它就在你的下一条 SELECT 语句里。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐