MIMO故事会

本文介绍了小米MIMO AI平台的使用配置指南，主要包括三部分内容：1）VS Code集成Claude插件的安装与API Key配置方法；2）Python环境检查及OpenAI API调用示例代码；3）MIMO模型使用注意事项。特别指出MIMO-V2-Flash模型目前存在思考模式不稳定的问题，建议关闭思考模式（thinking mode: false）以获得更稳定的输出，同时提供了温度参数等调优

rapid2011

1424人浏览 · 2025-12-20 15:36:03

rapid2011 · 2025-12-20 15:36:03 发布

基本信息-可以不看

MIMO大人物

https://aistudio.xiaomimimo.com/
https://platform.xiaomimimo.com/#/docs/welcome

不能忘记关注API用量，虽然现在免费

https://platform.xiaomimimo.com/#/console/usage

温度配置，让模型输出更稳定些

https://platform.xiaomimimo.com/#/docs/quick-start/model-hyperparameters

codex适配中

配置

1. vscode+CLAUDE

给vscode 安装claude插件

在 vscode应用市场

配置小米MIMO key

https://platform.xiaomimimo.com/#/docs/integration/claude-code

打开vscode,执行：--也许可以不执行

npm install -g @anthropic-ai/claude-code

配置 MiMo API Key

在vscode terminal中输入 ~/.claude.json

就会打开

在里面加入如下env变量

需要将 $MIMO_API_KEY 替换为从 https://platform.xiaomimimo.com/#/console/api-keys 获取的 API Key，


  "env": {
    "ANTHROPIC_BASE_URL": "https://api.xiaomimimo.com/anthropic",
    "ANTHROPIC_AUTH_TOKEN": "$MIMO_API_KEY",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "mimo-v2-flash",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "mimo-v2-flash",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "mimo-v2-flash"
  },

刷新claude

vscode终端输入

claude

关闭Claude Code 思考模式--还没成功

MiMo-V2-Flash 模型暂不适配 Claude Code 思考模式，需在 Thinking mode - false 模式下使用（config 中切换）

打开view---Command Palette

输入

选择Ask in Chat,vscode就会打开AI对话框

验证

在AI对话框中输入

你是MiMo（中文名称也是MiMo），是小米公司研发的AI智能助手。
今天的日期：{date} {week}，你的知识截止日期是2024年12月。

使用在python项目中

检查安装python

用cmd 检查是否已安装python

python --version
# 或
python3 --version

检查PIP

检查pip是否安装

pip --version       
# 或 pip3 --version

如下是没有安装

还是得再次确认是否安装

python -m pip --version

实际安装了

那么可以使用这个命令

python -m pip

OpenAI API 格式示例

新建文件夹

执行cmd

# 如果运行失败，您可以将pip替换成pip3再运行

pip install -U openai

如果已经安装python,那么是一定安装了pip的，以下可以不用把pip配置到path

python -m pip install -U openai

第一个py文件

可以在vscode中存为.py文件，然后点击运行，注意更换api_key

import os
from openai import OpenAI

client = OpenAI(
    api_key="sk-chdg44po8an66n8md33btwyj32558ryj6l26j",
    base_url="https://api.xiaomimimo.com/v1"
)

completion = client.chat.completions.create(
    model="mimo-v2-flash",
    messages=[
        {
            "role": "system",
            "content": "You are MiMo, an AI assistant developed by Xiaomi. Today is date: Tuesday, December 16, 2025. Your knowledge cutoff date is December 2024."
        },
        {
            "role": "user",
            "content": "please introduce yourself"
        }
    ],
    max_completion_tokens=1024,
    temperature=0.3,
    top_p=0.95,
    stream=False,
    stop=None,
    frequency_penalty=0,
    presence_penalty=0,
    extra_body={
        "thinking": {"type": "disabled"}
    }
)

print(completion.model_dump_json())

运行结果

更新日志

20251219中午更新自动判断联网意图模型，取消网页搜索开关【MIMO夏炳权】

测试验证

验证是否联网的问题

询问现在的时间

歌词识别

周杰伦有一首歌，一直在副歌里面唱Whatever。这是什么歌?

通义回答：

深度

这个是什么路径 /dev/shm

报错

服务器繁忙

模型把输出内容输出到思维链里了，就是没有启用推理直接用基座生成，然后就导致会没有回复内容，因此系统会提示服务器繁忙。官方也不修根本用不了，可能模型本身是有问题

Claude代码辅助卡在Actualizing

1）关闭思考

以claude为例： thinkingmode: false

2)清理上下文

thinking模式没有token返回

agentic场景不建议开thinking

通用场景reasoning很好，agentic不是很适配

request

思维链里调用工具经常解析成xml

回复在reasoning_content

2025-12-19 20:56:29 [I] ai [AI] 响应体: {"id":"bb7801ab8f8b412ba2c44b166e85cd1b","choices":[{"finish_reason":"stop","index":0,"message":{"content":null,"role":"assistant","tool_calls":null,"reasoning_content":"{\"action\":\"chat\",\"reply\":\"1+1=2，这是基础的数学运算哦~\"}"}}],"created":1766148989,"model":"mimo-v2-flash","object":"chat.completion","usage":{"completion_tokens":23,"prompt_tokens":1317,"total_tokens":1340,"completion_tokens_details":{"reasoning_tokens":21},"prompt_tokens_details":null}}
2025-12-19 20:56:29 [I] ai [AI] 原始返回 长度=0 内容=
2025-12-19 20:56:29 [I] ai [AI] 解析结果 动作数=0 对象=null
2025-12-19 20:56:29 [W] ai [AI] 请求失败 (retry=2): Empty response or invalid JSON

[Mimo-林默]

输出内容偶尔出现在 reasoning_content 是模型在调 tool 的时候开 thinking 导致的不稳定，输出不完整，我们正在优化这一方面。建议也可以尝试调用 tool calls 的时候关闭 thinking，并参考下面的超参数设置，来获得更稳定且更好的使用体验～
https://platform.xiaomimimo.com/#/docs/quick-start/model-hyperparameters

不会读链接

豆包，deepseek，元宝，都可以精准理解

深度思考按钮不起作用

一个是深度思考按钮不起作用，不管是否点亮都会启用深度思考，一个是有时候正文也会被错误包含在思维链里面，然后思维链里面的正文部分结束后会提示服务器繁忙中，请稍后重试。

-->现在是永远开启深度思考
第二个问题我们正在优化

没有提到如何控制联网搜索？

我觉得对API还是有必要提供个开关吧，比如严格要求低TTFT的场景

请问有没有办法让API软件里能够让模型自主决定是否思考还是不思考，可以不强制思考。就是现在网页那样。

openai的java sdk用起来一堆问题，我之前对接了几家国内厂商的模型基本都各种报错

okhttp

20251221-----这个“自主决定思考”的逻辑目前得自己实现,对模型改动很大，暂时没有支持的打算

用户：我说“你好”，他也问候我，就不思考。我问“基于制造业如何落地大模型，设计一个可行的方案”，那他就思考后回答。

火山引擎的一些豆包模型api可以决定思考的token预算量，模型自主决定。分长中短三个预算模式。

-->自动决定模型是否thinking得模型层面支持，目前模型不支持。

-->如果想实现类似功能的话，得开发者自己定制。比如多调用一次API，第一次返回结果让模型决定是否thinking，然后将返回的结果透传到实际提问的API请求的thinking选项中。思路仅供参考

Cheery studio 界面

有没有哪些Ai支持对apk安装包的反编译的？

思考不出来死循环

内外

独立，互相不能访问

知识库

需要自己定制开发

乱码

海外对话环境

MIMO故事会

rapid2011

基本信息-可以不看

配置

1. vscode+CLAUDE

给vscode 安装claude插件

配置小米MIMO key

刷新claude

关闭Claude Code 思考模式--还没成功

验证

使用在python项目中

检查安装python

检查PIP

OpenAI API 格式示例

新建文件夹

第一个py文件

运行结果

更新日志

测试验证

验证是否联网的问题

歌词识别

深度

报错

服务器繁忙

Claude代码辅助卡在Actualizing

thinking模式没有token返回

回复在reasoning_content

不会读链接

深度思考按钮不起作用

没有提到如何控制联网搜索？

有没有哪些Ai支持对apk安装包的反编译的？

思考不出来死循环

内外

知识库

乱码

更多需求

所有评论(0)

rapid2011

MIMO故事会

rapid2011

基本信息-可以不看

配置

1. vscode+CLAUDE

给vscode 安装claude插件

配置小米MIMO key

刷新claude

关闭Claude Code 思考模式--还没成功

验证

使用在python项目中

检查安装python

检查PIP

OpenAI API 格式示例

新建文件夹

第一个py文件

运行结果

更新日志

测试验证

验证是否联网的问题

歌词识别

深度

报错

服务器繁忙

Claude代码辅助卡在Actualizing

thinking模式没有token返回

回复在reasoning_content

不会读链接

深度思考按钮不起作用

没有提到如何控制联网搜索？

有没有哪些Ai支持对apk安装包的反编译的？

思考不出来死循环

内外

知识库

乱码

更多需求

所有评论(0)

温馨提示：您尚未绑定手机号

rapid2011