MIMO故事会
本文介绍了小米MIMO AI平台的使用配置指南,主要包括三部分内容:1)VS Code集成Claude插件的安装与API Key配置方法;2)Python环境检查及OpenAI API调用示例代码;3)MIMO模型使用注意事项。特别指出MIMO-V2-Flash模型目前存在思考模式不稳定的问题,建议关闭思考模式(thinking mode: false)以获得更稳定的输出,同时提供了温度参数等调优
基本信息-可以不看
MIMO大人物
https://aistudio.xiaomimimo.com/
https://platform.xiaomimimo.com/#/docs/welcome
不能忘记关注API用量,虽然现在免费
https://platform.xiaomimimo.com/#/console/usage

温度配置,让模型输出更稳定些
https://platform.xiaomimimo.com/#/docs/quick-start/model-hyperparameters
codex适配中

配置
1. vscode+CLAUDE
给vscode 安装claude插件
在 vscode应用市场

配置小米MIMO key
https://platform.xiaomimimo.com/#/docs/integration/claude-code
打开vscode,执行:--也许可以不执行
npm install -g @anthropic-ai/claude-code
配置 MiMo API Key
在vscode terminal中输入 ~/.claude.json

就会打开

在里面加入如下env变量
需要将 $MIMO_API_KEY 替换为从 https://platform.xiaomimimo.com/#/console/api-keys 获取的 API Key,
"env": {
"ANTHROPIC_BASE_URL": "https://api.xiaomimimo.com/anthropic",
"ANTHROPIC_AUTH_TOKEN": "$MIMO_API_KEY",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "mimo-v2-flash",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "mimo-v2-flash",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "mimo-v2-flash"
},
刷新claude
vscode终端输入
claude
关闭Claude Code 思考模式--还没成功
MiMo-V2-Flash 模型暂不适配 Claude Code 思考模式,需在 Thinking mode - false 模式下使用(config 中切换)
打开view---Command Palette

输入

选择Ask in Chat,vscode就会打开AI对话框

验证
在AI对话框中输入
你是MiMo(中文名称也是MiMo),是小米公司研发的AI智能助手。
今天的日期:{date} {week},你的知识截止日期是2024年12月。

使用在python项目中
检查安装python
用cmd 检查是否已安装python
python --version
# 或
python3 --version

检查PIP
检查pip是否安装
pip --version
# 或 pip3 --version
如下是没有安装

还是得再次确认是否安装
python -m pip --version
实际安装了

那么可以使用这个命令
python -m pip
OpenAI API 格式示例
新建文件夹

执行cmd
# 如果运行失败,您可以将pip替换成pip3再运行
pip install -U openai
如果已经安装python,那么是一定安装了pip的,以下可以不用把pip配置到path
python -m pip install -U openai
第一个py文件
可以在vscode中存为.py文件,然后点击运行,注意更换api_key
import os
from openai import OpenAI
client = OpenAI(
api_key="sk-chdg44po8an66n8md33btwyj32558ryj6l26j",
base_url="https://api.xiaomimimo.com/v1"
)
completion = client.chat.completions.create(
model="mimo-v2-flash",
messages=[
{
"role": "system",
"content": "You are MiMo, an AI assistant developed by Xiaomi. Today is date: Tuesday, December 16, 2025. Your knowledge cutoff date is December 2024."
},
{
"role": "user",
"content": "please introduce yourself"
}
],
max_completion_tokens=1024,
temperature=0.3,
top_p=0.95,
stream=False,
stop=None,
frequency_penalty=0,
presence_penalty=0,
extra_body={
"thinking": {"type": "disabled"}
}
)
print(completion.model_dump_json())
运行结果
更新日志
20251219中午 更新自动判断联网意图模型,取消网页搜索开关 【MIMO夏炳权】
测试验证
验证是否联网的问题
询问现在的时间
歌词识别
周杰伦有一首歌,一直在副歌里面唱Whatever。这是什么歌?
通义回答:

深度
这个是什么路径 /dev/shm

报错
服务器繁忙
模型把输出内容输出到思维链里了,就是没有启用推理直接用基座生成,然后就导致会没有回复内容,因此系统会提示服务器繁忙。官方也不修根本用不了,可能模型本身是有问题
Claude代码辅助卡在Actualizing
1)关闭思考
以claude为例: thinkingmode: false

2)清理上下文
thinking模式没有token返回
agentic场景不建议开thinking
通用场景reasoning很好,agentic不是很适配

request

思维链里调用工具经常解析成xml
回复在reasoning_content
2025-12-19 20:56:29 [I] ai [AI] 响应体: {"id":"bb7801ab8f8b412ba2c44b166e85cd1b","choices":[{"finish_reason":"stop","index":0,"message":{"content":null,"role":"assistant","tool_calls":null,"reasoning_content":"{\"action\":\"chat\",\"reply\":\"1+1=2,这是基础的数学运算哦~\"}"}}],"created":1766148989,"model":"mimo-v2-flash","object":"chat.completion","usage":{"completion_tokens":23,"prompt_tokens":1317,"total_tokens":1340,"completion_tokens_details":{"reasoning_tokens":21},"prompt_tokens_details":null}}
2025-12-19 20:56:29 [I] ai [AI] 原始返回 长度=0 内容=
2025-12-19 20:56:29 [I] ai [AI] 解析结果 动作数=0 对象=null
2025-12-19 20:56:29 [W] ai [AI] 请求失败 (retry=2): Empty response or invalid JSON
[Mimo-林默]
输出内容偶尔出现在 reasoning_content 是模型在调 tool 的时候开 thinking 导致的不稳定,输出不完整,我们正在优化这一方面。建议也可以尝试调用 tool calls 的时候关闭 thinking,并参考下面的超参数设置,来获得更稳定且更好的使用体验~
https://platform.xiaomimimo.com/#/docs/quick-start/model-hyperparameters
不会读链接
豆包,deepseek,元宝,都可以精准理解

深度思考按钮不起作用
一个是深度思考按钮不起作用,不管是否点亮都会启用深度思考,一个是有时候正文也会被错误包含在思维链里面,然后思维链里面的正文部分结束后会提示服务器繁忙中,请稍后重试。
-->现在是永远开启深度思考
第二个问题我们正在优化
没有提到如何控制联网搜索?
我觉得对API还是有必要提供个开关吧,比如严格要求低TTFT的场景
请问有没有办法让API软件里能够让模型自主决定是否思考还是不思考,可以不强制思考。就是现在网页那样。
openai的java sdk用起来一堆问题,我之前对接了几家国内厂商的模型基本都各种报错
okhttp
20251221-----这个“自主决定思考”的逻辑目前得自己实现,对模型改动很大,暂时没有支持的打算
用户: 我说“你好”,他也问候我,就不思考。我问“基于制造业如何落地大模型,设计一个可行的 方案”,那他就思考后回答。
火山引擎的一些豆包模型api可以决定思考的token预算量,模型自主决定。分长中短三个预算模式。
-->自动决定模型是否thinking得模型层面支持,目前模型不支持。
-->如果想实现类似功能的话,得开发者自己定制。比如多调用一次API,第一次返回结果让模型决定是否thinking,然后将返回的结果透传到实际提问的API请求的thinking选项中。思路仅供参考
Cheery studio 界面

有没有哪些Ai支持对apk安装包的反编译的?
思考不出来死循环

内外
独立,互相不能访问
知识库
需要自己定制开发
乱码
海外对话环境

更多需求
1,增加图片、表格生成功能(更直观)
2,增加聊天记录某一条的删除功能(有时候生成的某个东西不满意,和满意的东西混在一起,很乱)
更多推荐



所有评论(0)