前言

deepseek-v3.2-Speciale,3月1日发布已经第三天了,本来想第一天就搞,但周一异常的困,不过昨天也干了通宵现在才来写博客。

sp开没开源我都不知道,ds最近发了个math-v2和sp拿了什么数学金牌测评,好像只有openai和google也说自己能拿,但只有ds开源了。

先说结论:gemini3pro从感官上来说全胜,不想深度观察的直接撤吧。

另外SP的思考过程超久,稍微复杂一点的问题就要思考十分钟往上了。。。现在测评吹牛的多,用的没几个可能和这个也有关系(ds网页版截止到写稿时还不能体验)

参数

  • gemini3pro:官方网页版(非studio)无法设置参数,白嫖了会员再用
  • deepseek-v3.2-Speciale:官方API,但走的是openai兼容协议
    • temperature=0.7
    • top_p=0.6还是0.5我不记得了,因为我后来调整过一次配置,sp思维链太长了

Prompt1

帮我用最短的代码实现一个纯H5肉鸽游戏,刷怪每达到一定条件获得三选一能力,怪不断变强,能力可以叠加变化,地图随机变化,自行分析并扩展需求,然后实现它!

Gemini3Pro(理论上还是preview,web版没显示)

体验地址:https://demo.bpdream.com/2512a/g3prosimplerg.html
评论:一次开机,符合预期

gemini3pro prompt1
战斗界面
升级界面

deepseek-v3.2-Speciale

体验地址:https://demo.bpdream.com/2512a/ds32spsimplerg.html

评论:一次开机,一言难尽,但ds可能仔细思考了我说的用最少代码实现

感言:这个一开始我还以为不能玩,后来把代码给ai解释了下玩法,好像确实能玩,ai分析的还有很多功能我就不放了,因为我根本打不出来,超级难,我只打过一次下一关

值得一提的就是这个有下一关,但肉鸽无限循环没下一关其实也正常

ds游戏界面1

过关

Prompt2

帮我实现一个纯H5肉鸽游戏,刷怪每达到一定条件获得三选一能力,怪不断变强,能力可以叠加变化,地图随机变化,自行分析并扩展需求,然后实现它!

思考:起初我是害怕提示词里短代码限制了gemini发挥,设计了两个提示词,毕竟ds-sp思维链超长,但结果是限制住了ds-sp,gemini稳定发挥

gemini3pro结果体验地址:https://demo.bpdream.com/2512a/g3pronosimplerg.html

deepseek-v3.2-Speciale结果体验地址:https://demo.bpdream.com/2512a/ds32spnosimplerg.html

分析

Gemini:多了地形和开始界面
Deepseek:变的和gemini类似也有开始界面和地形,但整体UI+画面较丑,子弹需要点鼠标不是自动释放。肉鸽抽卡在,我懒得截图了。
ds依旧可以过关,gemini还是循环模式,ds整体偏难。ds还是一次开机,gemini这次有个bug,第一次抽卡之后游戏就卡死了,修了一次才好,考虑到网页版可能因为参数不可控,不带入评价因素。

gemini游戏界面2-1
gemini游戏界面2-2
下面这张是DS的
ds游戏界面2

趣事

说来就烦其实这个事我已经搞2天了,第一天从coze搞到dify搞了很久,今天做测试的时候发现dify有个十分钟超时(可能是openai协议兼容插件导致的,ds和openai的插件都不适配sp,截止到我测试时),我env所有timeout都改了,还是绕不掉这个超时。。。最后用trae前一段新出的solo模式,写了web出来,花了1个半小时。
demo
这个我也部署了,但就不发出来了,token挺贵的,而且我2号早上玩的时候接口还总是繁忙。

总结

感官上讲gemini完胜,不过deepseek-v3.2-sp本来也不是冲着日常使用去的,我还是期待deepseek年前的大版本迭代(希望有)。从prompt1表现上看,ds-sp思维链跑了十分钟确实跑出了不一样的想法和不一样的东西,且一次点亮还有可玩性(我用v3.2-think也跑了 跑出来也是小球打子弹,全是bug我懒得放了)

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐