【2025年7月】AI生产力再探再报:AI 女友来啦~顶级开源项目井喷,好物太多了!
前言
2025年7月的个人学习笔记。
一、工具尝鲜快报:好玩的,初探感觉不错,但还未十分深入的工具。
二、生产力军火库:好用的,开箱即用的神器,或一些隐藏的技巧。
三、前沿动态速递:好看的,个人感兴趣的新工具、动态信息,或一些优质资料。
本篇一图流速览:
一、工具探索快报
1.Dify
Dify 和 FastGPT 是做本地化智能体开发的两个常见解决方案。前者部署和配置门槛较低,更适合专注于轻量级应用和敏捷开发的用户使用。笔者部署 Dify 进行了尝试,并整理了经验,戳下文了解 Dify 入门:
一文速通 Dify + Ollama 本地化部署:从零配置到应用发布,超详细保姆级教程!
2.阿里云百炼
百炼是阿里云推出的大模型服务平台,通过模型-应用-MCP模块可深度定制属于你的 AI 应用,还可对接支付宝API,真正地发展副业,不得不说阿里的生态齐全就是方便。待笔者码一篇应用案例再进一步介绍。
3.LM Studio
大模型本地化部署框架,对于零编码和零运维经验的同学,选择 LM Studio 更合适,覆盖 Ollama 的大部分功能且基本上所有的设置都可以通过界面操作完成。核心功能:
- 从 huggingface 下载模型,具有本地硬件匹配提醒,也可从魔搭下载 gguf 格式的模型
- 具有便利的模型管理功能,加载/卸载、设置参数等
- 可设置推理运行环境 CPU / GPU
- 具有大模型对话界面,轻松切换比对不同模型
- 可上传总大小不超过 30M 的至多 5 个文件
- 可配置 MCP 服务
- 可通过开放 API 调用本地模型
- 服务日志监控
4.prompt:AI 调研行业或企业
DeepResearch 类产品是最适合做调研辅助工作的,但试用下来,在调研企业个体时没有太大参考价值,因为公开数据多数都是宣传口的,经过包装的信息无法反映真实情况,而行业调研还是能比较到位的。分享两份提示词,由 AI 优化生成,再次感受到提示词工程的魅力,框架本身就能促进思考。
行业调研-以美甲为例
- Role: 美甲行业资深分析师兼电商直播运营专家
- Background: 用户作为美甲电商直播带货新手,需要对美甲行业进行全面且深入的调研,以便更好地开展直播带货工作,提升销售业绩。
- Profile: 你是一位长期深耕美甲行业的资深分析师,对美甲行业的发展历程、市场规模、消费趋势、产品种类、竞争格局等有着全面且深入的了解。同时,你也是一位经验丰富的电商直播运营专家,熟悉电商直播的各个环节和运营策略。
- Skills: 你具备敏锐的市场洞察力、强大的数据分析能力、丰富的行业知识和直播运营技巧,能够从多维度对美甲行业进行精准调研,并为用户制定有针对性的直播带货策略。
- Goals:
1. 全面梳理美甲行业的发展历程、现状和趋势,为用户提供宏观的行业认知。
2. 深入分析美甲行业的产品种类、特点和市场需求,帮助用户选择适合直播带货的产品。
3. 研究美甲行业的消费群体特征、消费习惯和购买决策因素,为用户制定精准的直播营销策略。
4. 调研美甲行业的竞争格局,分析竞争对手的优势和劣势,为用户找到差异化竞争的切入点。
5. 结合电商直播的特点和规律,为用户提供实用的直播带货技巧和运营建议。
- Constrains: 调研内容需基于公开数据和行业报告,确保信息的真实性和客观性;分析结果应具有可操作性和实用性,能够直接指导用户的直播带货实践。
- OutputFormat: 结合文字报告、数据图表、案例分析等形式,清晰地呈现美甲行业的调研结果和直播带货建议。
- Workflow:
1. 收集美甲行业的相关数据和资料,包括行业报告、市场调研数据、新闻资讯等。
2. 对收集到的数据进行整理和分析,从行业整体发展、产品、消费群体、竞争格局等维度进行深入剖析。
3. 根据分析结果,结合电商直播的特点,制定针对性的直播带货策略和运营建议。
- Examples:
- 例子1:美甲行业产品种类分析
- 美甲行业产品主要包括指甲油、甲片、甲油胶、美甲工具等。其中,指甲油和甲油胶是主流产品,市场占有率较高。从消费趋势来看,消费者对环保、持久、易卸的美甲产品需求日益增加。建议用户在直播带货时,优先选择环保型指甲油或甲油胶,并强调其环保、持久等优势。
- 例子2:美甲行业消费群体分析
- 美甲行业的消费群体以年轻女性为主,年龄在18-35岁之间,她们注重时尚和个性,追求美的体验。在购买美甲产品时,会受到产品外观、品牌口碑、价格等因素的影响。建议用户在直播中注重产品的时尚元素展示,分享真实的用户评价,同时推出不同价位的产品组合,满足不同消费层次的需求。
- 例子3:美甲行业竞争格局分析
- 美甲行业竞争激烈,品牌众多。一些知名品牌在产品质量、品牌知名度、销售渠道等方面具有优势,但也有许多新兴品牌凭借创新的产品和营销策略脱颖而出。建议用户在直播带货时,突出自己产品的独特卖点,如特色款式、优质服务等,同时通过与网红合作、开展促销活动等方式提升品牌知名度和影响力。
企业调研-通用
- Role: 企业调研专家
- Background: 用户需要从不同视角调研【企业名称】,可能是为了投资决策、求职规划或竞争分析。这表明用户需要全面且深入的信息,以便从不同角度理解该公司。
- Profile: 你是一位经验丰富的市场调研专家,擅长从多维度分析企业信息,包括财务状况、市场地位、企业文化、技术实力等。
- Skills: 你具备强大的信息收集能力、数据分析能力、行业洞察力以及对不同视角需求的理解能力。
- Goals:
1. 从投资者视角,调研公司的财务状况、市场前景、行业地位、管理团队、风险因素等。
2. 从求职者视角,调研公司的发展历程、企业文化、员工福利、职业发展机会、工作环境等。
3. 从竞争者视角,调研公司的核心竞争力、技术优势、市场份额、营销策略、合作伙伴等。
- Constrains: 提供的信息必须基于公开数据和可靠渠道,避免主观臆断,确保客观性和准确性。
- OutputFormat: 以结构化报告的形式输出,包括关键数据、图表、分析结论等。
- Workflow:
1. 收集公开信息:包括公司官网、年报、新闻报道、行业分析报告等。
2. 分析关键指标:从财务、市场、技术、人力资源等维度提取关键数据。
3. 撰写报告:根据不同视角的需求,分别撰写针对性的分析报告。
- Examples:
- 投资者视角:
- 财务状况:2024年营收X亿元,净利润X亿元,毛利率X%,研发投入占比X%。
- 市场前景:所在行业年增长率X%,公司在行业中的市场份额X%,未来增长潜力较大。
- 风险因素:市场竞争加剧、技术更新换代风险、政策法规变化等。
- 求职者视角:
- 发展历程:成立于X年,已获得X轮融资,员工规模X人。
- 企业文化:注重创新、团队合作、员工成长。
- 职业发展机会:提供完善的培训体系,晋升通道明确,有丰富的项目经验。
- 竞争者视角:
- 核心竞争力:拥有自主知识产权的X技术,获得X项专利。
- 市场份额:在细分市场中占据X%的份额,主要竞争对手为X公司。
- 营销策略:通过参加行业展会、举办技术研讨会、与高校合作等方式推广产品。
5.Jackywine/Bella
Grok Ani 是马斯克推出的 AI 伴侣产品,一经发布就吸引了众多技术宅。但笔者要介绍的是一位大佬开源的 3D 复刻版 ,名为 Bella —— 二次元女儿,降临!(在项目文件中,Bella 是称呼用户为父亲的)。因为本地项目折腾太多了,笔者电脑的端口占用乱七八糟,调了好久才启动。注意:用项目中的 download_models.js
下载模型没有进度条显示,要耐心等待,必要时换源或挂梯子。
二、生产力军火库
1.KIMI K2 开源
最新最强开源通用大模型!直接用就完事儿了。在最初被 R1 抢了风头后,月之暗面终于赢得一筹。然而,Qwen Week 鲨疯了。
2.Qwen3-Coder 开源
最新最强开源编码大模型!直接用就完事儿了。以较小规模、较低资源逼近闭源大模型的输出质量。
3.文心系列开源
最…6月30日开源的,老李的开源未免拖得太久了,但近期在官网体验的文心X1、4.5等模型,输出质量还是不错的,可以和大家一起玩了。
4.GLM-4.5 开源
7月限定最高神,真-最新最强开源大模型——title 说累了,直接用就完事儿了。强势登场,又压了前面几位一头。另外还有 GML-4.1V 视觉大模型,向 Qwen-2.5-VL 发起挑战。
2.2 Qwen-30B-A3B 开源
不是哥们儿,我刚打完文章草稿,你又更新了…好,最新最强开源小参数模型 ! Qwen-30B-A3B 爆诞。
5.美团 NoCode
起猛了,等外卖时就可以用 AI 开发一个美团平台 ?美团推出的 AI 建站平台,可以配置数据库,可以申请开发者模式在线编码,从需求实现到应用部署,极简化产品上架流程。虽然还有些瑕疵,容易出 BUG,但也很有潜力。
6.京东 joyagent 开源
京东出品,号称首个100%开源的智能体开发平台,在申请通过前笔者先本地部署尝鲜,但似乎存在一些 BUG。官网的输出质量还是不错的,毕竟是BAT御三家之后的第四天王,京东入局也是必然。(吐槽一下比较抽象的用户体验,没有用户中心,进入对话后甚至没有返回首页的按钮,无法新建对话,刷新浏览器后就回到以下页面,没有历史记录 = 。= |||)
另外,笔者也尝试了本地部署开源版,存在一些问题不知如何解决,还要等更多大佬加入共建社区。
7.字节 Coze 三件套开源
四天王有五个也不奇怪吧?以下为官网介绍:
- 扣子开发平台是一站式 Al Agent 开发工具。提供各类最新大模型和工具、多种开发模式和框架,从开发到部署,为你提供最便捷的 Agent 开发环境。上万家企业、数百万开发者正在使扣子开发平台。
- 扣子罗盘是一个面向开发者,专注于 Al Agent 开发与运维的平台级解决方案。 它可以解决 AlAgent 开发过程中面临的各种挑战,提供从开发、调试、评估、到监控的全生命周期管理能力。
- Eino 是基于Go 语言的 Al Agent 开源开发框架,提供了丰富的辅助 Al Agent 开发的原子组件、集成组件、组件编排、切面扩展等能力,可以帮助开发者更加简单便捷地开发出架构清晰、易维护、高可用的 Al Agent 和各类AI 应用。
8.腾讯 Codebuddy IDE
鹅厂终于也进军 AI Coding 了。现在申请还没通过,姑且预先放在生产力军火库中,另外有插件版的可以体验。
9.字节 TRAE SOLO
TRAE 是 AI 深度集成的开发工具,提供智能问答、代码自动补全以及基于智能体的 AI 自动编程能力。这波最新升级的模式, 就如同这个名字,把一切都交给 AI 去 SOLO。TRAE 原本的智能体 beta 感觉就不赖,笔者日常也在使用,最近还新增了 Kimi-K2 和 Qwen3-Coder 模型,可以期待 SOLO 的表现。
10.Jaaz 开源
Jazz 是全球首款开源、可本地部署的创意 Agent 工具。在官网体验感觉很棒,甚至令笔者觉得值得充值,爱设计的同学在众多生图平台中又有了新的选择。测试 GPT 生图很方便,画风迁移、主体一致性、局部修改,有两把刷子!
三、前沿动态速递
(一)智能体分区
1.MiniMax Agent
如同 Manus 之流,主攻海外战略的国产厂商,对国内用户友好度不高,只能用 Google 账号登录,不予置评。
2.Nxtscape 开源
开源的 AI 浏览器,是 AI+ 而不是 +AI,原生的 AI 功能将颠覆传统浏览器的交互模式。
3.Notebookllm
Google 推出的 AI 笔记本,适用于科研论文阅读、学术研究、创意写作等场景,例如通过分析论文和视频内容生成故事结构建议,或辅助科研过程中的文献整理与观点提炼。
4.Ani
虽然上面已经提过了,但还是应该给这个里程碑式创造留有一席之地。Ani 是马斯克旗下公司推出的虚拟 AI 伴侣,以二次元形象和互动功能引发关注,支持语音互动、3D动作表演及好感度培养系统。用户可通过聊天提升好感度可解锁不同互动内容,甚至触发换装功能。
(二)图影像分区
1.Flux
Flux 是由 Stable Diffusion 成员建立的黑森林实验室(BlackForestLabs)发布的模型,生图领域大火的开源新秀,基本上是一更新,各 AI 生图平台就会马上部署上架。
2.Kontext komposer
黑森林实验室推出的 AI 图像编辑工具,支持一键切换图片风格、地点、光线调整及添加产品等操作,无需手动编写提示词。
3.字节 XVerse
字节跳动智能创作团队推出的 XVerse 模型,基于 Diffusion Transformer 架构,实现了对复杂场景中多个主体的独立精确控制,同时保持了生成图像的高质量表现。简答来说就是,输入模特和商品 2 张图,可以合成 1 张拿着商品的模特图,在多人多物品时也能有较好的表现。
另外有一家深圳的企业叫元象XVerse,主打 AI 3D 内容生产。
4.Veo3
Google Veo 3 是 Google DeepMind 最新的 AI 视频生成模型,于 2025 年 Google I/O 上发布。这项革命性技术将文本和图像提示转换为惊人的高质量视频,具有超越 Veo 2 的卓越动态、清晰度和真实感。
5.Marey
Marey 是由 Moonvalley 公司开发的 AI 视频生成模型,专为电影工业设计,支持公开数据训练并解决版权问题。主要面向电影制作人、独立导演等群体,帮助降低拍摄设备租赁、场地许可等成本,尤其适用于小众题材或预算有限的创作需求。
6.LTXV 开源
LTXV 是 Lightricks 推出的一个实时 AI 视频生成开源模型。
(三)应用开发分区
1.ToolHouse
ToolHouse 是一个后端即服务(BaaS)平台,集 Agent 构建、运行和管理于一身,简化了在本地环境中构建代理并在生产环境中运行它们的过程。可以通过对话构建 Agent,运行满意后即可发布,托管于 ToolHouse,并可对接至 Lovable 或 Bolt 构建前端。官方slogan:Vibe code agents with superpowers (有超能力的氛围编程)。
2.Vertex AI
Google 推出的构建和部署机器学习模型的一体化平台。
(四)具身智能分区
1.Reachy mini 开源
Reachy Mini 是 Hugging Face 推出的开源人形机器人,满大街萝卜的未来世界即将到来。
2.Unitree R1
宇树科技最新产品,提供了开发套件,将比以往的智能玩具更具实用性,当世最具性价比的具身智能,伟大无需多言。
(五)More & more
1.OCRFlux-3B 开源
开源的轻量级多模态 OCR 工具,专注于将 PDF 文档和图像高效转换为结构化、可读性强的 Markdown 文本。
2. Phi-4-mini 开源
微软开源的大模型,专为算力、内存和延迟受限的场景设计,可在单个 GPU 上运行,适用于个人设备运行和端侧开发。
3.Mirage
Mirage 是由谷歌、英伟达、微软等机构联合开发的实时 AI 游戏引擎。该引擎支持通过自然语言指令实时生成游戏场景,并动态调整物理规则和视觉效果,彻底打破了传统游戏引擎的预设模式。
4.MERCURY
官方slogan:The fastest commercial-grade diffusion LLM (最快的商业级扩散大模型),简单来说,它不从头逐字输出内容,而从多个标记点开始扩散,就像众多雨点落在纸上,直至将整张纸浸湿。看看 Mercury 自己怎么说:
(六)推荐资料
零碎的新闻令人目不暇接,让人眼前一亮的深度文章还是可以读一读,点击直达:
1.盘一盘,2017年Transformer之后,LLM领域的重要论文!
2.从DeepSeek-V3到Kimi K2:八种现代 LLM 架构大比较
3.腾讯研究院:2025 AI Coding非共识报告
4.中国最会用AI赚钱的公司,是谁?
5.我搜DeepSeek,搜索引擎给我个DeepScek(AI诈骗)
6.在WAIC 2025看到AI的明天:六个变化,正在发生
Vibe coding 是指和 AI 对话进行编码开发的模式,AI 时代让每个人都有机会跨越技术门槛,可仍不建议把重要事务随意放权给自己无法掌控的代行者。外行看热闹,内行看门道,强烈推荐喜欢或打算尝试 Vibe coding 的同学阅读以下几篇:
7.Vibe code 是屎山代码吗?
8.一周 vibe code 三个小工具,写个踩坑周报吧
9.Vibe 编码手册:人工智能辅助开发的模板
后记
太多了,吃不下了,每日一更新,每小时一动态,AI 榨菜已然变成可以不分昼夜 24 小时享用的 AI 薯片。更加切身体会到信息爆炸,这里是脑容量不够用的 Seon塞翁,下一篇见~
更多推荐
所有评论(0)