AI 及开发领域动态与资源汇总(2025年8月11日)
·
| 产品/项目名称 | 分类 | 核心功能/简介 | 主要特点/亮点 | 开发者/来源 | 相关链接 |
|---|---|---|---|---|---|
| AI大模型 (Models) | |||||
| MiniCPM-V 4.0 | 多模态模型 | 基于SigLIP2和MiniCPM4-3B构建的高效多模态模型,适合端侧部署。 | 4.1B参数,强大的单/多图像及视频理解能力,效率高。 | 面壁智能(OpenBMB) | GitHub, Hugging Face |
| GPT-5 | 大语言模型 | OpenAI的下一代旗舰大模型。 | 向所有用户开放,Plus/Pro用户有更高额度或无限使用权限。 | OpenAI | - |
| Speech 2.5 | 语音生成模型 | 新一代多语种语音生成模型。 | 支持40种语言,能跨语种保留音色、复刻口音。 | MiniMax | - |
| dots.vlm1 | 多模态大模型 | 小红书首个开源多模态大模型。 | 基于自研12亿参数视觉编码器和DeepSeek V3构建。 | 小红书 | - |
| Qwen3-4B 系列 | 大语言模型 | 两款更小尺寸的端侧部署模型。 | 4B参数,支持256K超长上下文。 | 阿里通义千问 | - |
| Qwen-Image | 文生图模型 | 阿里最新的文生图大模型。 | 200亿参数,MMDiT架构,能精准生成含复杂文字的图像。 | 阿里巴巴 | - |
| MiDashengLM-7B | 声音理解模型 | 小米开源的声音理解大模型。 | 在22个公开评测集上取得SOTA成绩。 | 小米 | - |
| gpt-oss-120B/20B | 大语言模型 | OpenAI开源的两款MoE架构大模型。 | Apache 2.0许可,可微调,支持Agentic功能,原生MXFP4量化。 | OpenAI | GitHub, HF-20B |
| Claude Opus 4.1 | 大语言模型 | Anthropic的最新旗舰模型。 | 提升了智能体任务、真实世界代码处理和推理能力。 | Anthropic | - |
| 盘古大模型 | 大语言模型 | 华为开源的三款不同规模的模型。 | Ultra MoE版本达7180亿参数,采用混合专家架构。 | 华为 | - |
| KittenTTS | 语音生成模型 | 一个25MB大小的轻量级文本转语音AI模型。 | CPU本地运行,几分钟即可安装完毕。 | KittenML | GitHub |
| AI应用/产品 (Applications/Products) | |||||
| 腾讯ima | 内容创作 | 腾讯的内容创作平台。 | 新增AI播客、文件夹导入等功能。 | 腾讯 | - |
| 纳米AI多智能体蜂群 | AI视频生成 | 一句话生成高质量AI视频的平台。 | 号称可降低95%的视频制作成本。 | 纳米AI | - |
| 百度智能云数字员工 | 企业应用 | 具备特定业务技能的数字员工解决方案。 | 覆盖招聘、营销、客服等岗位,可接入企业内部系统。 | 百度智能云 | 官网 |
| Gemini个性化插画故事书 | 内容创作 | 在Gemini应用中通过提示词生成图文并茂的有声电子书。 | 数秒内生成10页内容,包含原创配图和朗读音频。 | 体验入口 | |
| 剪映小云雀 | AI视频/数字人 | 剪映旗下的内容创作Agent,新增文生数字人功能。 | 可通过提示词生成一致性角色,并自动完成视频剪辑全流程。 | 剪映(字节跳动) | - |
| OpenCreator AI Studio | AI视频生成 | AI Studio新增的批量视频生成功能。 | 一键为故事生成数百条短片,全流程自动化,保持角色一致性。 | - | 链接 |
| 开源框架/工具/库 (Frameworks/Tools) | |||||
| MiroTalk SFU | 视频会议 | 基于Mediasoup构建的WebRTC视频会议系统。 | 开源,支持高达8K/60fps,兼容主流浏览器。 | miroslavpejic85 | GitHub |
| Termix | 服务器管理 | 开源、自托管的全能服务器管理平台。 | 提供Web界面,可通过浏览器SSH连接和管理服务器。 | LukeGus | GitHub |
| TinyAuth | 认证中间件 | 为Docker应用添加登录界面或OAuth认证的中间件。 | 支持Google/Github等,兼容Traefik, Nginx, Caddy。 | steveiliop56 | GitHub |
| copyparty | 文件服务器 | 将目录快速变为多协议文件服务器的Python程序。 | 支持HTTP, WebDAV, FTP等多种协议。 | 9001 | GitHub |
| packetd | 网络工具 | 命令行网络数据包查看和解析工具。 | 支持多种网络协议,可查看完整对话。 | packetd | GitHub |
| pansou | 搜索引擎 | 开源的网盘资源聚合搜索API服务。 | 需要自行架设。 | fish2018 | GitHub |
| hyprnote | 会议助手 | 本地运行的AI会议助手。 | 自动监听线上会议,生成笔记和总结。 | fastrepl | GitHub |
| GithubStarsManager | GitHub管理 | 使用AI自动分类和管理GitHub Stars的工具。 | 支持自然语言搜索。 | AmintaCCCP | GitHub |
| SWE-Swiss | 模型开发方案 | 提升软件工程能力的高性能模型开发方案。 | 32B模型在SWE-bench上表现优异,提供完整复现代码。 | - | - |
| Investbrain | 投资追踪器 | 基于Laravel构建的智能开源投资追踪器。 | 集成多市场数据,支持与持仓进行AI聊天。 | - | - |
| MCP·RL | 强化学习框架 | OpenPipe推出的开源LLM+RL框架。 | Agent能自动发现工具、生成任务,在闭环中自我优化。 | OpenPipe | GitHub |
| LiYing | 照片处理 | 自动化处理证件照的Python程序。 | 模拟照相馆后期流程,提供Windows整合包。 | aoguai | GitHub |
| DocTron | 内容解析框架 | 通用视觉语言模型架构,用于结构化内容解析。 | 无需定制化模块,覆盖通用文档、公式、图表等。 | DocTron-hub | GitHub |
| ADK (Agent Dev Kit) | Agent框架 | 谷歌的模块化、高解耦的Agent构建框架。 | 任务导向,多Agent协同,提供20+高质量示例。 | adk-samples | |
| AgentFly | Agent框架 | 基于强化学习的可扩展语言模型智能体框架。 | 支持多轮训练,异步执行,集中式资源管理。 | - | - |
| Coze Studio | Agent开发工具 | 一体化的AI智能体开发工具。 | 集成提示/RAG/插件/工作流,支持无代码/低代码开发。 | - | - |
| Cognitive Kernel-Pro | Agent框架 | 腾讯AI Lab推出的全开源、多模块、层次化的智能体框架。 | 旨在为深度研究和智能体基础模型训练提供解决方案。 | 腾讯AI Lab | GitHub |
| Gemini Fullstack Quickstart | Agent应用模板 | React前端+LangGraph后端Agent的全栈应用模板。 | Agent能动态研究用户问题并给出带引文的答案。 | - | - |
| OxyGent | 多智能体框架 | 京东开源的多智能体协作框架。 | 帮助高效组装协作系统,实现弹性扩展和全链路可追溯。 | 京东零售Oxygen团队 | GitHub |
| Pixelle-MCP | ComfyUI工具 | 将ComfyUI工作流一键转换为MCP工具。 | 让支持MCP的客户端能以函数方式调用ComfyUI工作流。 | AIDC-AI | GitHub |
| Groq Code CLI | 开发工具 | Groq推出的命令行代码工具。 | - | Groq | GitHub |
| Open SWE | 代码Agent | LangChain Labs推出的开源、异步代码代理。 | 专长于处理长周期、高复杂度的编程任务。 | LangChain Labs | 官方博客 |
| 行业新闻/文章/资源 (News/Articles/Resources) | |||||
| Node.js 2025新写法 | 技术文章 | 介绍Node.js在新时代应该采用的新写法。 | - | kashw1n | 博客文章 |
| Dario Amodei的故事 | 人物报道 | 介绍Anthropic创始人兼CEO Dario Amodei的经历。 | 一个生物学博士如何创立Anthropic并做出Claude AI。 | Big Technology | 文章链接 |
| Linux服务器安全措施 | 技术资源 | 收录了启用Linux服务器后应采取的各种安全措施的英文仓库。 | - | imthenachoman | GitHub |
| SVG基础知识长文 | 技术文章 | 一篇详细介绍SVG格式基础知识的长文。 | - | Josh W. Comeau | 文章链接 |
| 谷歌大模型对抗赛 | 行业新闻 | 谷歌发起首届大模型国际象棋对抗赛。 | 8款顶级AI模型(OpenAI, Kimi等)参赛,全程直播。 | 谷歌/Kaggle | - |
| 苹果BCI HID协议 | 行业新闻 | 苹果与Synchron合作,让脑电波成为操作系统原生输入方式。 | 与触控、键盘并列,支持iOS, iPadOS, visionOS。 | 苹果/Synchron | - |
| mcp-for-beginners | 技术教程 | 覆盖五种主流编程语言的MCP协议原理与实战教程。 | 7.3k⭐,内容完整。 | - | - |
| MCP精选清单 | 资源集合 | 一个收集了各种优秀MCP相关项目和资源的列表。 | - | MobinX | GitHub |
更多推荐

所有评论(0)