产品/项目名称 分类 核心功能/简介 主要特点/亮点 开发者/来源 相关链接
AI大模型 (Models)
MiniCPM-V 4.0 多模态模型 基于SigLIP2和MiniCPM4-3B构建的高效多模态模型,适合端侧部署。 4.1B参数,强大的单/多图像及视频理解能力,效率高。 面壁智能(OpenBMB) GitHub, Hugging Face
GPT-5 大语言模型 OpenAI的下一代旗舰大模型。 向所有用户开放,Plus/Pro用户有更高额度或无限使用权限。 OpenAI -
Speech 2.5 语音生成模型 新一代多语种语音生成模型。 支持40种语言,能跨语种保留音色、复刻口音。 MiniMax -
dots.vlm1 多模态大模型 小红书首个开源多模态大模型。 基于自研12亿参数视觉编码器和DeepSeek V3构建。 小红书 -
Qwen3-4B 系列 大语言模型 两款更小尺寸的端侧部署模型。 4B参数,支持256K超长上下文。 阿里通义千问 -
Qwen-Image 文生图模型 阿里最新的文生图大模型。 200亿参数,MMDiT架构,能精准生成含复杂文字的图像。 阿里巴巴 -
MiDashengLM-7B 声音理解模型 小米开源的声音理解大模型。 在22个公开评测集上取得SOTA成绩。 小米 -
gpt-oss-120B/20B 大语言模型 OpenAI开源的两款MoE架构大模型。 Apache 2.0许可,可微调,支持Agentic功能,原生MXFP4量化。 OpenAI GitHub, HF-20B
Claude Opus 4.1 大语言模型 Anthropic的最新旗舰模型。 提升了智能体任务、真实世界代码处理和推理能力。 Anthropic -
盘古大模型 大语言模型 华为开源的三款不同规模的模型。 Ultra MoE版本达7180亿参数,采用混合专家架构。 华为 -
KittenTTS 语音生成模型 一个25MB大小的轻量级文本转语音AI模型。 CPU本地运行,几分钟即可安装完毕。 KittenML GitHub
AI应用/产品 (Applications/Products)
腾讯ima 内容创作 腾讯的内容创作平台。 新增AI播客、文件夹导入等功能。 腾讯 -
纳米AI多智能体蜂群 AI视频生成 一句话生成高质量AI视频的平台。 号称可降低95%的视频制作成本。 纳米AI -
百度智能云数字员工 企业应用 具备特定业务技能的数字员工解决方案。 覆盖招聘、营销、客服等岗位,可接入企业内部系统。 百度智能云 官网
Gemini个性化插画故事书 内容创作 在Gemini应用中通过提示词生成图文并茂的有声电子书。 数秒内生成10页内容,包含原创配图和朗读音频。 Google 体验入口
剪映小云雀 AI视频/数字人 剪映旗下的内容创作Agent,新增文生数字人功能。 可通过提示词生成一致性角色,并自动完成视频剪辑全流程。 剪映(字节跳动) -
OpenCreator AI Studio AI视频生成 AI Studio新增的批量视频生成功能。 一键为故事生成数百条短片,全流程自动化,保持角色一致性。 - 链接
开源框架/工具/库 (Frameworks/Tools)
MiroTalk SFU 视频会议 基于Mediasoup构建的WebRTC视频会议系统。 开源,支持高达8K/60fps,兼容主流浏览器。 miroslavpejic85 GitHub
Termix 服务器管理 开源、自托管的全能服务器管理平台。 提供Web界面,可通过浏览器SSH连接和管理服务器。 LukeGus GitHub
TinyAuth 认证中间件 为Docker应用添加登录界面或OAuth认证的中间件。 支持Google/Github等,兼容Traefik, Nginx, Caddy。 steveiliop56 GitHub
copyparty 文件服务器 将目录快速变为多协议文件服务器的Python程序。 支持HTTP, WebDAV, FTP等多种协议。 9001 GitHub
packetd 网络工具 命令行网络数据包查看和解析工具。 支持多种网络协议,可查看完整对话。 packetd GitHub
pansou 搜索引擎 开源的网盘资源聚合搜索API服务。 需要自行架设。 fish2018 GitHub
hyprnote 会议助手 本地运行的AI会议助手。 自动监听线上会议,生成笔记和总结。 fastrepl GitHub
GithubStarsManager GitHub管理 使用AI自动分类和管理GitHub Stars的工具。 支持自然语言搜索。 AmintaCCCP GitHub
SWE-Swiss 模型开发方案 提升软件工程能力的高性能模型开发方案。 32B模型在SWE-bench上表现优异,提供完整复现代码。 - -
Investbrain 投资追踪器 基于Laravel构建的智能开源投资追踪器。 集成多市场数据,支持与持仓进行AI聊天。 - -
MCP·RL 强化学习框架 OpenPipe推出的开源LLM+RL框架。 Agent能自动发现工具、生成任务,在闭环中自我优化。 OpenPipe GitHub
LiYing 照片处理 自动化处理证件照的Python程序。 模拟照相馆后期流程,提供Windows整合包。 aoguai GitHub
DocTron 内容解析框架 通用视觉语言模型架构,用于结构化内容解析。 无需定制化模块,覆盖通用文档、公式、图表等。 DocTron-hub GitHub
ADK (Agent Dev Kit) Agent框架 谷歌的模块化、高解耦的Agent构建框架。 任务导向,多Agent协同,提供20+高质量示例。 Google adk-samples
AgentFly Agent框架 基于强化学习的可扩展语言模型智能体框架。 支持多轮训练,异步执行,集中式资源管理。 - -
Coze Studio Agent开发工具 一体化的AI智能体开发工具。 集成提示/RAG/插件/工作流,支持无代码/低代码开发。 - -
Cognitive Kernel-Pro Agent框架 腾讯AI Lab推出的全开源、多模块、层次化的智能体框架。 旨在为深度研究和智能体基础模型训练提供解决方案。 腾讯AI Lab GitHub
Gemini Fullstack Quickstart Agent应用模板 React前端+LangGraph后端Agent的全栈应用模板。 Agent能动态研究用户问题并给出带引文的答案。 - -
OxyGent 多智能体框架 京东开源的多智能体协作框架。 帮助高效组装协作系统,实现弹性扩展和全链路可追溯。 京东零售Oxygen团队 GitHub
Pixelle-MCP ComfyUI工具 将ComfyUI工作流一键转换为MCP工具。 让支持MCP的客户端能以函数方式调用ComfyUI工作流。 AIDC-AI GitHub
Groq Code CLI 开发工具 Groq推出的命令行代码工具。 - Groq GitHub
Open SWE 代码Agent LangChain Labs推出的开源、异步代码代理。 专长于处理长周期、高复杂度的编程任务。 LangChain Labs 官方博客
行业新闻/文章/资源 (News/Articles/Resources)
Node.js 2025新写法 技术文章 介绍Node.js在新时代应该采用的新写法。 - kashw1n 博客文章
Dario Amodei的故事 人物报道 介绍Anthropic创始人兼CEO Dario Amodei的经历。 一个生物学博士如何创立Anthropic并做出Claude AI。 Big Technology 文章链接
Linux服务器安全措施 技术资源 收录了启用Linux服务器后应采取的各种安全措施的英文仓库。 - imthenachoman GitHub
SVG基础知识长文 技术文章 一篇详细介绍SVG格式基础知识的长文。 - Josh W. Comeau 文章链接
谷歌大模型对抗赛 行业新闻 谷歌发起首届大模型国际象棋对抗赛。 8款顶级AI模型(OpenAI, Kimi等)参赛,全程直播。 谷歌/Kaggle -
苹果BCI HID协议 行业新闻 苹果与Synchron合作,让脑电波成为操作系统原生输入方式。 与触控、键盘并列,支持iOS, iPadOS, visionOS。 苹果/Synchron -
mcp-for-beginners 技术教程 覆盖五种主流编程语言的MCP协议原理与实战教程。 7.3k⭐,内容完整。 - -
MCP精选清单 资源集合 一个收集了各种优秀MCP相关项目和资源的列表。 - MobinX GitHub
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐