系列篇章💥

No. 文章
1 【GitHub开源AI精选】LLM 驱动的影视解说工具:Narrato AI 一站式高效创作实践
2 【GitHub开源AI精选】德国比勒费尔德大学TryOffDiff——高保真服装重建的虚拟试穿技术新突破
3 【GitHub开源AI精选】哈工大(深圳)& 清华力作 FilmAgent:剧本自动生成 + 镜头智能规划,开启 AI 电影制作新时代
4 【GitHub开源AI精选】Lumina - Image 2.0 文生图模型,以小参数量实现高分辨率多图生成新突破
5 【GitHub开源AI精选】探索 Mobile-Agent:X-PLUG 推出的创新型移动智能操作代理
6 【GitHub开源AI精选】吴恩达团队开源VisionAgent:用自然语言开启计算机视觉新时代
7 【GitHub开源AI精选】Oumi:一站式AI开发平台,涵盖训练、评估与部署全流程
8 【GitHub开源AI精选】深入剖析RealtimeSTT:开源实时语音转文本库的强大功能与应用
9 【GitHub开源AI精选】PodAgent:多智能体协作播客生成框架,自动化打造高质量播客,赋能内容创作与品牌传播
10 【GitHub开源AI精选】OpenManus开源AI工具:3小时复刻Manus,39.5k星
11 【GitHub开源AI精选】OpenGlass:大模型赋能的开源方案,25美元打造智能眼镜,支持语音控制+AR叠加
12 【GitHub开源AI精选】AppAgentX:西湖大学发布可自主进化的手机智能体,实现GUI操作的高效与智能
13 【GitHub开源AI精选】Agent-S架构揭秘:低代码+多模态融合的智能体新范式
14 【GitHub开源AI精选】Open-Interface:大模型驱动的计算机“自动驾驶”系统|自然语言操控的自动化工具
15 【GitHub开源AI精选】2025年AI工程师必备!AgentOps五大功能重构智能体开发流程
16 【GitHub开源AI精选】LangManus:社区驱动的多智能体AI自动化框架,开启复杂任务处理新纪元
17 【GitHub开源AI精选】autoMate:AI 驱动的本地自动化助手,用自然语言解锁高效办公,让电脑任务自己动起来
18 【GitHub开源AI精选】Sitcom-Crafter:北航联合港中文等高校打造的剧情驱动3D动作生成系统
19 【GitHub开源AI精选】Local Deep Researcher:本地化部署的AI研究助手,零门槛开启智能研究
20 【GitHub开源AI精选】Browser Use:开源AI自动化工具,让AI像人类一样操控网页
21 【GitHub开源AI精选】LLaVA-Med:微软打造的生物医学领域多模态AI助手,助力医疗智能化
22 【GitHub开源AI精选】RF-DETR:Roboflow 的实时目标检测模型『边缘设备鹰眼』,低至160FPS的工业级检测利器
23 【GitHub开源AI精选】MegaTTS 3:字节跳动开源语音利器,吊打VALL-E,自然度逼近真人录音
24 【GitHub开源AI精选】LocAgent:斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
25 【GitHub开源AI精选】WhisperX:70倍实时语音转录!革命性词级时间戳与多说话人分离技术
26 【GitHub开源AI精选】Crawl4AI:LLM专属极速开源爬虫利器、1秒处理百万级数据
27 【GitHub开源AI精选】Oliva:开源语音RAG助手,一句话秒搜海量数据,多AI协作颠覆传统搜索
28 【GitHub开源AI精选】UFO²:微软开源的 Windows 桌面 Agent 操作系统,开启智能自动化新时代
29 【GitHub开源AI精选】ebook2audiobook:AI驱动的电子书转有声书利器,支持1107种语言+语音克隆
30 【GitHub开源AI精选】WebThinker:赋能大型推理模型的自主科研新范式
31 【GitHub开源AI精选】ZeroSearch:阿里巴巴开源的大模型搜索引擎框架,无需真实搜索引擎交互
32 【GitHub开源AI精选】Toolkami:极简AI Agent框架,七种工具实现高效轻量化开发
33 【GitHub开源AI精选】Docext:NanoNets 打造的文档提取利器,本地化、高效能、免费开源
34 【GitHub开源AI精选】SketchVideo:手残党福音!草图秒变大片,快手黑科技让创作效率飙升300%
35 【GitHub开源AI精选】NLWeb:微软开源的自然语言交互利器,让网站秒变智能AI应用
36 【GitHub开源AI精选】ScrapeGraphAI:基于LLM的智能爬虫,多页面爬取、语音生成,开启数据提取新纪元
37 【GitHub开源AI精选】FaceShot:同济大学联合上海 AI Lab 推出的无需训练肖像动画生成框架
38 【GitHub开源AI精选】Minion Agent:开源界的“全能王”,深度研究、自动规划全搞定
39 【GitHub开源AI精选】AgenticSeek:开源本地通用AI Agent,打造自主执行任务的智能助手
40 【GitHub开源AI精选】Morphik:开源多模态检索增强生成工具,助力AI应用开发
41 【GitHub开源AI精选】TEN VAD:高性能实时语音活动检测系统,助力AI对话系统高效交互
42 【GitHub开源AI精选】Google AI Edge Gallery:谷歌赋能的离线AI模型探索利器
43 【GitHub开源AI精选】PandasAI:一键开启数据对话时代,非技术用户也能轻松上手
44 【GitHub开源AI精选】ContentV:字节跳动开源的高效文生视频模型框架,助力AI视频生成技术突破
45 【GitHub开源AI精选】VRAG-RL:阿里通义推出的多模态RAG推理框架,助力视觉信息理解与生成
46 【GitHub开源AI精选】MultiTalk:中山大学与美团联合打造的音频驱动多人对话视频生成框架
47 【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架
48 【GitHub开源AI精选】InftyThink:浙大联合北大打造的无限深度推理范式,突破大模型长推理瓶颈
49 【GitHub开源AI精选】RAG-Anything:港大开源利器、让AI真正理解复杂文档,PDF、表格、公式全能读
50 【GitHub开源AI精选】PreenCut深度解析:开源AI视频剪辑利器,用自然语言一句话精准定位片段
51 【GitHub开源AI精选】TradingAgents-CN:基于多智能体LLM的中文金融交易决策框架深度解析
52 【GitHub开源AI精选】KlicStudio:极简 AI 视频翻译配音工具,让跨平台内容本地化效率翻倍,GitHub狂揽7.9k星
53 【GitHub开源AI精选】JoyAgent-JDGenie:京东开源的通用多智能体系统,助力AI应用落地
54 【GitHub开源AI精选】SuperDesign:开源AI设计Agent,让你的设计从想法到实现只需60秒
55 【GitHub开源AI精选】WeKnora:腾讯开源的文档理解与语义检索框架,助力智能问答与知识管理
56 【GitHub开源AI精选】LandPPT:开源AI PPT生成工具,助力演示文稿高效创作
57 【GitHub开源AI精选】NeuralAgent:开源桌面AI助手,助力高效生产力与自动化任务执行
58 【GitHub开源AI精选】开源AI桌面助手Glass:实时屏幕捕捉与音频识别,助力高效办公
59 【GitHub开源AI精选】MiroFlow:开源多Agent系统开发框架,助力AI大模型高效开发
60 【GitHub开源AI精选】ScreenCoder:开源智能UI截图转代码工具,助力前端开发自动化
61 【GitHub开源AI精选】OxyGent:京东开源的多智能体协作框架,助力高效智能系统开发
62 【GitHub开源AI精选】Hugging Face AI Sheets:开源无代码构建、丰富和转换数据集的利器
63 【GitHub开源AI精选】Coze Studio:字节跳动开源的AI智能体开发平台,一站式构建与部署AI应用
64 【GitHub开源AI精选】Chaterm:开源的AI终端工具,运维版Cursor,助力高效云管理
65 【GitHub开源AI精选】MobileUse:由MadeAgents打造的分层反思驱动的移动自动化GUI代理
66 【GitHub开源AI精选】WhisperLiveKi:开源实时语音识别利器,实时转写+说话人识别+完全本地部署,一键搞定会议纪要
67 【GitHub开源AI精选】Open-Fiesta:开源AI聊天平台,多模型并行对比的新选择
68 【GitHub开源AI精选】AgentScope:阿里开源多智能体核弹、并行工具+Actor架构+秒级介入+沙箱隔离
69 【GitHub开源AI精选】Super Agent Party:开源3D AI桌面伴侣,开启智能交互新体验(聊天、写代码、控直播)
70 【GitHub开源AI精选】Parlant:为企业级应用而生的开源LLM智能体框架,打造“AI员工监工”,让LLM可解释、可审计
71 【GitHub开源AI精选】AI-Video-Transcriber:开源AI视频转录与摘要工具,支持30+平台,赋能高效内容处理
72 【GitHub开源AI精选】DeepDoc:开源本地知识库深度研究工具,多格式文档解析与智能报告生成
73 【GitHub开源AI精选】Strix:AI驱动的安全测试先锋,助力应用安全防护
74 【GitHub开源AI精选】通义DeepResearch:开源深度研究智能体,助力复杂信息检索与多步推理
75 【GitHub开源AI精选】Presentation-AI:ALLWEONE团队打造的开源AI演示文稿生成工具
76 【GitHub开源AI精选】SciToolAgent:浙大开源的知识图谱驱动的科研利器
77 【GitHub开源AI精选】FireRedChat:小红书开源的全双工语音交互系统,开启智能语音新时代
78 【GitHub开源AI精选】OpenLens AI:清华推出的医学研究全自主AI助手,开启科研新纪元
79 【GitHub开源AI精选】StableAvatar:复旦大学联合微软亚洲研究院推出的无限时长音频驱动虚拟形象视频生成技术框架
80 【GitHub开源AI精选】MineContext:字节开源的主动式上下文感知 AI 工具,助力高效信息管理
81 【GitHub开源AI精选】LLaVA-OneVision-1.5:面向多模态训练大众化的全开源框架
82 【GitHub开源AI精选】Glyph:智谱与清华开源的视觉文本压缩框架,突破大模型上下文限制
83 【GitHub开源AI精选】DiaMoE-TTS:清华 & 巨人网络开源的多方言语音合成利器
84 【GitHub开源AI精选】Meta Omnilingual ASR:支持1600+语言的开源多语言语音识别技术
85 【GitHub开源AI精选】DeepEyesV2:迈向多模态智能体的新里程碑
86 【GitHub开源AI精选】Kosong:月之暗面开源的AI代理开发利器,赋能智能体应用构建


前言

在当今AI技术飞速发展的时代,构建智能体应用面临着诸多挑战,如多模型和工具的集成难题、技术栈的可维护性问题等。为了应对这些挑战,月之暗面(Moonshot AI)开源了Kosong框架,为开发者提供了一个高效、灵活且可扩展的解决方案。
在这里插入图片描述

一、项目概述

Kosong是一个专为现代AI Agent应用设计的LLM抽象层,旨在解决与多个模型和工具交互时的技术栈可维护性问题。它通过统一消息结构、异步工具编排和可插拔的聊天提供商,帮助团队避免将业务逻辑硬编码到单一API,从而简化智能体的构建过程。

二、核心功能

(一)异步工具编排引擎

Kosong的异步工具编排引擎能够高效调度多个工具并行执行,例如同时调用天气API、地图服务与日历系统等,大幅提升任务处理效率与响应速度。这种设计使得复杂任务的处理变得更加简单和高效,例如可以根据实时天气状况自动调整日程安排。

(二)插件化设计

框架支持可插拔的聊天供应商(Chat Provider),开发者可以自由切换或混合调用不同模型,如Kimi、DeepSeek、Llama3等,无需修改核心业务逻辑。这种灵活的插件化设计避免了开发者被单一AI服务商绑定,增强了技术选型的灵活性。

(三)开箱即用的Python支持

Kosong基于现代Python生态构建,要求Python 3.13及以上版本,推荐使用新一代包管理器uv进行安装。官方提供了完整的示例代码,从调用Kimi模型、实现流式响应到自定义异步工具(如加法函数、数据库查询),代码简洁清晰。内置的演示代理允许用户通过简单的环境变量配置快速启动和运行,5分钟内即可体验完整的AI代理工作流。

(四)统一的LLM抽象层

Kosong构建了统一的LLM抽象层,将不同大模型、工具函数与记忆模块封装为标准化组件,解决了接口不兼容和工具碎片化问题,简化了开发流程。

(五)高度可扩展性

Kosong的架构设计允许开发者根据需求扩展功能,支持更多工具和模型的集成,满足不同规模和复杂度的项目需求。

三、技术揭秘

(一)异步编程技术

Kosong采用异步编程技术,通过异步任务队列和事件驱动机制,能够同时处理多个API调用或工具执行任务,显著提升任务处理效率和响应速度。

(二)标准化接口封装

框架通过标准化接口封装不同模型和工具函数,使开发者可以灵活切换或混合使用多种AI模型,无需修改核心业务逻辑,增强了开发的灵活性和可扩展性。

(三)现代Python生态兼容

基于Python 3.13及以上版本构建,充分利用现代Python的异步编程特性,同时支持新一代包管理器uv,确保与现代Python生态的兼容性。

四、应用场景

(一)智能客服与自动化服务

Kosong可构建智能客服系统,通过异步调用用户信息查询、订单处理、知识库检索等工具,实现高效问题解答与任务处理。其并行执行能力大幅提升响应速度,优化用户体验,为企业提供高效、自动化的客户服务解决方案,降低人力成本。

(二)个人助理与日程管理

利用异步工具编排,Kosong可开发个人助理应用,自动调整日程安排、提醒重要事件,并根据实时天气、交通状况等数据做出智能决策。它帮助用户高效管理时间,提升生活与工作效率。

(三)多模型混合开发

支持插件化设计,Kosong允许开发者混合使用多种AI模型,如Kimi、DeepSeek、Llama3等,适用于内容创作、数据分析和语言翻译等场景。这种灵活性使开发者能根据需求选择最优模型组合,发挥不同模型的优势。

(四)企业级应用集成

Kosong的标准化组件和灵活插件机制,使其能轻松集成企业现有系统,如ERP、CRM等,实现智能化业务流程自动化。它解决了工具碎片化和接口不兼容问题,降低了企业数字化转型的技术门槛。

(五)教育与学习工具

Kosong可开发智能教育应用,通过调用知识库、在线课程资源和实时反馈工具,为学生提供个性化学习体验。它支持多模型混合使用,满足不同学习场景需求,助力教育智能化。

(六)智能家居控制

Kosong能连接和控制多种智能家居设备,通过语音或文本指令实现设备自动化操作。其异步工具编排能力可实现复杂场景联动,如根据天气自动调节室内温度,提升家居生活便利性和舒适性。

五、快速使用

(一)环境准备

Kosong框架要求Python 3.13及以上版本,推荐使用新一代包管理器uv进行安装,速度较快。

uv init --python 3.13

(二)安装Kosong

使用uv包管理器安装Kosong,命令如下:

uv add kosong

(三)使用示例

1、简单的聊天示例

import asyncio

import kosong
from kosong.chat_provider.kimi import Kimi
from kosong.message import Message


async def main() -> None:
    kimi = Kimi(
        base_url="https://api.moonshot.ai/v1",
        api_key="your_kimi_api_key_here",
        model="kimi-k2-turbo-preview",
    )

    history = [
        Message(role="user", content="Who are you?"),
    ]

    result = await kosong.generate(
        chat_provider=kimi,
        system_prompt="You are a helpful assistant.",
        tools=[],
        history=history,
    )
    print(result.message)
    print(result.usage)


asyncio.run(main())

2、工具调用示例
使用 kosong.step 进行工具调用

import asyncio

from pydantic import BaseModel

import kosong
from kosong import StepResult
from kosong.chat_provider.kimi import Kimi
from kosong.message import Message
from kosong.tooling import CallableTool2, ToolOk, ToolReturnType
from kosong.tooling.simple import SimpleToolset


class AddToolParams(BaseModel):
    a: int
    b: int


class AddTool(CallableTool2[AddToolParams]):
    name: str = "add"
    description: str = "Add two integers."
    params: type[AddToolParams] = AddToolParams

    async def __call__(self, params: AddToolParams) -> ToolReturnType:
        return ToolOk(output=str(params.a + params.b))


async def main() -> None:
    kimi = Kimi(
        base_url="https://api.moonshot.ai/v1",
        api_key="your_kimi_api_key_here",
        model="kimi-k2-turbo-preview",
    )

    toolset = SimpleToolset()
    toolset += AddTool()

    history = [
        Message(role="user", content="Please add 2 and 3 with the add tool."),
    ]

    result: StepResult = await kosong.step(
        chat_provider=kimi,
        system_prompt="You are a precise math tutor.",
        toolset=toolset,
        history=history,
    )
    print(result.message)
    print(await result.tool_results())


asyncio.run(main())

六、结语

Kosong作为月之暗面(Moonshot AI)开源的AI代理开发框架,为开发者提供了一个强大的工具,用于构建高效、灵活且可扩展的智能体应用。通过异步工具编排引擎、插件化设计和现代Python生态的支持,Kosong不仅简化了开发流程,还降低了开发成本,提高了开发效率。无论是智能客服、个人助理还是企业级应用,Kosong都能提供强大的支持,帮助开发者快速实现智能化的应用场景。

  • Kosong GitHub仓库:https://github.com/MoonshotAI/kosong

在这里插入图片描述

🎯🔖更多专栏系列文章:AI大模型提示工程完全指南AI大模型探索之路(零基础入门)AI大模型预训练微调进阶AI大模型开源精选实践AI大模型RAG应用探索实践🔥🔥🔥 其他专栏可以查看博客主页📑

😎 作者介绍:资深程序老猿,从业10年+、互联网系统架构师,目前专注于AIGC的探索(CSDN博客之星|AIGC领域优质创作者)
📖专属社群:欢迎关注【小兵的AI视界】公众号或扫描下方👇二维码,回复‘入群’ 即刻上车,获取邀请链接。
💘领取三大专属福利:1️⃣免费赠送AI+编程📚500本,2️⃣AI技术教程副业资料1套,3️⃣DeepSeek资料教程1套🔥(限前500人)
如果文章内容对您有所触动,别忘了点赞、⭐关注,收藏!加入我们,一起携手同行AI的探索之旅,开启智能时代的大门!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐