【GitHub每日速递 20260324】LongMemEval性能登顶!这款碾压RAG的AI记忆系统,让Agent从「记聊天记录」变「真正会学习」,2行代码直接集成
摘要:阿里开源PageAgent实现网页自动化操作,仅需一行JavaScript代码即可集成AI助手功能。该工具支持自然语言操控网页,能自动完成点击、填写表单等操作,无需插件或后端支持。核心优势包括简单集成、文本DOM操作、可自定义大模型和美观的UI界面,适用于SaaS助手、智能表单填写等场景。提供NPM安装和CDN两种快速接入方式,特别适合前端开发者和AI应用开发者使用。
·
LongMemEval性能登顶!这款碾压RAG的AI记忆系统,让Agent从「记聊天记录」变「真正会学习」,2行代码直接集成
hindsight 是一个用于分析和可视化浏览器历史记录的工具。简单讲,它能帮你查看和理解自己的上网浏览行为。适用人群:数据分析师、网络安全研究人员
项目地址:https://github.com/vectorize-io/hindsight
主要语言:Python
stars: 3.0k

核心功能
- 智能学习型记忆系统:Hindsight 是一个旨在创建能随时间学习的智能代理的记忆系统。与大多数专注于回忆对话历史的代理记忆系统不同,它更注重让代理学习,而非只是记忆。
- 高性能与准确性:经过独立研究验证,Hindsight 在 LongMemEval 基准测试中取得了最先进的性能表现,是目前测试过的最准确的代理记忆系统。
主要优势
- 消除技术缺陷:消除了如 RAG 和知识图谱等替代技术的缺点,在长期记忆任务中表现卓越。
- 简单集成:可以通过 LLM 包装器轻松添加到现有代理中,只需两行代码就能为代理添加记忆功能。也可以使用 SDK 或直接通过 HTTP 集成简单的 API,以获得对记忆存储和检索的更多控制。
- 多用途设计:适用于支持对话式 AI 代理和自主执行任务的代理,尤其适合需要结合多种功能的 AI 员工等场景。
应用场景
- 个性化对话代理:可用于个性化 AI 聊天机器人和其他对话式代理,通过存储和回忆与单个用户相关的记忆来实现个性化服务。
- 复杂任务自动化:适用于需要处理开放式任务、根据用户反馈改变行为并学习执行复杂任务以近似人类工作水平的 AI 员工等场景。
代码架构特点
- 仿生数据结构:使用仿生数据结构来组织代理记忆,类似于人类记忆的工作方式,包括世界事实、经验和心理模型。
- 三种交互方法:提供了三个简单的方法来与系统交互,即
retain(保留信息)、recall(检索记忆)和reflect(反思记忆以生成新的观察和见解)。
快速启动方式
- Docker(推荐):通过设置环境变量并运行 Docker 命令,可以快速启动 Hindsight。可以通过设置
HINDSIGHT_API_LLM_PROVIDER来修改 LLM 提供商。 - Docker(外部 PostgreSQL):设置相关环境变量后,在特定目录下运行
docker compose up命令启动。 - 客户端:支持 Python 和 Node.js/TypeScript 客户端,提供了简单的代码示例来展示如何使用
retain、recall和reflect操作。 - Python 嵌入式(无需服务器):安装
hindsight-all包后,可以在 Python 代码中直接使用嵌入式的 Hindsight 服务器。
太香了!阿里开源Page Agent:自然语言操控网页,20步表单一句话搞定,无插件无后端,一行代码给产品加AI copilots
page-agent 是一个基于大模型实现网页自动化操作的智能代理工具。简单讲,它能让AI自动理解网页内容并完成点击、填写表单等操作,像真人一样使用浏览器。适用人群:前端开发者、自动化测试工程师、AI应用开发者。
项目地址:https://github.com/alibaba/page-agent
主要语言:TypeScript
stars: 5.8k

核心功能
- 轻松集成:无需浏览器扩展、Python 或无头浏览器,仅通过页面内的 JavaScript 就能实现所有操作,一切都在网页内完成。
- 基于文本的 DOM 操作:无需截图,也不需要多模态大语言模型或特殊权限,就能进行 DOM 操作。
- 可自定义大语言模型:支持用户使用自己的大语言模型。
- 美观的用户界面与人工干预机制:拥有漂亮的用户界面,并且支持人工干预。
- 可选的 Chrome 扩展:对于多页面任务,可使用可选的 Chrome 扩展。
优势
- 集成简单,降低了使用门槛和技术成本。
- 文本操作方式减少了对特殊工具和权限的依赖,提高了使用的便捷性。
- 允许用户使用自己的大语言模型,增加了灵活性和可扩展性。
- 美观的界面和人工干预机制提升了用户体验和操作的准确性。
- 可选的 Chrome 扩展满足了多页面操作的需求。
应用场景
- SaaS 人工智能助手:只需少量代码就能在产品中集成 AI 助手,无需重写后端。
- 智能表单填写:将原本需要 20 次点击的工作流程简化为一句话,非常适合 ERP、CRM 和管理系统。
- 无障碍访问:通过自然语言让任何网页应用都能实现无障碍访问,支持语音命令和屏幕阅读器,消除使用障碍。
- 多页面代理:借助可选的 Chrome 扩展,让代理能够在浏览器的不同标签页之间操作。
快速开始
- 一键集成:使用免费的演示大语言模型快速尝试 PageAgent,在 HTML 中添加如下代码:
<script src="{URL}" crossorigin="true"></script>
需注意,此演示 CDN 使用的是免费测试 LLM API,使用时需同意相关条款。不同地区的 URL 如下:
- 全球:<https://cdn.jsdelivr.net/npm/page-agent@1.5.7/dist/iife/page-agent.demo.js>
- 中国:<https://registry.npmmirror.com/page-agent/1.5.7/files/dist/iife/page-agent.demo.js>
- NPM 安装:
npm install page-agent
然后在 JavaScript 中使用:
import { PageAgent } from 'page-agent'
const agent = new PageAgent({
model: 'qwen3.5-plus',
baseURL: '<https://dashscope.aliyuncs.com/compatible-mode/v1>',
apiKey: 'YOUR_API_KEY',
language: 'en-US',
})
await agent.execute('Click the login button')
更多编程用法可查看[文档](<https://alibaba.github.io/page-agent/docs/introduction/overview>)。
原文:https://mp.weixin.qq.com/s/d4GXTGWrjuIzNeISWgBDXw
欢迎关注公zh:AI Tech研习社
更多推荐

所有评论(0)