问题描述

按照官网指导,安装了browser-use并配置了AI接口之后,运行的时候一直刷Step 1,而且弹出的浏览器一片空白。

问题解决

参考了这个链接:https://github.com/browser-use/browser-use/pull/1053

在这里插入图片描述

如果用阿里云的百炼平台的话,采用如下代码模板可以实现效果:

from browser_use import Agent
import asyncio

import time

import asyncio
from langchain_openai import ChatOpenAI

from pydantic import SecretStr


async def main():
    
    start_time = time.time()

    agent = Agent(
        # task="go to baidu.com, search 'weather' in the search bar,tell me the weather of shanghai today, and return the result. ",
        task="打开携程, 搜索 '长沙到上海的机票',告诉我本周末最便宜的一趟航班,返回结果。",
        llm=ChatOpenAI(model="deepseek-r1",
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
        api_key=SecretStr("sk-cd54114de1dc********************"),
        timeout=30,  # 超时设置
        ),
        tool_calling_method="auto",  # 工具调用方法设置
        use_vision=False,  # 是否使用视觉模型设置
    )
    result = await agent.run()

    # 第二次获取时间并计算间隔
    end_time = time.time()
    time_diff = end_time - start_time
    print(f"任务执行耗时: {time_diff:.2f} 秒")

    print(result)

asyncio.run(main())

最后会在控制台输出:
在这里插入图片描述
虽然最后能获取结果,但是目前还没解决运行时长吓人的问题。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐