AI低代码自动化测试工具Midscene.js
摘要: Midscene.js是一款基于多模态大语言模型的JavaScript库,支持通过自然语言指令实现浏览器自动化操作,如数据提取、表单填写等,大幅降低技术门槛。用户可通过Chrome扩展安装配置,输入自然语言指令(如网页操作步骤)即可自动执行任务,并生成结构化报告。其典型应用场景包括办公自动化(数据汇总、批量注册)、电商运营(商品上架、竞品监控)、内容创作(资讯采集、素材整理)、数据调研(表
一、Midscene.js介绍
Midscene.js是一个开源的、由AI驱动的JavaScript库,主要用于浏览器自动化。与传统自动化工具不同,它借助多模态大语言模型(LLM)的强大能力,让用户能够通过自然语言指令来控制网页并从中提取数据,极大地简化了自动化操作流程。这意味着,即便是没有深厚编程知识的用户,也能轻松创建强大的自动化脚本。
例如,当你需要在网页上完成一系列复杂操作时,如登录网站、填写表单、提交信息等,无需编写复杂的代码,只需用自然语言描述你的需求,Midscene.js就能将这些指令转化为实际的操作步骤,自动执行任务。它还能够分析用户界面元素,并以JSON格式提供结构化的响应,方便用户从网页中提取特定数据。
二、如何在Chrome浏览器使用Midscene.js
在Chrome浏览器中使用Midscene.js非常简单,通过以下步骤即可轻松实现:
- 安装Chrome扩展:打开Chrome浏览器,进入Chrome网上应用店。在搜索栏中输入“Midscene.js”,找到对应的扩展程序后,点击“添加到Chrome”按钮。按照提示完成安装,安装完成后,浏览器右上角会出现Midscene.js的扩展图标。
- 配置扩展:点击浏览器右上角的Midscene.js扩展图标,打开扩展界面。在界面中,你需要配置一些参数,如接入的模型和API KEY等。具体配置信息可根据你的需求和所使用的模型进行设置。例如,若使用GPT-4o模型,你需要获取OpenAI API密钥,并在配置中填写相应信息。支持模型详情参考:midsceene官网
- 在这里插入图片描述
- 使用指令操作:
用自然语言写测试用例步骤描述如下:
打开https://account.wps.cn/usercenter/apps?isclient=false 网页
点击更多按钮
点击同意
点击返回按钮
点击手机
输入手机号1857563555
点击按钮开始智能验证
在短信验证码那里输入xxx6778
点击确认登录
会看到每个步骤的执行,执行结束还可以下载报告和视频,很详细排查问题也很容易
三、 Midscene.js 典型应用场景
Midscene.js 凭借“自然语言驱动自动化”的核心优势,已在多个领域落地实用场景,无论是个人日常办公提效,还是企业级批量操作,都能发挥显著价值。以下是其最具代表性的几类应用场景,结合具体案例帮助你理解:
一)、日常办公自动化:告别重复操作,节省80%机械时间
对于需要频繁处理网页操作的办公人群(如行政、HR、数据整理员),Midscene.js 能彻底替代“复制粘贴”“反复点击”等机械动作,让复杂流程一键完成。
- 场景1:多平台数据汇总
若需从多个行业报告网页(如艾瑞咨询、易观分析)提取“2025年电商用户规模”“增长率”等关键数据,无需逐页复制表格——只需输入指令:“提取当前页面及下方3个链接页面中的‘电商用户规模’‘同比增长率’数据,按‘来源+年份+数据’格式整理成JSON”,Midscene.js 会自动跳转页面、识别数据字段,并生成结构化结果,直接用于Excel导入。 - 场景2:批量表单填写与提交
HR需为100名新员工批量注册企业协作平台(如飞书)时,无需手动输入姓名、邮箱、部门等信息——提前准备好员工信息Excel(或直接用自然语言描述规则),输入指令:“根据‘姓名=张三,邮箱=zhangsan@xxx.com,部门=技术部’的格式,为100名员工注册账号,注册后保存每个账号的登录链接”,Midscene.js 会自动模拟填写表单、点击提交,并记录结果,避免人工操作失误。
二)、电商与零售运营:批量处理商品信息,提升运营效率
电商运营常需在平台(如淘宝、拼多多、企业自建商城)上批量操作商品,Midscene.js 能简化“上架、改价、数据采集”等流程,尤其适合中小商家。
- 场景1:多平台商品批量上架
商家需将100款服装同时上架到淘宝和抖音小店时,无需在两个平台重复上传图片、填写标题、规格、价格——输入指令:“将当前淘宝草稿箱中的100款服装商品,按‘标题保留前30字+规格同步+价格下调5%’的规则,同步上架到抖音小店,上架后标记‘已同步’”,Midscene.js 会自动读取淘宝商品信息,适配抖音小店的界面元素,完成批量上架,节省数小时操作时间。 - 场景2:竞品价格与销量采集
运营需监控10家竞品店铺的“连衣裙”价格、月销量、好评率时,无需每天手动打开竞品页面记录数据——输入指令:“每天上午10点,访问指定的10家竞品店铺,采集‘连衣裙’品类下所有商品的‘标题、售价、月销量、好评率’,整理成Excel并发送到指定邮箱”,Midscene.js 可设置定时执行,自动完成数据采集与分发,帮助商家及时调整定价策略。
三)、内容创作与媒体运营:自动化素材整理,降低创作成本
自媒体人、内容编辑常需从网页中采集素材(如图片、文字、视频链接),Midscene.js 能快速汇总素材,减少手动整理的工作量。
- 场景1:行业资讯批量采集与排版
科技类公众号需每天从30个科技网站(如36氪、虎嗅)采集“AI领域最新资讯”,并整理成推文——输入指令:“从指定的30个网站中,采集今日发布的‘AI’相关资讯,要求‘标题+摘要(150字内)+原文链接+发布时间’,排除广告类内容,采集后按‘发布时间倒序’整理成Word文档,保留原文图片链接”,Midscene.js 会自动筛选符合要求的资讯,提取关键信息并结构化,编辑只需在此基础上修改润色,即可快速生成推文,缩短内容生产周期。 - 场景2:视频素材链接批量提取
短视频创作者需从B站、YouTube上批量下载某UP主的视频链接(用于二次创作或素材参考)时,无需逐个视频点击“分享-复制链接”——输入指令:“提取当前B站UP主‘XXX’主页下所有‘教程类’视频的‘标题+播放量+视频链接’,按播放量从高到低排序,保存为CSV文件”,Midscene.js 会自动遍历UP主所有视频,识别“教程类”标签,提取所需信息,避免重复点击操作。
四)、数据调研与分析:结构化提取网页数据,辅助决策
市场调研、行业分析人员常需从网页中提取非结构化数据(如表格、散落在文字中的数字、用户评论),Midscene.js 能将这些数据转化为结构化格式(JSON、Excel),方便后续分析。
- 场景1:政府公开数据提取与整理
调研人员需从某省统计局官网提取“2010-2024年各城市GDP、人口数量、人均可支配收入”数据时,无需手动复制网页中的表格(部分官网表格无法直接复制)——输入指令:“提取当前页面中‘2010-2024年各城市经济数据’表格,按‘年份+城市+GDP+人口+人均收入’的字段整理,缺失数据标注‘无’,生成Excel”,Midscene.js 会自动识别网页中的表格元素(即使是图片格式的表格,也能通过多模态能力识别文字),转化为可编辑的结构化数据,避免手动录入错误。 - 场景2:用户评论情感倾向采集
产品经理需分析某款APP在应用商店(如苹果App Store、华为应用市场)的用户评论,了解“用户主要吐槽的问题”(如“闪退”“广告多”“功能复杂”)时,输入指令:“采集当前App Store页面中‘近30天’的1000条用户评论,筛选出‘一星、二星’的差评,提取评论中提到的‘问题关键词’(如闪退、广告、卡顿),统计每个关键词的出现次数”,Midscene.js 会自动采集评论,进行关键词提取与统计,生成可视化结果(如词云数据),辅助产品优化决策。
五)、企业内部系统操作:适配定制化界面,简化员工流程
部分企业有自建的内部系统(如ERP、CRM、库存管理系统),界面操作逻辑固定但繁琐,Midscene.js 能适配这些定制化界面,帮助员工简化操作。
- 场景1:CRM客户信息批量更新
销售团队需将100个新客户的“跟进状态”(如“已沟通”“待报价”“已成交”)批量更新到企业CRM系统时,无需逐个搜索客户姓名再修改状态——输入指令:“根据‘客户姓名=李四,跟进状态=待报价;客户姓名=王五,跟进状态=已成交’的列表,批量更新CRM系统中对应客户的跟进状态,更新后标记‘已处理’”,Midscene.js 会自动模拟CRM系统的“搜索-修改-保存”流程,完成批量更新,避免销售重复操作影响跟进效率。 - 场景2:库存数据自动核对
仓库管理员需每天核对“ERP系统中的库存数量”与“实际入库数量”是否一致时,无需手动对比两个表格——输入指令:“从ERP系统中提取‘所有商品的库存数量’,与当前Excel中的‘实际入库数量’对比,筛选出‘ERP库存≠实际库存’的商品,生成差异报表并标红差异项”,Midscene.js 会自动读取两个来源的数据,完成比对与报表生成,减少人工核对的时间成本与误差。
更多推荐
所有评论(0)