DeepSeek+PyTest+Browser Use:新一代UI自动化解决方案
引语
还在为动态网页反爬彻夜调试?还在为UI自动化反复编写XPath定位器?
当传统爬虫与测试工具遭遇瓶颈时,Browser Use + 大模型已悄然开启新范式——通过类人化决策链实现智能数据抓取与自适应UI测试,让代码拥有“人”的智慧:理解页面语义、模拟视觉判断、动态修正操作路径,真正突破规则化脚本的天花板!
今天给大家介绍一下Browser Use!
Browser Use是什么
Browser Use 是一款开源Python库,专为大语言模型设计的智能浏览器工具,目的是让 AI 能够像人类一样自然地浏览和操作网页。它支持多标签页管理、视觉识别、内容提取,并能记录和重复执行特定动作。
Browser Use 还支持开发者自定义动作,如保存数据到数据库,文件等。支持多种主流的大型语言模型,如 DeepSeek,GPT-4 和 Claude等,并支持同时运行多个任务,具备自我修正功能,从而提高任务执行的准确性和效率。
使用场景
- 自动化任务:适合重复高频的浏览器操作任务,如表单填写,信息检索,文件下载
- 数据收集:适合爬取网络上的数据,如爬虫
- 自动化测试:适合WEB UI自动化测试,结合pytest轻松实现web自动化
环境安装
1、安装python环境,python版本要求3.11及以上
2、安装browser use库
代码语言:javascript代码运行次数:0运行复制pip install browser-use
3、安装playwright
代码语言:javascript代码运行次数:0运行复制playwright install
实例展示
一、爬取基金数据
代码语言:javascript代码运行次数:0运行复制llm = ChatOpenAI(
model='deepseek-chat',
api_key='*************',
base_url='',
temperature=0
)
asyncdefmain():
agent = Agent(
task="""
1、导航到网址:/
2、点击基金排行
3、返回排行前10的基金数据,以json格式返回
""",
llm=llm,
use_vision=False,
)
result = await agent.run()
print(result.final_result())
asyncio.run(main())
效果展示
1、导航到指定网址
2、点击基金排行
3、提取top 10的基金数据
代码语言:javascript代码运行次数:0运行复制DEBUG [browser_use] --act Execution time: 0.00 seconds
INFO [controller]
发布评论