AI自动化探索之gpt4与playwright
之前介绍过一个使用 chatgpt4 分析 dom,然后生成 puppeteer 代码进行自动化的测试工具 Taxy AI。今天发现有人推荐了一个使用 chatgpt4 生成 playwright 代码的测试工具BrowserGPT,稍微看了一下,原理比较简单,比较适合我们去研究一下,顺便打开思路。
演示动画
具体使用
因为我没有 chatgpt4 的 key,所以没办法直接上手使用,只能通过文档去猜测一下具体用法。
BrowserGPT 设置了 openai 的 key 以及 start url 之后就可以在命令行里运行了,大致的使用方式是输入一些自然语言,然后 BrowserGPT 执行 AI 生成的 playwright 代码,实现自然语言自动化的功能。
go to hn
click on the abc article
比如上面的一些描述就实现了去 hacknews 网站点击 abc 这篇文章的功能。
原理分析
大致看了一下,执行的流程是这样的,代码在这里
- 获取初始化的 url,打开 chrome 浏览器,跳转到这个 url
- 在命令行里启动 prompt,也就是给用户一个输入的 ui
- 初始化 openai 的 api
- 写个死循环,每次用户输入之后调用
doAction
函数 - 在
doAction
函数里简化当前页面的 dom 元素 - 将简化过的 dom 元素传给 chatgpt,让 gpt 根据 playwright 的示例生成代码
- 执行 chatgpt 生成的代码
这里最有意思的部分是doAction
函数