探索使用网页抓取工具 IDE 进行网页抓取的全面示例,包括交互代码,解析、处理多个结果以及高级技术。
tag_html
、tag_request
、tag_graphql
此外,更新一些现有指令:tag_response
、tag_sitemap
、tag_all_responses
。有关更多详情,请参见IDE 文档: https://docs.brightdata.com/cn/api-reference/web-scraper-ide-api
使用任何标记指令时,您可以提供自定义名称。 然后,您可以在解析器下的解析器代码中使用此名称访问数据。YOUR_KEY
.
对于 tag_html
,当前的浏览器位置 URL
将保存在解析器下。YOUR_KEY_url
.
对于只需要一个 tag_html
的简单情况,可以跳过,它会自动保存在 parser.page
下。
next_stage
and rerun_stage
next_stage
调用。若要解析页面中的某些内容,应使用 load_html
:
tag_response