向阳乔木 on Nostr: 一款很好用的浏览器抓取插件 Easy Scraper - One-click web scraper ...
一款很好用的浏览器抓取插件 Easy Scraper - One-click web scraper
https://t.co/n2tDc5sHhn抓取网页,一般从获取URL列表开始,然后抓取详情页。
比如我想读英语故事学英语,想采集100wordstory网站内容导入到Heptabase,每天学一篇。
1. 打开
https://t.co/1YXBoYGtHL 点击插件图标,它会自动提取页面中URL,支持下载为CSV或JSON。
2. 切换为“抓取详情页”,上传刚才下载的CSV文件(本地可以编辑修改,去掉无关的URL)
3. 点击“新建抓取工具”,这时会自动打开一个URL,可视化点击想要抓取的内容区域,支持Shift多选,比如先点选标题,再点击内容部分。
运行后,会自动访问每个网页抓取你指定的内容,可以下载成CSV或JSON。
Published at
2024-07-29 14:30:57Event JSON
{
"id": "9bcf1ecffaa5985828c556fca09e78895d67379ab95f710e1f1dcbf08497b79c",
"pubkey": "dc78ed6115492137f00a39f69408c7120d162f16436522b53ab6ebb28c164a6e",
"created_at": 1722263457,
"kind": 1,
"tags": [],
"content": "一款很好用的浏览器抓取插件 Easy Scraper - One-click web scraper\n\nhttps://t.co/n2tDc5sHhn\n\n抓取网页,一般从获取URL列表开始,然后抓取详情页。\n\n比如我想读英语故事学英语,想采集100wordstory网站内容导入到Heptabase,每天学一篇。\n\n1. 打开 https://t.co/1YXBoYGtHL 点击插件图标,它会自动提取页面中URL,支持下载为CSV或JSON。\n\n2. 切换为“抓取详情页”,上传刚才下载的CSV文件(本地可以编辑修改,去掉无关的URL)\n\n3. 点击“新建抓取工具”,这时会自动打开一个URL,可视化点击想要抓取的内容区域,支持Shift多选,比如先点选标题,再点击内容部分。\n\n运行后,会自动访问每个网页抓取你指定的内容,可以下载成CSV或JSON。 https://pbs.twimg.com/media/GTqPepeacAAvfzB.png https://pbs.twimg.com/media/GTqPlA7bgAAUobm.jpg https://pbs.twimg.com/media/GTqP00sa4AAnT_U.jpg https://pbs.twimg.com/media/GTqQEQFawAASCHa.jpg",
"sig": "6c956c919da5094df3df7a391874e507770e643e06defbb97846353cd1479357a953f1e0c7efd71d5f5a16182e9dde6db5f2d3e918f6938f10d1125dd1651d7c"
}