我们使用联盟链接。它们让我们能够维持运营,而您无需承担任何费用。

章鱼评论

适用于 Windows 和 macOS 的适合初学者的网络抓取工具。

octoparse 评论缩略图

继续讨论网页抓取的主题,今天我们将回顾另一个网页抓取工具:Octoparse。类似于 解析中心,它相当容易使用并且不需要任何编码。 

我会查看价格、用户界面和功能。我还会调查该软件的兼容性和安全性。

Octoparse 定价

与 ParseHub 一样,Octoparse 可免费下载和使用,但功能有限。但如果您想更多地使用该软件,则需要购买订阅。虽然免费版本不限制抓取的页面数量,但它将并发本地运行限制为 2 个,并允许您构建最多 10 个爬虫。 

第一个付费计划是 标准版,每月收费 89 美元(如果按年计费,则每月 75 美元)。下一个, 专业的, 每月 249 美元(按年计费则为每月 209 美元)。最后,Octoparse 有一个 企业版 计划,但它适用于大型定制解决方案,因此该计划的价格未公布。Octoparse 还提供五天退款保证。

octoparse 定价计划
Octoparse 定价计划。

从免费版到标准版,功能上的飞跃相当可观:数据导出和并发本地运行的限制消失了,你可以构建多达 10 个爬虫,而不是 100 个。新功能包括计划提取、平均速度提取、自动 IP 轮换、任务模板、API 访问和电子邮件支持。 专业 该计划最重要的是增加了爬虫数量(最多 250 个),以及 高 快速提取、高级 API、高优先级电子邮件支持以及一对一培训和任务评审。

除了定价计划外,Octoparse 还提供数据抓取服务。起价 399 美元,针对那些不想自己获取信息的人。Octoparse 提供的另一项独立产品是爬虫服务。它提供定制的爬虫,可满足个人需求,可在 Octoparse 上运行(起价 189 美元)。 

总而言之,Octoparse 似乎为个体经营者和大型企业提供了选择。 

界面与功能

我不想一直提到 ParseHub,但 Octoparse 的界面与之前的网页抓取工具非常相似。它有一个内置的浏览器视图,抓取工作使用相同的点击和抓取方法。您可以轻松选择需要提取的确切信息,并指示软件在网站的每个页面上自动重复相同的抓取任务。由于不需要任何编码知识,Octoparse 也适合初学者。 

一个独特的功能(但仅限于付费计划)是任务模板。如果你想最大限度地提高抓取任务的效率,这些模板非常方便。Octoparse 有各种各样的模板,从亚马逊(不同国家的模板也有)到谷歌地图和推特。 

这些模板之所以如此方便,是因为它们为您设置了整个选择,您无需浏览页面来单击需要下载的内容。信息是根据其在页面上的位置提取的,因此这些模板已经知道根据不同的布局将价格、名称和产品图片放在何处(例如,美国亚马逊和印度亚马逊不会在同一侧显示评论,因此有 2 个不同的模板)。 

您可以将提取的任何数据以 Excel 格式下载,或通过 API 直接下载到您自己的数据库中。 

Octoparse 最大的缺点是它与 macOS 和 Linux 操作系统不兼容。如果您想在 Mac 上使用 Octoparse,则必须使用远程桌面连接或启动虚拟机(例如 Oracle VM Virtualbox)。不过,似乎有一些好消息——5 月初,Octoparse 宣布 Mac 版本即将推出!什么时候?不幸的是,从未具体说明。我们只能说该公司在保持神秘。 

编辑: Octoparse 已发布适用于 macOS 设备的测试版。好棒!

客户服务和教程

在 Octoparse 的网站上,你可以找到几个联系客服的链接。它们都指向同一个提交表单。没有实时聊天,这有点令人失望:如果你的抓取工具出现问题,你无法立即联系到他们。

客户支持级别因订阅计划而异。我不确定 Octoparse 是否真的想这样称呼其员工,但根据网站介绍,如果您只使用免费计划,那么您有权获得 懒惰 支持。但是,随着计划的推进,您可以通过电子邮件联系支持人员,并成为 高优先级.

Octoparse 的 YouTube 视频内容数量让我印象深刻。有多个视频教程解释了从什么是网页抓取到在 Octoparse 中构建自定义任务等所有内容。 

附注:许多视频教程都侧重于使用仅供付费客户使用的功能(例如任务模板),但 Octoparse 并没有真正提到这一点。因此,如果我按照我在 YouTube 上看到的内容,我会非常失望地发现我必须支付额外的费用才能获得现成的亚马逊任务模板。 

Octoparse 与 ParseHub 对比

最终的对决就在这里。两款抓取工具的界面、功能以及开始抓取所需的经验都非常相似。 

但是,如果我们只比较免费版本,Octoparse 会以更少的钱提供更多功能。虽然 ParseHub 允许您构建 5 个项目并允许每次运行 200 个页面,但 Octoparse 的限制是 10 个爬虫,并且不限制爬取的页面数量。但是,如果您查看下载抓取数据的格式,您会发现 Octoparse 的选项比 ParseHub 少(例如,无法以 JSON 格式获取结果)。 

如果您正在寻找付费版本,ParseHub 的起步价比 Octoparse 稍贵一些(每月 149 美元)。但是,这两个程序提供的功能非常相似。ParseHub 所没有的功能是那些方便的任务模板。

最后,一切都取决于您的偏好。仔细考虑您的抓取项目会是什么样子,测试两者的免费版本,看看哪一个更适合您的需求。 

Octoparse 安全吗?

人们对于网页抓取仍持观望态度,这并不让我感到惊讶。它合法吗?使用抓取工具会让你成为罪犯吗? 

让我们先解决一件事:抓取 is 合法,但这一切都取决于你收集的信息和方式。如果你想确保自己没有违反任何法律,请考虑你抓取的信息是否公开。如果是,那么你很可能没事。如果你不确定,查看网站的条款和条件以及 robots.txt 文件总是一个好主意。 

所以,如果你出于正确的理由使用 Octoparse,那么  – 它非常安全。

您应该使用什么代理?

Octoparse 的免费版本不包含付费版本中的 IP 地址轮换功能。因此,如果您要使用它,则需要获取代理。

有人可能会说不包括 IP 轮换很不方便;我认为这是因祸得福。现在您可以决定要使用哪些代理!代理绝对与抓取工具本身一样重要,因此请确保选择可靠的代理。 

一般来说,在为抓取项目选择代理时,你会希望它们能够轮换,并且 住宅 以避免任何潜在的阻碍。我们整理了一份清单, 最佳网页抓取代理提供商 让您的选择更轻松。 

结语

总体而言,Octoparse 是一款适合初学者的可靠网页抓取工具。它为小型项目提供了不错的免费计划,但也不回避制作定制的企业解决方案。 

Octoparse 不限制页面数量,免费版允许您构建 10 个抓取工具,付费版则提供简洁的任务模板。它还以丰富的视频教程给我留下了深刻的印象, 几乎 弥补了客户服务没有在线聊天的缺点。这里的缺点是结果提取格式有限,并且仅提供电子邮件客户服务。 

代理服务器作为房屋

关于 Octoparse 的常见问题

是的。Octoparse 最近发布了 macOS 的测试版。

Octoparse 有免费版本,但功能有限。要解锁其全部功能,您必须付费使用 Octoparse。

是的。如果你想尝试一款适合初学者的可视化抓取工具, 解析中心 成为 Octoparse 的绝佳替代品。

Adam Dubois 的图片
亚当·杜波依斯
代理极客和开发人员。