什么是公司数据?
公司数据是从不同来源(如公开报告、网站、公共记录和数据库)收集的有关企业的信息。以下是被视为公司数据的内容:
- 基本业务信息: 姓名、地址、联系方式和行业分类。
- 财务数据: 收入、利润、资金和债务。
- 员工和高管详细信息: 员工人数和组织结构。
- 业务绩效指标: 增长趋势、市场份额和其他绩效指标。
- 法律与合规信息: 公司文件、专利、商标和法律历史。
公司数据传输方法:数据集与 API
处理预先抓取的公司数据主要有两种方式:API 和数据集。
什么是公司数据集?
公司数据集是已清理和组织好的预编译的业务信息集合,因此您在下载后即可立即使用。
数据集的工作方式很简单:选择数据源,根据需要或供应商允许时自定义其范围,购买后,只需下载文件即可。数据已准备好立即进行集成。
数据集主要采用 CSV、JSON 或 SQL 格式。您通常可以将它们与 AWS S3、Google Cloud Storage 等云托管提供商集成。一些提供商提供定期接收数据集的选项,例如每月、每季度或按照与提供商的约定。
什么是公司数据 API?
公司数据 API(应用程序编程接口)可通过 API 接口按需访问公司信息。使用 API 时,您会向服务器发送请求,然后服务器会以结构化或原始格式返回相关的公司数据。
API 允许您从大型数据库中仅检索必要的数据点,而无需下载整个数据集。例如,您可以按名称、行业、位置等筛选公司。这不仅限制了范围,还限制了费用。
除了传统的公司数据 API,还有网页抓取 API。这些 API 会在您发送 API 请求时实时返回从网页抓取的数据。网页抓取 API 特别适用于从公开来源检索最新或不太常见的汇总信息。
公司数据 API 和数据集之间的差异
在我们深入研究列表之前,这里有一个关于何时选择 API 而不是数据集的快速指南:
| 公司数据 API | 公司数据集 | |
| 来源 | 数据来自各种来源,包括商业注册、新闻、公共记录、数据库和公司网站。 | 数据通常来自类似的商业注册中心、公共记录和第三方数据提供商,并且是预先编译的。 |
| 数据格式 | 基于 API 的原始 HTML、JSON、XML、CSV 或自定义格式。 | CSV、JSON、SQL 或其他结构化文件格式,如 Parquet。 |
| 发货频率 | 如果您使用网络抓取 API,则为实时。 | 通常可一次性下载或按照固定时间表(每月、每季度或自定义频率)下载。 |
| 之路 | 可以通过 API 调用集成到 CRM 系统、网站、营销自动化平台和内部工具中。 | 可下载的数据集可以手动或以编程方式导入到分析工具、数据库或云存储解决方案中。 |
| 最适合 | 企业需要实时、动态地访问公司数据,以供 CRM、潜在客户生成或竞争情报等应用使用。 | 非常适合深入分析、市场研究以及需要大量静态数据集进行批量分析的情况。 |
定价
公司数据 API 和数据集的成本因数据量、复杂性、交付频率和使用情况等因素而异。许多提供商提供免费试用或免费增值计划,但对工具的测试权限有限制。
API 通常提供按量付费定价或订阅计划,并提供基于数量的折扣。其费率在每 10 个请求 50 至 1,000 美元之间。
数据集的定价通常基于数据量和交付方式,一次性购买的价格从 100 美元到 5,000 美元以上不等,或订阅计划的费用为每月 200 至 2,000 美元。
不同提供商的定价模式可能存在很大差异,有时是因为数据计费方式不同。例如,一些公司可能会根据以下因素报价: 学分。 这种模型很灵活,但也可能造成混乱,因为单个请求所需的信用数量可能因请求的数据字段数量而异。
虽然一些提供商可能根据其每信用价格看起来更便宜,但每条记录的实际成本(考虑到每个请求中包含的字段数量或请求类型)可能高于最初建议的成本。
为了简化事宜,一些公司现在正在转向更清晰的定价模式,例如 每条记录的价格,用户可以提前知道他们要支付的费用。
最佳公司数据 API 和数据集
1. 核心信号
一家提供实时 B2B 数据、支持 AI 的企业数据集和 API 的供应商。

可用工具
公司数据 API、公司数据集、Agentic 搜索 API

刷新频率(数据集)
实时 API 访问,按日、周、月、季度
- 数据格式:
– 公司数据 API: CSV
– 公司数据集: JSON、CSV 和 Parquet - 定价模型:
– 数据集: 一年合约,一次性购买
– 数据API: 车辆订阅 - 定价结构:
– 数据集: 定制化
– 数据API: 信用系统,包括所有可用数据字段 - 客户支持: 联系表, 专门的客户经理(针对订阅者和数据集用户)、技术支持
- 免费试用:
– 数据集: 数据样本
– 数据API: 7-day免费试用 - 起始价:
– 数据集: $1,000
– 数据API: $ 49 /月
Coresignal 专注于数据领域,通过 API 和数据集提供高质量、即用型的公司数据。该提供商拥有一个庞大的数据库。 商业信息,其公司数据集涵盖超过 75 万个丰富的公司资料、500 多个数据字段,并覆盖全球。
我们先从数据集开始。Coresignal 的公司数据集提供关键的公司信息,包括公司概况、公司联系人、员工和财务状况、竞争对手、在线形象和产品数据。
更详细的多源公司数据集包含超过 500 个数据字段,涵盖财务、员工、增长等类别。该数据集包括 过滤、映射、清理和丰富 有关全球超过 40 万家独特公司的信息,这些信息来自商业目录和专业网络平台等多种来源。
公司数据集以 JSON、JSONL、Parquet 或 CSV 格式交付。您可以选择合适的交付频率,文件将使用 gzip 压缩,并附带集成说明。
或者,您可以通过公司数据 API 或多源公司数据 API 获取数据。API 允许您查找和检索符合特定筛选条件的数据,或使用公司域名或 URL 段作为标识符来增强现有信息。对于高级全文搜索,用户可以选择 Elasticsearch 查询。
Coresignal 的 Agentic Search API 是新增功能之一,它支持 AI 代理使用自然语言进行 B2B 数据检索。用户可以使用简单的英语描述所需数据,API 会将请求转换为结构化查询,并返回机器可读的记录。
最后,您可以通过自助服务试用 Coresignal 数据。在免费试用期间,您可以构建自定义数据列表、丰富公司数据、体验公司 API 测试平台、搜索相关公司记录,并下载丰富后的数据,而无需从头开始构建自定义数据管道。
然而,自助服务还有待改进。目前,它主要适用于 API,而数据集交互则通过销售和客户管理团队处理。
欲了解更多信息和性能测试,请阅读我们的 Coresignal 评论.
2. Bright Data
具有强大基础设施的公司数据工具。

可用工具
各种数据集和公司数据 API,能够创建自定义数据集

刷新频率(数据集):
一次性、每半年、每季度、每月
- 数据格式:
– 公司数据 API: JSON 和 CSV
– 数据集: JSON、ndJSON、CSV 和 XLSX - 定价模型:
– Web 爬虫 API: 订阅或按使用量付费
– 数据集: 一次性购买,或每半年、每季度、每月购买 - 定价结构: 根据记录
- 客户支持: 全天候实时聊天,专属客户经理
- 免费试用: 企业享有 7 天试用期,个人享有 3 天退款期
- 起始价:
– Web 爬虫 API: 每 1K 条记录 1 美元,或订阅 499 美元(每 0.85K 条记录 1 美元)
– 数据集: 500 万条记录 200 美元(每 2.50 条记录 1 美元)
Bright Data 是另一家出色的提供商,它为 LinkedIn、Crunchbase、Indeed、Glassdoor 和 G2 等公司网站提供公司数据集和网络抓取 API,以及专用端点。
让我们从数据集开始。您可以下载 JSON 或 CSV 格式的数据样本,其中包含 30 条记录。但完整数据集将包含 1,000 条记录。此外,您还可以选择通过删除或重命名字段并根据您的特定要求过滤数据集来创建自定义子集。
您可以从 JSON、CSV、Parquet 等格式中进行选择,或者选择 .gz 压缩。 Bright Data 还提供灵活的交付选项:Snowflake、Amazon S3、Google Cloud、Azure 和 SFTP。该提供商允许您按照自定义时间表(每日、每周、每月或每季度)自动交付数据。
Bright Data的 Web 抓取工具 API 提供实时数据,并附带适用于各种公司网站的现成抓取工具。无论抓取工具类型如何,您都可以在实时抓取时输入最多 20 个 URL,在批量请求时输入更多 URL。
该提供商提供多种交付方式,例如 Amazon S3、Google Cloud Storage、Google PubSub、Microsoft Azure Storage、Snowflake 和 SFTP。您可以以 JSON、NDJSON、JSON 行、CSV 和 .gz 文件(压缩)等格式获取数据。API 允许您管理数据收集进度、设置每个输入的记录限制并监控快照,同时遵守系统对文件大小和交付选项的限制。
如果你坚持使用这个提供商,你还能得到什么?一个互动游乐场、良好的文档以及一个专门的订阅计划客户经理。
欲了解更多信息和性能测试,请阅读我们的 Bright Data 评估.
3. Oxylabs
提供来自顶级来源的公司数据集的优质提供商。

可用工具
Web Scraper API 具有用于公司网站的专用端点、各种数据集以及创建自定义数据集的能力

刷新频率(数据集):
一次性、每月、每季度、每半年或自定义
- 数据格式:
– 公司数据 API: HTML 和 JSON
– 数据集: XLSX、CSV 和 JSON - 定价模型:
– Web 爬虫 API: 根据成功的请求
– 数据集: 未披露 - 定价结构: 订阅
- 客户支持: 全天候实时聊天,专属客户经理(数据集)
- 免费试用:
– Web 爬虫 API: 一周试用,5K 成绩
– 数据集: 联系销售 - 价格:
– Web 爬虫 API:49 美元/月(2 美元/1K 个结果)
– 数据集: 从$ 1000 /月
Oxylabs 是一家优质提供商,提供来自 Owler、AngelList、Crunchbase 等顶级来源的公司数据集。您还可以从 Zoominfo 和 Product Hunt 等目标获取其 Web Scraper API 以获取实时数据。
该提供商支持各种输出格式,包括 XLSX、CSV、JSON 等。您可以将这些数据集存储在多个存储选项中,例如 AWS S3、Google Cloud Storage、SFTP 等。此外,您还可以选择接收数据集的频率 - 每月、每季度或根据自定义时间表。
使用公司抓取工具 API,您需要提供必要的参数和目标 URL。然后,将请求发送到我们的 API 并以 HTML 格式接收结果。
您还可以通过 API 或云存储桶(AWS S3 或 GCS)接收结果。抓取工具包括自定义解析器、网络爬虫和调度程序功能。
该 API 具有 OxyCopilot 功能,可将自然语言指令转换为 Python、Node.js 等 API 代码。即使您不具备高级编码技能,也可以更快、更简单地集成和使用 API。 Oxylabs 还提供专家支持、专门的客户经理和详细的文档。
作为优质供应商, Oxylabs 可能相当昂贵,所以要准备好为高质量数据支付高价。
欲了解更多信息和性能测试,请阅读我们的 Oxylabs 评估.
4. 坚果
超过 50 万份公司简介。

可用工具
公司数据集,LinkedIn Scraper API

刷新频率(数据集)
每月和每季度
- 数据格式: CSV 和 JSON
- 定价模型: 基于成功的结果
- 定价结构: 订阅
- 客户支持: 通过电子邮件、实时聊天、电话全天候
- 免费试用: 可使用
- 价格: 定制
NetNut 提供公司数据集,可访问超过 50 万份公司资料。该数据集采用 CSV 和 JSON 格式,并与各种分析工具兼容。这些数据集可以存储在 AWS S3 和 Google Cloud 等云服务中,并提供灵活的交付时间表,包括每月和每季度选项。
NetNut 提供 3 个月、6 个月和 12 个月的订阅计划。如需更多信息,最好联系提供商的销售团队。
此外,NetNut 还拥有 LinkedIn Scraper API,允许用户实时提取详细的 LinkedIn 公司信息,例如名称、职位和公司规模。该 API 提供干净、结构化的数据。
要了解有关 NetNut 数据集的更多信息,您需要联系他们的销售团队。虽然您可以通过实时聊天联系他们,但请注意,回复是自动的,聊天机器人不会提供太多帮助。虽然有真人可以联系,但您很难联系到他们。
欲了解更多信息和性能测试,请阅读我们的 NetNut 评论.
5.阿皮菲
具有用户友好界面的多个 API。

可用工具
参与者(不同的 API),开发自定义 API 的能力

刷新频率
自定义与监控参与者
- 数据格式: JSON、CSV、XML、RSS、JSONL 和 HTML 表
- 定价模型: 根据使用情况
- 定价结构: 订阅
- 客户支持: 联系表格
- 免费试用: 提供免费计划,含 5 美元平台信用额度
- 价格: 定制(租赁,按结果、事件或使用付费);或每月 49 美元
Apify 是一家知名提供商,拥有数千个预制模板,适用于 LinkedIn、Apollo、Trustpillot 等各种网站。但该提供商还拥有相当值得注意的 API,即所谓的 Actors。
Apify 平台上的参与者是无服务器云程序,根据脚本执行任务,类似于人类参与者执行动作的方式。
Apify 的 Actors 具有易于使用的界面和灵活的设置,因此您可以通过 API 运行它们或让它们随时准备实时运行。这意味着您可以像标准 API 服务器一样快速处理传入的请求,而无需复杂的设置或技术专业知识。
每次 Actor 运行的数据都保存在单独的数据集中,这些数据集通常在网页抓取、爬取或数据处理任务期间创建。这些数据集可以导出为各种格式,包括 JSON、CSV、XML、Excel、HTML、RSS 或 JSONL,并以表格形式可视化。
在定价方面,您可以尝试聘请单个演员并支付特定费用(每个演员的费用不同)或订阅月度计划。