• 售前咨询
  • 400-6240-800

产品概述

百分点互联网数据采集系统(Baifendian Data Crawl,简称:BDC)是一款强大易用的互联网数据采集系统,通过友好的可视化界面操作,精准、快速和大规模地将网页数据采集下来并实现结构化转变,支持多种存储和发布方式。

产品功能

多类型网站采集

支持新闻、电商、微博、贴吧、论坛、博客等多种类型网站数据采集。

多种抓取策略

全量抓取、增量抓取、自动翻页,支持自动扩散、过滤、实时、定时、优先级设定。

自动调整抓取周期、基于深度学习的自动内容解析。

轻量级数据处理

系统支持字符串替换、字符串提取、数据类型转换等轻量级数据处理,后续可以通过文本分析技术进行深度挖掘。


告警功能

数据质量监控,数据采集量监控,当天下载量、站点改版监控,账号失效、任务运行日志报错监控,并支持系统界面告警、邮件告警和短信告警方式。

产品功能

多类型网站采集

支持新闻、电商、微博、贴吧、论坛、博客等多种类型网站数据采集。

多种抓取策略

全量抓取、增量抓取、自动翻页,支持自动扩散、过滤、实时、定时、优先级设定。

自动调整抓取周期、基于深度学习的自动内容解析。

轻量级数据处理

系统支持字符串替换、字符串提取、数据类型转换等轻量级数据处理,后续可以通过文本分析技术进行深度挖掘。


告警功能

数据质量监控,数据采集量监控,当天下载量、站点改版监控,账号失效、任务运行日志报错监控,并支持系统界面告警、邮件告警和短信告警方式。

产品功能

多类型网站采集

支持新闻、电商、微博、贴吧、论坛、博客等多种类型网站数据采集。

多种抓取策略

全量抓取、增量抓取、自动翻页,支持自动扩散、过滤、实时、定时、优先级设定。

自动调整抓取周期、基于深度学习的自动内容解析。

轻量级数据处理

系统支持字符串替换、字符串提取、数据类型转换等轻量级数据处理,后续可以通过文本分析技术进行深度挖掘。


告警功能

数据质量监控,数据采集量监控,当天下载量、站点改版监控,账号失效、任务运行日志报错监控,并支持系统界面告警、邮件告警和短信告警方式。

产品优势

全面覆盖

基于源代码提取原理,几乎可以实现所有网站页面数据采集;自动翻页、不限级深度爬取实现对网页数据全面深度抓取;支持接口和插件多种扩展延伸,满足更加多样化的使用需求。

数据精准

实时监控采集和告警,异常快速应对,确保数据准确。

灵活便捷

友好的可视化操作界面,可便捷定义目标网站和页面,标定抓取内容;灵活策略配置,针对不同网站类型采用不同抓取策略,可自动调整抓取周期。

高效稳定

分布式高速采集,将任务分配至多个服务端节点同时运行采集,多任务多线程式的运行模式,能够最大化提升运行效率; 任务量得以分解,服务端所占用资源减少,性能更加稳定。

全面覆盖

基于源代码提取原理,几乎可以实现所有网站页面数据采集;自动翻页、不限级深度爬取实现对网页数据全面深度抓取;支持接口和插件多种扩展延伸,满足更加多样化的使用需求。

数据精准

实时监控采集和告警,异常快速应对,确保数据准确。

灵活便捷

友好的可视化操作界面,可便捷定义目标网站和页面,标定抓取内容;灵活策略配置,针对不同网站类型采用不同抓取策略,可自动调整抓取周期。

高效稳定

分布式高速采集,将任务分配至多个服务端节点同时运行采集,多任务多线程式的运行模式,能够最大化提升运行效率; 任务量得以分解,服务端所占用资源减少,性能更加稳定。

全面覆盖

基于源代码提取原理,几乎可以实现所有网站页面数据采集;自动翻页、不限级深度爬取实现对网页数据全面深度抓取;支持接口和插件多种扩展延伸,满足更加多样化的使用需求。

数据精准

实时监控采集和告警,异常快速应对,确保数据准确。

灵活便捷

友好的可视化操作界面,可便捷定义目标网站和页面,标定抓取内容;灵活策略配置,针对不同网站类型采用不同抓取策略,可自动调整抓取周期。

高效稳定

分布式高速采集,将任务分配至多个服务端节点同时运行采集,多任务多线程式的运行模式,能够最大化提升运行效率; 任务量得以分解,服务端所占用资源减少,性能更加稳定。

应用场景

舆情监控和普查

汇聚国内外网络公开信息数据,监控关注话题或事件态势,进行实时监控,对不利或危情信息及时预警,为有效预防和控制提供有效手段。

通过对网络各渠道信息的提取分析,对企业信息(经营人、办公地、联系方式、经营范围)进行核查。


获取商业情报和销售线索

实时准确获取公共信源的行业新闻、竞争对手信息(价格、销量、营收、投资、合作、专利等)等商业情报,提升企业数据决策力;

抓取网络中用户的评价或反馈信息,发掘口碑数据,为服务和产品改善和公关提供数据支撑;

从网络公共信息中采集销售线索,获取潜在客户的资料,增加企业获客渠道。

内容补充和影响力分析

通过对指定网站的新闻内容、专业文章、论坛帖子等内容的采集,扩充内容来源与数量,构建稿件库,指导选题、节约采编人员时间;

分析新闻或文章网络传播路径和影响力。

政府应用
企业应用

舆情监控和普查

汇聚国内外网络公开信息数据,监控关注话题或事件态势,进行实时监控,对不利或危情信息及时预警,为有效预防和控制提供有效手段。

通过对网络各渠道信息的提取分析,对企业信息(经营人、办公地、联系方式、经营范围)进行核查。


获取商业情报和销售线索

实时准确获取公共信源的行业新闻、竞争对手信息(价格、销量、营收、投资、合作、专利等)等商业情报,提升企业数据决策力;

抓取网络中用户的评价或反馈信息,发掘口碑数据,为服务和产品改善和公关提供数据支撑;

从网络公共信息中采集销售线索,获取潜在客户的资料,增加企业获客渠道。

媒体出版

内容补充和影响力分析

通过对指定网站的新闻内容、专业文章、论坛帖子等内容的采集,扩充内容来源与数量,构建稿件库,指导选题、节约采编人员时间;

分析新闻或文章网络传播路径和影响力。

案例

业务咨询

姓名
邮箱
手机号码
公司名称
需求描述

*为了更好的为您提供咨询服务,请确保手机号码填写正确。

提交