专利内容由知识产权出版社提供
专利名称:数据抽取方法及装置专利类型:发明专利发明人:曹六一,张丹,于晓明申请号:CN201611161732.4申请日:20161215公开号:CN108228629A公开日:20180629
摘要:本发明实施例提供一种数据抽取方法及装置。该方法包括:数据抽取插件从数据总线获取数据抽取任务,所述数据总线连接有多个数据抽取插件,每个数据抽取插件用于抽取不同种类的数据;数据抽取插件根据所述数据抽取任务抽取数据;并将其抽取到的数据发送给所述数据总线。本发明实施例基于数据抽取插件的数据抽取子系统,将散步在各个爬虫系统的中的抽取子模块插件化,解除与原系统的紧耦合,因此可以方便的对数据抽取模块进行复用;同时,将抽取模块以插件的方式集中管理,能更好的调配机器物理资源,提高物理资源的利用率。
申请人:北大方正集团有限公司,北京北大方正电子有限公司
地址:100871 北京市海淀区成府路298号中关村方正大厦9层
国籍:CN
代理机构:北京同立钧成知识产权代理有限公司
更多信息请下载全文后查看