以下内容摘自文献
Chia-Hui Chang, Mohammed Kayed, Moheb Ramzy Girgis, et al. 2006.
A Survey of Web Information Extraction Systems. IEEE transactions on knowledge and data engineering, 18(10): 1411-1428
执行信息抽取的程序被称为抽取器(extractor)或包装器(wrapper)。包装器的最初定义来自于信息集成系统的一个部件,该部件提供一个统一的查询界面,可以通过该界面从多个异构信息源中获得数据。在一个信息集成系统中,一个包装器通常是一段程序,用该程序将一个信息源(例如一个数据库服务器或一个Web服务器)进行包装,这样,信息集成系统不需要改变其核心查询应答机制,就能够访问该信息源。当信息源是Web服务器时,包装器必须通过超文本传输协议(HyperText Transfer Protocol, HTTP)查询Web服务器,收集查询结果页面;然后对HTML (HyperText Mark up Language,超文本标记语言)文档执行信息抽取,获取其中的内容;最后把抽取结果和其他数据源的抽取结果集成起来。在这三个过程中,信息抽取往往得到更多的关注,有一些人甚至直接使用包装器来描述抽取程序。一个包装器通常执行一个模式匹配过程(如某种有限自动机),匹配过程的依据是一组抽取规则。
分享到:
相关推荐
QueryWrapper 常用用法
去CSDN下载所谓破解出现以下错误:wrapper | Licensed to (null) for (null) wrapper | wrapper | Launching a JVM... jvm 1 | WrapperManager: Initializing... jvm 1 | WrapperJNI Error: Not licensed to use ...
MyBatisPlus条件构造器 -Wrapper详解(为知笔记版,可用网页打开),详解wrapper条件构造器的各种使用方法及其扩展类的使用方法。
RDP Wrapper对应的配置文件,支持10.0.1904.1503
windows程序设计(珍藏版)_wrapper_wrapperwindows程序设计(珍藏版)_wrapper_wrapperwindows程序设计(珍藏版)_wrapper_wrapper
wrapper java window系统服务
RDP Wrapper10.0.19041.84,win10多用户
C:\Users\Administrator\.m2\wrapper 解压到这里 方便idea调用
wrapper.h头文件都在里面了,我的操作系统实验作业源码是需要这里的头文件才可以运行,当然这个头文件只是相当于万能头文件,你也可以按自己的经验添加部分头文件即可运行我的源码。(最后拜托审核员大大不要修改我...
10G以太网 wrapper 千兆万兆以太网控制器 wrapper 万兆
Kompex SQLite Wrapper Source
Java Service Wrapper可以将Java程序包装成系统服务,这样就可以随着系统的运行而自动运行,本资源是linux 64位java环境下使用的wrapper资源,其他操作系统资源可以从地址:...下载
tcp_wrapper tcp_wrapper
Java Maven Wrapper 0.4.2独立Jar包。
Java Service Wrapper使用总结,将java应用发布为可安装的服务
windows wrapper 相关文件,包括wrapper相关文档、配置说明文档。实现通过windows服务的方式启动java项目
【RDP Wrapper 配置文件更新脚本】 简介:由于 RDP Wrapper 多年未更新,自带的配置文件不支持新版本的远程桌面服务。因此我们只需更新配置文件即可。 用途:一键解决 RDP Wrapper 提示 Not listening [not ...
Java Service Wrapper使用说明
卡耐基梅隆 Kinect Wrapper Unity Package v2.9 较新SDK,更多资源讲解请到开发者官网查看 可以去unity资源店资源界面查看开发者的介绍
wrapper工具包制作windows服务