作者:
出处:1.语义网的特征:
每个资源有清晰的定义,如软件,文件,人,地点。概念之间的关系有清晰的定义,如软件产生文件,软件依赖于软件,文件的版本,文件具有主题,人所在地点。目标是实现机器自动处理信息。它将提供诸如信息代理、搜索代理、信息过滤等智能服务。语义Web上提供的这些智能服务应该超越目前这些服务的技术水平,克服它们在功能上仅能独立运行、无法交互的限制。语义网的技术基础是 XML和 RDF;其基本实现方法是开发功能逐层增强的形式化信息规约语言,用以唯一确定信息的含义,其最终目标是成为智能化网络服务和应用开发的基础设施,成为机器与人协同工作的媒介。
2.语义网的目标:
让计算机能够“理解”分布在网上的信息和知识,并在“理解”的前提下更好地处理、利用这些信息和知识,使Web成为支持全球化知识共享的智能信息服务平台,为人们提供优质的服务。
3.语义网的相关问题
信息检索 — 关键词检索与基于内容的检索 信息抽取 — 元数据:有关数据的数据。主要包括
- 语法元数据:描述有关数据内容的非上下文信息。如文档的大小、位置、创建日期等
- 结构元数据:提供有关内容结构的信息,如使用DTD或者XML Schema 可以定义XML文档用到的元素、属性和实体以及不同元素和属性之间的关系。
- 语义元数据:对语法和结构元数据添加了关系、规则和约束条件。
信息表示 — 内容与表示的分离 信息与自然语言语义 数据挖掘和知识发现 信息集成和概念集成
4.语义网层次
该体系中从低层到高层分别为:Unicode和URI、XML、RDF、Ontology、Logic、Proof、Trust
- 第一层Unicode和URI。该层是整个语义Web的基础,其中Unicode处理资源的编码,URI负责标识资源
- 第二层XML+NS+XML Schema,用于表示数据的内容和结构
- 第三层RDF+RDF Schema,用于描述Web上的资源及其类型
- 第四层Ontology vocabulary,它用于描述各种资源之间的联系
- 第五层到第七层是在下面4层的基础上进行的逻辑推理操作,包括公理和推理规则、认证机制及信任机制
- 其中核心层为XML、RDF、Ontology,这3层用于表示Web信息的语义
5.RDF
资源描述框架(Resource Description Framework, 简称 RDF)提供了一种用于表达这一信息、并使其能在应用程序间交换而不丧失语义的通用框架。RDF是一种描述资源的语言,是W3C组织推荐的描述Web上元数据的标准。用Web标识符(URI)来标识事物,用简单的属性(property)及属性值来描述资源
主要包括三部分
- RDF模型
- RDF/XML语法
- RDF Schema
RDF三元组 被定义为(Subject,Predicate,Object),它由主体(事物)、谓词(属性)和客体(值)三部分组成。主体和谓词的类型是URI,表示一个Web 资源,客体即可以是URI,也可以是文字(Literal),RDF三元组也被称为RDF声明(Statement)。
RDF的图模型: 可把RDF声明表示为有向、带标签的图。
- 椭圆节点表示用URI指代的主体和客体
- 方框节点表示文字类型的客体
- 有向弧标签则表示用URI指代的谓词
RDF /XML 语法:
用于RDF图的表示和交换。如
- 为RDF图中所有空节点指定一个空节点标志符
- 对应于每个RDF三元组中的主体,生成一个rdf:Description元素
- 同一个主体的多个声明可合并为一个rdf:Description元素
RDF Schema: 实现对RDF的扩展,可用于描述和定义于特定应用相关的类和属性,从而可创建自定义的词汇表,如字典表述语言。
RDFS的作用:
- 定义资源以及属性的类别;
- 定义属性所应用的资源类以及属性值的类型;
- 定义上述类别声明的语法;
- 申明一些由其它机构或组织定义的元数据标准的属性类。
描述RDF类
- 类是指事物的类型或者分类,rdf:Class、rdf:Resouce、rdf:type、rdf:subClassOf 例如:
- 描述RDF属性,rdf:Property、 rdf:range、rdf:domain 例如:
Semantic Web和Semantic Web Service。区别就像Web和Web Service的区别。Semantic Web提供了语义化的Web网络,而Semantic Web Service则更进一步,提供了对外调用接口的支持。
6.Ontology
客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。An ontology is a formal, explicit specification of a shared conceptualization – Gruber
- ‘Conceptualization’指通过抽象出客观世界中一些现象的相关概念而得到的模型
- ‘Explicit’指所使用的概念及使用这些概念的约束都有明确的定义
- ‘Formal’指Ontology是计算机可读的
- ‘Shared’指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
- “共享”指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集
- “概念模型”指通过抽象出客观世界中一些现象的相关概念而得到的模型
- “明确”指所使用的概念及使用这些概念的约束都有明确的定义
- “形式化”指Ontology是计算机可读、可理解的
建模元语:
类(classes)或概念(concepts):指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述 ,e.g. In university-ontology: student and professor are two classes
关系(relations):在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1×C2×…×Cn Such as: subclass-of, is-a
函数(functions):一类特殊的关系。该关系的前n-1个元素可以唯一决定第n个元素。形式化的定义为F:C1×C2×…×Cn-1→Cn,如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。
公理(axioms):代表永真断言,如概念乙属于概念甲的范围
实例(instances):代表元素。从语义上讲实例表示的就是对象,Such as: Student called Peter is the instance of Student class。
4种基本关系:
构造Ontology的规则:
- 明确性和客观性:Ontology应该用自然语言对所定义的术语给出明确、客观的语义定义
- 完全性:所给出的定义是完整的,完全能表达所描述的术语的含义
- 一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾
- 最大单调可扩展性:向Ontology中添加通用或专用的术语时,不需要修改已有的内容
- 最小承诺:对待建模对象给出尽可能少的约束
广泛使用的本体:
语言栈:
6.语义Web的应用
- 语义Web服务(Semantic Web Services)
- 内容管理(Content/Knowledge Management)
- 概念检索(Concept Searching)
- 智能代理(Intelligent Agent)
- 普适计算(Ubiquitous/Pervasive Computing)
作者:
出处: