基于本体的电子商务思索

时间:2022-04-13 04:50:00

导语:基于本体的电子商务思索一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

基于本体的电子商务思索

一、引言

随着全球信息化的发展,电子商务(E-commerce-EC)已经成为世界经济市场必不可少的组成部分。有预测表明,2009年全球电子商贸的总量将超过18000亿美元。伴随电子商贸的蓬勃发展,EC模式呈现出自动化、智能化和移动化的新趋势。而传统基于HTML的EC平台缺乏语义信息,无法将显示信息与数据分离,难以满足EC新需要。Web元信息处理和语义化发展,特别是AI成熟的理论、方法和技术,将对EC的发展起到关键的作用。

电子商务平台是使交易双方的需求及供给信息都可以良好交流和交换的地方,所以构建一个良好的电子商务平台首要的要求就是交易双方的信息可以充分地交换和互用。但是,由于交易双方所使用的计算机系统等一些方面的不同,会产生互用性问题,特别是通过Internet进行商业活动时。计算机系统相互作用时存在的问题大体可以划分为以下四种类型:系统异构、语法层异构、结构层异构和语义层异构。系统异构包括硬件和操作系统之间的不相容;语法异构指的是不同语言和不同的数据表示;结构层异构指使用不同的数据模型;语义层异构指系统间交换信息时所用术语的含义不同,如同义词。其中,随着技术的发展,前三种类型的问题已逐渐得到更好的解决,如使用CORBA,DCOM和不同的中间件产品。XML的出现在一定程度上解决了最后一类问题。XML本身具有的许多优点为电子商务特别是B2B的发展带来了很大的变化,如XML持国际语言编码标准Unicode,把业务规则和数据内容、结构分离开来,用户只需协商数据内容和结构,从而可以自由定义和实现各自的业务规则,企业之间可以灵活方便地建立多对多的连接等。本文着重描述数据内容和结构的元语言XML[1],凭借其强大的定义和表示标记语言能力,正成为互联网信息表示与交换的标准格式。采用XML作为表示语法,W3C开发了在Web上进行元数据处理和交换的标准RDF(S)[2],RDF(S)的出现使得本体建模技术可以应用于EC内容定义和信息交换,使得开发自动化、智能化和移动化的EC平台成为可能。然而,XML虽然在定义数据结构和语义方面提供了标准的语法,但它并没有提供描述商业过程和商品交换的标准的数据结构和术语。因此,使用XML进行交易方之间的数据交换时,首先必须在使用的词汇,以及用法和语义方面达成一致,这在一定程度上抑制了电子商务特别是B2B的跨领域、跨地区甚至跨国家的扩展性发展。为了更好地解决电子商务中的语义异构问题,引入了人工智能领域中的Ontology(本体)技术。它是不同领域、不同应用系统之间进行交流、协定的可以共享理解的表示。这种协定有助于对内容意义的精确、高效通信,同时又反过来促使系统的交互式操作、重用和共享等一系列的性能得以提高[3]。

二、Ontology的概念及相关理论

Ontology在人工智能领域用于知识的共享,从20世纪90年代初以来,Ontology就已成为许多人工智能研究领域中如知识工程、自然语言处理与知识表示的研究主题。经过多年的发展,如今Ontology在智能信息集成、协作信息系统(CooperativeInformationSystems)、信息检索、知识管理及电子商务等方面的应用越来越广泛。其中主要原因就是Ontology提供了对某一领域(Domain)可共享的、通用的理解,从而使不同人员、不同应用系统之间可以进行通信。因为Ontology针对的是领域中达成一致的知识,所以它的发展也常常是参与其中不同的人、不同组织(可能分布在不同地方)之间的协作过程。

(一)Ontology的概念

Ontology作为从哲学领域借鉴过来的术语,在哲学中它是一种存在的系统化解释。Ontology的概念有很多,但是目前基本上得到认同并能够较好表明它的本质的概念是:Ontology是对一个共享的概念化的形式的、显式的规格说明。“概念化”指的是世界上某些现象的抽象模型,该模型能够识别现象的相关概念。“显示的”指所使用概念的类型及这些概念在使用上的约束要显式定义。“形式的”指Ontology是机器可以处理的。当然,这种形式化的程度可以不同,例如WordNet提供了超过100000的使用自然语言解释的术语,而CYC提供了常识知识许多方面的形式化、公理化理论。“共享”说明Ontology表明的是达成一致的知识,也就是说,它并不是局限于某几个个体而是被整体所接受。

1、Ontology的语言有许多语言可用于表示Ontology,其中一些语言是基于XML语法并用于语义Web的,如:OXL(OntologyeXchangeLanguage),SHOE(SimpleHTMLOntologyExtension,最初基于HTML),OML(OntologyMarkupLanguage),以及由W3C工作组创建的RDF(ResourceDescriptionFramework)与RDFSchema。最后,还有建立在RDF与RDF之上的、较为完善的Ontology语言OIL(OntologyInferenceLayer)和DAML+OIL(图1)。当然,还有其它创建Ontology的语言如传统的OKBC,OCML等。选择何种语言表示,要根据具体的应用来定。

2、RDF框架的概念本体需要某种语言来说明,该语言应能以机器可理解的方式准确地定义概念以及概念之间丰富的关系。RDF框架由三个部分构成:①RDFDataModel。其形成对资源的形式描述。它包括三个对象类型:资源、属性、陈述。任何可以通过URI(UniversalResourceIdentifier)来表示的对象都是RDF资源,它的属性由属性类型来标识,每一个属性类型都有对应的属性值。RDF采用对象-属性-值的三元组来描述资源间的相互关系,记为A(O,V),分别对应上面的资源、属性和属性值,或者称为主题、谓词和对象,意为对象O拥有值为V的属性A。②RDFSchema。定义描述资源时需要的属性类及其意义、特性。RDFSchema使用一种机器可以理解的体系来定义描述资源的词汇。如:rdfs:Resource、rdfs:Class和rdfs:Property类,rdfs:subClassof和rdfs:subPropertyof属性关系,以及rdfs:domain和rdfs:range的属性约束关系。该词汇集构成了一种基本类型系统及该系统的基础类,这些基础类包括了定义新类必需的元对象类型,因此RDF具有扩展特性,适合于EC本体建模。③RDFSyntax。尽管RDFDataModel提供了一个抽象的框架来描述资源,Schema定义和声明了一些属性类,但要形成人机可读的具体文件,还需要一个具体的语法体系来完成。RDFSyntax借助其宿主语言XML,把形式化描述转换成机器可以理解和处理的文件。

(二)Ontology在B2B电子商务信息集成中的应用

电子商务中的B2B[4]主要从事企业与企业之间在线进行商业合作的交易,Internet和基于Web的电子商务为优化商业关系提供了较高水平的灵活性和开放性。这些电子商务B2B平台为他们的客户提供了新的机会,可以帮助客户不需要通过大量的通讯渠道,就可以联系到许多潜在的商业伙伴。譬如中国的阿里巴巴以全球领先的B2B电子商务网上贸易平台为许多企业带来了商机和利润。当然,B2B电子商务网上贸易平台在带来优于传统商务交易的许多特点的同时也带来了一些问题,其中成指数增加的交易方提供的大量产品描述、目录和文档等,由它们带来的异构问题成为了B2B电子商务发展的瓶颈,因而对这些不同类型描述信息的有效管理成为B2B电子商务的主要任务。B2B电子商务中包含了三种不同类型的标准之间的相互作用:

(1)描述像购买合同等可交换商业文档的不同标准(如:XMLCommonBusinessLibraryxCBLandCommerceXMLcXML)。

(2)使用产品种类等级和每一种类的属性对产品进行详细说明的内容标准(如:UN/SPSC,ecl@ss4和UCEC)。

(3)根据某个内容标准对产品进行详细说明的产品目录,它可以被可交换商业文档引用(如:Ariba和CommerceOne)。从技术的角度来看B2B的信息集成任务,它主要包括两种:商业文档的集成和内容标准管理。其中的关键技术是基于本体(Ontology)来实现的。

1、B2B文档集成随着XML技术的不断成熟,大多数进行B2B电子商务的企业使用XML编码的文档,从而产生了许多基于XML的电子商务标准。如:CommerceOne提出的xCBL(XMLCommonBusinessLibrary)标准,包含了B2B中进行交互使用的约600种不同文档类型。虽然在一定应用范围内,这些文档具有一致性,可以进行互操作,但是它们在文档的结构、信息分解、复杂性和应用背景上不同。传统的转换技术在效率和应用范围上均不能满足要求,但使用具有发展前景的Ontology技术,能够较好地解决电子商务中的这一问题。以Ontology为中介的信息集成提供了进行文档集成、将概念结构引入文档和对基于知识的文档查询、检索进一步集成的良好架构。XSL-T与Xpath结合使用可以转换任意XML文件,但由于进行的是直接映射,所以规则比较复杂,程序编写困难、复杂,维护起来不容易,而且实现的映射重用性差。基于Ontology的多层次集成可以解决以上的问题,该方法中将信息的表示分为三个层次:语法层、数据模型层和Ontology层。

(1)语法层对应使用XML序列化表示的文档实例,该序列化主要说明使用到的XML元素和属性以及它们的顺序。

(2)数据模型层可以看作是语法层与Ontology层之间的桥梁,该层将在语法层中的差异抽取出来进行表示,并用对象—属性—值对产品进行描述。标准化(Normalization)的进行是根据相应的Ontology进行的,因为在Ontology中表明了按所要求粒度进行元素分解后的元素的语义。该层使用的术语由相应的Ontology进行定义,并且通常必须与在语法层使用到的相符合。然而,前者比后者要详细得多,如在XML文件描述中,街道名称与门牌号可以作为一个元素,而在Ontology中,两者肯定是分开的。该层次可以使用RDF进行描述,也可使用SOAP(SimpleObjectAccessProtocol)。

(3)Ontology层包含每一种文档类型通用的文档Ontology,如产品目录Ontology、购买合同的Ontology等。这些Ontology提供了电子商务B2B中的使用到的术语及术语的形式化语义。如地址在运输文档中可能是指运输地址,而在财务文档中可能是指账单地址,在Ontology层这两种类型的地址必须明确地分开。另外,Ontology中还包含了在一些文档标准中可选或忽略的元素。按照上述层次描述,可实现电子商务B2B中的较复杂的文档集成,结构如图2所示,总的来说可以分为三步:①按照从语法层到数据模型层的转换要求,从XML描述中抽象出源文档的RDF数据模型,这样解决了由于XML语法的多样性和复杂性带来的转换规则的复杂性。②把文档的数据模型转化为电子商务B2B中的使用的术语,并在相应的文档Ontology中详细说明。在该步骤中,数据模型的粒度水平需要与电子商务B2B中的使用的粒度水平平齐。这意味着可能需要进行一对多的转化。③电子商务B2B的按照目标文档标准的术语生成一个相应的文档,其中由于原子概念的粒度水平的不一致,需要对该文档进行多对一的到RDF表示的转换。

2、内容管理内容标准提供了产品描述的等级,并定义了产品类别之间的Subclass-of关系。产品目录中的每一个产品链接到某一特定产品类别,该产品类别对产品进行了详细描述。内容标准可以分类为“水平型”标准和“垂直型”标准。“水平型”标准提供了高层次的所有可能产品的分类并覆盖了多个领域。每一个“垂直型”标准提供了某一领域的深入和细致的分类。通常“,垂直型”一个“水平型”标准的几个低层次种类的扩展。较著名的“水平型”内容标准UNSPSC,具有超过12000种类的五层分类模式,但它不是描述性的,也就是说,它不包含产品的属性描述,仅仅只有产品名称的层次描述。该标准的层次是从产品供应方的角度进行分类的,如打印纸与书写纸均属于印刷产品一类,笔则属于办公用品这一类,因为从供应方的角度考虑它们完全属于不同的类别。另一“水平型”内容标准ecl@ss,支持工业企业供应链的产品和信息流,是德国企业中主要使用的标准。它根据工业用户及供应商的需要,提供了约为12700以上的种类,层次的划分是按照购货方的需要进行的,如书写纸与笔都归于办公用品供应方一类。ISO,RosettaNe(t主要是为IT产品)是“垂直型”标准的典型例子。从本质上说,内容标准也就是产品Ontology,它们提供产品分类层次和相关产品属性。因此,电子集市需要进行的内容管理任务实际上是Ontology的管理任务。它包括:①产品分类。按产品Ontology中的类别,对产品进行分类。②产品再分类。由于不同企业有自己不同的需求,因此,往往会造成不同的产品分类,因此这就要求B2B电子商务网上贸易平台具有根据新的分类模式再分类的能力,根据新的产品Ontology将新类型分配给某一产品。在该任务中需要解决水平型标准之间、垂直型标准之间,以及水平型标准与垂直型标准之间的映射问题。③产品描述层次的个性化并根据不同产品Ontology产生视图。不同的用户希望得到不同的产品分类视图,根据用户的描述,内容管理过程可半自动化地产生用户需要的产品目录视图。为了更好地实现面向用户,需要设计和实现两个产品Ontologies:客观的与主观的产品Ontology。客观的Ontology用于描述被讨论域内典型产品目录中的元素,如打印机重量;主观Ontology描述有关用户喜好的产品信息元素,如打印机的打印分辨率。分类规则可以发展成为根据一定主观的类别对产品信息进行分类,如便宜的家用打印机。Ontologies可以用于模仿(Model)每一产品特性的协商。④不同版本Ontology的维护,确保Ontology的一致性。这主要是由于内容标准的经常变化,如UNSPSC每两个星期需要进行一次更新。

三、结论

本文介绍了Ontology的概念和相关理论,从较高的层面上研究分析了它在B2B电子商务产品信息集成中特别是文档集成和内容管理中的作用,在一定程度上帮助解决了B2B电子商务发展的瓶颈问题。随着Ontology技术(如Ontology表示语言、Ontology学习方法、Ontology库系统及Ontology工程工具等)的不断完善,以及语义Web技术的日臻成熟,Ontology技术在B2B电子商务中的应用将更加广泛。