地理信息系统概念及其理解范文

时间:2023-11-27 17:55:56

导语:如何才能写好一篇地理信息系统概念及其理解,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

地理信息系统概念及其理解

篇1

关键词 Web GIS 构建方案 技术 应用

中图分类号:TP393 文献标识码:A

0引言

GIS是地理信息系统(Geographic Information System)的简称,是一种在计算机软硬件支持下的空间数据输入、存储、检索、运算、显示、更新和综合分析的应用技术系统。经过三代软件的改进,形成了图像处理功能强大、支持大型数据库的信息系统平台。目前,最具代表性的新技术有:互联网GIS(Web GIS)、虚拟现实GIS(VR GIS)、组件GIS(COM GIS)等。Web GIS作为GIS的一大分支,本文将在理解该技术基本概念和特点的基础上,重点探讨基于各类构建方案的新应用。

1 Web GIS概述

21世纪是信息的时代,互联网技术的飞速发展正在改变着整个世界,互联网技术与诸多领域相互交融,成为了当今世界最大的信息网络。在此背景下,互联网技术为GIS提供了一种崭新的地理信息载体,开创了GIS与互联网相融合的重大革新。

互联网地理信息系统(Web GIS)是一种基于互联网平台、客户端运行于互联网上的地理信息系统,是地理信息系统基于互联网技术的新扩展。Web GIS通过互联网来连接多个主机、数据库以及终端来组成系统,具备服务端为客户端提供服务、客户端获取有效信息的功能结构。

Web GIS在结构上属于分布式地理信息系统模型,通过互联网可有效地实现分布式地理信息处理。主要由浏览器、服务器、编辑器、信息四部分组成。其中,浏览器可用于服务器连接点上各种地理信息数据读取;服务器可用于浏览器与服务器之间的交互;编辑器可用于各类空间数据的编辑与显示;信息直接提供数据库访问功能,空间网络化的关键部分。

2 Web GIS主要特点

与传统桌面或局域网GIS技术相比,简单来说,Web GIS是一种基于Web的GIS技术,具有以下主要技术优势:

(1)支持互联网标准。Web GIS支持互联网网络通信标准,可以实现与各种数据连接的功能,具有结构上的优越性,是实现所有需求的保证。

(2)分布式服务体系结构。该结构可在客户端和服务器端活跃执行进程,显著降低了宽带要求提高系统性能,有效平衡处理负荷。

(3)高效利用空间数据资源。该技术可充分调用GIS数据库,将其转换为自身所能使用的数据。同时将数据分散存储,对于降低负荷、加快访问速度、减少成本有很大帮助。

3 Web GIS构建方案

Web GIS具有开放的服务器和客户端结构,这使得客户端可以同时获取服务器端硬件资源和互联网数据资源等。依据属性数据的逻辑位置,可将Web GIS划分为服务器端和客户端两种解决方案。对于服务器端解决方案,主要是由服务器完成复杂的数据库任务,通过网络传输给客户端并显示出来;对于客户端解决方案,服务器通过发送客户程序来实现与用户的简单交互,操作方便灵活,但处理大型数据库能力有限。

目前,常见的Web GIS系统开发方法有:利用通用网关接口(CGI)技术构建系统;利用服务器端应用程序接口构建系统;利用plug-in插件技术构建系统;利用ActiveX控件和DCOM组件对象模型构建系统;利用Java编程语言构建系统。前两类构建方案主要运行于服务器平台,后面三类构建方案运行于客户端。基于上述五种技术方法构建的Web GIS系统平台在许多领域获得了很好的应用。

4 Web GIS的应用

由于Web GIS的重要性以及提供的巨大商机,地理信息系统软件商纷纷推出了各自的系统版本,且更新周期非常快。虽然各个软件生产商推出的Web GIS平台的实现技术不同,但是它们的体系结构和系统组织基本是一致的,都是由GIS浏览器、Web服务器、GIS服务器、数据库四部分组成。

其中国外具有代表性的Web GIS平台有ESRI公司的Internet Map Server(ArcIMS)平台、MapInfo公司的MapXtreme平台、Autodesk公司的Autodesk公司的Autodesk MapGuide平台、Intergraph公司的GeoMedia Web Map平台。国内以武汉吉奥公司的GeoSurf平台和国家遥感应用工程技术研究中心的地网GeoBeans平台最具代表性。

总之,Web GIS成功开拓了地理信息资源研究的新领域,有效提高了地理信息的共享化程度,为地理信息工作者们开辟了有效途径,是地理信息系统软件发展的必然趋势。

参考文献

[1] 梁红莲,刘登忠.GIS应用现状及发展趋势探讨[J].物探化探计算技术,2001(1).

篇2

地理信息系统(GIS)是采集、存储、管理、分析和描述地理信息的空间信息系统。GIS诞生于20世纪60年代,随着人们对资源、环境和灾害防治等问题的日益关注,其在短短五十年的时间里得到蓬勃发展,从一开始仅在地学领域应用到现今几乎深入社会生活的各个领域。GIS的迅速发展,带动了大量相关人才的需求,对GIS教育提出了更高的要求[1]。

GIS涉及计算机、测绘、管理等多学科,从理论和技术方法上,可分为数据采集、数据加工处理和应用等多个分支,《地图学》是其最重要的理论与方法支撑。GIS是《地图学》在计算机技术支持下发展的产物,《地图学》与GIS一样,都以空间地理信息为操作和表现对象,其相关理论、原理和技术方法等在GIS中的地理信息加工处理、可视化表达、分析应用等方面都得到充分体现[2]。

《地图学》是使用图形及符号模型系统再现客观实体,反映和研究自然与社会现象的空间分布、变化、组合和相互联系及其空间变化规律的科学。地图是一种特定而又十分重要的空间信息描述及计算机表示信息系统数据的基础与来源,为以采集、存储、管理、分析和描述整个或部分地球表面与空间和地理分布的数字地球系统提供最基础与真实的图形和相关属性数据。因为地球是人类赖以生存的基础,所以《地图学》是与人类的生存、发展和进步密切关联的一门信息技术学科。知识经济时代,知识的更新日益加快,《地图学》的基本理论和应用技术也飞速发展[3]。

《地图学》既是一门具有悠久历史的传统科学,又是一门随现代信息科学技术发展而迅速发展的学科。如何在教学中帮助学生牢固地掌握本学科的基础知识,以适应科学技术的快速发展变化,一直是《地图学》教育领域中最关注的问题。在整个世界都已经信息化的今天,不同专业的学生学好《地图学》是非常重要的。下面笔者以GIS专业为例,谈一谈《地图学》教学。

长江大学是一所湖北省重点支持的综合性大学。GIS专业培养适应我国社会主义现代化建设需要,具备地理信息系统与地图学的基本知识、基本理论、基本技能,熟练应用计算机的能力,具有创业精神和创新能力的高级专门人才。根据本专业人才培养的目标,《地图学》作为本专业的专业基础课程之一,对于实现上述专业培养目标具有举足轻重的作用。通过对本门课程的学习,学生掌握地图学的基本知识、基本理论和地图各要素的表示方法,理解并掌握普通地图(特别是地形图)的阅读及量算,专题地图的编制、分析及应用,了解现代地图制图的新技术、新方法,为后续《地理信息系统原理》、《地图编绘与设计》、《地图分析》、《电子地图学》等课程的学习打下良好的基础。

二、精选优秀教材

由于《地图学》课程理论较深,涉及知识面广,学习该门课程要求基础知识较丰富,而该课程学时数又相对较少,因此教师针对专业特点,选择合适的教材并合理安排教学内容显得十分重要。目前有关《地图学》的教材版本很多,侧重点各有不同。按照长江大学教材选用管理规定,优先选用教育部推荐教材和国内具有影响力的优秀教材。2001-2006年,我们选用蔡孟裔等编著的由高等教育出版社于2000年出版的《新编地图学教程》(面向21世纪课程教材);2007-2009,年我们选用由武汉大学出版社于2004年出版的祝国瑞主编的《地图学》(高等学校测绘工程专业核心教材);根据我校GIS专业培养计划的修改,最近几年我们选用由科学出版社于2006年出版的王家耀等编著的《地图学原理与方法》(21世纪高等院校教材)。这本书系统、完整地介绍了地图学的原理和方法,包括地图和地图学的基本特征、定义、基本内容、学科体系、发展历史与趋势,地图的数学基础,地图内容表示方法与制图综合,现代地图制图的技术方法,地图分析与应用等[4]。这本书强调原理与方法相结合、理论与实际相结合、经典与现代相结合,内容的可读性、客观性很强。经过试用,本书十分符合制订的教学计划,教学效果良好。

一本教材肯定不可能达到最理想的教学效果,为了弥补教材的局限性,我们在教学过程中采用了由武汉大学出版社于2004年出版的祝国瑞主编的《地图学》作为主要参考教材。该书系统地介绍了地图学领域的理论、技术和方法,包括地图的基本知识、地图投影、地图数据、地图符号设计、图形设计、制图综合、制图数学模型、地图编辑设计、地图制图工艺、地图出版印刷及地图分析应用等[5],是一本为测绘工程专业编写的核心教材。该教材在某些知识的讲解上具有独到之处,十分适合作为补充教材。

三、教学内容安排

如何在选定教材的基础上做好教学内容的安排是十分重要的一件事。《地图学》的教学内容主要包括理论地图学、地图制图学和应用地图学三部分。针对GIS专业的特点,应将教学目标与新技术的进步结合起来,以现代的内容对传统的内容加以拓宽及调整删减,将新内容、新技术与传统内容有机结合,把传统内容转化到现代内容中。

在长期的教学过程中,我们总结以前的经验,对《地图学》课程内容采用模块化的组织方法,共划分为六大知识模块。每个模块具有相对的独立性。知识点是教材的重点或难点,也是教学大纲要求理解、应用的知识单元,根据知识单元的多少与掌握的难易程度,确定相应的授课学时。下面对各知识模块做详细说明。

知识模块一:地图与地图学的基础知识,这一模块的讲授共用八学时。主要知识点包括:地图的概念、地图的类型、地图的基本内容、地图的分幅与编号、地图的基本功能能和用途、地图学的历史与发展、地图学的学科体系构成、地图学与其他学科的联系、地图学的发展趋势等。

知识模块二:地图数学基础,这一模块的讲授共用八学时。主要知识点包括:地球体的自然表面、物理表面、数学表面的概念及它们之间的关系、地球坐标系与大地定位、地图投影的基本概念、比例尺的概念、变形椭圆的概念、投影变形的基本公式、地图投影的分类、几类常见的地图投影的特点、地图投影的应用与变换等。

知识模块三:地图内容要素的表示方法,这一模块的讲授共用十八学时。主要知识点包括:地图数据、地图符号的分类、基本图形变量、地图符号设计、地图图形设计、地图色彩设计、地图注记、普通地图内容表示方法、专题地图内容的表示方法等。

知识模块四:制图综合,这一模块的讲授共用四学时。主要知识点包括:制图综合的基本概念、影响制图综合的基本因素、制图综合方法、制图综合的基本规律、地图要素的制图综合、制图数学模型等。

知识模块五:现代地图制图技术,这一模块的讲授共用四学时。主要知识点包括:数字地图的概念、分类与产品、数字地图的数据结构、地图数据库、地形图数据库与数据生产、多媒体电子地图与互联网地图、遥感制图等。

知识模块六:地图分析与应用,这一模块的讲授共用六学时。主要知识点包括:地图分析方法、地形图的野外应用、地图的专题应用等。

制图综合和地图分析与应用两个模块所安排学时不多,是因为在教完《地图学》后,我们还安排有《地图编绘与设计》和《地图分析与应用》两门专业课,作为对地图学所讲内容的重要补充,以提高学生在《地图学》领域的知识水平。

四、实践教学设置

地图学课程是地理信息、测绘和遥感等专业的重要专业基础课程,它的教学内容紧凑、理论知识集成度高、实践操作性强。为了培养学生的地理学综合分析能力,全面提高学生素质,本课程安排了八学时的实验和为期两周的课程设计实习,实验安排在理论教学中穿行,课程设计安排在理论教学结束后集中实习。

地图学实验的主要目的是巩固相关理论知识,培养学生的动手能力。具体内容如下:

地图投影:通过绘制某区域的经纬网与方里网,加深有关高斯-克吕格投影的知识;根据经纬网的特点判断各地图投影的性质。

地图符号的设计与使用:通过设计制作栅格、矢量的点状符号,设计制作线状、面状符号,学会常见绘图软件中地图符号的设计方法,并利用多种方法设计不同类型的符号。

地图矢量化:基于屏幕矢量化普通地图的部分要素,通过对地图部分要素的矢量化,了解从纸质图形转化为计算机数字图形的基本过程,掌握数字地图制图软件中地图数据数字化输入的处理方法。

设计制作专题地图:基于ArcGIS或Mapinfo软件,设计制作表示面装地理信息的各种专题地图。通过专题地图的设计与制作,掌握表示面状地理信息的主要方法,学会在制图软件支持下独立地开展专题地图设计与制作。

课程设计内容包括:编制各种类型的专题地图,对全国人口分布、构成及演变进行分析;设计和编绘一幅电子地图。课程设计主要是结合实例,对地图学基本理论和方法进行综合运用。

上述实践教学,提高了本科生解决问题和综合分析的能力,使学生对地图学知识的掌握提到了一个新的高度。

篇3

中图分类号:TU984.18

文献标识码:B

文章编号:1008-0422(2014)01-0069-04

1引言

在制定生态环境保护过程中,测定区域的生态敏感度是一个十分重要的环节。而按照传统的方法对生态环境进行评价时,多采用定性的方法来研究,这样不仅工作量大,而且数据的主观性也较强。利用ArcGIS 9.3带有的工具和数据立即进行GlS分析和地图创建,可以为区域生态环境保护规划提供很好的技术支持,克服传统规划方法的缺陷,达到定量与定性相结合。

清江是长江中游在湖北省境内仅次于汉水的第二大支流,也是恩施州各族人民的母亲河和重要的生态屏障。恩施州清江流域的环境形势的变化,直接影响着恩施州的社会经济发展。因此,本文在充分研究恩施州清江流域现状的基础上,提出了一套生态敏感度评价体系,并采用的GIS的技术手段,减少了定性分析的随机性,保证了生态敏感度测评的科学性,为恩施州清江流域生态环境保护规划中的生态分区规划提供了依据。

本研究的技术路线如图1。

2、区域现状分析

2.1 区域概况

恩施土家族苗族自治州位于中国湖北省西南部,占地面积2411.1km2辖恩施、利川两个县级市和巴东、来凤、咸丰、建始、鹤峰、宣恩6个县。恩施州清江流域是指清江流经区域,即除来凤外的五县两市。

2.1.1 水文条件

清江是长江的一级支流,全长423km,流域面积1 6700km2。清江流域东邻江汉平原,南与澧水流域相接,西与乌江流域接界,北与长江三峡地区相邻,流域形状南北窄而东西长。清江支流众多,所有支流均流向清江干流,无分河道,干支流呈对称性羽状分布。

2.1.2 气候及动植物资源

恩施州清江流域属云贵高原与东部低山丘陵的过渡区域,境内小气候特征明显,雨热同期,降水充沛。独特的地理气候环境,造就了恩施州生物的多样性。恩施州现有林地2403万亩,占全州国土总面积的66.6%。恩施州素有“鄂西林海”、“华中药库”、“天然植物园”、“种子基因库”、“烟草王国”等美称。

2.1.3 地质地貌及矿产资源

恩施州清江流域地势地貌基本特征是:阶梯状地貌发育。这种特殊的自然地理环境,决定了恩施州清江流域是一个地质灾害易发的地区。恩施州位于多种构造体系联合、复合部位,成矿条件较好,矿产资源极为丰富。尤其是硒矿资源特别丰富,有“中国硒都”之称。由于矿产资源的大量开采,对清江流域的地质灾害的形成也造成了威胁。

2.2 区域生态环境现状问题

恩施州清江流域目前还存在一些生态环境问题:

第一,水质污染问题。近年来,随着工农业生产的发展,废、污水的排放量逐年增加,致使区域内的水质越来越差。清江及长江流域附近农村面域污染严重,地区污水处理率不太高,造成了一定的水资源污染。

第二,水土流失问题。由于过度开采矿产及植物资源,造成的水土流失问题十分严重。经区划调查统计,从上世纪八十年代以来,全州已发生各类地质灾害1993处,清江流域地质灾害发生种类多、分布广、频率高、危害大。

第三,植被破坏问题。恩施州清江流域现有林地2403万亩,林业发展具有良好的物质基础和拓展空间。但森林可利用资源比重小,森林资源质量不高,林地产出率低。流域内开荒种植较普遍,已造成生态环境的严重破坏,毁林种药、滥采乱挖现象十分普遍,破坏了恩施州清江流域的植被生长。

3、生态敏感度分区研究

3.1 评价模型的建立

3.1.1 确定研究因子

研究因子的确定,是生态敏感度分析的关键。在因子的选取时需符合以下要求:首先是因子的完整性,易于理解;其二是因子的可量化性,即可以用数量化的指标表示;第三是因子的可操作性,因子的统计数据具可取性和可测性;第四是因子的可控性。

根据恩施州清江流域的生态环境情况,最终确定了在生态敏感度分析的评价因子如下:

(1)高层:高程是生态环境中一个重要因素,空气温度随着海拔的升高而降低,整个生态系统呈现出明显的垂直分布。恩施州的地势变化多端,因此,根据海拔梯度分布由高到低进行分级。

(2)坡度:主要考虑坡度对植物生长能产生较大影响,通常坡度大于25度时只能生长灌术或小乔木,坡度大于45度时连草皮都难以生长。根据倾斜率分为以平坡(45°)为主,这五种坡度类型。

(3)坡向:坡向对区域小气候的形成起着至关重要的作用,一般而言,山坡地南坡优于北坡,最优越的是南偏东。恩施州清江流域植物多样性保护应当受到重视,因此坡向对生态敏感度的影响还是不容忽略的。

(4)水文因子:水是生命之源,动物和植物的生长都离不开水,它对动植物的生存、生长有重要影响,也是最容易受到人为干扰的因子之一。本次生态敏感度评价中,主要考虑清江、长江的干流及支流。

(5)山体因子:山体是生态系统的重要组成部分,山体上植被丰富。并且,恩施州山体面积较大,因此要纳入到考虑范围之中。

3.1.2 确定因子权重

在生态敏感度评价过程中,因子的权重直接影响着区域敏感度测定的科学性。在权重的确立中,综合了多方意见,通过对文献查阅,参考了几种类似的评价体系,最终得出了一套针对恩施州清江流域的生态敏感度评价系统。如表1所示。

3.2 GIS相关数据处理分析

3.2.1 单因子评价

首先将地形数据导出至ArcGIS里,转为ArcGIS9.3能识别的数据信息,每一单因素为一图层,进行单因子敏感度的分级与制图。然后,对各评价因子的原始数据进行缓;中区分析,以及重分类。按照不同因子的影响程度,分为了敏感度弱(1)、敏感度中(3)、敏感度强(5)等三个等级,对于划分等级较多的因子,可采用敏感度较弱(2)、敏感度较强(4)作为中值。

对地形因子的单因子评价结果可看出:在高程分析中,可以看到恩施州境内除东北部有海拔3000m以上小面积山地外,普遍展示着海拔500m以下、500-1000m、1000-1500m、1500-2000m、2000m以上等五级面积不等的夷平面,并存在一至二级河谷阶地,呈现明显层状地貌。在坡度分析中,恩施州90%以上地区的坡度均低于45°,而坡度大于45°的地区属于生态敏感度极高的区域,主要分布在清江以及长江经流的区域。在坡向分析中,坡向随着地形的变化而均匀变化。(图2)

对水文因子的单因子评价结果可看出:清江以及长江流经区域范围很广,其辐射范围涵盖了巴东、恩施、利川、建始等县市的大部分区域。生态敏感度也随着距离清江、长江的远近而变化。(图3)

对山体因子的单因子评价结果可看出:恩施州清江流域的山体众多,主要分布在清江和长江的两侧。(图4)

3.2.2 多因子叠加

在进行单因子评价后,按照所建立的评价模型中所附的权重,采用Spacial Analysis中的Raster Calculate工具,对因子进行叠加分析。所得出的图即为生态敏感度评价图(如图5)。从图中可以看到,生态敏感度较弱的地区分布在清江、长江的流域范围。因此,在生态环境保护规划的过程中,应当着重考虑对清江流域水污染的治理,以保持生态系统的稳定性,保障恩施州清江流域的可持续发展。

3.3 生态敏感度分区

为了便于清江流域的生态管理,在生态敏感度评价的基础上,根据恩施州州域生态用地安全和功能的使用,将基本控制线划定范围分为生态核心区,生态协调区及生态辐射区。其划分标准如表2。

按照这个分类标准,将生态敏感度图进行重分类,最终得出了生态敏感度分区图(如图6),由浅到深依次表示生态敏感度由弱到强。

生态核心区是指维持生态安全格局的关键地区,主要为自然山体、自然水体、森林植被、自然保护区等。主要包括:清江流域、长江流域、自然保护区以及恩施州内各重要山体、林地等。生态核心区总面积3688.98km3,占恩施州总面积的15.3%。

生态协调区是指自然条件较好的生态重点保护地或敏感区,根据资源环境条件科学合理地引导少量开发建设行为。主要是清江流域毗连区,长江流域毗连区,以及山体区域等。生态协调区总面积11621.50km3,占总用地面积的48.2%。

生态辐射区是指除了生态核心区及生态协调区之外的区域,主要是城镇建设用地的区域。该区建设应充分尊重自然条件,科学引导开发。做好前期规划,严格控制开发量,因地制宜建设。生态辐射区总面积8800.52km3,占总用地面积的36.5%。

4、生态环境保护规划分区保障措施

4.1 生态核心区保护措施

在水污染治理方面,应加强长江巴东段及清江流域等通航水域船舶航行排放的生活废水和油污污染进行防治,在2020年末,清江干流城区段水质稳定在Ⅲ类标准以上,长江干流段水质稳定在Ⅱ类标准以上。在对重要山体、林地的保护方面,限制天然林商品性采伐,确保长江中上游地区森林生态功能修复;加强森林管护,管护全州现有森林面积。境内的两个国家级自然保护区:湖北七姊妹山国家级自然保护区、湖北星斗山国家级自然保护区,应当严格保护其生态环境的稳定性,禁止一切非法开采活动。在矿产资源开采方面,应严格限制在生态协调区内的开采。在建设力度方面,城市建设用地必须避让该区域,以保障生态核心区的稳定发展。

4.2 生态协调区保护措施

在水污染治理方面,应当加强对清江流域毗连区,长江流域毗连区内的水体监控,提高污水处理率。在植被保护方面,流域内修建交通、水利、采矿、旅游等设施及其它工业项目应当尽量减少破坏植被,或及时恢复植被。积极开展植树造林,为涵养水土,防治地质灾害的发生起到一定作用。在矿产资源开采方面,应严格限制在生态协调区内的开采力度,适度对矿产资源进行开采。在建设力度方面,应在合理规划的指导下,适度开发建设。

4.3 生态辐射区保护措施

在水资源污染防治方面,应加强水质监控,对生活污水、生产污水按照标准进行处理。在矿山开采方面,基本建立地矿信息系统,实现地矿信息数字化和管理工作的资源网络化。在农业面源污染综合治理方面,应以减少化肥、农药施用量为目的,全面治理因农药、化肥、畜禽养殖等造成的农村面源污染。在工业污染治理方面,应治理重点工业污染源,列入本规划重点治理工业企业,采取相应的污水处理设施,确保废水污染物达标排放。在实施清洁生产方面,应发展循环经济,推行清洁生产。实施再生资源回收利用项目,支持建设生物质能发电、风力发电和石煤发电,支持推广规模化畜禽养殖零排放技术。

4.4 生态环境动态监测

进一步加强环境质量监测网络建设,全面提高全州水环境、空气环境、噪声环境、核与辐射环境等监测预警的总体水平。着力提高全州环境质量监测及预报的频率和精准度,增强对环境辐射水平的动态变化监测能力。为应对生态环境安全,在规划期间,侧重加强恩施、利川、巴东、宣恩和咸丰5个县市的生态环境监管能力,配备必要的人员、设备、仪器,具备基本的生态环境监管能力。加强各级监测站实验室能力建设,提高实验分析精度,掌握环境质量和污染状况的变化趋势。联合林业、水利、地质的动态监控,形成恩施州清江流域的生态环境一体化监测体系。

篇4

关键词:知识图谱;中医药;应用前景;综述

DOI:10.3969/j.issn.1005-5304.2017.07.033

中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2017)07-0129-04

Abstract: As the new development of scientometrics and informetrics, knowledge graph has infiltrated into the financial, industrial and medical fields, and become a hot issue in the real world research. In this article, the concept and features of knowledge graph, construction and the existing softwares, the application status and development prospect in the TCM field were reviewed, which may provide references for research on the knowledge graph in the TCM field.

Key words: knowledge graph; TCM; application prospect; review

随着2012年谷歌第一版知识图谱的,特定领域的知识图谱构建成为真实世界研究中的热点问题。从搜索引擎优化,到新药发现,知识图谱在学术界掀起了一股热潮,并渗透到金融、工业和医学等领域。这种以科学学为基础,涉及应用数学、信息学及计算机学等多学科的可视化技术,成为科学计量学和信息计量学的新发展方向。本文就知识图谱的概念、特点及其在中医药领域的应用现状、前景进行梳理,以期为中医药领域知识图谱相关研究提供参考。

1 知识图谱概念及特点

1.1 知识图谱的概念

在知识图谱的定义上,陈悦等[1-2]从其功能角度进行阐释,认为知识图谱能够可视化地描述人类随时间拥有的知识资源及其载体,绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系,在组织内创造知识共享的环境以促进科学技术研究的合作和深入。杨国立等[3]从理论和方法层面,将其定义为把应用数学、计算机科学、科学学、信息科学等学科的理论和方法与科学计量学引文分析、共现分析、社会网络分析等方法结合,用可视化的图谱形象地揭示科

学发展进程和结构关系的一种研究方法,属于科学计量学的范畴。

杨思洛等[4]提出知识图谱有广义与狭义之分,广义上可包括生物的基因图谱、教育教学中的认知地图、探索太空的天体图、描绘地形的地理信息系统(GIS)图、模拟人脑的神经网络图、各种金属图谱等;狭义的知识图谱主要是运用文献计量学方法,通过文献知识单元分析来可视化科学知识的结构、关系与演化过程,包括“科学图”“文献计量图”“文献图”“知识图谱”等。

简言之,知识图谱是随着计算机技术的发展,应用数学算法来简化知识单元结构以达到可视化知识结构关系的一种方法,是显示科学知识的发展进程与结构关系的一种图形,是一种有效的知识管理工具。

1.2 研究对象

知识图谱所描绘的对象主要包括:①从事科学技术活动和作为知识载体的人,包括科学家、技术专家、项目组、实践团体或某一知识领域共同体;②显性或编码化的知识,如论文、专利、所学课程、数据库等;③过程或方法,包括研究问题和解决问题的过程或方法、组织的业务流程,以及相关的知识投入等。

知识图谱主要源于三大领域:①计算机科学领域的数据、信息、知识与知识域可视化研究;②图书情报领域的引文分析可视化、知识地图和知识网络等研究;③复杂网络系统和社会网络分析的研究。上述领域的研究方向和内容正在走向融合[5]。

2 知识图谱绘制流程

参考国内外已有研究,目前知识图谱的绘制主要包括以下几个版块[4,6-7]。

数据检索:绘制知识图谱的基础,其数据源在传统文献数据库的基础上逐渐扩展到出版商、机构联盟等机构网站的网络日志、用户记录、点击流数据等。

数据清洗:即对数据的预处理,包括、勘误等,进行历时或分时段对比分析时需要对数据M行分段处理;若样本数据过大或分析目的不同,则需要进行有代表性的抽取。

构建关系矩阵:选择要分析的知识单元,如关键词、题名、作者等,构建其相互关系,常用方法有共词分析、共引分析、共作者分析、书目耦合分析、期刊耦合分析等。

数据标准化:根据数据间的相似度对数据进行标准化,常用方法有集合论方法(Cosine、Pearson、Spearman、Ochiai、Jaccard指数等)和概率论方法(合力指数、概率亲和力指数等)。

数据简化:运用因子分析、多为尺度分析、自组织映射图、寻径网络图谱、聚类分析、潜在语义分析、三角法等方法处理数据以更好地展示各数据单元。

可视化展示:是知识图谱构建过程中最重要的一环,通过运用不同的算法,调整相关参数,构建整个图谱。可通过不同模拟实现可视化,如几何图、战略图、冲积图、主题河图、地形图、星团图、簸幅图等。

图谱解读:采用历时分析、突变检测、空间分析、网络分析等方法对图谱进行解读,同时需要结合研究者的经验、知识、学术背景、学术功底等。

3 知识图谱绘制软件

目前可用于知识图谱绘制的软件非常丰富,根据主要功能可分为2类[4]:一类为通用软件,如SPSS、社会网络分析软件Ucinet和Pajek、词频分析软件Wordsmith Tools和GIS相关软件;另一类为绘制知识图谱的专用软件,如CiteSpace、Bibexcel、Gephi、VOSviewer、VantagePoint、Network Workbench Tool、NWB、Sci2 Tool、In-SPRIE、SciMAT、Histcite、GeoTime、ColPalRed、Guess、Leydesdorff、Jigsaw、Carrot等。分析各软件的特点[6,8-9]可以看出,随着知识图谱的绘制软件越来越多,一方面其支持的数据格式愈发多样,相互之间的兼容性也逐步增强;另一方面,在可视化效果方面也日趋完善,知识展示的真实度、准确度逐渐提高。详见表1。

4 知识图谱在中医药领域的应用

目前知识图谱的研究中,国外学者主要集中在2个研究方向[10]:部分偏于技术研究,包括可视化工具和算法的开发;部分以应用为主,利用科学计量学理论及相关方法、知识图谱软件等进行分析研究。国内研究也可分为2个方向:部分以科学计量学为理论基础,利用可视化方法研究科学学与管理学、科学技术合作等领域;部分以电子资源数据库为数据源,通过可视化方式展示某一学科的研究前沿和发展动向。

4.1 应用现状

医学领域各学科中采用知识图谱理论与方法进行的研究尚处于起步阶段,中医药领域已有部分学者开展了相关研究。

在学科层面,赵蓉英等[11]以Web of Science为数据来源,运用CiteSpace对中医研究领域的研究热点进行了可视化探索。徐浩等[12]以我国医药卫生领域中文核心期刊文献为数据来源,对我国中医学科交叉领域的研究热点进行了可视化分析,但研究仅限于中医学与医药卫生领域之间的合作。杨秦等[13]采用共词分析及社会网络方法对中医外科疮疡领域的研究主题及分布进行了探索。

具体在疾病方面,谭火媛等[14]基于中国知识资源总库(CNKI)收录的近10年中医药治疗高血压相关文献,对前沿与热点研究进行了可视化分析。王淑斌等[15]对中西医治疗2型糖尿病的国内外研究进行了系统梳理。在证候方面,刘俊丽等[16]采用文本挖掘技术,通过数据清洗、实体抽取、构建共词矩阵并采用Ucinet软件绘制乙型肝炎热点研究知识图谱,分析了子模块中的中医证候描述及疾病名称。秦义等[17-18]基于CiteSpace软件对气虚证、血瘀证证候诊断标准的相关研究进行了可视化分析。在中药材方面,郭栋等[19]通过关键词共现网络和聚类图对中药枸杞的育种、种植、采收、加工、储存等5个领域的研究进行了热点分析。在治疗措施方面,李祖偷[20]对针灸治疗腰椎间盘突出症常用腧穴的演变过程及施穴治疗的变迁进行了可视化分析,胡松洁等[21]运用Ucinet软件对“五行音乐”疗法的发展脉络进行了梳理。

此外,张静[22]基于CNKI核心期刊文献关键词,探讨了中医药专业人才培养热点主题。陈姗姗等[23]对中医药传播发展的研究文献进行了可视化分析,荣光等[24]基于中医电子病历研究领域的相关文献,构建了该领域的研究者、研究机构、关键词的共现网络。

上述研究主要集中在不同领域的研究现状及热点分析,多以期刊文献为数据来源,多采用CiteSpace软件构建研究者、研究机构、关键词等信息的共现图和聚类图,从不同侧面宏观解释了中医学信息的整体结构特点。但针对特定研究目标,尚未形成一套明确的建模策略及技术,导致已有研究结果中也有差异甚至矛盾之处[5]。因此,中医药领域知识图谱理论尚处在针对各学科结构宏观概述阶段,急需解决对多层信息深度整合的知识图谱建模策略及其技术。

近年来,已有学者在中医药知识图谱构建方法与标准化流程方面进行了尝试和探索。于彤等[25]提出以中医药学语言系统(TCMLS)为框架,以中医药领域现有的术语和数据库资源为内容,构建大型知识图谱的构想,并进行了探索和实践,但尚未实现中医药知识资源的有效整合及提供全面、及时、可靠的知识服务。阮彤等[26]基于文本抽取、关系数据转换及数据融合等技术提出了中医药知识问答和辅助开药领域的知识图谱半自动化构建流程。此外,该课题组对知识图谱进行了形式化定义,详细描述了数据驱动的增量式知识图谱构建方法,同时阐述了以此方法所构建的中医药知识图谱在辅助开方领域的应用,但未涉及其它领域[27]。贾李蓉等[28]以中药知识图谱为例,从数据来源、研究内容、图形化展示等方面探讨如何构建中医知识图谱,但其应用尚局限于浏览检索方面,对多种数据资源间的映射及数据元等标准未进行详细论述。张德政等[29]提出了基于本体的中医核心知识图谱表示及其构建方法,对中医本体与知识图谱的映射方法进行了探索,为中医知识图谱的构建提供了较系统的方法流程,但对多源数据的获取技术及中医师临床实际诊疗数据的研究未进行深入研究。王华珍等[30]以中医慢性胃炎数据可视化处理为例,引入随机森林(RF)技术进行可视化前的数据预处理,根据高维中医数据的特征进行变换和降维,使数据在低纬空间呈现良好的分离性,从而增强了数据的可视化效果。

4.2 应用前景

知识图谱研究已经渗透到金融、医学和工业等领域,对知识图谱定量与定性特征的科学理解已成为大数据时代科学研究中一个极其重要的挑战性课题。结合自身知识体系的特点,中医药领域的知识图谱研究应以从事相关领域活动和作为知识载体的人(如临床医学领域的医师)、显性或编码化的知识(如症状、药物等)、过程或方法(如辨证论治等)为研究对象,运用图论、统计学、应用数学、数据挖掘等方法,研究知识之间多维网络关系及演化规律等一系列问题。

在我国,中医临床研究领域的知识图谱构建研究仍较滞后,研究大多处在术语本体领域的研究层面。知识图谱在中医药领域有着广阔的前景,如在中医药知识体系构架方面,可建立中医药知识地图系统、维基百科系统[25]等;在中医药知识的推广普及方面,可建立基于知识图谱的信息检索系统、基于自然语言的问答引擎[26]等;在临床诊疗方面,可建立基于知识图谱的四诊信息采集、诊断、处方用药系统;在医师诊疗规律挖掘方面,可\用知识图谱挖掘中医师“病-证-治-效”临床诊疗数据之间的相互关系和内在规律。因此,知识图谱为开展中医基础理论体系、临床诊疗规律研究提供了有利的工具,探索解决中医临床诊疗过程中多尺度非完整信息整合的核心技术,建立中医药知识图谱构建的流程和规范将成为研究的热点。

参考文献:

[1] 陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005,23(2):149-154.

[2] 陈悦,刘则渊,陈劲,等.科学知识图谱的发展历程[J].科学学研究, 2008,26(3):449-460.

[3] 杨国立,李品,刘竟.科学知识图谱――科学计量学的新领域[J].科普研究,2010,5(4):28-34.

[4] 杨思洛,韩瑞珍.国外知识图谱绘制的方法与工具分析[J].图书情报知识,2012,20(6):101-109.

[5] 杨思洛,韩瑞珍.国外知识图谱的应用研究现状分析[J].情报资料工作,2013(6):15-20.

[6] 肖明,邱小花,黄界,等.知识图谱工具比较研究[J].图书馆杂志, 2013,32(3):61-69.

[7] 陈超美.科学前沿图谱――知识可视化探索[M].北京:科学出版社, 2014.

[8] 邓君,马晓君,毕强.社会网络分析工具Ucinet和Gephi的比较研究[J].情报理论与实践,2014,37(8):133-138.

[9] 侯月明,乔晓东,孙卫,等.开源分析工具在中文文献分析中的应用[J].现代图书情报技术,2013(3):71-76.

[10] 曹树金,吴育冰,韦景竹,等.知识图谱研究的脉络、流派与趋势――基于SSCI与CSSCI期刊论文的计量与可视化[J].中国图书馆学报,2015, 41(5):16-34.

[11] 赵蓉英,王敏.国际视野下中医研究的可视化分析[J].医学信息学杂志,2011,32(7):36-41.

[12] 徐浩,濮文渊,钱爱兵,等.我国中医学学科交叉领域研究热点可视化分析[J].中草药,2015,46(19):2966-2973.

[13] 杨秦,曾莉,李文林.中医外科关于疮疡研究的知识图谱分析[J].南京中医药大学学报,2012,28(6):535-537.

[14] 谭火媛,魏静,谭定英,等.基于CiteSpaceⅢ的中医药治疗高血压前沿与热点可视化研究[J].现代计算机:专业版,2016(11):50-54.

[15] 王淑斌.中西医治疗2型糖尿病的知识图谱分析[D].北京:北京中医药大学,2014.

[16] 刘俊丽,张秀梅,蒋勇青.基于文本挖掘的乙型肝炎相关文献知识图谱分析[J].医学信息学杂志,2014,35(1):48-53.

[17] 秦义,田元祥.基于CiteSpace的气虚证证候诊断标准知识图谱可视化分析[J].中医杂志,2015,56(18):1588-1592.

[18] 秦义,田元祥.基于CiteSpace的血瘀证证候诊断标准研究的可视化分析[J].世界科学技术-中医药现代化,2015,17(12):2656-2665.

[19] 郭栋,童元元,S生权,等.基于数据挖掘的枸杞研究热点分析[J].中国中医药信息杂志,2016,23(9):48-51.

[20] 李祖停田元祥,赵建新.针灸治疗腰椎间盘突出症常用腧穴的可视化分析[J].河北中医,2016,38(9):1372-1377.

[21] 胡松洁,马彦平.基于知识图谱的“中医五行音乐疗法”可视化构建研究[J].长春中医药大学学报,2015,31(3):534-537.

[22] 张静.中医药专业人才培养研究的知识图谱与主题分析[J].济宁医学院学报,2017,40(1):51-55.

[23] 陈姗姗,邵英俊.基于中国知网的中医药传播研究的计量分析[J]. 中国中医药现代远程教育,2017,15(3):6-9.

[24] 荣光,谢晴宇,孟庆刚.中医电子病历研究领域科学知识图谱分析[J].中国中医药信息杂志,2017,24(1):99-104.

[25] 于彤,刘静,贾李蓉,等.大型中医药知识图谱构建研究[J].中国数字医学,2015,10(3):80-82.

[26] 阮彤,孙程琳,王昊奋,等.中医药知识图谱构建与应用[J].医学信息学杂志,2016,37(4):8-13.

[27] 阮彤,王梦婕,王昊奋,等.垂直知识图谱的构建与应用研究[J].知识管理论坛,2016(3):226-234.

[28] 贾李蓉,刘静,于彤,等.中医药知识图谱构建[J].医学信息学杂志, 2015,36(8):51-53.

[29] 张德政,谢永红,李曼,等.基于本体的中医知识图谱构建[J].情报工程,2017,3(1):35-42.

[30] 王华珍,彭淑娟,缑锦,等.基于随机森林的中医数据可视化研究[J]. 系统仿真学报,2014,26(11):2751-2756.