诗句分类范文

时间:2023-04-04 13:27:48

导语:如何才能写好一篇诗句分类,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

诗句分类

篇1

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学、计算机科学、统计学、生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。

聚类分析是一组将研究对象分为相对同质的群组的统计分析技术。主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析。

(来源:文章屋网 )

篇2

关键字:城市竞争力;省会城市;聚类分析

一、研究方法

聚类分析(Cluster Analysis)是对多数行统计样本进行定量分类的一种多元统计分析方法。 本文采用SPSS软件编制的聚类分析法程序, 把样本按照竞争力的强弱进行分类。通过分析各类城市的共同点,找出各类城市的优势和差距,以便城市能针对性地制定提高其竞争力水平的对策。在这里,聚类方法选用的是聚类分析分析中的Q型系统聚类法,距离采用欧氏距离。

二、聚类分析操作步骤和结果

省会城市由于其特殊的政治地位而获得了额外的资源,一般都是各省的政治、经济、文化中心,省内其它城市也不可能与其相比。由于政治地位的作用,中国的中心城市享有掌握和使用更多资源的权利,一般来说,也必然比各省内的其它城市具有更大的竞争力。

基于上述原因,为宏观分析评价石家庄城市竞争力水平,本文样本城市的选取主要以同等级别的省会城市为主体,选取了石家庄、哈尔滨、长春、沈阳、济南、南京、杭州、福州、广州、海口、郑州、合肥、武汉、长沙、南昌、南宁、太原、西安、贵阳、昆明、成都、银川等省会城市,对这些城市竞争力进行聚类较分析,进一步了解石家庄竞争力的整体状况。

1.聚类分析操作步骤

首先把各城市的竞争力水平的综合评判分值进行消除量纲的标准化处理。

2.聚类结果

将标准化数据进行Q型系统聚类前,根据聚合系数随着分类数变化得碎石检验图,确定分为四类,然后采用迭代聚类中的重心法(Centriod clustering),将样本城市竞争力水平划分为四类,可以得到聚类谱系图。通过对聚类谱系图进行分析,各类所包含的样本城市如下:(见表1)。

三、城市竞争力综合评价

(1){上海}为第一类。这座城市是我国最大的国际化城市之一,他代表着我国城市竞争力的最高水平,其综合经济实力远远超过其它城市,鲜明地具有旗帜性的作用。{沈阳、济南、杭州、南京}为第二类紧随其后,这类城市的竞争力水平也很高,水平仅次于第一类城市。他们具有良好的区位优势和经济实力,同时具备完善的城市设施和较好的人才资源。

(2){哈尔滨、长春、成都、武汉、福州、西安、昆明、郑州、石家庄、长沙、海口}为第三类,这类城市多位东北、华北、华中、华东、西北、西南等我国各大区域的核心省会城市,在各大区域范围内有着雄厚的经济基础,交通便利,城市设施比较完善,由于这些优势,这11座城市也吸引了一大批人才,为自身的发展提供了良好的外部条件,因此该类省会城市的竞争力水平相对较高。

(3){合肥、贵阳、银川、太原、南宁、南昌}为第四类城市,这类城市主要包括地处中西部省会城市,他们与前积累相比,既不是中西部大区域的手为核心城市,也不是地处沿海,所以相对落后,竞争力较低,需要进一步加大基础设施人力方面的投入,使自身的竞争力真正得到提高。

四、提升石家庄城市竞争力的战略性建议

针对石家庄未来的发展和综合竞争力的提高,站在战略的高度审视石家庄今后的发展,在政策取向上应该把握好以下几个方面:

(1)充分利用比较优势,保护性利用不可再生要素。中国城市在与国际城市竞争时,更多地是具有劳动力和资源等方面的比较优势,中西部城市在与东部沿海城市竞争时,也主要是具有劳动力和资源等方面的比较优势。因此,石家庄市要充分应用自身的比较优势。

(2)扩大对科技、教育等领域的关注。中国城市经济即将进入科技推动型的时期,科学技术和人力资本在城市价值创造中的作用将越来越重要。

(3)扩大对外开放,通过学习和交流不断实现创新。落后城市通过广泛开放引进和兼收并蓄地学习可以迅速削弱先进城市的相对优势和自身的劣势。石家庄市要特别重视、积极鼓励国内外城际间的经济、科技、社会、文化等领域的交流和合作,鼓励市内外机构和人士的各种民间的非正式交往,以营造有利于创新的城市环境。要主动加快城市参与经济区域一体化和全球化的进程,开放各类市场,促进城市的分工和协作,以迅速形成自身的集合优势。

作者单位:孙立娟刘胜花北华航天工业学院

侯石柱河北工业大学分院

参考文献:

[1]郝寿义,倪鹏飞.中国城市竞争力研究[J].经济科学,1998,(3):96-98.

篇3

关键词:数据库课程;个体差异;分类教学实践模式

同济大学计算机科学与技术专业作为国家教育部第三批高等学校特色专业建设点,秉承“夯实基础、面向应用、培养创新、国际接轨”的办学宗旨,在创造性的“一体两翼”人才培养模式下,完善了本科教育课程体系,完成了学科方向布局、分类分层培养课程体系建设[1]。基于总的学科发展与各级各类专业人才培养规划的目标,我们对主干课程之一的数据库课程进行了教学模式的研究与探索。

数据库技术是计算机信息系统中的核心和基础,是应用最广泛的技术之一,也是计算机科学技术发展最快的领域之一。数据库课程不仅是计算机科学与技术专业、信息安全专业、信息管理专业等的必修课程,也是大部分非计算机专业的选修课程。通过数据库课程的教学,学生应掌握数据库系统的基础理论、基本技术与实践技能。在同济大学计算机系的本科专业必修课数据库课程的教学实践中,一方面由于学科发展和分类分层培养目标的确立,使得该课程的教学实践模式与体系需要进行新的规划与设计;另一方面,数据库课程相关的教学和实践环节中,学生所表现出来的学习兴趣、知识背景、创新能力以及未来的就业取向等多方面的差异,也对于传统的课堂教学模式提出了新的挑战和研究课题。要取得好的教学与实践效果,让学生更好地发挥所长,需要不断的研究与探索课程的教学实践模式。

基于计算机系学科发展与专业人才培养总体规划,根据数据库课程自身的特点、数据库相关研究和应用技术的发展,并参考国际、国内一些主要大学数据库课程的教学资源和科研文献,我们提出一种数据库课程分类分层教学模式:根据培养目标、学习兴趣、知识背景和创新能力的不同将学生分为3种类型,有针对性地调整和完善课程的教学内容和实践环节,对不同类型的学生采用不同的教学方式,侧重不同的教学与实践内容,更好地体现该课程教学的基础性、科学性、先进性与实用性。

1课程的教学对象分类

计算机科学与技术本科专业的培养目标为:培养具备良好的科学素养,系统地掌握计算机科学与技术,包括计算机硬件、软件与应用的基本理论、基本知识和基本技能与方法,能在科研部门、教育单位、企业、事业、技术和行政管理部门从事计算机教学、科学研究和应用的计算机科学与技术学科的高级专门人才[2]。

但是,同一年级同一专业学生的学习兴趣、知识背景和创新能力并不完全相同,如有的学生数学基础好、擅长理论分析,有的学生编程能力强、喜欢软件开发,有的学生则倾向于计算机应用系统的管理。因此,基于计算机科学与技术专业和信息安全专业的人才培养总体规划,根据学生的个体差异,我们将数据库课程的教学对象与培养目标分为以下3种类型:

1) 理论强化型。学生通过课程学习将具备坚实深入的数据库理论知识,掌握扎实的实验技能,具有良好的科学素养和较强的创新能力,能独立开展科研和实际工作。

2) 工程研发型。学生通过课程学习将掌握数据库基础理论和主流数据库软件产品,以及数据库系统分析和设计方法,具备较扎实的研究与开发数据库应用系统的技能,成为国内乃至国际认可的高级研发型工程技术人才。

3) 应用管理型。学生通过课程学习将掌握数据库系统基础理论,以及数据库系统开发与管理的基本方法,熟悉主流数据库软件产品,能较好地设计、管理与评估数据库项目方案。

目前,国内已有许多高校,以不同形式的实验班或培训课程,对不同类型的学生分别培养。如清华大学的“计算机科学实验班”、北京大学的“元培计划实验班”、同济大学的“图灵班”和“卓越工程师班”等。在数据库课程分类教学与实践模式研究探索中,我们把计算机系特色教学的“图灵班”、“卓越工程师班”和其他学生分别作为数据库课程教学的理论强化型、工程研发型和应用管理型对象。

2课程的分类教学与实践模式

对于上述3种不同培养目标的学生,我们在数据库课程的教学总纲基础上,有针对性地设计不同的教学方案,调整课堂授课内容的广度和深度,选用不同教材,安排不同的课程实验与课程设计,开展不同的课后活动,引导学生研究与解决不同的开放思考问题,尽量充分调动不同类型学生的学习积极性和主动性,使学生能根据自身的发展目标、研发能力和学习兴趣等在各自擅长和需要拓展的领域内得到更充分的发展。

2.1分类调整授课内容

数据库课程的基本教学内容主要包括:数据库基本概念、关系数据库基础理论、关系数据库标准语言SQL、数据库安全性、数据库完整性、关系查询处理和查询优化、数据库恢复技术、并发控制、数据库设计与实现以及数据库技术的新进展等。对于不同类型的学生,我们有针对性地拓展和加强不同部分的知识。

1) 对于理论强化型学生,拓展和加强关系数据库理论知识,强化数据库管理系统(DBMS)原理与相关算法实现,如存储、索引、查询处理及其优化、事务处理、并发控制、数据库恢复等的机制与主要算法。教材上倾向于国外原版教材,即《Database System Concepts》[3] 辅之以《Database Management Systems》[4]和《Database Systems: The Complete Book》[5]。

2) 对于工程研发型学生,在关系数据库理论知识基础上,强化DBMS的底层算法实现与数据库系统工程设计方法,介绍基于一种主流数据库产品的应用系统设计与实现。教材上使用国内经典教材结合国外原版教材,即《数据库系统概论》[6] 辅之以《Database System Concepts》[3]和《Database: Principles, Program- ming, and Performance》[7]。

3) 对于应用管理型学生,则在关系数据库理论知识基础上,强化关系数据库的查询优化技术、数据库事务处理技术、数据恢复和并发控制技术、DBMS的安全技术和完整性检查技术,介绍基于主流数据库产品的应用系统设计、开发与管理技术。教材上使用国内经典教材,即《数据库系统概论》[6]辅之以《Database System Concepts》[3]和《数据库系统原理》[8]。

2.2分类安排课程实验

数据库课程的实验内容主要包括:数据库安装与配置、数据库使用、SQL语言使用、数据库安全性、数据库完整性和数据库编程等。对于不同类型的学生,我们在课程实验中有针对性地安排了不同的内容。

1) 对于理论强化型学生,课程实验将完成6~8个DBMS底层算法的研究与实现,主要包括存储、索引、查询处理、查询优化、事务处理、并发控制、数据库恢复等算法,另外还有一个理论方法探索或实际应用系统研发的综合大作业。

2) 对于工程研发型学生,课程实验将完成4~5个DBMS底层算法的实现,如存储、索引、查询处理与优化等的算法,完成1~2个通过ODBC访问数据库、数据库设计与应用开发实验,一个实际系统工程研发相关的综合大作业。

3) 对于应用管理型学生,课程实验将完成6~8个数据库应用系统设计与管理相关的部分实验,主要包括安装了解DBMS、SQL数据定义与查询、SQL更新与视图,数据库事务处理、数据恢复与并发控制、数据安全性与完整性以及一个实际应用开发管理相关的综合大作业。

2.3分类进行课程设计

数据库课程设计的目的是让学生加深对数据库系统基础理论知识的理解,提高数据库应用系统设计与开发的实践能力,全面拓展数据库原理课程相关的综合研发能力。通过课程设计实现一个实际的数据库应用系统,熟悉并能灵活运用所学基础理论,掌握数据库应用系统的设计方法、开发技术,提高分析问题和解决问题的能力,强化动手能力,进一步了解和研究分析DBMS的体系结构与主要技术,并在一定程度上把握课程相关的理论技术发展与前沿动态。数据库课程设计的主要内容包括3个方面。

1) 数据库应用系统的研发:综合运用数据库理论与技术方法设计一个较完善的有实际意义的数据库;掌握流行数据库管理系统SQL Server/ORACLE/ DB2等的应用与开发技术;利用高级语言开发完整的数据库应用系统。

2)DBMS研究分析以及功能实现与扩展:以开源代码的DBMS为基础熟悉并研究分析DBMS的体系结构、基本功能及其实现,完成一些系统功能的实现和进行相应的可扩展性研发,形成系统分析报告、算法实现软件包和技术文档。

3) 领域研究综述与热点问题研究探讨:跟踪数据库相关领域的理论与技术发展,完成相关的前沿研究或技术问题的综述,对领域热点问题开展研究探讨,形成综述报告、技术报告或研究论文。

对于不同类型的学生,我们开展不同主题的课程设计,有不同的考查侧重:

1) 对于理论强化型学生,课程设计更强调在开源代码的数据库系统如Postgres上,针对DBMS底层实现做进一步研究与扩展,以3~5人的课题小组为单位,分析开源DBMS的体系结构和主要的技术方法,并对其中某方面进行重点研究与扩展实现;此外,强调对领域前沿的了解,对某方面理论与技术研究的综合把握与研究分析,并能对一些领域热点问题展开研究探讨,完成领域某方面的综述报告和研究论文。

2) 对于工程研发型学生,课程设计强调在Oracle或SQL Server等数据库产品基础上,以实际应用为背景,以3~5人的课题小组为单位,设计一个中等规模的数据库应用系统,并要求对系统研发过程中的各个设计与技术实现环节能够有较全面的把握;此外,强调对领域技术动态的了解,并能对领域技术和应用有较全面的认识和分析,对实际系统研发能形成有效的技术方案和分析报告。

3) 对于应用管理型学生,课程设计将以3~5人的课题小组为单位,在Oracle或SQL Server等数据库产品基础上,构建一个实用的数据库系统,强调数据库的设计方法和过程的全面把握,以及对项目研发过程中各个实践环节的全面调度与管理;此外,强调对领域研究与技术动态的了解,对系统开发与应用相关的知识体系和管理模式有较全面的认识和分析,能对实际项目开发与管理形成有效的方案和分析评估报告。

2.4分类开展课后活动

数据库课程以各种形式的课后活动,培养不同类型学生对课程的学习兴趣,是对课堂教学的有益补充。

1) 对于理论强化型学生,增加一些相关的领域研究现状和动态的介绍,提出一些开放思考问题,引导学生更深入、广泛地了解相关理论与技术的研究和发展现状,培养学生对本学科的学术前沿的研究热情和研究能力。由教师引导学生去找寻一些课程相关的理论与技术热点或难点问题,主要追踪数据库领域的重要国际会议与国际期刊,国际会议如SIGMOD/PODS、VLDB、ICDE等,国际期刊如ACM Transactions on Database Systems (TODS)、IEEE Transactions on Knowledge and Data Engineering (TKDE)、VLDB Journal等,以及追踪国际国内一些著名的数据库研究小组,学生以自由组合小组形式展开针对某个主题的研究探讨,完成领域综述以及研究论文,并在讨论课上做口头报告;更进一步鼓励学生加盟数据库相关领域导师的实验室和课题组,参与相关的实际科研项目的研究。

2) 对于工程研发型学生,增强数据库前沿理论研究与应用技术的介绍,培养学生对本学科的理论与技术前沿的研究探索热情和研发能力,由教师或企业研发人士引导学生去探讨一些相关的理论与技术热点问题,完成领域技术分析报告以及研究或技术型论文,并在实验课上做口头报告;鼓励学生参与相关导师的实验室和课题组,具体开展一些相关实际课题的研发;引导学生在小学期的企业实习期间有效地参与和完成实践项目的调研和分析设计与实现工作。

3) 对于应用管理型学生,加强数据库软件产品和应用案例的介绍,培养学生对本学科技术前沿的研究探索热情和应用管理能力,邀请企业数据库工程师举行讲座,引导学生去思考一些相关的技术热点问题,完成领域综述以及数据库系统开发案例分析报告,并在实验课上做口头报告;鼓励学生参与相关导师的实际项目研发;引导学生在小学期的企业实习期间有效地参与相关企业项目的研发与管理实践的调研分析。

3结语

数据库课程分类教学与实践模式是计算机本科专业课程教学的一种新模式的探索,通过对学生个体

差异的分析,有针对性地分类采用不同的教学内容、集中实验以及课程设计和课外辅导,因材施教。在数据库课程教学研究与实践中,我们针对计算机科学与技术专业和信息安全专业的本科生探索和逐步应用分类教学和实践模式,在课堂教学、实验教学、课程设计、课外实践等多方面进行了探索,从学生们的课程作业、实验报告、技术分析报告、应用系统设计、DBMS分析报告、领域综述报告、研究或技术论文、参与相关导师的研讨班与课题工作、期中和期末考试等情况来看,分类教学和实践模式在较大程度上激发了学生的学习和研究的热情与潜力,大部分同学取得了较好的学习和实践效果。当然,我们还需要不断研究数据库课程教学与实践各个环节,特别是课程自身的体系与数据库日益发展的相关领域的研究与技术应用间的关联,以探索更合理、更优化的教学实践模式。

参考文献:

[1] 蒋昌俊,苗夺谦,王晓国,等.“一体两翼”的创新人才培养模式[EB/OL]. [2009-02-19]. 高教教学参考,2009,3(1):1. /Model1024.asp?id=1425.

[2] 同济大学计算机科学与技术系. 计算机科学与技术专业培养计划(2006修订)[EB/OL]. [2009-09-30]. cs.tongji. /prog/InforWeb/publish/newsdetail.jsp?newsno=904.

[3] Abraham Silberschatz,Henry F. Korth,S. Sudarshan. Database System Concepts(影印版)[M]. 5th ed. New York:McGraw- Hill,2006.

[4] Raghu Ramakrishnan,Johannes Gehrke. Database Management Systems[M]. 3rd ed. New York:McGraw-Hill,2002.

[5] Hector Garcia-Molina,Jeffrey D. Ullman,Jennifer D. Widom. Database Systems:The Complete Book[M]. New Jersey: Prentice Hall,2002.

[6] 王珊,萨师煊. 数据库系统概论[M]. 4版. 北京:高等教育出版社,2006.

[7] Patrick O’Neil,Elizabeth O’Neil. Database:Principles,Programming,and Performance[M]. 2nd ed. San Fransisco: Morgan Kaufmann,2001.

[8] 李建中,王珊. 数据库系统原理[M]. 2版. 北京:电子工业出版社,2004.

Classified Teaching and Its Practice Model for Database System Course

GUAN Ji-hong1, WEI Qing-ting1, 2

(1.Department of Computer Science and Technology, Tongji University, Shanghai 201804, China;

2.School of Software, Nanchang University, Nanchang 330046, China)

篇4

故障原因分析

遇到先前用得好好的闪盘,突然变身到“未格式化”状态的情况,请一定要保持冷静。首先考虑是否存在插口接触不良的问题,检查步骤也很简单。将闪盘重新拔插一次,换插到其他USB插口上,或把闪盘插到其他电脑上看看,一步一步检查下来,绝大多数“未格式化”的闪盘都能正常使用了。

如果排除了接触不良的因素,闪盘仍然不能正常使用,那就有可能是闪盘的分区表遭到了破坏。我们可以尝试用数据恢复软件R-Studio来搜救数据。

R-Studio大搜救

打开R-Studio,在目录树中用鼠标右键点击闪盘盘符,然后在右键菜单中选择“扫描”。如果在扫描设置窗口中正确设置了扫描范围、扫描文件类型等参数,就能达到最佳搜救效果。如果对此不熟,那就用默认的设置也行(如图1所示)。

R-Studio的全面扫描速度相当快,扫描1GB容量的闪盘,只需不到2分钟时间。扫描完成后,会出现“识别1”、“识别2”之类的选项,那是R-Studio扫描出来的分区信息,直接点击进去,即可查看扫描结果(如图2所示)。

在扫描结果中勾选需要恢复的文件,点击右键,选择“恢复标记的内容”,然后指定恢复路径即可。

软件名称: R-Studio汉化版

软件版本: 4.0 Build 124045

授权方式: 共享软件

软件大小: 5.79MB

下载地址: 省略/soft/8654.htm

独特的映像功能

如果闪盘有急用,不能慢慢等待完成数据恢复操作,我们也可以用R-Studio的映像功能将“现场”保存下来,然后直接把闪盘重新格式化后使用。以后需要恢复数据时,直接在映像文件中操作即可。

篇5

【关键词】土地利用分区 聚类分析 潜江市

随着潜江市国民经济快速,土地资源利用矛盾日益凸显,人地关系日趋紧张,开展潜江市土地利用分区研究,发现土地利用中的分异规律,真实客观地反映潜江市土地利用呈现的空间分异特征。不仅可以为土地利用规划中制定的用途管制措施的实施提供理论支撑,还可以为区域土地资源的合理开发利用服务。通过土地利用分区研究,明确各区的比较优势,强化各区之间的协作关系,进行合理的社会分工,适应潜江市产业、经济、人口、资源与环境的协调快速发展。

一、区域概况

潜江市位于湖北省中南部的江汉平原腹地,国土总面积为2004平方公里。东接仙桃,西达江陵、荆门,南连监利江,北接荆门。总人口 103万,城镇人口约48.8万人,境内有全国十大油田之一的江汉油田,辖3个省级经济开发区、6 个县级国有农场、16个镇处。

二、分区原则

(一)自然环境条件相似性

自然环境因素是影响土地利用功能空间分异的最基本因素,也是生态环境系统形成和分异的物质基础,也是影响区域生态环境和资源禀赋的最直接因素。

(二)定性与定量相结合

单一采用定性或定量方法来进行分区,势必会影响结果的科学性和可行性。因此,需要采用定性与定量方法相结合进行分区研究。

(三)行政单位完整性原则

尽量使分区的界线在空间上保持与乡镇等基层行政单元界线的基本一致,有利于制定并实施具有连续性的土地规划与土地整治保护措施,避免行政单位间可能出现的用地矛盾与冲突。

三、指标体系的建立

潜江市地域之间的社会经济发展存在着明显的差异,使得各区域的土地利用主导方向存在着明显的地域差异,土地利用分区就是以这种土地利用主导方向的地域差异为基础的。

根据土地利用分区原则,结合潜江市土地利用数据与潜江市国民经济发展状况,建立起由地均GDP、农业单位产值、农民人均纯收入、人口经济密度、城镇化水平、人均耕地面积、土地利用率、林地比重、水域比重、粮食单产、人均城乡建设用地、人均水利设施用地等18个指标构成的评价指标体系,充分而全面的体现潜江市土地利用特点。

四、分区过程

利用SPSS软件提供的主成分分析方法完成初选指标的筛选工作,软件默认保留特征根大于1的变量,并从中提取出6个变量作为主成分,这6个主成分集中了原变量85.69%的原始信息,可以较全面地反映解释原始数据包含的信息。

从每一个主成分中挑选一个对主成分贡献最大的指标,共挑选出6个指标,分别是人均耕地面积、土地利用率、水域比重、人均城乡建设用地、林地比重、人均水利设施用地,并运用这6个指标在SPSS软件中对潜江市23个镇、办事处、原种场、管理区进行聚类分析,最终将潜江市分为5个土地利用分区。

五、分区概述

(一)中心城区

该区主要包括园林办事处、杨市办事处、广华办事处、潜江经济开发区、周矶办事处、周矶管理区。该区是是潜江市的核心发展地区,区内人口密集,经济活动活跃,以化工业为代表的工业发达,土地利用程度高,城镇化水平高,人均耕地面积较少,建设用地与非建设用地矛盾十分尖锐,生态环境压力极大。

区内土地利用方向:1.加强对区内土地利用的宏观调控与引导,严格控制各类建设用地的规模,防止城市的无序蔓延与扩张。充分利用存量建设用地与闲置土地,提高土地的节约集约利用程度。2.在稳定粮食、棉花和油料产量的前提下,发展面向主城区市场的优质高效农业,重点发展蛋奶、水产、蔬菜、花卉、水果等高附加值农业。3.充分发挥开发区对全市经济发展的带动作用,制定和完善相关产业及投资政策,重视开发区基础设施建设配套工作,营造良好的投资环境。4.通过实施旧城改造、存量建设用地清理、建筑容积率提升、城乡增减挂钩等途径来取得大量的城市建设用地,并配套建设城市基础设施,提高城市建设用地的使用效益。

(二)城镇重点发展区

该区主要包括竹根滩、王场镇、张金镇和总口管理区。该区工业基础较好,是潜江市城镇开发建设的重点地区,是潜江市主城区未来新增城市用地的重要储备地区。因距离中心城区较近,经济结构与用地结构呈现出明显的为城市发展服务的倾向。

区内土地利用方向:1.因该区承担中心城区扩展用地储备的任务,分配城镇建设用地指标时应参照城市用地标准执行,合理保证重点基础设施建设用地,充分挖掘存量建设用地的潜力,提高土地利用率,积极推进新农村建设以及农村宅基地整理复垦工作。2.加强土地开发整理工作,充分挖掘区域土地资源资源的利用潜力,提高土地承载力和利用率。3.继续推进基本农田建设工作,通过工程措施改善本区农业生产条件。积极调整种植结构,发展无公害大棚蔬菜、水果种植以及水产、畜禽养殖等高附加值农业。

(三)城镇发展潜力区

该区主要包括渔洋镇、熊口镇、老新镇、浩口镇、积玉口镇,该区是潜江市城市建设、高附加值农业的发展潜力区域。区内人口密度较大,经济发展水平较高,以小龙虾养殖、水产品加工为代表的加工业较为发达,土地利用程度较高,土地利用方式转换频繁,生态环境压力较大。

区内土地利用方向:1.应大力发展盐化工、石油化工等工业,加大科技投入。2.高度重视莲藕种植、小龙虾养殖等高附加值农业的发展,努力走现代农业发展路线,持续提高农业的整体产业水平。3.进一步完善排灌沟渠等地区基础设施,加大对水产品加工等加工产业的投入。

(四)农业集中保障区

该区主要包括西大垸管理区、运粮湖管理区、熊口管理区、后湖管理区、高场原种场、棉花原种场。作为潜江市主要的粮棉油及水产基地,水稻、棉花以及油菜种植在全市乃至全省起着举足轻重的作用。以小龙虾为代表的水产品养殖业十分发达,养殖技术先进,已经形成完整的水产养殖产业链条。该区村庄众多,已建立起完整的农副产品生产-加工-流通-销售渠道,但耕地后备资源不足制约着该区经济的可持续发展。

区内土地利用方向:1.高度重视对耕地尤其是基本农田的保护,加快中低产田改造,继续加强农田基本建设与水利设施建设,改善农业生产条件。2.发展优质高效粮食作物与经济作物,培育农业产业化经营龙头企业,提高农产品的附加值。3.高度重视农产品质量安全性,采用先进技术,降低生产成本,提高本区农产品的市场竞争力。4.营造农田防护林,加强农业生态环境建设,提高农业生产综合水平。

(五)自然生态协调区

该区主要包括高石碑镇、龙湾镇。该区是以保护生态环境和发展旅游业为主导方向的区域。因受城市发展影响较少,生态环境较好,分布着汉江、兴隆河、冯家湖等具有重大生态保护价值的水域以及大面积的速生林,在保护和改善潜江市生态环境方面起着举足轻重的作用。区内还分布着国家南水北调中线工程重点项目——高石碑兴隆水利枢纽,东湖村楚墓群、章华台遗址等具有巨大开发价值的旅游资源,旅游开发市场前景广阔。

区内土地利用方向:1.加强水系、湖泊等生态土地的保护与管理,重视生态工程与基础设施工程建设,有效保护区内自然生态环境与旅游资源。2.增加生态建设资金投入,营造生态林带,禁止除适度生态旅游业建设项目之外的不合理开发建设活动,建设项目动工前必须按规定进行环境影响评价。3.在保护自然生态环境的前提下,因地制宜地发展该区生态环境承载力范围内的生态旅游、生态农业实现经济增长与资源环境的协调发展。4.实施精品生态旅游资源战略,利用当地的自然资源,发展以度假、水上游乐、农家体验为主的生态旅游项目,高石碑镇重点建设兴隆水利工程风景园,龙湾镇重点发展以龙湾遗址展示公园为核心的章华台文化旅游项目。5.加强中心村建设工作,配套并完善基础设施,改善人居环境,引导农民向中心村转移,推进农村居民点整理工作。

六、结语

通过系统聚类分析法在潜江市区域土地利用研究中的运用,基本确定了潜江市今后土地利用分区的方向。但这种方法仅仅只是一种尝试,尚待继续完善,需要进一步深化研究。在方法上,还需要探索更多、更科学指标的使用,建立更快捷、操作性更强的评价体系,进行更广泛的实例研究,使土地利用分区研究更加科学合理。

参考文献:

[1]赵荣钦,黄贤金,钟太洋等.聚类分析在江苏沿海地区土地利用分区中的应用[J].农业工程学报,2010,26(6):310-314.

[2]曲晨晓,孟庆香.许昌市土地利用功能分区研究[J].中国土地科学, 2008,22(11):51-55.

[3]余德贵,吴群,赵亚莉.土地利用主体功能分区方法与应用[J].农业系统科学与综合研究,2008,24(2):196-200.

篇6

伴随着计算机和网络技术的不断发展,人们在享受其带来的高品质生活的同时,也遭受着各种安全问题的侵扰,网络攻击一刻也没有停过。传统的网络安全防御手段如防火墙、入侵检测系统(Intrusion Detection System,IDS)、身份认证等虽已得到广泛应用,但是面对日新月异的攻击方法,它们也只能被动“接招”。蜜罐技术的提出和应用,大大提高了网络安全系统的主动防御能力和对未知类型攻击的响应速度。

蜜罐(Honeypot)从本质上来说是一种资源,其本身价值是引诱攻击者对网络进行攻击。蜜罐能够实时监视攻击者的所有活动,诱惑或者欺骗入侵者,转移攻击目标使他们优先攻击蜜罐系统,并从捕获到的数据中学习入侵者使用的工具、方式和方法,从而赢得研究入侵对策的时间。

蜜罐按照交互能力主要分为低交互型和高交互型,前者的价值在于检测,为网络提供直接的安全保护;而后者的价值在于对恶意软件及黑客攻击的捕获和分析。蜜罐系统主要包括了网络诱骗、数据控制、数据捕获、数据报警、数据分析和日志远程存储等功能模块。由于蜜罐系统一般要结合防火墙、路由器和IDS来进行数据控制,因此,整个蜜罐系统的数据包括防火墙日志、IDS网络数据包和日志、蜜罐本身日志等。数据报警通常借助一些监视工具(例如Swatch)来实现,通过字符串模式匹配去判断,然后实现 Email等方式报警[1]。

1研究现状

蜜罐技术作为一种新型的网络安全技术,已经得到国外很多研究机构和公司的重视。目前该领域较大型的研究项目有:致力于部署分布式蜜罐的“分布式蜜罐项目组”(Distributed Honeypot Project);研究蜜罐网络诱骗技术的“蜜网项目组”(Honeynet Project);而“蜜网研究联盟”(Honeynet Research Alliance)在此领域有较大影响。“分布式蜜罐项目组”主要研究将蜜罐散布在网络的正常系统和资源中,利用闲置的服务器端口进行欺骗,将欺骗分布到更广范围的IP地址和端口空间中,从而增大欺骗在网络中的百分比。“蜜网项目组”致力于提高人们的网络安全意识,同时提供必要的网络安全知识及该组织开发的开源工具软件。“蜜网研究联盟”主要是通过使用蜜罐网络这样一个真实的环境来研究入侵者使用的工具、策略和动机,其所有的研究成果都是开放的,向整个安全研究领域公布。目前蜜罐网络研究的重点被放在数据捕获和数据分析上,以提高蜜罐网络的易用性,即增加工具软件的界面友好性和操作的简便性等,并在此基础之上提出了第三代蜜罐网络结构模型。

我国在蜜罐技术研究方面起步较晚,2001年才对其立项研究。2004年9月北京大学计算机研究所正式成立的蜜罐网络项目研究组,开展“狩猎女神”项目研究,该研究组于2005年2月22日正式成为“蜜网研究联盟”的一员。这是我国第一个正式研究蜜罐技术的组织,标志着我国蜜罐技术研究与世界接轨[2]。

篇7

    我国历史文化悠久,历代正史中都有关于灾害发生、危害情况的记载,形成了一个序列长、内容丰富的资料库,这些历史灾害信息对我们认识灾害、研究灾害和减轻灾害有着非常重要的参考价值,国内外灾害研究者都对此给予了高度评价。2011年5月国家减灾委发表了《国家自然灾害空间信息基础设施总体构思》主旨报告[1],进一步把历史灾害信息平台作为我国灾害空间信息系统建设的重要组成部分。

    然而由于古代科技水平的限制,长期以来灾害记录一直处于定性描述阶段,这使得对历史灾害信息的还原、提取、量化难度很大,基于现代翔实灾害记录的各类灾害分级方法因而难以套用于历史灾害记录。现代灾害记录中的各种灾害属性如伤亡人数、受灾面积、倒房数量、直接经济损失等作为灾害分级方法的重要依据,都有着客观准确的统计结果,量化程度很高,可比性较强;然而历史灾害记录的各项灾害属性则以描述性语言为主,并且存在大量属性值缺失,可比性较差。例如一条典型的洪涝灾害记录:“十二月戊戌,开封府陈留等六县水灾,诏免其田租”,仅包含了灾种,时间,地点,政府响应等信息,既未提及伤亡人数,也未提及倒房数量,而经常作为灾害分级关键属性的“直接经济损失”更无从得出,数据量化难度很高,这使得现有的一些历史灾害分级方法人为观念介入较多,难以令人信服,而基于现代灾害记录的分级方法[2-5]则适应性较差,神经网络[6]则因为其较强的逼近非线性函数的能力、模式识别能力以及分类能力,成为理论上较为适用的方法,但是由于历史灾害记录的特殊性,神经网络必须先通过专家人工分级的结果进行训练,依然无法摆脱对主观因素的依赖。

    鉴于此,本文尝试用另一种思路即先聚类再分级的方法来解决历史灾害分级问题,目前已有学者提出相关的模糊聚类[7-8]、灰色聚类[9-10]等灾害聚类分级方法,然而这些方法仍离不开人为的参数干预,如模糊聚类必须手动设置合适的αе担并且其应用背景都是灾害记录已经过高度量化的情况。因此本文提出一种蚁群聚类算法对历史灾害记录进行自动聚类,再根据聚类结果中各聚类中心的层次性完成分级,从而有效减免了灾害分级流程中的主观因素介入,并通过实验证明了本方法的有效性。

    1 蚁群聚类分级算法

    1.1 蚁群聚类思想

    历史灾害分级问题可以归结如下。1)分级标准问题。由于历史灾害记录以描述性为主,不可避免地加入了记录人的 主观看法,因此对这些记录难以制定出较客观的分级标准,不同的历史专家对同一条记录也很可能根据各自的标准而产生不同的评级结果。而通过聚类可以不依赖于具体的分级标准,是一个很好的解决思路。2)数据量化问题。历史灾害记录叙述简约且无统一格式,这就要求既要提取出能体现灾害特征的关键信息,又要兼顾其他重要信息以补不足。3)批

    量处理问题。现有的一些分级方法都是基于小样本进行分析的,当样本量较大时其运算效率就会大大降低,而历史灾害记录浩如烟海,对其进行分级处理就必然要考虑到算法时效性问题。4)专家监督问题。在历史灾害数据自身系统性,表述性不足的情况下,历史专家的专业意见就显的格外重要,而且聚类结果本身也要获得历史专家的认可才有意义。但是由于历史灾害记录固有的主观性特点,专家与专家之间也存在着一定的分歧,这使得在分级过程中过多参入专家的意见又可能使所得出的分级结果成为“一家之言”,客观性不足,因此需要加以权衡,本文认为让专家的指导作用尽量体现在大方向上是一种较为理想的解决方式。

    聚类是指将物理或抽象的数据集合按有关特性的相似程度进行分组的过程。通过聚类可以使同一组中各数据的特性尽可能地相似,而不同组数据间的特性差异尽可能地大,灾害分级对等级内和等级间灾害数据的期望与聚类思想是一致的,可见灾害分级问题可以被视为一种层次聚类问题。

    自1991年蚁群算法[11-12]提出以来,已在多个领域得到了广泛的应用,并衍生出了各种蚂蚁行为模型。孵化分类(brood sorting)是一种可以在许多种类的蚂蚁中观察到的行为,蚂蚁将卵和小幼虫紧密地排列成束并且放置在巢穴孵化区的中心,而最大的幼虫位于孵化束的外围。Deneubourg等[13-15]提出了一个模拟这一现象的模型,其中蚂蚁根据周围物品的数量来收集或丢弃某个物品。例如,如果一只蚂蚁带有一个小卵,那它极有可能将其放置在排布了许多相同的卵的区域;相反,如果一只未携带任何物品的蚂蚁在一堆小卵中发现了一只大幼虫,那么它带走这只幼虫的概率非常大。在其他任何情况中,蚂蚁收集或丢弃物品的概率值都非常小。

    受上述模型的启发,本文提出了一种基于蚁群聚类行为的历史灾害分级算法。算法思想是先根据历史专家的意见,将历史灾害划分为“轻灾、中灾、重灾和特重灾”4个等级,即聚为4类,然后把历史灾害数据随机放到4个组中,通过令蚂蚁从一个组中选出一个数据再放入一个组,引导蚂蚁把初始混乱无章的各组整理成有序。算法中蚂蚁的各种行为仿照上述模型,是按概率进行的,如蚂蚁要选择某个组进行整理时,评价越混乱的组被蚂蚁整理的概率越大,然而蚂蚁并非一定会选择最混乱的组进行整理,这样可以很好地避免算法陷入局部最优,同时保证算法向较好的方向上收敛。与K.means聚类算法不同,蚁群聚类算法受初始聚类中心选取质量的影响不大,蚂蚁会根据各组混乱度自适应地对聚类中心进行调整,因而很适用于解决大批量问题,样本量越大,聚类中心层次性越强,蚂蚁聚类出的结果也越有意义。

    1.2 历史灾害信息提取

    通过对历史灾害记录的大量分析,并结合历史专家的意见,我们对灾害信息的各项特征进行了标准化编码,并归纳出以下4项属性来提取各条记录的灾害信息。

    1)“受灾范围”指灾害波及的地域,以县为单位,通过地理信息系统转化现代的县制大小,该项为灾害记录必有属性,具有较高的量化程度。

    2)“物情”包括对灾害的物态及影响描述,如“伤禾苗”、“水漂民居”、“决堤四十余丈”等。

    3)“民情”指对灾民生存情况的描述,如“民饥”、“溺死人畜”等。

    4)“政情”指对政府响应灾害情况的描述,如“诏免其租”、“祈祷雨泽”、“发仓赈济”等。

    后3项属性为可缺失属性,能有效涵盖住每条历史灾害记录的基本灾情信息。为了实现这3项属性的合理量化,先为各项属性分别编制出各自的特征区分码,再利用命名实体识别技术将历史灾害记录编入数据库。以“政情”属性为例,分为“无记录、祈祭、遣官、减租税粮、免租税粮和赈济”6级,分别编码为“0/1/2/3/4/5”,凡是在历史灾害记录中出现“诏免盐粮、诏免税粮、免粮、免征秋粮、免征田粮”等描述的都视为“免租税粮”,在“政情”属性部分统一记为“4”。需要注意的是,“0/  1/2/3/4/5这种递增方式可能并不符合实际灾情严重程度的上升幅度,因此还可能需要根据所得出的聚类结果和专家的评估意见对各等级所对应的编码进行适当的调整。 至此将历史灾害分为4级,每条历史灾害数据有4项属性,属性值通过上述方法实现了初步量化,进而可以进行对历史灾害数据的聚类处理。在这里先默认这4项属性的

    权重是一样的,而在实际历史灾害聚类时,可以根据所得出的聚类结果和专家反馈的评估意见进行权值修正,以进一步保证聚类的质量,即着重于在灾害信息量化过程中借鉴和利用历史专家的专业意见,而在聚类过程中则尽量实现快速的自动化处理,以使专家的指导和监督作用更多地体现在大方向上。

    1.3 蚁群聚类算法描述

    算法描述如下,设灾害数据集合为S,每条灾害数据有p(此处p=4)个属性,首先将数据集S随机分配为k(此处k=4)个组,各组的灾害数据数量设为t璶(n∈[1,k])。依次进行如下处理。

    1)数据预处理。

    因为大量的历史灾害记录都至少存在一项属性值缺失,0值较多,数据聚合性差,为了改善这一问题,利用灰色关联系数的定义,按照式(1)进行归一化处理。

    第n个灾害数据的第i个初始属性值设为x璶i,预处理后,变为y璶i:

    y璶i =1/(2-(x璶i-x璵ini)/(x璵axi-x璵ini))(1)

    其中x璵axi,x璵ini分别为灾害数据集合S中第i个属性的最大值和最小值。

    2)选择一个出数据组。

    蚂蚁按照式(2)评估各个灾害数据组的混乱度,用chaos璶 (n∈[1,k])来表示,chaos值越大表示此组越混乱,那么其被蚂蚁整理的概率也就越大。第n个组的混乱度表示为:

    chaos璶=∑t璶i=1(x璱-avg璶)2t璶 (2)

    其中:x璱=∑pj=1y2璲,表示第n组中第i条数据各属性的平方和;avg璶=(∑t璶i=1x璱)/t璶表示第n组各x璱的平均值;chaos璶表示第n组中各灾害数据属性平方和的标准差。

    然后蚂蚁根据各个组的chaos值采用赌轮选择法[13],选出一个出数据组。

    3)选出一个灾害数据。

    在选出的组中,蚂蚁按照式(3)评估其中每个灾害数据对该组的混乱度的影响,用influence来表示,influence值越大表示此灾害数据影响越大,那么蚂蚁把此数据从组中取出的概率也就越大。组中第i个数据的影响力表示为:

    influence璱=(x璱-avg璶)2(3)

    其中求得x璱,avg璶的方法与第2)步相同。

    然后蚂蚁就组中各个灾害数据的influence值采用赌轮选择法,选出一个数据。

篇8

1、简单糖类的统称。经水解仅能得到单糖类分子。

2、通常是指具有甜味的单糖和寡糖。

糖的分类:

1、根据碳原子数分为丙糖,丁糖,戊糖、己糖。

篇9

关键词:历史灾害;分级;聚类;蚁群算法;灰色关联分析

中图分类号: TP311;TP18文献标志码:A

Historical disaster classification method based on ant colony clustering

JIA Zhi.juan1*, HU Ming.sheng2, LIU Si2

1. School of Computer Science and Technology, Wuhan University of Technology, Wuhan Hubei 430070, China;

2. Network Center, Zhengzhou Normal University, Zhengzhou Henan 450044, China

Abstract:

Aiming at the descriptiveness and parsimony problems of historical disaster records a historical disaster classification method which based on ant colony clustering is proposed in this paper. The disaster data are normalized by using gray relational analysis approach, and then the levels of historical disasters are divided by the results of ant colony automatic clustering, so as to avoid the arbitrary man-made interference. In comparison with other classification methods in performance, experimental results show that this method has high accuracy and practicality.Concerning the description and simplicity of historical disaster records, a historical disaster classification method based on ant colony clustering was proposed in this paper. The disaster data were normalized by using gray relational analytical approach, and then the levels of historical disasters were divided by the results of ant colony automatic clustering, so as to avoid the arbitrary man.made interference. In comparison with other classification methods in performance, the experimental results show that this method has higher precision and practicality.Key words:

historical disaster; classification; clustering; ant colony algorithm; gray relational analysis

0 引言

我国历史文化悠久,历代正史中都有关于灾害发生、危害情况的记载,形成了一个序列长、内容丰富的资料库,这些历史灾害信息对我们认识灾害、研究灾害和减轻灾害有着非常重要的参考价值,国内外灾害研究者都对此给予了高度评价。2011年5月国家减灾委发表了《国家自然灾害空间信息基础设施总体构思》主旨报告[1],进一步把历史灾害信息平台作为我国灾害空间信息系统建设的重要组成部分。

然而由于古代科技水平的限制,长期以来灾害记录一直处于定性描述阶段,这使得对历史灾害信息的还原、提取、量化难度很大,基于现代翔实灾害记录的各类灾害分级方法因而难以套用于历史灾害记录。现代灾害记录中的各种灾害属性如伤亡人数、受灾面积、倒房数量、直接经济损失等作为灾害分级方法的重要依据,都有着客观准确的统计结果,量化程度很高,可比性较强;然而历史灾害记录的各项灾害属性则以描述性语言为主,并且存在大量属性值缺失,可比性较差。例如一条典型的洪涝灾害记录:“十二月戊戌,开封府陈留等六县水灾,诏免其田租”,仅包含了灾种,时间,地点,政府响应等信息,既未提及伤亡人数,也未提及倒房数量,而经常作为灾害分级关键属性的“直接经济损失”更无从得出,数据量化难度很高,这使得现有的一些历史灾害分级方法人为观念介入较多,难以令人信服,而基于现代灾害记录的分级方法[2-5]则适应性较差,神经网络[6]则因为其较强的逼近非线性函数的能力、模式识别能力以及分类能力,成为理论上较为适用的方法,但是由于历史灾害记录的特殊性,神经网络必须先通过专家人工分级的结果进行训练,依然无法摆脱对主观因素的依赖。

鉴于此,本文尝试用另一种思路即先聚类再分级的方法来解决历史灾害分级问题,目前已有学者提出相关的模糊聚类[7-8]、灰色聚类[9-10]等灾害聚类分级方法,然而这些方法仍离不开人为的参数干预,如模糊聚类必须手动设置合适的α值,并且其应用背景都是灾害记录已经过高度量化的情况。因此本文提出一种蚁群聚类算法对历史灾害记录进行自动聚类,再根据聚类结果中各聚类中心的层次性完成分级,从而有效减免了灾害分级流程中的主观因素介入,并通过实验证明了本方法的有效性。

1 蚁群聚类分级算法

1.1 蚁群聚类思想

历史灾害分级问题可以归结如下。1)分级标准问题。由于历史灾害记录以描述性为主,不可避免地加入了记录人的主观看法,因此对这些记录难以制定出较客观的分级标准,不同的历史专家对同一条记录也很可能根据各自的标准而产生不同的评级结果。而通过聚类可以不依赖于具体的分级标准,是一个很好的解决思路。2)数据量化问题。历史灾害记录叙述简约且无统一格式,这就要求既要提取出能体现灾害特征的关键信息,又要兼顾其他重要信息以补不足。3)批量处理问题。现有的一些分级方法都是基于小样本进行分析的,当样本量较大时其运算效率就会大大降低,而历史灾害记录浩如烟海,对其进行分级处理就必然要考虑到算法时效性问题。4)专家监督问题。在历史灾害数据自身系统性,表述性不足的情况下,历史专家的专业意见就显的格外重要,而且聚类结果本身也要获得历史专家的认可才有意义。但是由于历史灾害记录固有的主观性特点,专家与专家之间也存在着一定的分歧,这使得在分级过程中过多参入专家的意见又可能使所得出的分级结果成为“一家之言”,客观性不足,因此需要加以权衡,本文认为让专家的指导作用尽量体现在大方向上是一种较为理想的解决方式。

聚类是指将物理或抽象的数据集合按有关特性的相似程度进行分组的过程。通过聚类可以使同一组中各数据的特性尽可能地相似,而不同组数据间的特性差异尽可能地大,灾害分级对等级内和等级间灾害数据的期望与聚类思想是一致的,可见灾害分级问题可以被视为一种层次聚类问题。

自1991年蚁群算法[11-12]提出以来,已在多个领域得到了广泛的应用,并衍生出了各种蚂蚁行为模型。孵化分类(brood sorting)是一种可以在许多种类的蚂蚁中观察到的行为,蚂蚁将卵和小幼虫紧密地排列成束并且放置在巢穴孵化区的中心,而最大的幼虫位于孵化束的。Deneubourg等[13-15]提出了一个模拟这一现象的模型,其中蚂蚁根据周围物品的数量来收集或丢弃某个物品。例如,如果一只蚂蚁带有一个小卵,那它极有可能将其放置在排布了许多相同的卵的区域;相反,如果一只未携带任何物品的蚂蚁在一堆小卵中发现了一只大幼虫,那么它带走这只幼虫的概率非常大。在其他任何情况中,蚂蚁收集或丢弃物品的概率值都非常小。

受上述模型的启发,本文提出了一种基于蚁群聚类行为的历史灾害分级算法。算法思想是先根据历史专家的意见,将历史灾害划分为“轻灾、中灾、重灾和特重灾”4个等级,即聚为4类,然后把历史灾害数据随机放到4个组中,通过令蚂蚁从一个组中选出一个数据再放入一个组,引导蚂蚁把初始混乱无章的各组整理成有序。算法中蚂蚁的各种行为仿照上述模型,是按概率进行的,如蚂蚁要选择某个组进行整理时,评价越混乱的组被蚂蚁整理的概率越大,然而蚂蚁并非一定会选择最混乱的组进行整理,这样可以很好地避免算法陷入局部最优,同时保证算法向较好的方向上收敛。与K.means聚类算法不同,蚁群聚类算法受初始聚类中心选取质量的影响不大,蚂蚁会根据各组混乱度自适应地对聚类中心进行调整,因而很适用于解决大批量问题,样本量越大,聚类中心层次性越强,蚂蚁聚类出的结果也越有意义。

1.2 历史灾害信息提取

通过对历史灾害记录的大量分析,并结合历史专家的意见,我们对灾害信息的各项特征进行了标准化编码,并归纳出以下4项属性来提取各条记录的灾害信息。

1)“受灾范围”指灾害波及的地域,以县为单位,通过地理信息系统转化现代的县制大小,该项为灾害记录必有属性,具有较高的量化程度。

2)“物情”包括对灾害的物态及影响描述,如“伤禾苗”、“水漂民居”、“决堤四十余丈”等。

3)“民情”指对灾民生存情况的描述,如“民饥”、“溺死人畜”等。

4)“政情”指对政府响应灾害情况的描述,如“诏免其租”、“祈祷雨泽”、“发仓赈济”等。

后3项属性为可缺失属性,能有效涵盖住每条历史灾害记录的基本灾情信息。为了实现这3项属性的合理量化,先为各项属性分别编制出各自的特征区分码,再利用命名实体识别技术将历史灾害记录编入数据库。以“政情”属性为例,分为“无记录、祈祭、遣官、减租税粮、免租税粮和赈济”6级,分别编码为“0/1/2/3/4/5”,凡是在历史灾害记录中出现“诏免盐粮、诏免税粮、免粮、免征秋粮、免征田粮”等描述的都视为“免租税粮”,在“政情”属性部分统一记为“4”。需要注意的是,“0/1/2/3/4/5”这种递增方式可能并不符合实际灾情严重程度的上升幅度,因此还可能需要根据所得出的聚类结果和专家的评估意见对各等级所对应的编码进行适当的调整。

至此将历史灾害分为4级,每条历史灾害数据有4项属性,属性值通过上述方法实现了初步量化,进而可以进行对历史灾害数据的聚类处理。在这里先默认这4项属性的权重是一样的,而在实际历史灾害聚类时,可以根据所得出的聚类结果和专家反馈的评估意见进行权值修正,以进一步保证聚类的质量,即着重于在灾害信息量化过程中借鉴和利用历史专家的专业意见,而在聚类过程中则尽量实现快速的自动化处理,以使专家的指导和监督作用更多地体现在大方向上。

1.3 蚁群聚类算法描述

算法描述如下,设灾害数据集合为S,每条灾害数据有p(此处p=4)个属性,首先将数据集S随机分配为k(此处k=4)个组,各组的灾害数据数量设为tn(n∈[1,k])。依次进行如下处理。

1)数据预处理。

因为大量的历史灾害记录都至少存在一项属性值缺失,0值较多,数据聚合性差,为了改善这一问题,利用灰色关联系数的定义,按照式(1)进行归一化处理。

第n个灾害数据的第i个初始属性值设为xni,预处理后,变为yni:

yni =1/(2-(xni-xmini)/(xmaxi-xmini))(1)

其中xmaxi,xmini分别为灾害数据集合S中第i个属性的最大值和最小值。

2)选择一个出数据组。

蚂蚁按照式(2)评估各个灾害数据组的混乱度,用chaosn (n∈[1,k])来表示,chaos值越大表示此组越混乱,那么其被蚂蚁整理的概率也就越大。第n个组的混乱度表示为:

chaosn=∑tni=1(xi-avgn)2tn (2)

其中:xi=∑pj=1y2j,表示第n组中第i条数据各属性的平方和;avgn=(∑tni=1xi)/tn表示第n组各xi的平均值;chaosn表示第n组中各灾害数据属性平方和的标准差。

然后蚂蚁根据各个组的chaos值采用赌轮选择法[13],选出一个出数据组。

3)选出一个灾害数据。

在选出的组中,蚂蚁按照式(3)评估其中每个灾害数据对该组的混乱度的影响,用influence来表示,influence值越大表示此灾害数据影响越大,那么蚂蚁把此数据从组中取出的概率也就越大。组中第i个数据的影响力表示为:

influencei=(xi-avgn)2(3)

其中求得xi,avgn的方法与第2)步相同。

然后蚂蚁就组中各个灾害数据的influence值采用赌轮选择法,选出一个数据。

4)选择一个入数据组。

蚂蚁按照式(4)评估所选出的灾害数据与各个组的拟合度,用similarity n (n∈[1,k])来表示,similarity值越大表示与该组拟合度越高,那么把该灾害数据放入对应组的概率就越大。与第n个组的拟合度表示为:

similarityn=1(xi-avgn)2 (4)

其中求得xi,avgn的方法与第2)步相同。

然后蚂蚁就各个组的similarity值采用赌轮选择法,选出一个数据入组。把选出的灾害数据放入此组中。

5)选择蚂蚁。

为了使算法收敛,需要使用一定数量的蚂蚁(Agent),让它们分别进行2)~4)步,然后按照式(5)评估各个蚂蚁整理的质量,用fitness来表示, fitness值越大表示此蚂蚁整理的质量越高,采用fitness值最大的蚂蚁的整理方案来改变原聚类。第n只蚂蚁的整理质量表示为:

fitnessn=1tn*chaosn(5)

其中:tn为第n个组的大小,chaosn为此组的混乱值。这些值都是蚂蚁整理后的值。

6)算法收敛。

循环蚂蚁的整理行为,当算法收敛时,蚂蚁选出的灾害数据会被一直放回到原组,灾害聚类结果不再发生变化。此时根据各组聚类中心的大小顺序把各组数据依次划分为“轻灾、中灾、重灾、特重灾”。

1.4 蚁群聚类算法实现

为了方便理解算法的实现流程,列出了蚂蚁的数据结构及算法流程伪代码。

定义蚂蚁的数据结构如下:

2 实例分析

篇10

现在的天津市,在政府的大力支持和关怀下,城市居民生活垃圾分类处理有了很大的改进。2016年,政府出台了最新的《生活垃圾管理条例》和《生活垃圾分类减量管理办法》,大力推动生活废弃物的循环再利用。按照现行规定,生活垃圾按不同成分、属性、回收利用价值及对环境的影响,分为可回收物、厨余垃圾、有害垃圾和其他垃圾四大类。为了推进城市居民生活垃圾分类工作的开展,天津市将创建1000个生活垃圾分类示范楼门,垃圾分类从家庭开始。2016年5月25日,“天津市生活垃圾源头分类宣传教育示范活动”在红桥区双环街佳园东里社区举办。“生活垃圾源头分类项目作为本市民心工程,将逐步在本市社区推广。”据天津市市妇联负责人介绍,该项目由市妇联、市市容园林委、市文明办、市民政局等多部门联手推广,目前,天津市各区正在逐步推广该项目。河东区在全市率先启动“美家美院”暨生活垃圾源头分类宣教示范楼门创建活动,把垃圾分类知识和“五美”标准贴到示范楼门各个楼层;河西区成立巾帼垃圾分类宣传队,向全区发出“垃圾分类我先行”的倡议;津南区示范楼门楼门长向区妇联递送创建工作责任书,承诺组建宣传队伍、建设宣教园地、开展宣讲活动、进行卫生清整;北辰区妇联在霞光里社区与新华里幼儿园联合举办儿童环保活动,小朋友在老师和家长帮助下,利用废弃生活用品制作成时装,并走秀展出。

在政府现行政策的支持和鼓励下,城市居民生活垃圾的分类情况有了很大的改进。垃圾围城的现象得到缓解,垃圾的处理成本有了很大的降低。当垃圾分类在一些城市推广收效甚微的时候,天津市在推行垃圾分类方面进行很多创新探索,取得显著成效,成果喜人。但是我们也应看到,市民不清楚垃圾的具体分类投放而错放垃圾,或是因为分类垃圾桶离自己的门楼有些距离而选择混放垃圾桶的情况时有发生。这些小瑕疵的存在使得政府的政策在落实上不能很好地被执行,构成了小小的遗憾。

针对这种现状,我们拾荒者团队提出了五色五类垃圾分类法。团队创造性地发明了一种以垃圾的组成成分为标准的垃圾分类方法,了现有的可回收与不可回收的垃圾分类方式。根据生活中人们经常接触到的垃圾,以颜色为标识将垃圾分成纸类(绿色)、塑料类(蓝色)、金属类(黄色)、有害垃圾(红色)、厨余垃圾(黑色)这五大类,并匹配作品设计的U型五色分类垃圾桶,方便人们投放垃圾。

在现行的生活垃圾理过程中,虽然实施了垃圾分类,但用的还是传统的垃圾桶。传统的垃圾桶只能把垃圾集中一处,功能较为单一,即便分类,也是简单采用不同颜色的垃圾桶加以区分;由于人们习惯就近投放垃圾,忽视分类规则,即便垃圾桶以颜色区分分类,仍有大多数人会采取就近投放,致使垃圾均倾倒在最近的垃圾桶中,分类垃圾桶形同虚设。这也是居民的住宅小区中垃圾分类与不分类混在一起的重要原因之一。而我们推出的这个U型垃圾桶将传统的垃圾桶五合一,实现了人们投放到垃圾时五个分色桶距离均等,不用去寻找不同类别的垃圾桶在哪里,便于人们的投放,有助于落实政府鼓励的垃圾分类政策。

除此之外,造成现阶段生活垃圾混放的原因还有人们对不同垃圾归类的认知混淆。像是塑料、灯泡这类东西很多人不知道该把它们归入哪一类。因而造成垃圾的错放、混放,降低了垃圾分类的效率。而我们提出的五色五类分类法则是以垃圾组成成分来分类的。居民不用去考虑一些材质的东西到底是可回收还是不可回收的了。这种分类方法帮居民规避了扔垃圾时遇到的一些麻烦,也能够让居民在家中更好地对垃圾直接归类,便于丢弃,在一定程度上有利于提高居民参与垃圾分类的积极性。总的来说,我们团队的五色五类分类法能帮助政府在天津市更好地落实城市居民的垃圾分类政策。