编号规则范文

时间:2023-04-05 17:58:14

导语:如何才能写好一篇编号规则,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

编号规则

篇1

毕业证编号是学校按照教育部制定的编码规则编制的,共有18位,排列有一定规律:

前5位是学校的编号,第6位是教育类型,第7到第10位是毕业年份,第11、12位是教育层次,最后6位是流水号。

每年在学生毕业前2到3个月,学校会把毕业学生的名单送交相关部门,每个毕业生会得到毕业证书和相应的证书编号。 一般编号都是18位,前五位为学校编号,这个是教育部制定好的。第六位是办学层次代码,1表示本科,2表示专科,3表示研究生。

(来源:文章屋网 )

篇2

第二条 货币市场基金在编制基金收益公告、临时报告、定期报告等信息披露文件时,除遵循中国证券监督管理委员会(以下简称中国证监会)信息披露的一般规定外,还应遵循本规则的要求。

第三条 货币市场基金收益公告的内容包括但不限于:每万份基金净收益和7日年化收益率。披露7日年化收益率时,应标注基金收益分配是按日结转份额还是按月结转份额。

货币市场基金的基金合同生效后,基金管理人应于开始办理基金份额申购或者赎回当日,在中国证监会指定的全国性报刊(以下简称指定报刊)和基金管理人网站上披露截止前一日的基金资产净值、基金合同生效至前一日期间的每万份基金净收益、前一日的7日年化收益率。

货币市场基金应至少于每个开放日的次日在指定报刊和管理人网站上披露开放日每万份基金净收益和7日年化收益率。若遇法定节假日,应于节假日结束后第二个自然日,披露节假日期间的每万份基金净收益、节假日最后一日的7日年化收益率,以及节假日后首个开放日的每万份基金净收益和7日年化收益率。

日每万份基金净收益=当日基金净收益/当日基金份额总额×10000;

期间每万份基金净收益= ×10000;其中,r1为期间首日基金净收益,S1为期间首日基金份额总额,rw为第w日基金净收益,Sw为第w日基金份额总额,rn为期间最后一日基金净收益,Sn为期间最后一日基金份额总额。

按日结转份额的7日年化收益率={ -1}×100%;按月结转份额的7日年化收益率=[( )×365/10000]×100%;其中,Ri为最近第i个自然日(包括计算当日)的每万份基金净收益。

除基金合同另有规定外,每万份基金净收益应保留至小数点后第4位,7日年化收益率保留至小数点后第3位。

第四条当“影子定价”与“摊余成本法”确定的基金资产净值的偏离度的绝对值达到或者超过0.5%时,基金管理人应当在事件发生之日起两日内就此事项进行临时报告,至少披露发生日期、偏离度、原因及处理方法,并参照如下内容和格式在基金年度报告和半年度报告的重大事件揭示中进行披露:

项 目 发生日期 偏离度 披露报刊 披露日期 报告期内偏离度的绝对值在%(含)以上

本条款中,“摊余成本法”、“影子定价”及“偏离度”的涵义参见《关于货币市场基金投资等相关问题的通知》。

第五条在基金年度报告、半年度报告中,货币市场基金至少应披露以下财务指标和数据:本期净收益、期末基金资产净值、期末基金份额净值、本期净值收益率、累计净值收益率。在披露本期净值收益率和累计净值收益率时,应标注基金收益分配是按日结转份额还是按月结转份额。在基金季度报告中,至少应披露基金本期净收益、期末基金资产净值等财务指标和数据。

按日结转份额的本期(或累计)净值收益率={[ ]-1}×100%;其中,R1为期初(或基金合同生效日)的每万份基金净收益,Ri为日每万份基金净收益,Rn为报告期末的每万份基金净收益。

按月结转份额的本期(或累计)净值收益率={[ ]-1}×100%;其中,R1为报告期起始至首次转份额期间(或基金合同生效后首月)的每万份基金净收益,Rm为第m-1次转份额至第m次转份额期间的每万份基金净收益,Rl为报告期最后一次转份额至期末的每万份基金净收益。

其他有关指标的计算应参照《证券投资基金信息披露编报规则第1号》。

第六条 货币市场基金的净值表现应参照以下格式披露:

(一)历史各时间段收益率与同期业绩比较基准收益率比较

阶段 基金净值收益率

① 基金净值收益率标准差② 比较基准收益率

③ 比较基准收益率标准差④ ①-③ ②-④

过去×个月

过去×年

自基金合同生效起至今

基金净值收益率的计算参照本规则第五条。上述指标均以百分数形式表示,并保留至小数点后第4位。

(二)自基金合同生效以来基金累计净值收益率与业绩比较基准收益率历史走势对比

基金累计净值收益率的计算参照本规则第五条。

第七条 货币市场基金的投资组合报告应参照以下内容和格式披露:

(一)报告期末基金资产组合

资产组合 金额(元) 占基金总资产的比例(%)

债券投资

买入返售证券

其中:买断式回购的买入返售证券

银行存款和清算备付金合计

其他资产

合计

(二)报告期债券回购融资情况

序号 项 目 金额(元) 占基金资产净值的比例(%)

报告期内债券回购融资余额

其中:买断式回购融资

报告期末债券回购融资余额

其中:买断式回购融资

上表中,报告期内债券回购融资余额应取报告期内每日融资余额的合计数,报告期内债券回购融资余额占基金资产净值比例应取报告期内每日融资余额占基金资产净值比例的简均值。

若报告期内货币市场基金债券正回购的资金余额超过基金资产净值的20%,还应作如下说明:

序号 发生日期 融资余额占基金资产净值的比例(%) 原因 调整期

(三)基金投资组合平均剩余期限

1、投资组合平均剩余期限基本情况

项 目 天 数

报告期末投资组合平均剩余期限

报告期内投资组合平均剩余期限最高值

报告期内投资组合平均剩余期限最低值

投资组合的平均剩余期限应保留至整数位,小数点后四舍五入,其计算公式参照《关于货币市场基金投资等相关问题的通知》。

若报告期内投资组合平均剩余期限违规超过180天,还应作如下说明:

序号 发生日期 平均剩余期限(天) 原因 调整期

2、期末投资组合平均剩余期限分布比例

序号 平均剩余期限 各期限资产占基金资产净值的比例(%) 各期限负债占基金资产净值的比例(%)

1 30天以内

2 30天(含)—60天

3 60天(含)—90天

4 90天(含)—180天

5 180天(含)—397天(含)

合 计

若报告期末货币市场基金持有剩余期限小于397天但剩余存续期超过397天的浮动利率债券,还应参照以下格式在上表相应栏目下标注:

序号 平均剩余期限 各期限资产占基金资产净值的比例(%) 各期限负债占基金资产净值的比例(%)

××天以内

其中:剩余存续期超过397天的浮动利率债

剩余存续期的涵义参见《关于货币市场基金投资等相关问题的通知》。

(四)报告期末债券投资组合

1、按债券品种分类的债券投资组合

序号 债券品种 成本(元) 占基金资产净值的比例(%)

1 国家债券

金融债券

其中:政策性金融债

3 央行票据

4 企业债券

5 其他

合 计

剩余存续期超过397天

的浮动利率债券

上表中,附息债券的成本包括债券面值和折溢价,贴现式债券的成本包括债券投资成本和内在应收利息。

2、基金投资前十名债券明细

序号 债券

名称 债券数量(张) 成本

元 占基金资产净值的比例

自有投资 买断式回购

1

2

3

4

5

6

7

8

9

10

上表中,“债券数量”中的“自有投资”和“买断式回购”指自有的债券投资和通过债券买断式回购业务买入的债券卖出后的余额。

(五)“影子定价”与“摊余成本法”确定的基金资产净值的偏离

项 目 偏离情况

报告期内偏离度的绝对值

在0.25%(含)-0.5%间的次数

报告期内偏离度的最高值

报告期内偏离度的最低值

报告期内每个工作日偏离度的绝对值

的简均值

(六)投资组合报告附注

1、基金计价方法说明。

2、若本报告期内货币市场基金持有剩余期限小于397天但剩余存续期超过397天的浮动利率债券,应声明本报告期内是否存在该类浮动利率债券的摊余成本超过当日基金资产净值的20%的情况。

3、本报告期内需说明的证券投资决策程序。

4、其他资产的构成

序号 其他资产 金额(元)

1 交易保证金

2 应收证券清算款

3 应收利息

4 应收申购款

5 其他应收款

6 待摊费用

7 其他

篇3

一、真题再现

二、答题情况分析

评卷中发现学生关于有机物命名的答题情况很不乐观,得分率极低。主要的问题归纳如下:

1.主链选取不正确;

2.不能正确表示取代基的位置;

3.命名表达不规范;

4.书写错别字,如“炔”写成“缺”、“戊”写成“戍”或“戌”等。

三、考点复习

中学化学教材的有机化学板块中,仅仅介绍了简单脂肪烷烃的系统命名规则,而烯烃、炔烃、芳香烃和衍生物则只是介绍了个别物质的名称,没有对类别中的物质进行明确的命名规则介绍,使得考生在如上的考查中颇感困难。为了让学生更科学地备考,掌握其他类别有机物的命名规则,可以在脂肪烷烃的命名规则基础上进行必要延伸,提升学生学习能力,也为学生对有机化合物问题的探究学习奠定必要的基础。

1.脂肪烷烃的一般命名规则

如:

(1)选主链:选择最长的、支链最多的碳链为主链,以此为母体,按主链碳原子总数称“某烷”。该链烃中,最长碳链中有9个碳原子,故主链为“壬烷”。

(2)编号:从近支链的一端开始编号,用阿拉伯数字标出主链上碳原子的编号。若有多个支链,则遵从“最近、最简、最小”原则。

(3)写名称:支链名称写在烷烃名称之前,支链名称前加支链所连接主链上碳原子的编号,编号与文字之间加短横线“-”分隔。

(4)相同的烷基合并,并在支链名称前加二、三、四等数字表示相同烷基的数目。位置编号之间用逗号“,”分隔。

(5)不同的支链烷基,中学阶段只要求按支链碳原子数由小到大的顺序排列。

综合上述规则,该有机物命名为:

掌握了脂肪烷烃的命名规则,对于其他类别的简单有机物命名,只需追加额外的规则即可完成。

2.烯烃、炔烃命名的额外规则

(1)主链必须包含双键或三键;

(2)主链编号时,必须使双键或三键的碳原子位置最小;

(3)命名时要单独标明官能团碳原子的编号。

如:

3.含苯环有机物的命名规则

(1)将苯环作为母体,苯环侧链的烷基作为取代基,类似烷烃命名,可以对苯环的碳原子进行编号,称“某苯”。如:

(2)若苯环侧链上有双键、三键或其他官能团,则将侧链作为母体,苯环当作取代基,称“苯某某”。如:

4.卤代烃的命名规则

(1)以含有链接卤素原子的最长碳链作为母体,卤原子作为取代基;

(2)以使卤原子支链位置最小的碳主链一端开始编号;

(2)如有烷烃取代基,书写时将其写在卤原子的前面。

如:

目前我国现用的多种版本有机化学教材中,都没有统一且细化的卤代烃命名规则,因此中学化学在卤代烃的命名上并不作明确的要求。在考查时,上述的(3)中也可以将卤基写在前面。如2009年卷中的30题(2)问将“”命名为“2-甲基-1-氯丙烷”,而人教大纲版的现行教材《高二化学》(选修加必修)第147页却将“”命名为“2-氯-2-甲基丙烷”。

5.醇类的命名

(1)主链:选含链接-OH碳原子的最长碳链为主链;

(2)编号:从离-OH近的一端开始。如:

6.醛、羧酸类的命名

醛和羧酸类从分子结构上看都是由烃基与分子端头含不饱和碳的官能团构成,因此这两类衍生物的命名规则大体相同。

(1)主链:以含有官能团的最长碳链为主链;

(2)编号:以端头官能团碳原子为1号。

如:

7.酯的命名

酯类的命名是根据酯水解得到相应的羧酸和醇来命名的,称“某酸某酯”。如:

甲酸丙酯苯甲酸乙酯

对于脂肪烷烃以外有机物命名的考查,不少中学化学教师认为属于超纲内容。如果单纯从教材的教学安排和要求来看,以上年份试题所考查的有机物命名确实超出了课程教学内容,但是结合考试说明中关于“源于教材而不拘泥于教材”“在考查化学知识和技能的同时,着重对考生运用知识和技能、分析和解决问题的能力进行考查”的理解,命题中出现上述稍微高于课程要求的内容也不为过。如果备考复习过程中,在学生能够较好地掌握脂肪烷烃命名的基础上,适当地提升要求,主动归纳分析其他类别有机物的命名特点,学生就能够很好地掌握考查的新热点,而且对学生进一步认识有机化学的结构、性质也有着重大的意义。

参考文献

[1]罗焕林等.2013年高考广西理科综合(化学卷)抽样调查报告.

[2]罗焕林等.2010年高考广西理科综合(化学卷)质量分析.

[3]邢其毅,裴伟伟,徐瑞秋等.基础有机化学(第3版)[M].北京:高等教育出版社,2005.

[4]许胜,任玉杰.卤代烃的系统命名问题辨析[J].化工高等教育,2009(3).

篇4

规范商厦制度运行流程,完善制度管理体系

2适用范围

适用于本商厦所有与制度有关的管理流程和工作人员

3职责

3.1总经理:

3.1.1掌控商厦管理制度体系的工作导向;

3.1.2批准颁布各项管理制度。

3.2各部门:

3.2.1根据需求和规定编制管理制度;

3.2.2确保管理制度的适宜性、有效性和可操作性;

3.2.3确保员工学习、理解并执行管理制度要求。

3.3制度管理部:

3.3.1拟制商厦管理制度规划;

3.3.2组织管理制度的编写和评审工作;

3.3.3提交管理制度运行状况评估报告;

3.3.4统筹管理商厦制度文本工作。

4参考文件

4.1管理制度编号规则

4.2管理制度目录一览

5定义

5.1管理制度:指因商厦经营管理需要,由各部门编制,总经理批准的,要求员工执行和约束员工行为的商厦管理规则文本。本商厦的管理制度包括:

5.1.1工作职责[部门职责和岗位职责];

5.1.2作业指导书;

5.1.3管理规则;

5.1.4工作流程;

5.1.5其他文件。

5.2工作职责:部门或工作岗位应履行的基本工作责任。

5.3作业指导书:说明完成工作职责应采取的操作手段和具体措施的文件。

5.4管理规则:商厦经营管理方面所要求遵照执行的一般规则。

5.5工作流程:图示某项工作任务的内容和步骤的说明文件。

5.6其他员工须知文件:员工应了解的其他商厦管理文件,如:须知、手册。

6内容

6.1制度管理原则

6.1.1制度的形成应符合国家法律、法规要求;符合社会公认的道德规范要求。

6.1.2凡商厦员工均应遵守各项管理制度;依据制度要求开展工作。

6.1.3管理人员负有培训、指引和监督员工依据制度开展工作的责任,应确保员工遵守管理制度,按要求开展工作。

6.1.4各部门经理负责本职能范围内制度的管理工作,包括:编制、传播、执行和检查等。

6.1.5商厦制度条款最终解释权属于制度管理部。

6.2制度需求

6.2.1有下列要求时,产生制度需求:

6.2.1.1商厦经营管理工作产生新的要求;

6.2.1.2商厦运营状况出现问题,需采取管理措施;

6.2.1.3管理层提出的经营管理要求;

6.2.1.4员工提出的合理建议。

6.2.2形成管理制度需求后,制度管理部评估并形成制度编写计划,说明:

6.2.2.1制度的必要性和紧迫程度;

6.2.2.2制度的具体内容和形式;

6.2.2.3制度的编写责任、审核责任和相关事项;

6.2.2.4与其他管理制度兼容和配套的状况。

6.2.3管理制度编写计划的内容包括:管理制度名称、类型、目的、基本要求、编制时间、管理对象、编制责任、审核责任与时间、审批人、预计时间。

6.3制度编写

6.3.1责任部门根据制度编写计划编写制度,部门经理应注意确认下列事项,以确保管理制度编写的质量:

6.3.1.1制度编写人或小组的业务能力和经验资格;

6.3.1.2制度编写的文本质量;

6.3.1.3制度编写的时效性;

6.3.1.4制度编写内容涉及其他部门时,与其沟通协调,达成统一认识;

6.3.2编写完成的管理制度初稿应部门经理审核,必要时进行修改。具有跨部门管理内容的,还应经其他部门审核和修订。

6.3.3制度管理部对制度初稿进行校核工作,内容包括:

6.3.3.1评估与现有管理制度的相容和支持程度;

6.3.3.2制度格式,如:编号、排版、属性等是否符合规定要求;

6.3.4管理制度经校核后,形成定稿。交由律师评估制度法律风险,提出相应的修订意见。最后报总经理批准。由制度管理部予以。

6.4制度的与管理

6.4.1获得批准的管理制度,由制度管理部[制度令],制度以[制度令]的附件形式。

6.4.2制度公文部登记保管制度审批原件文本;复印、分发和登记制度文本,确保制度知会范围内的有效传播与送达。

6.4.3制度由编写部门在规定的时间内形成培训教案和培训计划,移交培训部门,落实制度的培训和解释工作。

6.4.4具有特定要求或重要意义的制度,制度管理部应组织必要的会议或宣传活动,用于对制度的专项培训和定向推广。

6.4.5禁止将商厦管理制度文本以任何形式向商厦外部传播。发放的制度文件应加盖控制标志,专人管控。制度文本应保持整洁、齐全,不能修改、涂污、损坏、丢失。

6.5制度执行、检查与反馈

6.5.1商厦各级管理人员在获得制度信息后,应尽快熟悉制度要求,按培训部门要求进行对应管理对象的培训工作。新进员工应在入职日起半个月内,应掌握商厦管理制度。

6.5.2商厦员工依据制度要求履行工作职责,开展工作。各级管理人员确保员工理解、掌握文件要求,对其进行定期培训和考核活动,监督和检查员工在工作中是否按照管理制度的有关规定进行工作。

6.5.3员工在执行制度过程中发生的任何疑问,可向部门经理征询或寻求帮助;员工有义务对制度的有效应用提出建议和意见,但不得影响其贯彻与执行现行制度。

6.5.4制度管理部定期检查各部门、员工的制度执行情况;调查制度执行中形成的问题,形式包括:

6.5.4.1组织制度执行评审;

6.5.4.2组织制度基本内容的问卷笔试;

6.5.4.3电话抽样调查。

6.5.5制度执行状况的检查结果,和有关制度改进的建议,由制度管理部集中汇总,形成商厦制度执行情况报告,呈报商厦管理层。

6.6制度的修订、增加和废止

6.6.1制度修订、增加和废止条件:

6.6.1.1制度经执行和反馈,存在问题需进行局部修改的,应进行制度修订;

6.6.1.2根据工作反馈,存在无制度管理工作状况的,应新增制度;

6.6.1.3制度有较大问题需进行大范围修改或完全不能适用于工作的,应废止制度,重新拟制。

6.6.2制度修订、增加和废止管理

6.6.2.1管理制度修订和增加由制度管理部指定部门负责制度编写,制度管理部负责校核文本格式;制度废止要求由该制度的编写部门提出,修订、增加和废止管理制度均需经总经理批准。

6.6.2.2属于修订制度的,原制度名称和编号不变,更换版本编号,新修订的管理制度;属于增加制度的,形成新的制度名称、编号和版本编号,予以;废止管理制度的,取消原制度。

6.6.2.3管理制度的修订、增加和废止均由制度公文部[制度令],说明制度变更原因。

6.6.2.4制度管理部应确保适用管理制度的唯一版本,及时更换修订或回收废止的旧版本制度,防止误用。

6.6.2.5制度修订和增加时,各部门应注意及时更新信息,组织培训,确保商厦员工对新制度理解的有效性和及时性要求。

7附录

7.1制度编号规则

7.2制度目录一览

7.3制度编制流程

7.4制度审批表

7.5制度令

附录7.1制度编号规则

制度编号规则

1.制度编号样式为:OO-X-OOO

2.释义:[自左向右]:

2.1“OO”为职能识别标记;

2.2“X”为制度类型识别标记;

2.3“OOO”为制度生成自然流水编号。

3.职能识别标记规则为:策划部“CH”;营运部“YY”;采购部“CG”;防损部“FS”;工程部“GC”;财务部“CW”;信息部“XX”;人事部“RS”;行政部“XZ”;

4.制度类型识别标记规则为:部门职责“A”;岗位职责“B”;作业指导书“C”;管理规则“D”;工作流程“E”;其他文件“F”;

5.形成新制度时,应配备制度编号;一个制度只有一个对应制度编号。

6.制度版本规则

6.1制度版本代码样式为:O.O

6.2制度修订后的,更改右边序列号,如原来为“1.0”版本的,修订后,为“1.1”版本;

6.3原制度废止,新制度的,更改左边序列号,如原制度为“1.0”版本的,新制度应用“2.0”版本。

篇5

关键词 地图;数据管理;编号规则

中图分类号G214 文献标识码A 文章编号 1674-6708(2014)121-0146-02

0 引言

随着社会发展和信息技术不断进步,各类地理信息更新换代不断加快,各式各样的地图产品融入人们的日常生活,如:导航地图、城市旅游图、行政区划地图以及各类专题图等。面对越来越多的各式地图,本文试图设计建立一套面向生产编制单位,将各种数字化地图数据集中进行系统管理的方案。

1 数字化地图现状分析

自80年代国内数字制图起步以来,经过30年的稳步发展,国内数字地图制图理论技术及各类软件系统已经具有了相当的基础和规模,慢慢趋于成熟。尤其是互联网的普及,通信和信息技术高速发展,数字化地图在生产、使用方面都呈现新的特点。

1.1需求现状

随着个人电子设备普及,尤其是移动终端产品网络化、智能化迅猛发展,人们对地图的需求发生新变化。以前厚重的纸质地图融入到了小巧的手机中,携带更加方便,同时网络化使地图使用成本进一步降低,各式各样地图充斥着网络,随时供人使用。这些都促使地图进一步融入人们日常生活。同时,地图制图理念也朝着面向对象和服务发展,地图种类样式和用途更加丰富,由此供与需之间形成一个良性互动,相互促进发展。例如,中国地图出版社出版的《地图见证辉煌-中国改革开放三十年》地图集,便首次利用地图的形式讲述了中国改革开放的成果,服务对象明确,并突破了传统地图集的使用范畴。

1.2生产现状

随着地图理论和技术日益成熟和完善,近几年,地图生产技术发展似乎遇到瓶颈。由于自动制图仍是一个难以攻破的课题,目前仍主要采用数字化采集和矢量地图符号化编绘的手段组织生产。在设备方面,个人计算机基本能够满足大部分生产要求,因此整体上地图生产工艺手段相对简单,对专业领域门槛要求较低。在生产工艺设备发展缓慢的同时,多数地图人把注意力转向了地图内容与样式的创新,地图生产由专业地图制图软件向综合图形图像处理软件发展,内容由单一地图要素向多学科知识融合表达过渡,因此呈现出制图手段多样化、比例尺非系列化、符号系统个性化、专题内容复杂化的趋势。例如《中国国家地理》杂志,其内一幅幅巧具匠心的精美地图插图,便是制图与图像处理技术巧妙结合的成果。

1.3存储管理现状

由于地图生产的变化,造成地图数据格式多样,数据之间联系性减弱,再利用率低的现状。通常地图数据主要包括过程生产数据和成果数据,过程生产数据因制图软件不同而各式各样,成果数据多为各类图形图片文件,如jpg、eps等,整体对存储手段和条件要求不高,因此较少生产单位对此类地图数据进行系统化管理。目前大多地图数据仍局限于简单复制、刻录备份的存储管理手段。

基于上述现状,面对大量复杂的地图数据,如何对这些数据进行有效管理是每个地图生产单位亟待解决的问题。

2 方案整体设计

整个方案主要分为三大部分:数据层、编号名称信息层和地图浏览窗口,如图1。数据层主要包括本地数据和外储数据信息两个部分,本地数据主要是完整存储于服务器的地图数据,包含数字化地图成果文件(图形、图片格式)、过程生产数据、元数据;外储数据则是指由于时效性和服务器存储量的限制,需要使用其他介质(如光盘、移动硬盘等)存储的部分地图数据,在数据层只保留了外储数据的位置信息(介质存放位置等信息)和元数据文件,以供使用者参考。编号名称信息层主要功能是通过系统的编号方式给每一幅入库数据赋予唯一码,并建立索引;通过编号查找定位数据位置。浏览窗口主要实现地图成果文件浏览,并提供元数据生成读取功能。

3 编号规则设计

地图数据编号是实施数据管理的有效手段,是整个方案连接数据层和浏览器的重要环节。根据每幅地图的特性,如坐标、比例尺、专题内容、生产日期等,进行编号使数据命名规则统一,实现管理系统化,从而便于地图在系统内部的调用索引。

目前常见编号规则主要是针对单一图种系列比例尺地图编号。如1992年国家标准局颁布的《国家基本比例尺地形图分幅和编号》(GB/T13989-92)国家标准,采用梯形分幅的8种国家基本比例尺地形图(1:100万、1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5千)均以1:100万地形图为基础,按规定的经差和纬差划分图幅。该编号规则是针对基本比例尺地形图,规范性和系统性较为苛刻,无法简单套用。现代地图分类复杂,很难将所有都纳入一个单一标准的编号体系,因此一幅地图的编号可能需要融合多个并行独立的标准,从而通过交集来增强编号的唯一性和包容性。例如在《电子地图数据管理系统的设计与实现》一文中提到的编号方法,见图2、图3。

在该方法中,共包括5个分类标准,但是可能由于单位业务领域和时间等问题,该编号规则难以满足综合性地图生产单位的需求,规则的包容性需要进一步提高。参考这种多标准并行的编号方法,结合地图发展趋势,本文按照数据获取时间、地图范围、比例尺、成果类型、数据类型、地图内容、流水号七种独立标准交集的方式确定地图编号,如图3、表2、3、4、5、6、7。每个标准内部划分应笼统概括,保证每幅图都可以在各标准中找到对应编号,然后将七个标准按照常用特性优先的原则进行排序。例如一幅2014年用mapgis生产的1:5000的西安市旅游地图的编号为20146Xa11B00,全国1:5万地形图中某一幅的编号为20143Yi21A01。考虑编号可扩展性,其中数据类型、地图内容等标准仍可进一步细化,流水号位数根据生产单位具体数据情况而定。同时因为整体编号规则具有一定的概括性,为方便用户使用,编号生成时采用菜单式赋值,并支持编号标准的模糊和缺省查询。

4其他主要功能设计

为了进一步理顺图幅关系,增强有效管理,还有以下三点功能需要重点建设和完善。

在每幅地图首次录入时,将会强制录入者填写元数据,主要包括图名、系统编号、生产日期、更新日期、参考资料使用情况、数学基础、生产软件、数据格式、特殊问题记载等内容,生成元数据文件,与地图数据一同保存,从而为数据使用者提供一个全面了解、记录地图状态的工具。

4.2数据管理

按照编号关系对数据进行路径管理,赋予常用的导出、复制、覆盖等功能。针对海量数据,通过编号、元数据信息、使用频率等信息对数据进行现势性分析,从而实现本地数据和外储数据的转换管理。

4.3地图浏览

针对地图成果文件,建立支持多种数据格式的地图浏览窗口,实现常用的放大、缩小、漫游等基础浏览功能。随着制图手段的不断发展,图形、图片文件往往分辨率较高,使用时占内存大、打开慢,因此在不断升级服务器硬件系统的同时如何优化各级算法,通过缓冲运算等技术,建立地图快照、预览等多种查看模式是系统建设过程中需要不断完善的问题。

5 结论

数字化地图数据管理是一项长期、复杂的工作,本方案在长期生产实践的基础上,意在解决地图生产单位在数据管理中遇到的一些实际问题,从而提高数据利用效率,实现生产单位对现有数据的集中系统化管控。

参考文献

[1]周全斌.地理制图数据管理系统的设计与实现[J].地理空间信息,2010,8(2):44-48.

[2]聂小波,何芸,范伟,汪剑云.电子地图瓦片数据管理系统的设计与实现[J]. 地理空间信息,2012,10(4):165-167.

[3]胡大国,夏先荣.电子地图数据管理系统的设计与实现[J].信息技术,2005(3):24-28.

篇6

图片自动对齐网格线 1、点击单元格后插入图片,这时图片就会左上角对齐2、若想再对齐右下角,则按住Alt键,然后用鼠标左键拖动调整图片大小。此时,就会发现图片会自动对齐旁边的网格线,一下子就吸附上去了。

单元格锁定图片,随单元格大小而变化 1、将图片对齐在单元格的网格线,可参考上面的“实用技巧一:图片自动对齐网格线”2、右击图片,选择“大小和属性”3、在“属性”下的对象位置,选择“大小和位置随单元格而变”4、设置后,移动行或列,图片都会随单元格大小而变化

快速输入编号 很多数据都有规则的编号,而如何利用设置单元格格式来快速搞定编号呢?1、选择单元格,右击,选择“设置单元格格式”2、在数字-自定义-类型,输入编号格式,如:"ABCDEFG-"0000003、此时,在单元格输入对应的数字,即可按编号规则填写对应的4、把格式复制到其它单元格中即可快速输入编号

(来源:文章屋网 )

篇7

关键词:余料管理 成本控制 钢料利用率

1 引言

当今船舶市场持续低迷,需求萎缩,竞争日趋激烈,形式不容乐观。目前我国的船舶造价在国际市场上并不具备优势,其主要原因是国内船企居高不下的造船成本。船企只有在保证船舶建造周期的前提下,最大化降低生产成本,获取更大的经济效益,才能提高造船竞争力,获取更多的新船订单。而在诸多控制成本的举措中,尤其是生产材料在总成本中占相当大比例的造船行业中,提高材料利用率是最直接也是最有效的办法之一。

余料再利用对船舶制造成本有着十分重要的意义,余料的成本定义关系到已占用零件的成本核算和余料再利用管理的价值,对制造业制造成本的精细化管理有密切关系,尤其是对以一定批量制造的企业,如何将余料纳入制造成本是目前亟待解决的课题。

2 建立余料管理体系

余料库存物流管理在船舶生产企业的整个供应链中起着至关重要的作用,如果不能保证正确的余料入库和余料库存以及余料发货,将会导致管理费用的增加和大量材料的浪费,最终是产品生产和质量难以得到很好保证,影响企业的竞争力。

在下料阶段产生余料的原因大致上有以下几种:①板材规格采购不合理,导致利用率无法达到最大化而产生余料。②套料人员由于对板材预算能力不足,导致板材排列不合理而产生余料。③板材套料过程无可避免的产生余料。为了避免造成大量的板材浪费,除了在设计阶段提高对板材规格的预估,提高套料人员成本意识和工作能力外,就是对生成的这些余料统一进行管理,建立余料管理体系,提高板材的利用率,避免钢材浪费,降低造船生产成本。

2.1 设计阶段余料管理

余料管理需从生产设计源头抓起,在生产设计阶段,即对余料进行统一编码归类并存档。我司使用东欣SPD设计软件进行生产设计,在船体套料方面,使用东欣建造系统进行套料,而建造系统套料模块余料管理功能并不齐全,无法满足我司余料管理生产需求。考虑公司现有的技术条件、环境背景及工作需求,开发了余料管理系统对余料进行统一的管理。

2.1.1 软件基本功能介绍

此余料管理系统利用Microsoft EXCEL的VBA编程语言+ACCESS数据库开发而成。

软件分四部分,分别为录入、查询、领用和后台控制管理。

在每个分段套料完成后,套料者即将所产生的余料录入余料管理系统存人数据库。余料管理系统按船号、来源(即母板编号)对余料进行自动编号。比如船号为HY2198,母板202-10A-01所产生的第一块余料编号系统自动编号为HY2110-202-10A-01R1,录入第二块时系统自动编号为HY2198-202-10A-01R2,避免人工输入错误。具体录入界面如图1所示。

在后续分段套料过程中,套料者优先搜索余料数据库,对符合规格要求的余料进行领取。查询可按船号、分段号、板材规格以及余料领用状态等进行筛选查询,提高查询准确率。具体查询界面如图2所示。

使用余料进行套料时,须在系统中进行领用登记后才可进行套料。具体领用界面如图3所示。其中余料编号可单击“选取…”进入如图4所示界面对数据库中已存在的未领取过的余料板进行选取。

后台控制管理版面中提供了密码修改,船号、用户、记录的添加删除修改等功能。并对后台控制管理设置权限,需持有用户名和密码才可进入进行修改。

2.1.2 不规则形状余料管理

数控切割机切割不规则形状余料板材的时候原点难以定位,板材摆放也不好放,因此在实际套料过程中,套料者应该有意识的使余料形成规则的长方形,避免梯形或者其他不规则形状余料。但如果确实难以避免,可以考虑将其分割成几块规则形状的余料分别进行保存。如果考虑套料利用率或者其他因素需保存不规则形状余料,本余料管理系统在余料信息录入时可以将不规则形状的余料按1:1绘制保存成DWG或DXF等CAD支持的格式保存进数据库中,在实际套料时调入套料系统中并在余料范围内进行套料。

2.1.3 不同部门领用的余料统计

针对部分由其他部门领用的余料,可通过定期收集领用的余料信息并录入余料库达到统一管理的目的,也可在公司的公共信息平台上通过建立项目工程共享余料管理软件和权限的设置达到实时录入的目的。

2.2 施工阶段余料管理

2.2.1 现场堆放管理

实际数控切割后产生的余料应现场予以标示登记并按级别和规格尺寸的不同将余料运至指定场所按一定的规则存放。超大板材运回材料堆放场所进行平躺放置,小型余料在保证安全的前提下按船号板厚尺寸规格等进行分类后竖直插放,并须在余料板侧边粘贴标签以便查找方便。余料管理员应将余料摆放位置实时更新至余料管理系统录入界面中的备注栏中以便查找调用。

2.2.2 余料使用反馈

施工部门在进行结构修改,制作胎架或者工装的时候应优先使用库存中存在的余料,但须首先征询设计部门的同意并及时的将领用的余料编码反馈给余料管理员,以便及时的更新余料系统中余料的状态。领取部门应在填写材料定额清单后方可领取。

2.2.3 先进设备提高余料切割定位精准度

由于余料形状多数呈不规则形状,现场切割时定位困难,切割效率低。针对此问题,我司引进先进设备,可针对任意放置在切割平台上的材料,采用CCD摄像机拍摄,借助KAP系统,高精度地认知材料的形状和尺寸,可在其轮廓内下料(即套料)并在极短时间内轻松地编制出NC数据。摄像机特性导致的图像扭曲可在KAP内自动修正,获得准确无误的形状数据,从而进行高精度的套料。

2.3 余料管理注意事项

2.3.1 优先使用余料避免库存量过大

我们建立余料库的目的,是为了合理地、尽量地、迅速地把产生的余料使用掉,从而达到提高材料利用率,提高经济效益的目标。所以,在余料使用这个环节就是关键,而且它涉及的部门也最多,如果各个需方怕麻烦,则出库量就会锐减,使得网上余料形同虚设,也使我们的初衷化为泡影。因此,无论是在设计阶段还是在施工阶段,需要使用板材进行套料时都应该尽可能的优先选择余料库中存在的符合使用要求的余料进行套料,避免余料库存量过大,否则不但不能提高材料利用率,反而会起到管理困难,增加人工管理成本的适得其反的作用。

2.3.2 谨慎定义余料入库

虽然通过余料管理能提高材料利用率,减少材料成本,但是如果余料库存过大,反而管理困难,增加入工管理成本。因此,在实际操作中,并不需要将所有规格尺寸的剩余板材都定义为余料,应在余料尺寸和材料利用率之间寻找一个平衡点,定义一个适合船厂的最小余料尺寸,废弃小于此尺寸的剩余板材,避免余料库存庞大,减小人工管理难度。

2.3.3 提高板材的一次利用率

篇8

【关键词】定量包装商品 净含量计量检验

前言

随着某厂生产的液压油销量激增,其商品外包装也受到厂家及消费者的广泛重视,因为其净含量准确与否直接关乎消费者的切身利益,也影响企业产品品牌。因此,本文期望通过对该桶装液压油净含量标注及实际净含量进行抽样检验,确保出厂产品实际含量与标注净含量相符的同时,也利于企业对该产品的市场推广,扩大销售渠道,增加企业利润。

1 抽样检验部分

1.1 技术规范

本次抽样检验严格按照《定量包装商品计量监督管理办法》以下简称《办法》和国家质量检验检疫总局的JJF 1070―2005《定量包装商品净含量计量检验规则》以下简称《规则》中对定量包装商品监督、检验的法律规定来执行的,以保证整个抽查检验过程的真实性、准确性以及可靠性。

1.2 方法概要

本方法主要是针对厂家在同一条件下生产的一定数量的(一般为一定时期内灌装的同批次油品)同种桶装液压油的抽查检验。抽查过程包括皮重称重、总重称重等相关原始数据的测量以及对原始数据的处理。

1.3 实验器具

抽样检验所使用的测量设备名称:METTLER TOLEDO;

型号规格:MS8001SE;

准确度等级:中 Ⅲ;

量程:Max=8200g;

最小分度值:d=0.1g。

1.4 实验条件及方法

接受计量检验的是在包装线上灌装的同一批次的同种定量包装商品,在此过程中,首先用自动封口机封好125只完好的待包装方桶,并逐一编号,使用称重测量设备对125只空桶皮重进行称重并记录,然后启动灌装。待方桶灌装喷码结束后,将方桶取下按编号进行称重,并在定量包装商品净含量计量检验原始记录中进行记录,便于后续对数据作处理分析。

2 实验过程及数据处理

该桶装液压油在其显著位置标注有净含量“×××L”的字样,因此按照《规则》要求其计量检验方法适用于附录D D.3密度法来进行抽检。计量检验步骤:(a)测定皮重:按附录B的规定检测样本皮重。(b)测定总重:逐个称量样本单位的总重。(c)检验密度:可直接使用化验分析监测中心提供的密度数据。

2.1 测定皮重

除去皮重方案的选定。根据 JJF 1070-2005规范定量包装商品净含量计量检验规则中附录B除去皮重的方法的相关要求。因本次所抽检的定量包装商品批量在100件以上,因此按照B.2方法1的要求需进行除去皮重方案的选定。本次皮重抽查检验选用的包装皮是未使用过的,按照等距抽样的原则进行。

按B.2.1 除去皮重方案的确定,首先我们计算皮重平均值()和皮重标准偏差(),由现场随机抽取15件待包装的皮,逐个称出皮的重量(数据参见4L空桶皮重原始记录),按照B.2.2.2给出的公式及要求进行计算。

平均皮重() =

皮重标准偏差() =

计算得出> ×10% 且>0.25T,由此可知,该液压油定量包装物除去皮重的方案应选择以样品各自的皮重,测定净含量,其中 =n。即抽取的样本量与抽取的皮重件数相等。根据《规则》表4计量检验抽样方案的要求,灌装一批次液压油需抽取样本量125桶,因此也需抽取未灌装的桶样125只,并需逐一称重记录皮重数据。

2.2 测定总重

依据前款所标注的皮重编号,对灌装完毕的桶装液压油进行总重称量,并记录数据。(详见定量包装商品净含量计量检验原始记录)

2.3 数据处理

按照《规则》的规定,以体积单位标注净含量商品的计量检验方法按照D.3密度法的要求进行抽样的过程中,先要对以重量为结果的计量形式进行单位换算,将重量单位换算为体积单位:即实际含量=(总重-皮重)M密度。本次抽检样本量是125件,且数据处理过程中需做多次重复计算,费时较多,计算量大且繁琐。因此本次抽检采用EXCEL来对数据进行处理,以简化计算步骤,提高工作效率。

首先,在由计算获取到实际含量以后,可求得样本平均实际含量,再由EXCEL对实际含量与标注净含量进行做差计算,得出每桶油品实际含量与标注净含量的偏差,即偏差=实际含量-标注净含量。

其次,在求得偏差后,依据样本实际含量标准偏差公式,求得实际含量标准偏差s。

第三,依据《规则》中表4的规定,本次抽样方案符合最后一栏检验批量大于3200桶,抽取的样本量125桶的情形,因此样本平均实际含量修正值=修正因子与样本实际含量标准差之积,修正因子==0.234。

通过以上步骤即可算出样本实际含量与标注净含量减去平均实际含量修正值的关系,若()或者类短缺的件数少于7,又或者没有出现类短缺,即表示该定量包装商品的净含量计量检验是合格的。

3 结论及建议

3.1 计量检验结论

根据对本次抽样检验的数据处理分析后发现,抽查的这125桶油品的实际含量都未达到大于或者等于标注净含量减去样本平均实际含量修正值的要求,因此依据《规则》第六章结果评定与报告的6.1评定准则的要求,本次抽检样品的检验结论是:该检验批净含量标注合格,净含量不合格。

3.2 建议

本次抽查检验样品的标注净含量实则为容器的容积,不是所装油品的实际净含量,而在灌装过程中需对容器留有一定的膨胀空间,避免油品过度膨胀而溢出,因此造成了实际净含量不满足标注净含量的情况。

根据抽查样品所得出的结论,提出以下几点建议。

(1)更改现有的标注净含量,由“L”改为“kg”;(2)将现有包装桶容积做适当调整,以满足灌装标注净含量为“×××L”的要求, 于此同时还需改定重量的灌装机为定容积的灌装机。

参考文献

篇9

关键词 主动数据库;EAC;触发器

中图分类号:TP311 文献标识码:A 文章编号:1671-7597(2013)15-0021-02

随着高校信息化的深入,越来越多的工作需要用计算机来完成,教务管理软件系统或类似的软件已被许多高校使用。一般来说,系统具备学生信息管理、学生成绩管理、学籍管理、学生选课管理等功能,能够满足教务管理的基本要求。但是因为承载数据量大,处理事务繁多,一些隐性的关键性问题却被忽视。基于主动数据库的高校教务管理系统采用EAC机制,SQL3触发器技术,在对信息进行整合的基础上,实现了各种主动服务功能,能够满足师生不同层次多方面的需求,为学校教务管理提供了有力的技术支持。

1 主动数据库及实现方法

主动数据库是相对于传统的数据库而言的。传统数据库系统只能被动的执行插入,删除,更新操作,而不会灵活地根据数据库的外部环境或内部状态等情况主动做些什么,而主动数据库系统是一种能根据各种事件的发生主动给用户提供相应服务的数据库系统。

1.1 主动数据库系统结构

主动数据库系统是在传统数据库系统基础上,添加一个由事件驱动的ECA(Event-Condition-Action)规则库和事件监视器来实现的,用以下形式来表示:

ADBS=DBS+EB+EM

DBS(Database System)等同于一般的传统数据库系统。

EB(Event Base)由事件驱动的规则库,存放当某一事件发生时,系统会执行的相应动作。

EM是一个随时监视EB中的事件是否已经发生的监视模块,一旦监视到某事件已经发生时就主动地触发系统,按照EB中指明的相应知识执行其中预先设定的动作。

1.2 主动数据库系统的实现

可通过三种途径:

1)在原有数据库系统上改造,在传统数据的基础上添加规则库和事件监视模块,使其构造为主动数据库系统。

2)把一般程序设计语言改造成一种主动的程序设计语言,然后按传统方法把数据库操作嵌入在其中执行。由主动程序设计语言将事件规则库分成块,分布在各个过程或对象中,主动程序作为人机接口。

3)从无到有构建主动数据库服务系统,不依赖于原先的数据库及程序。

第一种方法比较简单,可以充分利用现有的技术和资源,但效率较差;第二种方法除了在两种语言的接口部分可能损失一定的效率之外,运行效率较好;第三种方法是一种最彻底的方案,运行效率高,但是开发较为复杂,开发时间也需要较长。因此应根据具体情况对上述三种实现途径进行具体的选择。

2 基于主动数据服务的教务系统

2.1 目标

1)在管理学生、教师信息时,满足完整性约束条件,保证数据的一致性。即当一个学生不存在时,不会有他的成绩、奖惩等相关信息;当一个教师调整工作岗位后,他的相关信息也会调整。

2)在录入某位学生成绩时,会统计他的不及格的课程数,据此给出能否评优信息,并统计班级不及格人数;如果不及格人数大于规定值,会触动班主任服务事件,提醒根据班内成绩主动为学生服务,同时还会触发班主任考核事件。

2.2 基于主动数据库的教务管理系统模型

高校教务管理系统一般包括:学生信息管理、学生成绩管理、学籍管理、学生选课管理等模块,现以学生成绩管理模块为例,按照ECA主动服务的机制来设计,当录入学生成绩事件发生时,触发了学生成绩管理事件,进行成绩表的更新和并统计该生不及格的门数;当不及格门数大于规定阀值时,触发学生评优管理事件,进行班级评优表的更新并统计不及格人数,如一位学生不及格门数过多,将取消评优资格;当班内不及格人数大于规定阀值时,触发班主任服务事件,说明不及格不是个别现象,班主任需要分析学生学习情况,找出问题,主动服务于学生。同时触发班主任考核事件,依据学生情况,更新对该班主任的评价。

2.3 实现方式

使用规则库嵌入程序设计语言的途径来实现。通过程序设计语言来描述ECA规则,而不需另外的表来存储。具有主动功能的程序将传统数据封装起来,利用标准SQL中的触发器机制,使主动程序成为人机接口,从而实现主动数据库服务系统。这种途径减少了规则匹配时间,系统运行效率可以得到大大提高。

3 实例研究

3.1 基础数据

该模块涉及的基本数据如下:

S1---学生成绩表(学号,班号,课程号,成绩)――学号主键,班号外键

S2---成绩情况统计表(学号,不及格课程数)――学号

主键

S3---学生评优表(学号,是否具备评优资格)――学号

主键

S4---班级成绩统计表(班号,班主任编号,不及格人数)――班号主键,班主任编号外键

S5---班主任考核表(班主任编号,考核得分)――班主任编号主

3.2 实现步骤

1)录入学生成绩事件发生后,触发更新成绩情况统计表

行为。

CREATE TRIGGER INSET_S1 ON S1

FOR INSERT

AS

DECLARE @NUM INT,@SNO CHAR(10)

SELECT @SNO FROM INSERTED

SELECT @NUM=(SELECT COUNT(学号) FROM S1 WHERE 成绩

UPDATE S2 SET 不及格门数=@NUM

2)不及格门数>3事件发生时,触发更新班级评优表行为,并更新班级成绩统计表。

CREATE TRIGGER UPDATE_S2 ON S2

FOR UPDATE

AS

DECLARE @BJ CHAR(4)

SELECT @BJ=班号 FROM DELETED

――对不及格门数大于3的学生取消评优资格

UPDATE S3 SET 是否具备评优资格=0 WHERE 学号=

(SELECT 学号WHERE 不及格门数>3 FROM S2)

――更新学生所在班级的不及格人数

UPDATE S4 SET 不及格人数=(SELECT COUNT(DISTINCT 学号 FROM 学生成绩表 WHERE 成绩

4 结束语

分析了传统教务管理系统不能主动提供信息服务的不足,提出通过在程序中嵌入规则库的方式实现主动服务型的教务管理系统,实例证明该系统能主动为教师、学生提供实时,全方位的教务信息服务,该服务机制是高效的、可行的。

参考文献

[1]毕利.主动数据库的模型及实现途径[J].计算机工程,2000,26(9):102-103.

[2]汤庸,叶小平,汤娜,数据库理论及应用基础[M].北京:清华大学出版社,2004:113-125.

[3]李同英.主动机制数据库技术应用研究[J].微计算机信息,2006,22(36):214-216.

篇10

关键词:数据挖掘;关联规则;Apriori 算法;商务应用

中图分类号:TP311.13 文献标识码:A 文章编号:1009-3044(2013)14-3217-03

1 数据挖掘体系结构与关联规则

1.1 数据挖掘体系结构

数据挖掘(Data Mining)从定义上可以将其界定为从大量的、不完全的、有噪声的、模糊的、随机的数据中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的过程[1]。通过对数据挖掘的定义的分析可以看出,数据挖掘是一个高级的处理过程,其最终要达到的目的就是能够实现从数据集中识别出以模式来表示的知识。由此可以看出,数据挖掘作为一门学科,涉及的学科知识十分广发,最主要的是涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化等多个领域。借助数据挖掘这一工具和方法,其最终的分析结果和成果可以用在信息管理、过程控制、科学研究、决策支持等许多方面。一般来说,一个完整的数据挖掘过程由以下七个步骤组成:数据清理、数据集成、数据选择、数据变换、数据挖掘、模型评估和知识表示。

1.2 关联规则

关联规则的挖掘(ARM)是数据挖掘的一项重要的任务。关联规则挖掘最根本的目的就是能够快速有效地发现大量数据中项集之间有趣的关联或相关联系。其目的就是从事务数据库、关系数据库中发现项目集或属性之间的相关性、关联性以及因果性。随着数据挖掘相关研究的不断深入,许多研究学者更多地将研究的目光集中在了挖掘关联规则方面。从数据挖掘的本质特征来分析可以看出,关联规则更多地反映一个事件和其他事件之间依赖或关联的知识。通过关联规则的定义可以发现,如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。

2 一种基于矩阵的Apriori改进算法

挖掘关联规则的对象是含有大量事务的事务数据库,所以如何设计一个高效的算法,以提高挖掘的计算效率,降低数据库的扫描次数,是研究关联规则挖掘的重要课题。虽然现在对于挖掘算法Apriori 相关的改进和发展不断涌现,但是仍然有着自身的一些缺陷,最具有代表性的就是对数据库进行多次扫描而造成的精确度的降低,以及显著地存在由候选集C K 产生频繁集LK 等不足。正是由于这些缺陷的存在,本节提出一种基于矩阵的改进算法来产生频繁集L K ,这种算法只对数据库扫描一次,并且无需候选集C K ,即可得到频繁集L K 。

2.1 与算法相关的几个概念

3 Apriori算法在商务中的应用

3.1 问题提出

假如一家大型超市的管理人员想要知道每天超市的销售情况,顾客的购买模式,通过顾客特征,采取相应的货价摆放以增加顾客满意度和销售额。如果仅仅靠传统人工技术,从巨大的购买信息中找出相应的答案就像大海里捞针,非常困难。

本章利用数据挖掘技术针对这一问题进行研究。研究对象是顾客在一次购物的过程中,购买的不同商品之间联系,进而借助数据挖掘来进一步深入地分析顾客的购买习惯。在对不同商品种类和数量进行充分分析的基础上,进一步地分析出哪些商品最受顾客欢迎,从而购买频率很高,进而借助这种关联的发现可以帮助零售商制定营销策略。问题归结为分析当前销售情况,找出商品统计信息之间的关系。

3.2 数据来源

对于一个实际的数据挖掘应用来说,数据是进行数据挖掘的基础和根本,同时数据挖掘技术的应用对数据量也有一定的要求,只有这样数据挖掘才能有实际意义。数据的获取确实是这次研究数据挖掘面临的很大的问题。通过仔细的搜索和分析,我最终选择了Belgium 的一家的超市的销售数据。整个数据源是在三个非连续的时期收集的,在每一个间隔期,没有可获的数据。数据收集期跨时近5个月,总共收集到的数据记录有88163 条。在整个数据收集期间里,该超市总共出售了16470 种商品,共有5133 位顾客在该超市购买了至少一种商品。

但是与我们期望的数据还是有许多不同之处,数据表结构与我们需求的也存在很大的差别,这里可以采用等同和类比的方法,从而实现了对表结构的修改和数据的替换,这样以来就有效地实现了对大量的数据替换和表结构重组,解决了数据来源问题。

3.2.1 数据处理

由于数据仓库中各个主题中的数据是按照前端应用需求存放的,因此在数据应用前必然存在一个数据处理和转换的过程,这一过程需要对数据进行变形,使之适应前端应用需要。为了能够提高关联规则的效率,充分实现数据挖掘需要达到的既定目标,在进行数据挖掘之前,需要对交易数据库中的销售数据进行一定的预处理才能有效地应用数据挖掘技术和方法。这里采用超市销售表中的相关信息来进行数据挖掘,具体的每一条记录包括以下信息:

顾客编号 发票编号 购买日期 商品1 名称 商品1 总价 商品2 名称 商品2 总价 … 商品n 名称 商品n 总价 总计

通过分析可以发现,这种数据结构的特点是数据库的每一条记录能够对每一位顾客在一次进入商店进行购物的详细信息进行充分的记录,一次完整的交易记录通常由多种商品的名称和支付的价钱组成,这种数据结构提供的信息比较详细,但是不利于关联规则挖掘的。因为关联规则所描述的只是不同项目之间的关系,它只关注一次交易中有哪些商品被同时购买。我们不用去考虑顾客在一次交易中所购买物品的数量、价格等信息,每种商品 (也就是物品)都由一个二进制变量代替,而不管它是否在交易中被购买与否。由于我们挖掘的交易数据库中关联规则最根本要实现的目的是反映出各种物品之间的关联关系,因而,我们需要从综合数据库中取出当前主题需要的数据,将上述的交易记录的数据结构转换成如下结构形式:

顾客编号 发票编号 购买日期 商品1 名称 商品2 名称 … 商品n 名称

这样我们通过每一条的交易记录就能够清晰地看出每一名顾客在进入超市后的每一次购物情况,同时,经过变换也可以有效实现对数据的压缩和精简,一方面可以减少工作量,提升运算速度和效率,同时还能够有效筛除冗余信息,这样以来将会使算法搜索数据库的时间缩短,大大提高了Apriori 算法的效率。

3.2.2 数据转换

当对数据进行有效的压缩,并过滤了一些不需要的信息后,都会形成二维表形式的数据源模式。

但是这些数据都是描述业务事实的信息,在进行数据挖掘过程中,这些数据是不能直接拿来使用的,因此就需要把事实数据变换成算法能够识别的数据类型。一般来说,最常用的变换有两种:离散变换和值变换。

1)离散变换。离散变换的运算原理可以解释为通过将属性域划分为区间,减少连续属性值的个数,以区间的标号代替实际的数据值。概念分层就是其中常用的一种,在搜集会员数据的过程中,我们已经自然的进行了初步的概念分层。虽然绝大多数的商品都是用唯一的条形码标识予以区别,但是在超市中的某些商品分类比较细,而且种类繁多。这个时候如果按照每一条单独列出,就会比较繁琐,所以我们可以用某一种商品名称来代表一组商品,而不是某一单独的某一个商品。

2)值变换。在数据库中,由于许多属性值都是字符型数据,这样产生的最不利的影响会对数据的挖掘和统计分析造成不良的结果,我们采用值变换可以将字符型数值映射成为数值型数据。例如:

4 总结

该文回顾了数据挖掘及关联规则中的相关概念,并着重研究了一个关联规则的 Apriori 的算法实现,针对Apriori 算法存在的对数据库进行多次扫描,精确度不高,由候选集C K 产生频繁集L K 等的问题,提出了一种改进的算法,它解决了一些原有Apriori 算法可能遇到的一些难题。

参考文献:

[1] Agrawal R, Imielinski T, Swami A.Mining association rules between sets of items in large databases[C]. Proceedings of the ACM SIGMOD Conference on Management of data,1993:207-216,.

[2] Jiawei Han,Sonny H S. Chee,Jenny Y Chiang.Issues for On-Line Analytical Mining of Data Warehouses[C].

[3] Information Discovery,Inc.OLAP and Data Mining,Bridging the Gap[C].

[4] Park J S, Chen M S, Yu P S.An effective hash-based algorithm for mining association rules[C].Proceedings of ACM SIGMOD International Conference on Management of Data, 1995:175-186.

[5] 朱明.数据挖掘[M].合肥:中国科学技术大学出版社, 2002:100-128.

[6] 朱扬勇.数据挖掘入门[EB/OL].http://.