网站权重快速提升范文

时间:2023-03-29 15:02:18

导语:如何才能写好一篇网站权重快速提升,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

网站权重快速提升

篇1

在我们做SEO的时候,一直有一个问题围绕着我们,并且给我们站长带来了很多麻烦,而且这个问题不解决我们也很难做上排名,说到这里大家有没有想到这个问题是什么?当然我相信大家都知道,就是网站权重,现在有很多站长在优化网站时面对的困难不是外链被删帖,也是不站内文章不被收录,而是网站的权重提不上去,所以说做SEO时,我们最先关注的问题就是网站的权重性,而且有很多新手朋友做SEO时,可能对网站的权重概念比较模糊,所以也不怎么注重网站权重,所以说很多新手做SEO排名总是会碰到很多问题,其实说句实话,如果你的网站在搜索引擎有了权重,那么不管怎么样搜索引擎也会收录你的文章和站外信息的,希望新手朋友可以从现在开始注重权重,当然我也会跟大家分享一些我提高网站权重的方法和经验,也可以帮助熟手朋友们做一些做网站权重方法的总结,好了下面我先跟大家介绍一下网站权重的概念。

一、网站权重是什么?

有的朋友听到网站权重都不知道是什么意思,尤其是新手朋友根本就没有听过网站权重,所以在我们分享SEO提升权重的方法之前,我们要跟大家说一下什么是SEO权重,首先大家听到权重这词会联想到什么?是网站的信息内容多?还是网站的结构好?其实这些都是提高网站权重的一些方法,但是只有这些方法是不够的,说白了网站和搜索引擎就像合作关系一样,首先搜索引擎服务器那边会有一个网站信誉值,这个信誉值是搜索引擎都会给每一个网站做的评价,分数高的一半权重就高,分数低的就证明你的权重就低,而且大家不要误解,我说的信誉值不是说网站的PR值,PR值只是来计算网站时间的长短,而不是代表网站权重,所以我们要把它们分开来,而且刚才我说了信誉值,所以大家可以把网站权重想象为搜索引擎对网站的相信度,比如我的zsgacctv()这个站虽然是新站,但权重还不错。相信度越高的,收录的信息就会越多,如果相信度低的收录就不会高,所以这一点大家要记住,大家可以想象一下,如果你是新网站,搜索引擎还不了解你的网站是否安全,是否值得信任,所以不会马上的去收录你的文章信息,就算收录也会隐藏,所以一般都需要1-2星期让搜索引擎熟悉你的网站,如果你的网站时间比较长,而且没有被搜索引擎处罚拉入黑名单,那么权重自然而然的就会高起来,收录也会好起来,如果说你的网站已经被搜索引擎拉入黑名单,那么就证明搜索引擎再也不会相信你的网站,所以网站权重就会很低,再次收录已经成网站的奢望,何况是网站排名呢?

二、如何快速增长网站权重

刚才介绍了网站权重的一些概念性东西,大家是否感觉到网站的权重是多么的重要,它是直观影响我们网站排名好坏的重要因素,希望大家看了我上面写的概念,开始注重网站的权重,而且刚才我说了网站权重那么重要,可能有的朋友已经发现了自己网站有这个问题,但是不知道如何提高网站的权重性,当然本人会分享一些提高网站权重的一些方法,希望我的方法和经验可以帮助到各位,解决SEO上的难题:

1、用SEO次导航提升权重

有的朋友会问?什么事SEO次导航,加上这个东西有什么好处?其实很简单,SEO次导航就是为了防止正题网站的权重分散到内页当众,当权重分散了,那么我们就无法管理我们的网站上排名的页面了,如果网站权重分散,在网站内的页面都有可能上排名,所以为了避免这个问题,我们要加上SEO次导航,所以如果你的网站还没加上SEO次导航就马上行动起来,添加到每一个页面的地步吧!SEO次导航添加的样式是这样的,首先我们要把我们要做的关键词嵌入到网站的地步,并且每一个关键词分隔开,并且每一个关键词加入超链接到首页,这样就可以了,是不是很简单,而且每一个页面都要出现。

2、文章内锚提升权重

其实在我们做SEO工作时,我们更新的文章有很多,而且有很多的朋友习惯是把文章内大量的嵌入关键词,然后每一个关键词加入超链接到首页,并且加粗,感觉这样的方法最好,其实如果说以前的搜索引擎你这么做是很好,但是现在搜索引擎有了更改,在这么做的好,有可能被降权,所以更新文章的正确方法是,首先文章内嵌入关键词,整篇文章的百分之8左右出现一次关键词,第一个出现的关键词加粗加超链接到手,在往后的关键词只要加粗就可以了,其他什么都不用做,所以我们这样是最好的,而且每天可以更新4-6篇文章,网站的权重增长也会很快。

3、软文投稿提高权重

大家都知道软文是一种高权的SEO方法,我们可以利用软很多事情,比如做拉快照,吸引蜘蛛收录没有收录的页面等,所以大家都知道软文的好处是非常大的,那么大家是否知道软文也是可以提高网站权重的呢?软文本身就是有很高的权重,如果在文章内出现你的地址,那么也会随之影响你的网站权重,所以大家要记住哦,并且写软文的时候首先我们要记住,软文标题要吸引人,软文内容要原创,软文不要太广告化,软文内可以不加关键词和超链接,软文最后出现一次关键词和超链接即可,软文写好后要投入权重高的相关行业的原创网站上去,这样才会直接影响你网站的权重。

4、博客外链提升权重

其实博客的作用和软文的作用差不多,博客本身也是有一定的权重,所以我们可以做博客,并且博客提高权重的速度是很快的,所以本人建议大家多多做博客,而且做博客之前我们要培养博客1-2个星期时间左右,所以大家对博客要有耐心。

篇2

(1)关键字集体下滑,一般掉到十页以后或者直接前二十页找不到;

(2)通过domain指令查反链首页不在第一位。尽管很多人对这个指令存在很多不同意见,但是枫泠觉得,通过此指令还是可以作为网站降权与否的一个参考。当出现以上两种情况时,则网站处于降权状态。

网站降权的原因很多,通常有:(1)服务器不稳定;(2)友情链接出现问题;(3)文章内容原创性太低;(4)网站标签修改,尤其是标题;(5)网站改版;(6)关键词堆砌等任何作弊行为。

当网站出现降权问题时,网站快照则表现停滞现象,那么需要我们对以上各种导致降权的原因进行逐一分析排除,找到引起网站降权的原因。很多站长会这样说,为什么网站在前期没有被降权,后期并未出现任何不当操作,而却导致降权了呢?其实原因很简单,早期网站在搜索引擎中的关注度并不高,此时,搜索引擎会忽略到网站惩罚,而当网站处于首页,关注度会提升,从而对网站考察也会更加严格,因此,一旦发现网站存在作弊立马被惩罚。

找到了网站降权的原因之后,开始着手解决问题,问题解决之后,网站开始进入恢复状态,恢复状态下,我们需要做好以下工作:

1、原创更新网站内容。原创是一个网站的灵魂,原创的主要目的,是重新让搜索引擎开始关注到网站,让停滞的收录增长上去,让停滞的快照重新跟近。文章要注重质量,前期不需要增加太多内容,内容增加按照一定幅度梯度进行。

2、高质量的外链。所谓高质量的外链,主要强调两点:(1)稳定性;(2)相关性。想要满足以上两点,可以选择软文外链,不论是纯文本链接还是锚文本链接,都可以收到很好的效果。外链一定要保证在网站内容更新后,开始进行,这样以保证每天更新的内容能够最快被收录,从而养成每天蜘蛛来爬去网站信息的好习惯。

网站做好以上工作,那么网站恢复将逐步进行,实际网站恢复表现主要分以下几步:

1、网站原创内容开始收录

原创内容的收录分为两种:(1)审核后收录。所谓审核后收录,表现为收录增加显示是在百度每周进行的更新之后释放出来;(2)当天收录。实际收录显示为当天日期,其中包含内容的秒收。通常当网站收录表现为第二种的情况下,则表明网站降权开始进入恢复状态。

2、domain指令,首页恢复第一

此指令是网站降权恢复最直观的表现,网站降权后,此指令显示的首页结果,有的是直接首页在收录结果中找不到,还有的是结果在第二页或者首页后五位,还有的在更远位置。对于此指令的恢复会出现两种情况:(1)指令首页结果分阶段恢复。所谓分阶段,指的是首页位置随着时间的推移,逐步向第一位靠近;(2)指令首页结果越级恢复。所谓越级,指的是首页位置会从第二页或者第二页以后其它位置,直接跳到首页。至于网站究竟该采取何种恢复状态,根据网站在惩罚之前权重高低如何,原始权重越高,恢复则越快。

3、长尾关键词开始出现排名恢复

之所以长尾关键词首页出现排名恢复,是因为长尾关键词从竞争度上相对低,网站优化的难度也相对容易,所以其最先感应的降权恢复。这里讲到排名恢复,而并非是排名上升,之所以这样说,是因为网站降权之后,网站权重再次恢复,是逐渐恢复到网站降权之前的权重,此时并不会超越到原来的权重,所以此时关键字是逐渐朝越来的位置靠近。而要想让这些关键字提升,需要网站超越原来的权重。

4、目标关键词开始出现排名恢复

篇3

关键词:网络营销;网站优化;搜索引擎优化;SEO

从1997开始,Internet在我国进入了最为快速的阶段。国内Internet用户数1997年以后基本保持每半年翻一番的增长速度。2012年1月由中国互联网最高管理机构中国互联网络信息中CNNIC权威《中国互联网络发展状况统计报告》。报告显示,截至2011年12月底,中国网民规模突破5亿,达到5.13亿,全年新增网民5580万,互联网普及率达到38.3%。

互联网在中国国内的普及为中小型企业的网络推广和优化提供了物质基础,而搜索是除了电子邮件、微博、即时通信等以外被用得最多的网络行为方式。通过搜索引擎查找信息是当今网民们寻找网上信息和资源的主要手段。中小型企业网站要想获得较好的搜索引擎排名,对网站进行搜索引擎优化是一项必不可少的工作。

一、 搜索引擎优化技术简介

1、什么是SEO?

SEO(Search Engine Optimization),翻译成中文就是“搜索引擎优化”。SEO的是在掌握搜索引擎工作原理的基础上,通过对网站内部结构和网站外部条件的优化,通过采用易于搜索引擎索引的合理手段,使网站对用户和搜索引擎更友好,从而易于被搜索引擎收录及优先排序,最终达到提高网站访问量、提升网站宣传能力的目的。

2、SEO的优点

①、引擎通吃:网站优化最大的好处就是没有引擎的各自独立性,优化可以提升百度、谷歌、雅虎等主流搜索引擎的排名。

②、不用担心恶意点击:我们所做的效果是自然排名,不会按点击付费,不论您的竞争对手如何点,都不会给您浪费一分钱。

③、价格低廉:网站优化维持一年排名的费用也许只是做竞价一到两个月的费用,甚至更低。

④、稳定性强:网站优化能够帮助你提高网页的综合指数,如果你的链接已经得到提升,继续保持高质量反向连接数的增加和内容的维护,你的左侧排名会继续保持或提高。

⑤、认知度高:大部分网民已经了解带有“推广”字样的网站为竞价网站,是一种广告行为,所以对这种网站比较排斥。而SEO是按照搜索引擎的规律来建立网站的结构,按照搜索引擎衡量网站的权威程度的方法来与互联网上相关的资源建立链接关系,百度快照网站是依照用户体验度和浏览量排名的,这样搜索用户对其认知度有了很大提升,无形中可以提高企业的形象。

二、中小企业网站SEO策略分析

1、重视域名选择,提升网站权重

域名选择,域名简短容易拼写记忆且包含关键词。域名的年龄与域名的权重对SEO的意义重大。一个注册比较早的域名,一般来说,只要不是受惩罚的,那么做新站的时候很明显比新注册的域名在收录方面就要快,在排名方面就会更靠前。再者,域名续费时间长短也会对SEO网站权重有影响。

2、研究网站用户行为,重视关键词分析和选择

根据用户的搜索习惯,关键词有几种类型:核心关键词、热门关键词、广义关键词或者长尾关键词。采用与网站内容相关的关键词。在设置网页文件内容时,应尽量在不影响文章流畅的前提下,保证关键词都出现并且注意出现的密度。关键词密度最好控制在3%到8%。同时还应该通过站长之家、爱站、观其关键字分析等工具,挖掘网站关键词,随时调整优化。

3、优化网站布局和架构、便于蜘蛛爬行

一般来讲,网站布局适不适合蜘蛛爬行则相应的影响到网站的收录量、网站快照、网站权重之类的,一般收录越高,即使是利用长尾关键词来获取流量也是相当可观的。

① 网站架构和程序

用DIV+CSS的方式来呈现网页内容,避免Table的嵌套使用,内嵌表格会最终降低整页加载速度。DIV+CSS的布局方式实现了结构与表现相分离,更利于蜘蛛抓取网页信息。此外,网站采用的CMS内容管理系统应该能生成HTML静态页面,便于提升蜘蛛爬行和抓取。

②控制网页大小和网页深度

通过对网页代码进行清减,去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。页面的文件大小在15K 左右,最好不要超过50K。网页深度保持3层。

③优化网页中的图片,减少Flash的使用

搜索引擎不容易抓取Flash中的内容,应当尽量减少在页面中对于Flash的使用。搜索引擎只识读文本内容,对图像是不可见的。要给图片对象增加ALT 属性,增加搜索引擎可见的文本描述。

4、链接策略

①合理部署内链

网站内链的合理部署将直接影响搜索引擎spider 的爬行效率,从而影响其友好度。站内链接主要从网站导航、网站地图、链接锚文字、相关性链接以及内文链接等方面进行优化。注意控制文章内链数量,穿插于文章内的链接可以根据内容的多少控制在3~8 个左右;链接对象的相关性要高;使用绝对路径。

② 积极建设外链

“内容为王,外链为后”,由此可见,外链对于一个网站的重要性。一个网站被链接得越多,就意味着越受欢迎。但是,搜索引擎对各个链接的衡量也是按照链接网站的质量来定的,质量比数量更有分量。最能够提升排名的连接是来自于GOOGLE PR(PageRank)值较高网站的首页连接,以及来自社区、分类信息中权威页面的连接。

网络营销、网络推广已经成为现代中小型企业进行市场推广的主要途径,通过以上对搜索引擎优化技术的讨论,我们可以通过科学选择网站域名、优化网站结构、积极建设内链和外链,提升友好度从而达到提高网站的排名的目标,给中小型企业网站带来有价值的流量。(作者单位:武汉职业技术学院)

参考文献:

[1] 涂智 浅谈职业院校网站建设的定位、规划与运营[期刊论文]-科技创新导报2008(32)

[2] 李观金 基于SEO的代码优化策略[期刊论文]-科技致富向导2011(11)

篇4

首页尽量使用文字表述

很多站长都认为首页图片或者flash多一些,会更美观,同时可以让受众更直接的了解网站信息,但是目前在中国使用最多最广的搜索引擎是百度,而百度对flash和图片的识别能力是很差的,非常不利于网站的排名,同时过多的图片和flash对网页的加载速度影响也很大,非常不利于用户的体验。

网站首页导航不要用图片做链接

搜索引擎是一个很大的数据库,而不是一个图片库,尤其是中国的搜索引擎识别的是网站的文字标题,对图片并不感冒,导航链接如果用图片做链接,是很难被百度收录的,同时因为网络环境的不稳定及差异性,很容易影响网页的点开速度,而现在受众最缺失的就是耐心和等待,如何你的网站很长时间打不开,或者打开了却是很多无法显示的内容,受众就会马上放弃,迅速关闭网站,停止对网站的体验。

友情链接重量更重质,切勿滥加

篇5

北漂小伙返乡6次为办护照’其实就是反映了政府网站的服务质量,尤其是在细节方面做得还不够。”中国软件评测中心主任助理周亮在接受《中国经济和信息化》记者采访时说,而对类似民生领域服务的考核将是今年中国政府网站绩效评估的重点之一。

11月28日,第12届中国政府网站绩效评估结果暨经验交流会将在北京举行。2002年以来,中国软件评测中心已连续12年对76个部委网站、32个省级网站、330个地市政府网站和400多个区县政府网站进行了监测。

周亮在接受记者采访时表示,2013年的政府网站绩效评估工作进一步强调各级政府网站在信息公开、办事服务以及互动交流等方面的监测。包括像一些对于资金信息、保障性住房、食品药品安全、环境保护等重点信息公开的监测力度。同时深化了对教育、培训、医疗、卫生、社会保障、交通出行等一些重点领域的办事服务的监测要点。

今年国内政府网站评估主要涵盖三个维度,第一是技术维度,主要是指网站内容,以基本的概况信息为主。第二个是内容维度,网站的内容以信息公开、办事服务和互动交流为主体来展开,主要是考核网站解决内容多少的问题。目前我国绝大多数政府网站都仅能实现这个标准。

第三是服务维度,它的一个最显著的特点就是以解决内容质量好坏为标准,不能局限于内容仅仅是数量上的覆盖,更重要的是内容质量要高、要实用。目前来看,虽然政府网站的服务数量越来越丰富,覆盖面越来越全,但是具体到某一个服务,它的实用程度、有效程度还是比较低的,尤其是公众关注的一些重点服务领域。

同时,今年的评估在信息公开的考量上又进行了一些细化。比如政策规定是一样的,但是在实际办理中可能会出现多种可能,政府网站能否根据不同的用户有更加细化的规则,也是今年评估亮点之一。如果政府网站在这方面能够有所完善,“北漂小伙”也许就不用多跑那五趟了。

对于今年政府网站绩效评估的最大改变,周亮认为是日常监测权重的大幅度提升。往年政府网站评估仅限于在某一个时间段,而今年则是从5月份一直持续到年底。如果把往年的评估比喻成为奥运会,“一场比赛定胜负”,今年则更像是世界排名,“很多赛事成绩放在一起来决定排名”。这样可以引导网站注重日常的更新和维护。

在权重上,部委的日常监测由去年的12分上调至65分,省级、副省级城市和省会城市政府网站的日常监测的权重由6分上调至63分,地级市的网站监测权重由7分上升到66分。同时监测内容也有所转变,以往更多关注的是网站信息更新是否及时,功能是否有效,现在更关注的则是内容的运行和维护,比如说日常的服务是否能够很好地满足用户需求。

北京市西城区的政务服务网站“北京西城”在今年以用户为中心做了进一步优化。西城区信息化办公室主任付贵森在接受记者采访时表示,在今年的网站改版中,用户体验方面的调整得到市民的好评。网站首页首次采用简洁的布局,突出重点,摒弃传统政府网站复杂的页面布局,只提供用户关注度高的信息,同时在网站首页大胆尝试电商网站的人性化设计,突出导航功能及搜索服务,用户可以快速定位想要的信息,提高了用户的访问效率。

除此之外,“北京西城”在10月15日推出了“西城服务”手机客户端,主要提供西城政务信息、西城动态等信息的浏览,办事机构地址的查询、地图服务以及常用电话等信息的查询服务,在功能上可以实现随手拍西城、西城微信、微博访问等服务。

中国软件评测中心副主任张少彤向记者介绍,互联网新技术在政府网站中的应用也是今年政府网站绩效考核的重点之一。一方面是引导各地政府网站充分利用政府资源,建设面向苹果、安卓等移动终端的客户端,提高用户获取信息的便捷性,另外一方面,对于移动终端应用的安全性进行全面监测。

残障人士在过去使用政府网站时往往会遇到更多的困难,今年,国内多家政府网站都在这方面推出了无障碍的应用。北京市政务门户网站“首都之窗”推出的“无障碍浏览”通道就为这些特殊群体带来了方便,在首都之窗“无障碍浏览”主页上,残障人士可以选择“读屏专用”、“视觉辅助”、“在线语音”、“盲人在线”等辅助功能进行网站浏览。

“无障碍建设的专项评估”也被列入了今年的政府网站绩效评估体系之中。中国软件评测中心联合中国残联开展了政府网站信息无障碍建设的专项评估,推动政府网站提高无障碍建设的水平。张少彤说今年的无障碍评估主要从可感知性、可操作性、可理解性和兼容性等方面进行专项检测。

近几年,通过政府网站绩效评估,各级政府对政府网站建设以及网络的政民互动的重视程度都有了显著提升。与此同时,政府网站的管理机制逐步得到完善。从实效来看,政府对于网络舆论的响应速度,应对方式,与以往相比都有比较大的改善,处理的效果也比较好。

篇6

那么对于淘宝客的推广你会采取什么方法呢?

根据稻稻的观察主要有以下几中方法:

1、论坛发帖

论坛发帖算是比较常见的了,经常看到论坛的版块被淘宝客的链接占据了,我们在百度上搜索的时候就会发现有大量这样的内页在关键词排名的上较为靠前。主要是由于它们的权重较高而引起的,同时百度也适当的提升了大型网站的内页权重。

论坛发帖的主要优势在于快速,而且有利于排名,同时借助了论坛也吸引了部分的流量。缺点主要在于帖子需要经常发,保持更新频率。大多数论坛内页的排名都是经常变动的,所以需要新鲜血液来补充。同时,有的论坛发广告比较难,这就需要我们积累老账号或者借助一定的关系将淘宝客的产品图片和代码发上去!

发博文跟论坛发帖也是类似的道理,这里就不详说了。

2、博客评论

稻稻比较喜欢浏览博客,经常发现很多朋友发自己的网址,打开一看是做淘客的!呵呵,做淘客的朋友真多啊。

博客评论的好处不仅很多人能够看到,同时也在一定程度上为网站做了点外链,增加了点权重。它的缺点主要在于需要大量评论,比较花费时间。同时如果评论靠后,那么淘客广告被人看到的几率就小很多。

3、做SEO

其实淘宝客结合SEO是非常强大的,强大到什么程度呢?如果你将有较大搜索量同时潜在购买欲望强烈的词做到百度至少前三,那么收入是很稳定的。

运用SEO做淘宝客的优势在于做上排名后,收入比较稳定,而且是被动收入,后期的维护花费的时间也是较少的。当然这里一定要用白帽SEO,我们不能因小失大。

用SEO作淘宝客的缺点主要在于前期收入较少甚至没收入,对于站长们的耐心是一个较大的考验,在百度排名上,真正的是”剩者为王“。只要选择的方向正确,那么就放心的去坚持,收获的时候你就会觉得有多么值得。

篇7

一:邮件群发的自缚行为

无论是宣传网站,还是推广产品,邮件群发似乎成了网络推广中不可缺少的手段之一。但邮件群发真的可取吗?在进行大范围邮件群发后,完全被服务器过滤的信息又有多少呢?纵然没有得到过滤,但不得不说中国的网民常识已经明显提高,早先年的高效“点击”率已经十不存一,甚至于频繁的链接更是会被用户举报后列入邮箱黑名单。再说邮箱服务端,当接受到太多的垃圾信息,此后继续使用该邮箱,或带有该地址的链接信息,通通被邮箱服务器过滤掉,致使最后的得不偿失。品牌宣传,邮件是个不错的渠道,但若无选择的进行群发,最后的结果便是作茧自缚,更臭了品牌,还失去了邮箱传递信息的这一长久渠道。

二:群发软件的自缚行为

看帖回帖是对作者的尊重,甚至于在其中加入自身的一端链接还可以带到不少的访问量。对于这一点,不容否认,在高流量的论坛后博客中,大量的回帖确实很有效果。由此为了便捷性,便出现了所谓的“群发软件”。博客评论的群发、论坛回帖的自动顶贴群发,甚至于邮件群发,QQ群群发。在起始时或许还能见到不少的效果,但若长此以往下去,发一些与主题大都偏移五质量的帖子或信息,最后得到的更多是他人的厌恶,即使真正的用户也会反感。甚至于在相应网站中被封号,屏蔽URL地址等。最后笔者推荐,网站建站初期可采用此类方法进行外链与人气的宣传,促成基本流量。后期的发展,更应善于使用,才能长久提升网站流量与知名度。否群发推广,必定出现更多推广瓶颈。

三:虚假信息的自缚行为

在网站推广中,有着大量的虚假信息每天在散播宣传着,目的是为了快速的吸引用户,达到高效的宣传效果。但弊端也是显而易见的,往往造成用户的极度反感是其重要标志之一,更直接性的影响了“口碑宣传”。甚至与在一些虚假信息推广中,更易受到搜索引擎的惩罚,造成降权,甚至K站。如笔者有时在查一些网站外链中,偶尔会发现一些题为“妹妹上门****”等垃圾性标题,但若看其链接,其实质内容却截然想法。最后是带去流量了,垃圾流量又有何用呢?留不住任何的用户。甚至严重影响网站或企业形象。

另外,还有就是那些虚假忽悠人的广告信息,在表面上写着多么诱人,多么经济实惠。但引诱用户点击注册后,却出现这样那样的条条框框,甚至于更是在使用后,出现更多的限制。如,不限IIS、不限CPU的IDC服务商,这样的信息在淘宝中也比比皆是。看似多少G的骨干网,看似多高的配置,但当接入后又会如何呢?试问,若一台服务器被你花几百块钱占用了绝大部分的资源,别人又要怎么活?当所有人都抱着“不用白不用”的心态去做事时,这台服务器也就完了,说是不限制这个,不限制那个,最后却成了什么都限制,而这个限制是用户彼此给予的。

此后,即使公司或品牌改邪归正了,也很难赢得用户的信赖,做短线盈利还不如做垃圾站,何必在苦苦坚持呢?虚假推广,不可取,忽悠人信息更不可取。

四:掩耳盗铃的链接推广

篇8

〔关键词〕电子政务网;信息生态系统;生态评价;灰色理论

〔中图分类号〕C931.6 〔文献标识码〕A 〔文章编号〕1008-0821(2014)06-0012-06

电子政务网站建设自提出以来,在我国得到了迅速发展,各地区都投入巨额资金建设电子政务网,目的就是促进政府管理改革以及向公众提供便捷、高效的政务信息服务。电子政务网站不仅是宣传政府形象的窗口,也是政府信息、提供服务的重要渠道,是实现政府与公众互动沟通的主要载体。而伴随着电子政务网建设的不断发展,公众对电子政务网的服务质量要求越来越高,急需建立起对电子政务网的合理有效的评价方法,以不断发现其问题并及时改进。

电子政务网作为一种信息系统,涉及多个业务环节和相关业务单位,有着同自然生态系统相似的组成、功能目标与基本特征,系统中各主体相互作用和相互影响[1]。但在其发展过程中诸如信息超载、信息污染、信息孤岛、信息安全、信息不平衡、信息开放性差等类似自然生态系统的诸问题也越来越突出[2]。本文从生态的角度构建电子政务网的评价指标体系,利用基于灰色理论的评价方法进行实证分析,提出促使电子政务网健康、生态可持续发展的合理建议。信息生态系统是指在特定的信息环境中由信息及其他相互联系和作用的诸要素及其关系组成的、在一定的信息资源管理机制下实现自维持和自调节功能的动态变化的生态系统。信息生态平衡即指信息系统各组成部分之间协调互补,系统结构优化、功能良好,信息生态环境协调、信息人与信息生态环境高度适应、信息流转畅通高效。

1 电子政务网信息生态评价指标体系的构建

1.1 评价指标的选取原则

为了科学的评价政府网信息生态系统,本文遵循以下原则建立了具有操作性的评价指标体系。

1.1.1 系统性原则

评价指标体系必须能够全面反映政府网信息生态系统管理的各个方面,必须与政府网的战略目标、评价目的相一致,要具有层次结构合理、涵盖面广的特点。

1.1.2 科学性原则

评价指标体系的设计必须建立在科学的基础上,指标的概念要准确、涵义要明晰,能全面地反映评价对象,要重点突出,指标之间要相对独立,界限明确。

1.1.3 可行性和可操作性原则

评价指标要具有可获得性和可量化的特点,能够做到定量与定性相结合。要考虑指标量化的难易程度和可靠性,保证评价的合理性、公正性和客观性。

1.1.4 动态连续性原则

评价指标体系不仅要反映政府网的现状,而且要动态的反映其发展趋势和潜力。指标选取时要做到静态指标与动态指标相结合,静态指标反映政府网的现状,动态指标则揭示系统的发展前景。

1.2 评价指标体系的建立

对电子政务网进行合理有效评估的重要前提是构建科学的评价指标体系[3]。本文从信息生态系统的4个特征,即开放性、循环性、持续性和平衡性几个方面进行评价[4],评价指标体系如表1所示。

1.2.1 开放性

电子政务网开放的特征是在法律的允许范围内最大程度的实现政府信息的公开和易获得性,以及实现管理和沟通渠道的公开,在政府各部门之间、政府与公民和企业之间开辟良好的信息通道,使广大公民能够及时了解政府的相关政策和服务[5]。电子政务网站的开放性指标主要从服务开放和政策开放两个方面进行衡量。

1.2.2 循环性

生态环境中存在着物质循环、能量循环,在电子政务网信息系统中相应的也存在着信息的循环。当广大公民在浏览电子政务网站时,会对某些政策进行反馈或提出意见,相关人员对公民的反馈意见进行整理分析上报给相关领导,有价值的信息将会被重新利用,实现信息的循环。

1.2.3 持续性

越来越多的公民希望通过电子政务网站获得相关政策信息,或将自己的意见、建议传递给政府管理人员,并希望自己的问题能够得到重视和及时回复。电子政务网络平台的建立成了促进社会和谐发展以及沟通政府和公民的重要手段。衡量电子政务网络平台能否实现可持续发展,本文将从信息投入和社会产出两个方面进行分析。

1.2.4 平衡性

构建电子政务信息生态系统要秉承平衡性的原则,处理好各个要素之间的关系,使电子政务网成为一个健康的系统并得以可持续发展,实现系统的动态平衡和不断进化发展。在这种状态下,信息生态系统的结构与功能相互依存、相互作用,在一定时间和空间范围内处于最优化的协调状态,表现为输入和输出动态平衡,信息传递畅通和控制自由[6]。

1.3 评价指标体系权重的确定

表1所示的电子政务网的生态评价因素集多为定性评价,不同的评价主体对评价指标的赋权存在较大差异,需在确定评价指标权重时综合考虑多方意见。本文采取了一种定性与定量相结合的基于格栅获取的模糊Borda数分析法。运用该方法将抽象问题运用结构化的方法逐一分解成易于描述、能被具体评价的问题,从而建立递阶层次。然后通过“权专家组”对指标在不同属性下的重要程度进行打分建立完整的格栅[7]。最后对格栅进行分析得到每一指标的相对权重。具体分析如下。

1.4 灰色理论评价方法

1.4.1 评价灰类及评价样本矩阵

本文应用灰色理论评价法对电子政务网进行生态评价,该方法在整体平衡中综合考虑了各种因素,评价较为全面,因而得到广泛应用。相比模糊层次综合评价法,其主观性较强,模糊集的确定过程复杂,不利于实际操作。

1.4.3 综合评价

根据三级评价指标的打分求出三级指标的灰色评价权矩阵,对三级评价指标乘以三级指标相应的权重进行综合评价,得到二级指标的评价结果。对得到的二级指标的评价结果乘以二级指标的相应权重进行综合评价,得到一级指标的综合评价结果。对一级指标的综合评价结果乘以一级指标的权重可得到整体评价结果,进而对结果进行分析。

2 我国电子政务网的信息生态评价

2.1 权重计算

在评价因素权重的获取上,本文针对我国31个省、市、自治区的电子政务网站的建设情况,通过专家问询的方式对电子政务网站的各级评价指标的重要度和建设情况的现状进行打分,然后综合计算得出每个评价指标的权重。具体过程如下:

(1)三级评价因素的重要程度判断表如表2。

(2)计算三级指标隶属度,如表3。

(3)根据公式(2)求得三级指标的模糊频数,如表4。

(4)计算三级评价指标的模糊Borda数:

2.2 综合评价值计算

(1)通过专家打分得出电子政务网站的总体评分,并进行均值化处理,得到原始评价数据。

(2)根据前面的分析可求得三级指标灰色评价权矩阵:

2.3 评价结果分析

由计算,我国电子政务网站的整体评价结果为B=[03132 03774 03012 00082]。我国电子政务网站总体实施效果隶属于“良好”这个灰类的隶属度为03132,隶属于“中等”这个灰类的隶属度为03774,隶属于“较差”这个灰类的隶属度为03012,隶属于“差”这个灰类的隶属度为00082,从中可以看出我国电子政务网站整体处于中等水平,因为属于“良好”灰类的隶属度比“较差”灰类的隶属度稍微大一些,故我国电子政务网站的整体效果处于中等偏上水平。这主要是得益于自1999年我国启动政府上网工程以来,各级政府部门逐渐认识到了政府上网对推进国家信息化和社会发展的重大意义,纷纷开发和逐步完善各级政府的电子政务网站。但发展的同时也存在一些问题。

2.3.1 开放性

由数据B1=[0.3166 0.3823 0.2936 0.0075]可知,我国电子政务网站建设的开放性整体处于中等水平,若再细分处于中等偏上水平。从政策开放和服务开放两大方面来看,政策开放整体处于中等偏上水平,服务开放处于中等偏下水平。

①政策全面性。从评价结果B11=[03274 03944 02757 00025]可以看出我国电子政务网站的政策全面性整体处于中等偏上的水平。各级电子政务网站包括政府、办公厅室、法制办、监察局、信息办、纠风办等很多部门相互配合,全面梳理政府信息,编制政府信息公开目录,加快政务信息公开的步伐,各种政策信息,能够在很大程度上满足公众的需要。

②政务公开。从评价结果B12=[02965 03598 03269 00168]可知,我国电子政务网站的政务公开整体处于中等偏下的水平。大多数地方电子政务网站的基本政务信息,比如新闻动态、政策法规、政策解读、政府公文等大部分能做到及时、全面的公开,比较深度的政务信息,比如统计数据、办事指南、各部门业务动态的公开表现一般,而关键性的政务信息比如关于财务、采购、项目投资、人事任免、干部选拔等的公开透明度很低。

③用户服务。从评价结果可知,我国电子政务网站在用户服务方面整体处于中等偏下水平。在用户服务中包括个人服务和企业服务两大板块,不论是个人服务还是企业服务,能够真正实现用户网上事务处理和公众办事申请在线处理的电子政务网站只占少数。大多数电子政务网站的在线服务深度十分有限,更差的网站甚至连表格下载都很难令人满意。还有些网站只是建立起在线提交申请平台的空架子,当点击提交时会连接到错误的网址,即使有提交的平台其设计也不够便民。与此同时也有一些电子政务网站在用户服务方面做的很到位,能够及时准确的解决用户在线请求。

④查询服务。我国电子政务网站的查询服务整体处于中等偏下的水平。大多数电子政务网站可围绕社会公众的需求,提供比如交通出行、日常生活、教育培训等方面的查询,但是对于社会保险、养老保险、政策规划发展等一些涉及民生方面的查询提供的较少。

2.3.2 循环性

本文从信息生态和信息协调2个二级指标和信息污染、信息超载、信息集成和信息反馈4个三级指标分析系统的循环性。从评价结果B2=[0.2984 0.3650 0.3263 0.0103]可以看出,我国电子政务网站的循环性整体处于中等偏下的水平。

①信息污染。该指标整体处于中等偏下水平。一些电子政务网站上的信息过于陈旧,没能及时更新。过时的信息对广大用户来说是没有价值的,而且增加了网页的冗余度。

②信息超载。该指标整体处于中等偏下水平,主要表现在信息过量或信息未经分类整理,页面设计缺乏条理,用户很难在第一时间找到有价值的信息,搜索结果中罗列很多网页导致用户信息迷失,最终放弃对网站的浏览。

③信息集成。具有统一的应用平台是实现数据共享的前提,而该指标的整体评价不是很高,主要是存在一些网站的连接是无效的,或者在相关网站的网址变更时未能及时做出更新。

④信息反馈。我国大部分电子政务网站都设有政民互动环节、在线咨询、论坛、邮箱信箱等板块,供广大用户进行在线咨询或者提出建议。但也有相当一部分网站,用户在线提建议或咨询时,提交后往往会连接到错误的页面或者得不到相应的回复,降低了用户使用系统的积极性。

2.3.3 持续性

从评价结果B3=[0.3208 0.3813 0.2907 0.0072]可以看出,我国电子政务网站持续性指标整体处于中等偏上水平。

①信息化投入。自从实行政府上网工程以来,全国各地政府对信息化投入力度越来越大,包括前期的设备投入、平台的搭建、平台的运行和维护等。一个好的网络平台要求做到网页设计合理、网页响应速度快、用户界面友好并且能够进行定期维护[10]。网站平台的技术先进性也能在一定程度上反映信息化投入的力度。

②用户满意度。电子政务网站的社会(生态)产出主要从用户满意度方面来分析,从评价结果看我国电子政务网站的用户满意度整体处于中等偏上水平,大多数网站不论是界面设计还是功能方面都能让用户感到基本满意。但是仍然有很多电子政务网站的用户满意度很低,网站服务的宽度和深度不够。

2.3.4 平衡性

从分析结果B4=[0.3253 0.3833 0.2842 0.0072]可以看出,我国电子政务网站的平衡性整体上处于中等偏上水平。本文从地域平衡和信息环境平衡两个方面分析。

①地域平衡。该指标评价结果为中等偏下,经济发达地区的电子政务网站建设要比偏远落后的地区先进很多。各省之间不同地市之间的差距也存在差别,经济好的地区各市之间的网站建设平衡性非常好,而落后地区的各市之间的平衡性不令人满意。

②信息环境平衡。该指标评价结果是中等偏上的,主要表现在具有良好的导航和人与信息环境的适应关系上。功能结构合理的网站提供了使不同用户群生长壮大的信息环境,建立专门的信息管理组织有利于提高信息管理水平。

3 建议与结论

通过以上分析,可知我国电子政务网建设整体处于中等偏上水平,仍然有很大的空间需要提升和改进。本文从构建生态系统的角度提出如下建议。

3.1 加强电子政务网系统开放性,不断提高公共信息服务水平 电子政务作为一种网络平台,在平台建设上应强调系统的开放性,起到使广大公众直接有效监督政府的作用。按照不同用户的需求有针对性的设计公共服务,打破政府部门的界限,全方位提供有关社会保险运营、政策制定与实施、城市发展规划等涉及民生方面的信息。同时强化对公众的宣传,吸引更多用户关注和访问电子政务网。

3.2 实现系统生态可持续发展,避免系统失衡现象的产生 完善系统功能,提高网站的实用性,如提供高级查询功能,使用户能够在短时间内快速准确的查询到所需要的信息,实现便利的网上业务处理,从而提供全方位的“一站式”服务。及时更新信息,对网站上的过时信息和不良用户的言论进行及时处理,减少网页的冗余度。与此同时,政府部门应该认真接收和处理公众的咨询建议并能够给予及时的回复,提高用户的满意度,实现其生态可持续发展。

3.3 加大信息化的投入,特别是加强信息管理及技术人员的引进与培养 信息基础设施是保证电子政务网站持续健康发展的强有力的外部环境,加大信息化投入,以出色的软硬件保障高效准确的业务处理,减少业务处理过程中异常事件发生的概率。加快信息化建设高素质人才的引进和培养,合理有效的发挥信息技术人才的作用;加强与技术单位的合作,充分发挥社会力量的作用。

3.4 提高电子政务信息生态系统的地域和环境平衡能力 我国电子政务网的建设要充分考虑经济发达地区与欠发达地区的差异,支持经济欠发达地区的电子政务网的建设,对其加大资金投入,努力缩小与发达地区电子政务网站建设的差距,做好相关部门与人员的培训工作。

电子政务网的建设应以提供满足人民需要的信息为系统支撑,以和谐的信息行为为内在动力,加强电子政务网信息资源共享平台的建设,发挥与民众的良好互动,才能更好的为民办事,实现信息系统生态平衡并保持可持续发展。

参考文献

[1]王东艳,侯延香.信息生态失衡的根源及其对策分析[J].情报科学,2003,(6):572-575,583.

[2]王云梅.信息生态系统及其有效机制的构建[J].图书馆工作与研究,2010,(2):25-28.

[3]孙细明,企业技术创新能力评价研究[D].武汉:华中科技大学,2003.

[4]李宇,关伟,李文超,等.高新技术企业技术创新能力及其评价指标[J].辽宁师范大学学报:自然科学版,2007,30(3):372-375.

[5]齐莉丽,廖媛红.社保基金信息系统的生态评价模型及方法[J].科技管理研究,2013,(9):231-236.

[6]廖林.区域金融生态系统基本性状模型研究[D].成都:西南交通大学,2009,(4).

[7]刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].北京:科学出版社,2008.

[8]张成福,唐钧.电子政务绩效评估:模式研究与中国战略[J].探索,2004,(2):36-40.

篇9

第一,关键词推广数量多难度就大的谬论,很多Seoer接单的时侯都有习惯,喜欢把客户的关键词去百度搜一下,以为看到推广数量多就很难,其实不然,不信大家可以看看“杭州婚纱摄影价格”,这个词百度左边推广有10个,那这个词优化到百度很难吗?所以说看一个词的难道最好是看前十名网站的情况,在这里我也说下为什么有些词左边没有10个推广的原因:

a,百度有限制部分词不容许在左边出现10个,如“(左旋肉碱)”,这个词百度左边推广有4个,其他推广的都跑到右边去了;

b,推广用户设置了推广时间段,所以你在不同时间段看到推广数量是不一样的。

C,推广用户每日消费额也用尽,相关关键词也就随着下线了,这也是造成推广数量不一样的原因。

第二,site首页不在第一就是降权的谬论,这不排除有降权的原因,其实还有权重的问题,如果首页的权重不够的话,内页也会出现在首页的,这晕倒这种情况大家可以给首页做外链,也可以在内页做一些指向首页的链接,还有个现象也许大家都见过,一些大站内页经常会出现在首页前面,这难道是降权吗?很明显不是,这是因为内容刚更新的缘故。最好告诫新手如果遇到快照不倒退、不更新、site首页不在第一不要急,只要正规做站是不怕被降权、K站。正所谓身正不怕影子斜。

第三,交换链接看PR值的谬论,随着google的退出,据说PR值也将取消了,这对站长来说有利也有弊,因为有些站长他不会去看PR,如果你的快照新鲜、反连不多,收录差不多,他也会跟你交换链接的,而有些站长就不一样,即使你的排名都很好,收录、反连、都正常,PR不合适他也不会跟交换链接的,我就遇到了这种情况,真是郁闷,此时巴不得PR更新。这就是利弊。

第四,快速提升关键词排名的谬论,做Seo不是开灯,按下开关灯就能亮的,有人把SEO比喻成男女之间的谈恋爱,的确很形象,想要成为男女朋友,就需要慢慢接触、考察,最好给你一个答复,排名正是这样,所以你别跟我说我给你多少多少钱,让排名快速上去,也别三天两头问我为什么排名还没有,毕竟百度不是我家的,速成法只有送钱给李彦宏。

第五,好的排名就可以给带来利润的谬论,很多老板以为把关键词做到百度第几第几就能带来多少流量,能带来多少利润,所以我会问有些老板你想要的是什么,是排名、流量、还是转化率?因为很多老板都不懂SEO,他们会根据自己的经验选择一些关键词,然后就是让SEOER来执行了,结果排名上去了,流量却不增长,何来的生意、利润。我想人多人都遇到了这种情况,如果遇到这种情况可以考虑下优化长尾关键词,长尾关键词竞争小,也是能带来流量的。

篇10

[关键词] Web结构挖掘 网站结构 超链接 PageRank HITS

一、前言

网站的推广对电子商务网站而言尤为重要。网站在常用搜索引擎上的排名会直接影响到网站的推广和网站的运营效果。因网站的结构不同,即使内容相同,外观相同的网站,在常用搜索引擎中的排名也会不同。网站结构是否合理会影响到搜索引擎在网站页面上抓取的结果,从而影响到网站的排名。在实际应用中,常使用PR(Page Rank)值来判断网站结构是否合理, PR值越高说明网站结构越合理,搜索引擎就会收录该网站更多的页面,为网站带来更多的流量。因此,提高网站结构的合理性,获取更高的PR值就显得尤为重要。只有用网站结构优化的理念去设计网站,才有可能设计一个成功的网站。基于Web的数据挖掘技术中的Web结构挖掘( Web Structure Mining)则是判断网站结构是否合理的一个有效方法。使用Web结构挖掘方法可以提高网站结构的合理性,增加网站的PR值,扩大网站的流量。

二、Web结构挖掘的概念

基于Web的数据挖掘是指使用数据挖掘技术在Web数据中发现潜在的、有用的模式或信息。基于Web的数据挖掘一般可以分为三类:Web内容挖掘(Web Content Mining)、 Web结构挖掘( Web Structure Mining)及 Web 用法挖掘(Web Usage Mining)。其中Web 结构挖掘是对Web 的链接结构进行分析, 以对超链接分析来评估Web 资源, 从而发现有用模式, 提高搜索质量及提高网站被抓取的可能性。Web结构包括不同网页之间的超链接结构和网页内部用HTML,XML表示的树形结构,以及文档URL中的目录路径结构等。Web页面之间的链接结构中包含了许多有用的信息,Web结构挖掘是从Web结构中推导知识,即对Web文档的结构进行挖掘,挖掘Web潜在的链接结构模式,通过分析网页间链接数量及对象来建立网站自身的链接结构模式。

Web结构挖掘的基本思想是将Web看成是一个巨大的以Web页面为节点、页面之间超链接为有向边所构成的一个网状结构的有向图,然后利用图论对Web的拓扑结构进行分析,从而确定其网站结构的合理性。

Web结构挖掘的算法一般可分为查询相关算法和查询无关算法两类。HITS( Hypertext Induced Topic Search)和PageRank分别是查询相关算法和查询无关算法的代表。这些算法已经在实际的系统中实现和使用,并且取得了良好的效果。

三、Web结构挖掘算法描述

基于超链接分析的思想,Sergey Brin和Lawrence Page在1998年提出了PageRank算法,同年J. Kleinberg提出了HITS算法,其他一些学者也相继提出了另外的链接分析算法,如SALSA,PHITS,Bayesian等算法。对超链接进行挖掘的两个典型的算法是:PageRank算法及HITS算法。

1.PageRank算法

PageRank算法是Web超链接结构分析中最成功的代表之一,该算法是评价网页权威性的一种重要工具。Google、Yahoo、Baidu等都是基于该算法的搜索引擎。PageRank算法基于2个前提,一是若网页A被多次引用,则A重要;若 A被重要网页B引用,则A重要;B的重要性被平均的传递到它所引用的网页。二是若用户访问网页A,然后跟随A的导出链接向后浏览网页B而不退回A,那么浏览B的概率就是B的PageRank值。

PageRank在具体实现时会忽略掉页面的文本和其他内容,只考虑页面间的超链接。但由于网页的链接范围领域很广,链接的页面价值参差不齐,所以仅以简单的链接数量来判断网页的重要性是不真实客观的,所以其他研究者对PageRank算法提出了改进。改进的PageRank算法不仅考虑了网页引用数量,还根据页面的导入链接的权重来计算页面的重要性。页面导入链接的权重由链接提供页面的重要性所决定,即当前页面的重要性主要由其他页面的重要性来决定,PageRank算法就是从链接结构中获取网页的重要性。

简单PageRank算法描述如下:

PR(A) = (1-d) / N + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

其中:PR(A):页面A的PR值,

PR(Ti):页面Ti的PR值,页面Ti链向页面A

C(Ti):页面Ti链出的链接数量

d:阻尼系数,取值在0-1之间

N:互联网上所有网页的数量

由此可见,PageRank算法不以站点排序,页面PR值由独立的页面决定。页面的PR值由链向它的页面的PR值决定,但每个链入页面的贡献值是不同的。如果Ti页面中链出越多,它对当前页面A的贡献就越小。A的链入页面越多,其PR值也越高。阻尼系数的使用,减少了其他页面对当前页面A的排序贡献。所有页面的PR值形成了一个概率分布,所有页面的PR值之和为1。

简单PageRank算法也可以用矩阵来描述,设T为一个矩阵,T的行和列对应页面集的页面。PageRank的算法是将T的行和列互换后得到的矩阵A。为了将各列矢量的总和变成1(全概率),把各个列矢量除以各自的链接数(非零要素数), 即如果网页i有指向网页j的一个链接,则Aij=1/Ni,否则Aij=0,就形成了一个 “推移概率行列”,各个行矢量表示页面间的推移概率。由T倒置得到A的理由是,PageRank 并非重视“链接到多少地方”而是重视“被多少地方链接”。PR值的计算,就是求属于这个推移概率行列最大特性值的固有矢量。

2.HITS算法

HITS算法综合权衡了查询内容与页面链接的关系。HITS算法认为网页的重要性依赖于用户提出的查询请求。HITS算法通过两个评价权值――内容权威度(Authority)和链接权威度(Hub)来对网页质量进行评估。内容权威度与网页自身直接提供内容信息的质量相关,被越多网页所引用的网页,其内容权威度越高;链接权威度与网页提供的超链接页面的质量相关,引用越多高质量页面的网页,其链接权威度越高。HITS算法认为对每一个网页应该将其内容权威度和链接权威度分开来考虑,在对网页内容权威度做出评价的基础上再对页面的链接权威度进行评价,然后给出该页面的综合评价。

HITS算法是一个“迭代―收敛”的过程,在获取了一个与查询主题相关的返回页面根集合(Root Set)S后,根据S中的页面的链接关系再向集合S中扩充与S中页面相链接的页面, 将S扩展成一个更大的基础集合(Base Set)T。可将T看作一个二分有向图SG=(V1,V2,E),其中:顶点集Vl:T中的Hub网页集;顶点集V2:T中的Authority网页集;边集E: Vl中的网页到V2中的网页的超链接。对V1中的任一个顶点v,用h(v)表示网页v的Hub值,对V2中的顶点u,用a(u)表示网页的Authority值。开始时h(v)=a(u)=1,对u执行I操作修改它的a(u),对v执行O操作修改它的h(v),然后规范化a(u),h(v),如此不断的重复计算下面的操作I,O,直到a(u),h(v)收敛。

I 操作:(1)

O操作:(2)

每次迭代后需要对a(u),h(v)进行规范化处理:

式(1)反映了若一个网页由很多好的Hub指向,则其权威值会相应增加(即权威值增加为所有指向它的网页的现有Hub值之和)。式(2)反映了若一个网页指向许多好的权威页,则Hub值也会相应增加(即Hub值增加为该网页链接的所有网页的权威值之和)。HITS算法输出一组具有较大Hub值的网页和具有较大权威值的网页。

HITS算法存在的主要问题:

(1)实际应用中,由S生成T的时间开销很昂贵;

(2)站点内部网页在权威度数值上可相互加强;

(3)网页中一些无关的链接影响A,H值的计算;

(4)存在与查询主题无关的网页即主题漂移现象。

四、应用WEB结构挖掘算法提高网站价值

将WEB结构挖掘算法应用到自身网站的结构优化中来,对提高网站的价值有着重要意义。网站结构优化包括两个方面,物理结构的优化与逻辑结构的优化。Web结构挖掘所有算法都将网页中的链接(逻辑结构)作为主要挖掘的对象,特别在实际应用中,大多数用户都是使用基于PageRank算法的Google、Yahoo和Baidu等搜索引擎。但网站物理结构的合理性也是影响网站价值的一个重要因素。因此采取以下几种策略,将有助于用户将网站定位到相关主题的权威站点,从而获得更高的PR值,以提高电子商务网站在搜索引擎的排名,提高检索结果的质量,提高网站的访问率, 提升网站的档次。

1.网站物理结构优化

网站物理结构是指网站真实的目录及文件所存储的位置所决定的结构。网站物理结构优化不但关系到网站的易用性,还会影响到网站在搜索引擎上的排名。合理的网站物理结构可以让Google等搜索引擎轻松搜索到你网站的大多内容,收录你大量的页面,更多的关注你这个网站。虽然合理的链接可以取得一个比较理想的PR值,但由于Web结构挖掘过程是由机器搜索引擎蜘蛛(Spider)自动完成,因此就需要构建一个搜索引擎蜘蛛友好的网站物理结构。

要合理安排网站文件目录结构,使目录结构扁平,有序。网站的目录结构最好不要超过3层,因为每深一级目录,PageRank降低1-2个分值。重要内容放在顶级目录。目录文件夹命名应含关键词,网页文件名也应含关键词。文件名是词组时应用短横线而不要用下划线隔开。使用英文而不是拼音字母来命名文件及目录。如果目录超过三层,就应使用子域名来调整和简化目录结构层数。

2.网站逻辑结构优化

网站的逻辑结构(链接结构)是由网页间链接所形成的逻辑的或链接的一个网状结构。一般来说网页被一些“重量级”的网站链接的次数越多,PageRank的值就会越高;同样,网页的链接指向越多,PageRank的值也会很高。搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展开分析,并给出相应的PR值。常用链接策略有:

(1)尽可能多地让其他跟本站主题相关或互补的网站链接本站。

(2)同PR值更高的网站进行相互链接。

(3)在流量大、知名度高、频繁更新的重要网站上出现本站链接。

(4)与内容质量高、PR值上升潜力大的网站链接。

(5)与以本站关键词在搜索结果中排名前三页的网站进行链接,有了这些网站链接,即使不向搜索引擎提交网站,搜索引擎也自然找到并给予好的排名。

(6)网站提供与主题相关的导出链接,尤其是被链接网站名称(或者栏目名称、文章摘要和标题等)中含有重要关键词时,会丰富自己网站的关键词并会被搜索引擎认为有丰富的与主题相关的内容,也有利于排名。

(7)要确保网站内没有死链接,并保持网页内容或链接的稳定性和持久性。

(8)站内页面链接可以为网页创造尽可能多被收录的机会。一个网站被收录的网页数量增加,即使网站首页的PR值不高,也增加了网站总体的搜索引擎可见性。

网站地图是所有页面的快速入口,是搜索引擎更全面索引收录网站的重要因素。它可以方便搜索引擎蜘蛛快速遍历网站所有需要的内容。网站地图的三大因素:文本、链接、 关键词,都极有利于搜索引擎抓取主要页面内容。动态生成目录的网站尤其需要创建网站地图。网站地图的导航能力会使访问者更容易找到所需的东西,且有利于搜索引擎收录更多的页面以及在搜索引擎中得到更高的PR值。将网站地图生成为XML格式文件并存放在网站根目录中,并向搜索引擎提交,将有助于搜索引擎蜘蛛更快地遍历网站。

3.页面代码优化

精简代码,减少页面的体积,不但使得网页可以得到更快的下载,而且还影响到搜索引擎对该页面的收录及直接影响网站排名。搜索引擎倾向于在页面文件开始处查找本页的关键性内容,而不是文件的正文。因此要做到代码和页面分离,把javascript文件和css文件分别存放在js和css外部文件中,把重要的页面内容放到页面顶部,以缩小文件体积,提高有效内容占页面体积的百分比,从而提高关键词在页面中的比重,以利于搜索引擎快速准确地抓取。另外格式化标签也尽量少用。页面布局应采用DIV+CSS模式并减少表格嵌套, 尽量不要使用很难被搜索引擎收录的IFRAME或Frame框架及对搜索引擎蜘蛛不友好的Flus等,并保持页面简洁,以利于搜索引擎的收录。

五、结语

目前各大搜索引擎都采用了Web结构挖掘技术中的PageRank算法,为了提升自身网站在各大搜索引擎中的排名,用户应使用Web结构挖掘技术来对自身网站进行评估,发现自身网站结构的不足,并对优化网站结构提供决策依据。通过采取有效措施,提高自身网站结构的合理性,从而提高网站在搜索引擎中的排名,以达到为网站带来更大流量,发掘更多有效用户的目的。随着电子商务迅猛地发展,企业更应该重视并采用这种被挖掘的技术,以提高自身网站的价值。

参考文献:

[1]何晓阳吴强吴治蓉:HITS算法与PageRank算法比较分析,情报杂志2004年第2期

[2]王晓宇周傲:万维网的链接结构分析及其应用综述,软件学报

[3]曹军:Google的PageRank技术剖析,情报杂志2002年第10期

[4]刘丽珍等:网络结构挖掘的关键分析.计算机应用研究,2003(5) 116-118