文献计量学论文范文

时间:2023-03-14 03:42:21

导语:如何才能写好一篇文献计量学论文,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

文献计量学论文

篇1

(一)我国中央银行的会计核算基础———收付实现制。

我国中央银行业务由于具有特殊性,所以会计核算采用的是收付实现制。一是应收利息、待摊费用等科目没有在表内设置。虽然设有“暂收款项、暂付款项”等科目,但其核算内容与企业会计具有不同的资金性质,其性质仅是临时性、过渡性的。二是再贷款、再贴现这类资产是根据国家执行货币政策的需要而操作和发放的。发行债券时也是按债券面值计价,所发生的各类费用直接计入当期业务支出列损益。三是对固定资产计价时,仅在购建时一次性列支,除规定的特殊变动外一般不做调整,存续期间也不计提折旧,清理时一次性核销原值。四是各项财务收入的确认,以我国中央银行实际收到的各项收入计入相应账户。五是所有支出全部纳入财务支出核算,财务支出不准预提虚列,一律据实列支。按国家有关规定制定费用开支范围及标准,上报财政部批准后实施。每一会计年度的本期收入减去本期支出、减去按照国务院财政部门核定的比例提取总准备金后,所得净利润全部上缴中央财政。六是固定资产只在表外计算折旧额。七是应收未收利息在表外反映。

(二)我国中央银行的会计计量属性———历史成本。

我国中央银行遵循历史成本原则对各项资产进行确认、计量,按各项财产取得时的实际成本入账,存续期间财产价值不做调整。历史成本计量主要体现在以下几个方面:一是外汇储备占款和贵金属不随价值变动和汇率波动定期调整账面价值,只按历史成本进行核算。二是再贷款按发放时的实际金额入账,不采用重估价值,不进行减值测试,不计提损失准备,对其应收未收利息不纳入表内核算,只在表外反映。三是固定资产按购建时成本计价,存续期间不计提折旧,只对规定的特殊变动原因做价值调整。四是有价证券的入账价值按实际支付的价款列账,溢价、折价不做摊销,存续期间不按市价法或摊余成本法对账面价值进行调整。五是国际金融组织资产按出资时实际支付的金额入账。

(三)我国中央银行现行会计标准的历史成因。

我国中央银行长期采用收付实现制作为会计核算基础和采用历史成本作为会计计量属性有其历史成因。收付实现制核算基础和历史成本计量属性的长期存在是由我国中央银行单位性质所决定的。我国中央银行作为行政性单位不以盈利为目的,对利润指标的重视程度远不及企事业单位。我国中央银行以防止国有资产流失为目标,更加注重资金使用的真实性,从会计信息的客观性和相关性角度出发,我国中央银行更偏重于会计信息的客观性。

二、我国中央银行现行会计标准质量现状

我国中央银行遵循收付实现制会计核算原则,实行独立的财务预算管理制度,实行“统一领导、预算管理、分级核算、统负盈亏”的财务管理体制。资产项目中外汇储备经营管理必须坚持安全性、流动性和盈利性的原则,再贷款、再贴现根据国家执行货币政策的需要操作和发放;负债项目均按实际发生额计价,发行债券按债券面值计价,发行债券发生的各种费用计入当期业务支出;财务收入项目的确认按实际收到各项收入后计入相应账户;支出项目全部纳入财务支出核算,财务支出一律按规定的核算内容据实列支,不得预提虚列。利润等于各项收入减去各项支出,利润按财政部批准的比例提取总准备金后,净利润全部上缴中央财政,净亏损首先由历年提取的总准备金弥补,不足弥补的部分由中央财政拨补。所有者权益全部由国家所有,未经财政部批准不得变动。财务决算报告年度终了后按规定期限逐级上报上级行和财政部派出机构。财务收支、会计事务接受国务院审计部门和财政部门的审计和监督。我国中央银行的现行会计标准虽然发挥了积极、有效的作用,但也存在一定问题。

(一)未跟进会计制度改革和金融全球化步伐。

2003年英国伦敦中央银行出版社对全球159个中央银行的会计实务调查表明,各国中央银行对国际会计准则是认同度高达82%,大多直接或间接采用了国际会计标准。2006年我国新颁布的会计准则实质上实现了与国际的趋同,相续颁布的金融机构会计准则也确立了权责发生制和公允价值作为会计确认基础的地位。伴随日益全球化的经济金融环境,我国国际经济金融活动的参与程度日趋频繁,我国中央银行与其他国家中央银行的交流也在不断增加,对各国中央银行会计标准的趋同性要求越来越高,如果差异较大将会造成会计信息的不可比性,直接形成交流障碍。

(二)与当前业务需求相比会计核算基础相对落后。

我国中央银行作为国务院组成部门、实行由政府主导的财务预算管理体制直接决定了收付实现制的核算基础,收付实现制能够实现年度预算安排与财务收支的有效配比。收付实现制虽然能够较好反映预算收支的执行情况,但是不能完整反映中央银行的资产状况。当前我国中央银行资产种类日趋多样化、市场交易日益频繁,仅采用收付实现制已经不能满足真实、完整、准确地反映中央银行全部资产状况的要求。

(三)不符合会计信息相关性和谨慎性要求。

我国中央银行持有相当数量的外汇储备、金银和有价证券,它们是有效执行货币政策的必要工具,上述资产的价格受国际、国内多项因素的综合影响,币种、供求、利率和汇率等的波动都将对其价格造成较大影响。对外汇储备、金银和有价证券等资产实际发生减值时,由于没有引入客观的计量方法,对其现行的真实价值无法准确衡量,从而减值准备也无法相应计提,实际价值会与账面价值产生严重不符时,隐藏了较大的财务风险。上述资产如仍按现行历史成本法计价,将导致中央银行这些资产的账面价值严重脱离其市场价值,这将不利于会计信息使用者做出决策判断。

三、我国中央银行现行会计标准的会计学选择方向

我国中央银行现行会计标准正在经历多项核算改革,借鉴国外中央银行会计准则,与国际会计准则逐步趋同,积极探索适合中国国情、能够真实公允地反映中央银行经营成果的会计标准是大势所趋。虽然这些年来我国中央银行已形成了一套较为完善的会计和财务准则,由于实行独立的财务预算制度和采用收付实现制会计核算基础,其会计反映和监督的能力目前远远不能满足新准则后的需求,完善我国中央银行会计标准势在必行。与现行国际会计准则以及国外许多中央银行执行的会计标准相比,我国中央银行会计标准还存在不足之处,亟待改进。

(一)合理借鉴发达国家中央银行会计标准。

随着经济一体化、金融全球化的发展,我国中央银行与外国中央银行、商业银行及其他金融组织的交流日益紧密,参与国际经济、金融活动日益频繁,正因如此,我国中央银行会计标准改革已势在必行。我国中央银行要高度关注国内外会计准则新动态,认真研究各国中央银行国际会计准则的运用效果,找准我国中央银行运用国际会计准则的切入点和范围,成功借鉴发达国家会计标准改革的先进经验,结合我国中央银行的实际情况和经济金融业发展的内在规律,明确我国中央银行会计标准改革的具体内容和发展方向,制定符合我国中央银行自身特点的新会计标准,并将研究成果积极运用到中央银行会计实践活动中去。借鉴国外中央银行会计准则经验,逐步靠拢国际会计准则,采用谨慎性原则,真实、公允地反映中央银行经营成果是中央银行会计标准改革的必然选择。

(二)制定中央银行会计标准改革制度支撑。

在借鉴国际会计准则、发达国家中央银行会计标准和我国企业会计准则的基础上,我国中央银行应制定一套适合我国国情又与国际接轨的新会计标准制度或准则。具体应从以下几个方面考虑:一是为准确计量各期间的成本和收益情况,引入权责发生制作为中央银行会计核算的基础;二是完善中央银行会计核算原则,引入配比性、实质重于形式等原则;三是根据资产持有目的不同,采用历史成本、重置成本、可变现净值、公允价值等多种计量属性计算资产价值;四是建立健全会计信息对外披露机制,保障会计信息披露的质量和有效性。

(三)我国中央银行会计标准改革具体设计

1.我国中央银行会计基础宜采用收付实现制和权责发生制并用的“二元结构”模式。

会计基础仅仅是一种计量标准,它脱离了会计体系这一整体,是不可能发挥出应有作用的。只有在有效的财务报告和政府会计制度框架设计下,应计制的应用才有其实际意义。目前我国政府部门尚未明确财务报告的范围标准,从成本效益原则角度出发考虑,我国中央银行完全采用权责发生制短期内尚不具备条件。因此,我国中央银行近期内还是采取以收付实现制为主,以修正的权责发生制为辅的“二元结构”模式为宜。

2.对跨年度结算财务资金业务采用权责发生制计量更科学。

在现行收付实现制下,我国中央银行跨年度结算财务资金业务如跨年度结算采购资金、工程款等,存在会计核算无依据、预提虚列和账务处理不真实等问题。采用权责发生制,增设“待清算支出”、“应付支出”等类似科目,核算当年已安排未支出或应付未付的款项,项目发生时直接从费用账户将相关费用转入。在下一年度实际支付时,直接做冲减“待清算支出”、“应付支出”账务处理,不再列支费用科目。在当前部门预算制下,这种做法我国中央银行可以更为科学的安排费用开支。

3.对再贷款业务计提减值准备,实施更为严格的监管手段。

我国中央银行应根据再贷款业务的风险程度大小,计提相应的减值准备,减值准备金额与风险大小成正比。对再贷款业务应根据不同种类定期进行风险评估,对不同类别再贷款业务存在的逾期或无法收回的风险程度大小做出评估,可参考借鉴商业银行贷款的五级分类标准做法,分别计提相应减值准备。由于我国中央银行发放的再贷款金额较大,如果计提减值准备则相应的计提数额会较大,减值准备计入当期损益会造成损益的巨大波动,不利于客观评价。考虑此因素,我国中央银行再贷款减值准备可计入权益核算。

4.暂缓对固定资产计提折旧,保持现有固定资产会计核算方式不变。

篇2

>> 国内知识检索研究的文献计量学分析 国内钠离子通道研究现状的文献计量学分析 我国电子文件元数据研究的文献计量学分析 2000-2010年国内信息共享空间研究文献计量学分析 国内心理治疗效果的文献计量学分析 对国内“压力”主题体育类论文的文献计量学分析 办公自动化与电子文件研究文献计量学分析 电子商务网站评价研究 医院文献计量学分析及创新能力研究的启示 语义网应用研究的文献计量学分析 1900~2010年农业发展研究的文献计量学分析 基于文献计量学分析的我国酸枣研究现状 我国档案服务体系研究的文献计量学分析 我国学习倦怠研究现状的文献计量学分析 2003年~2012年我国档案学对电子政务研究的文献计量学分析 中医体质文献计量学分析 农业标准文献专业分布与热点领域的文献计量学分析 国内焦虑症文献计量学研究 高校二级学院党政联席会研究现状的文献计量学分析 胚胎干细胞研究文献计量学分析 常见问题解答 当前所在位置:

[3]周述文,郭晓军,孙爱平,汤海洪.电子商务网站的分类及评价初探[J].中国管理科学,2000,S1:748-754

[4]蒋颖,金碧辉,刘筱敏.期刊论文的作者合作度与合作作者的自引分析[J].图书情报工作,2000,12:23-28

[5]汪传雷,潘珊珊,熊月霞.2007-2011年国外企业孵化器文献计量分析[J].铜陵学院学报,2012,03:11-14

篇3

[关键词] h指数 文献计量学指标 机构学术评价

1 引 言

文献计量学的方法可以把复杂现象简化为指标及相关数据,从而可以对研究活动进行数值上的客观比较,能得到客观可信的定量的评价结果。在文献计量学中,科学家或科研团队的学术成果主要体现在发表学术论文的数量和学术论文的被引频次两个方面。论文的数量和论文被引的频次本身包含了很多有用的信息,从中可以获得科学家或科研团队n年发表的论文数量、每篇论文得到的引文数、的期刊以及期刊的影响参数等。而且,不同的人会使用不同的标准对科学家或团队的研究活动进行评估。

2005年,美国物理学家J.E. Hirsch 提出一种新的非常简单有效的数字指标——“h指数”,用以评价科学家个人的学术成就。Hirsch将h 指数定义为:“一个科学家的分值为h,当且仅当在他/她发表的Np篇论文中有h篇论文每篇获得了不少于h次的引文数,科学家剩下的(Np-h)篇论文中每篇论文的引文数都小于h次”[1]。 h指数作为引文影响力和论文产出力二者结合的新的评价指标,Hirsch 认为h指数优于其他一般用于评价科研人员学术成果的传统的单项指标[1]。他认为论文总数可以直接测度科研生产力,但不能测度论文的重要性和影响力;被引总数可以测度论文的总体影响力,但论文的被引次数不太容易找到,作者的影响力可能被少数重要的合作论文夸大,这些合作论文有可能是与许多其他作者共同完成的,因此并不代表作者的实际影响力,同时,该参数往往不能恰当分配被引次数较高的评论性文章与原创性研究成果的权重;篇均被引次数可以比较不同时代科学家的影响力,但数据不容易获得,容易造成奖少惩多。Hirsch认为h指数可以避免上述所有缺陷。

h 指数的绝妙之处,就在于它具有制衡被引频次和论文数量两个指标的特点。因此这项指标确实在一定程度上能够弥补传统的文献计量学指标在学术评价中的局限性。鉴于此,该指标一经问世,立即引起学术界的广泛关注。2006年,h指数的数学模型被建立[2-3],独立的类h指数-g指数也被发现[4],使h指数和类h指数的研究成为信息计量学的前沿研究领域,并显示出了发展成为下一代核心评价参数之一的可能性,因而及早对h指数和类h指数进行系统研究具有重大现实意义和学术价值[5]。

Hirsch 教授提出h指数的初衷是为了衡量科学家的个人学术成就,但h指数并非只限于评价科学家个人,也可以评价一个科研团队、一种学科或一所大学、一种学术期刊、一个地区或国家等群体[1]。利用h指数进行大学以及学科的评价时,显现出其他计量指标所不具有的特点。因而大学h指数显现出什么样的特点、h指数与传统文献计量指标是否存在相关性以及h指数对大学学术成果评价的可行性是值得探讨和研究的问题。

2 方法与数据

本研究以2009年上海交通大学的Academic Ranking of World Universities (ARWU)为依据,选取排名前100名的大学以及医学、生命科学、物理和化学4个学科排名前50名大学学科发表的国际论文作为分析样本价值[6],并以Thomson Scientific 制作的ISI Web of Science平台中的科学引文索引扩展版( Science Citation Index Expanded,SCIE) 、社会科学引文索引( Social Sciences Citation Index,SSCI)和艺术与人文科学引文索引(Arts & Humanities Citation Index,A&HCI)三大引文数据库为来源数据库,统计作为研究对象的每个大学及学科的论文总数和被引总数,并计算了h指数和篇均被引次数。

挑选上海交通大学ARWU中的大学作为实证研究对象,原因有两个:①ARWU的排名过程完全透明。ARWU以国际可比的科研成果和学术表现作为主要指标,采用可以验证的客观数据,进行全球性的大学排名,所采用的排名方法和数据来源完全透明,所有信息都公布在排名网站上(省略)。学术排名每年一次,其排名指标体系保持了较好的稳定性,大学名次的变化完全取决于它们在不同年份的表现。②排名受到广泛关注。自2003年开始排名结果以来,其以评价体系的客观和透明引起了国际社会的广泛关注[6],美洲、欧洲、澳洲等主要国家的主流媒体、欧盟等一批机构以及加州大学等一批世界名校进行了报道或引用。各国政府、大学从该排名出发,分析对比本国、本校的情况和发展态势,并在此基础上制定战略规划,采取各种举措促进一流大学建设。

篇4

具体的数据采集方法是:登录中国知网首页,点击“评价”进入评价中心,选择“中国学术期刊国际国内影响力统计分析数据库”,并输入用户名和密码,点击“登录”,对18种综合类农业学术期刊的下载量逐一检索并汇总。需要说明的是该数据库只提供2006年至今各期刊的下载量统计值,因此,本研究的下载量半衰期的统计数据是2006年至2015年的数据。其它文献计量学指标,如复合他引影响因子、期刊他引影响因子、复合即年指标、期刊即年指标、基金论文比、引用半衰期、被引半衰期、Web即年下载率、总下载量等,均是来源于《中国学术期刊影响因子年报(自然科学与工程技术•2016版)》。

2期刊下载量半衰期计算方法

期刊下载量半衰期是指某种期刊的所有论文被下载的总次数中,较新的一半是距离发表当年多长一段时间内累计达到的,其计量单位为年其中:HD是指所求的下载量半衰期,X为累计百分比小于且最接近50%的年份序号(统计当年年份序号为0),A为统计年至X年的下载量累计百分比,B为统计年至X+1年的下载量累计百分比。以《中国农业科学》为例(表1),其具体算法如下:HD=2+(50%-49.77%)/(61.29%-49.77%)=2.02003数据处理和分析方法采用的统计学处理软件为spss18,下载量半衰期、引用半衰期和被引半衰期数据正态性检验采用单样本Kolmogoro-Smirnov检验,三者的差异性比较和多重比较分别采用单因素方差分析和LSD检验。各指标间的相关检验采用Spearman等级检验,检验水准α=0.05。

3综合类农业学术期刊

2015年下载量半衰期及其他文献计量学指标的比较据统计,18种综合类农业学术期刊的总下载量达170.66万次,Web即年下载率为44次/篇,基于下载量的半衰期HD(Half-lifePeriodofDownloads)的范围是2.0359~3.4167年,极差为1.3808年。由附图可知,在被统计的18种期刊中,2<HD<2.5的有4种,2.5<HD<3的有8种,HD>3年的有6种,可见有44.44%的期刊HD集中在2.5~3年之间,有33.33%的期刊HD分布在3~4年之间,其中以《华南农业大学学报》的HD值最高,达3.4167年。

4下载量半衰期与引用半衰期和被引半衰期的比较

引用半衰期的范围是7.2~9.1年,均值和中值分别为8.261、8.200年;被引半衰期的范围是5.1~10.4年,均值和中值分别为8.317、8.850年;下载量半衰期的范围是2.02~3.4128年,均值和中值分别是2.8560、2.9185年,可见引用半衰期和被引半衰期的值均明显高于下载量半衰期,平均高出5~6年。该结论符合人们引用文献的习惯。如在综合类农业学术期刊中较有影响力的《中国农业科学》,其下载量半衰期为2.02年,被引半衰期为7.0年,相差5年左右,说明《中国农业科学》的文章从被读者下载到被学者引用大约需要5年的时间。在互联网快速发展的情况下,文献被引用从下载到引用,需要一定的沉淀,而下载是整个过程的开始,也是最能较快反应期刊以后被引情况的重要指标,因此,该指标被用于期刊评价时具有较强的时效性。

篇5

阅读本作,感到有以下特点:

1 研究视角新

科学计量学研究专著,在中国从上世纪80年代中期赵红州的《科学能力学》第二篇,到90年代初,谷兴荣先生《科学技术发展的计量研究》出版发行,至今已有相当一批科学计量学学术成果。但绝大多数专著都是运用文献计量学的方法进行研究。谷先生对它的整体结构功能规律进行探讨,采用的是计量经济学与数理经济学的研究方法。谷兴荣认为:用文献计量学研究科学计量学主要是研究科学技术的文献资料的分布结构和结构变化规律,这只是科学计量学研究内容中的一部分。另外还有科技机构、科技人员、科研经费的分布结构和演变规律问题,社会环境、科技经费、科技人才与科技成果的数量、质量之间的因果关系,科技发展对经济社会的影响关系,这些内容的研究是文献计量学方法不能解决的,只有计量经济学方法能解决。反过来,计量经济学、数理经济学的方法可以研究科技文献与科技成果的分布问题。而且,年轻一代的管理学者,运用经济数学与管理数学方法写了不少科学学与科技管理的计量研究论文。可见这是一个大的发展方向,谷先生在本作中概括出一个庞大而系统的论著是有重要意义的。

2 观点新,创新程度大

此专著运用计量经济学方法,对科学学与科技管理的结构、功能、发展规律等提出了一系列的理论观点,并用数学方法给予表述。在第34页把全书的基本论点的来源列了一张表。从表中可见,全书共有61个论点,其中,由本书作者在过去首次提出,并且先后以论文形式发表过的有42个论点,占68.8%;吸收其他学者的论文论点有19个,占31.2%。由此说明本书作者对科学学与科技管理计量研究的理论创新程度是相当大的。而且,多数论点都是有理论与实际意义的基本理论问题。比如:科学技术区际结构三大发展规律(两极分化、梯度转移、中心转移规律)的统一性原理等等,提法新颖,论证清晰, 很有意义。

3 内容广泛,涉及到科学学与科技管理领域多方面的基本理论问题

任何学科都是讨论研究对象的结构,外在表现形式和自身活动的方式,活动功能、演变和发展规律三个问题,此专著对科学技术体系各方面的结构和结构演变规律都作了详尽的定量探讨,如科技研发的要素结构及其演变机制,科学技术的门类结构、学科结构、知识结构、区际结构及这些结构的演变规律,以及这些结构的内在各部分的弹性替代关系等。这部分内容将近30万字,是目前科技结构研究中最广泛最详细的研究成果之一。

关于科学技术的运作方式、运作机制和经济社会功能与研究效益问题,从五个方面写了近15万字。包括科学技术发展的三大动力机制,科学技术与经济的链锁关系与替代关系,科学技术的社会经济功能及作用规律的定量研究,科学技术的社会经济功能及作用规律的定量研究,科学技术研发效益的历史变化规律等,都进行了系统的量化分析。

在科学技术的传播、渗透、转化发展及其评价方面, 分为五个方面写有20多万字。包括科技传播与渗透效应的几个问题研究, 科技发展与科技转化的质量指标和质量诊断问题, 科学技术发展历史规律与新陈代谢机制的定量研究; 科学技术活动的三大基本法则与行为边界的定量研究; 科学技术评价的四大指标与四大环节, 四大指标即数量指标, 质量指标, 效益指标和综合指标。四大环节即指标的选取与选取标准环节, 指标分类环节, 指标的组合建模环节, 指标的测算与检验环节等, 都作了全面的量化研究。

由此可见, 本作是科学学与科技管理领域中涉及面较广的大部头基础研究成果之一。

4 内容的系统性与逻辑性强,全书结构有科学性和合理性

由于研究时间较长,内容较多,相互之间已经构成了完善的理论体系。从编的层次看,第一编是讨论科学技术结构及其演变规律,是科学技术的横向结构,以及横向结构在科学技术发展中的变化。第二编讨论科学技术运行发展的机制和社会功能,前者是横向的,后者是纵向的。但都是指科学技术体系内在各部分之间的空间结构和各部分之间的时间依存关系和变化关系。第三编讨论科学技术传播发展与评价理论,这是科学技术体系的整体性发展规律,科技发展状态和科技活动结果的测评,与第一、二编相对应。每一编的各章之间,每一章的各节之间等都具有互为联系的系统性,相互间有较强的逻辑性。

5 计量分析的普及面较广,定量分析的程度较高

篇6

[关键词] 共词分析 专利引文分析 知识关联

[分类号] G255.53

1 科学―技术知识关联的概念

“科学―技术知识关联”是近年来专利计量学领域的重要研究内容之一,在Scientometrics、World PatentInformation等权威期刊的相关文献中通常被表述为Science Technology Linkage、Science Technology Interac-tion、Science Dependence of Technology。研究科学一技术知识关联的意义在于:通过揭示哪些基础研究学科与哪些技术发明领域之间存在知识关联,预见二者间可能的推动或启示作用,从而为国家创新体系的管理者提供科技资源配置方面的决策参考,以便目标明确地扶持更具产出能力的基础学科,发掘已具备基础储备的未来技术创新领域。

2 揭示科学一技术知识关联的各种途径和方法

目前,揭示科学一技术知识关联的途径多种多样,不同学科都在为此作出各自的贡献。

在科学社会学和技术社会学视野下,研究公共基础研究机构(公共科研院所、研究型大学、国家重点实验室)与企业的合作研发活动,是揭示科学一技术知识关联的有效途径。技术社会学认为,公共基础研究是技术变迁过程的基本要素,它通过提高社会整体创新水平间接推动企业的开发活动。科学社会学的双螺旋理论(Double Helix Model)认为,科学与技术是一对舞者(a pair of dancer)的关系,二者在相互推动下呈螺旋状上升发展。基础研究与技术开发之间的知识交互过程和合作活动是实现技术突破的能量储备过程,是实现技术跃迁的重要前提。文献[1―3]通过统计大学及公共基础研究机构与企业的合作研发活动,揭示了激光、分子生物学等领域的科学一技术知识关联、知识扩散和成果应用情况。

在技术经济学视野下,挖掘基础科研机构和技术开发机构(各类企业)在地理空间分布上所表现出的关联规则,是揭示科学一技术知识关联的又一途径。技术经济学认为,区域经济管理者在制定科技政策时,通常会从有利于本地经济和技术发展的角度出发,利用基础科研对本地技术创新的影响,在同一地域范围内统筹规划创新型企业和基础科研机构,从而构建起两者间知识关联和转移的通道。基于上述技术经济基础,基础科研机构和企业的地理邻近性与两者间的知识关联和转移强度之间通常会表现出明显的相关性。文献[4―6]分别通过研究美国、法国、东欧范围内基础科研机构和创新型企业的地理空间凝聚现象,揭示了对应的科学一技术知识关联和知识转移强度。

在科学计量学和文献计量学视野下,解析科研期刊论文与技术专利文献间的关联关系,也是揭示科学一技术知识关联的另一途径。科学计量学家Verbeek认为,企业创新人员对科研文献的理解、认同和利用是引发科学一技术知识关联和最终造就技术转化的关键环节。Garfield指出,发明不可能来源于魔术或真空,它是发明人对若干已有的概念进行重新组合的知识成果。Narin等认为,几乎所有的科技成果都是在前人工作的基础上发展起来的,知识的关联性在专利引文中有着明显的体现。科研期刊论文与技术专利文献之间的共词关系和引用关系是新知识向技术部门转移的显性表现。

3 利用共词分析法揭示科学一技术知识关联的局限

共词分析法以某一(或一系列)主题检索词(科学概念或技术术语)为“关联点”,分析该词在科研论文和专利说明书中的“共现”情况,从而推理和判断基础科学学科与技术创新领域之间关联关系的方法。共词分析法直观、有效,但同时也存在着明显的问题和局限。

3.1 科学概念与技术术语之间存在部分不对应问题

尽管INSPEC和INPADOCDB等词表能够提供某一科学概念和技术术语的多种词汇表达,但它们不能解决“部分科学概念与技术术语不对应”的基本矛盾。例如:专利说明书中的技术术语thin film(纳米绝缘薄膜)及其同义术语ion sol-gel(离子溶胶凝胶)、polyerys-talline film(硅多晶薄膜)等在科研论文中并没有绝对对应的概念,通常只能被近似地映射为chemical vapordeposition(化学气相沉积)、carbon nanotubes(纳米碳管)、amorphous nitride(无定形氮化膜)等词汇形式。

3.2 同一概念术语在科研论文和技术专利中的表达方式各不相同

科研论文中的化合物名称在专利说明书中往往以分子式、化学键结构式或马库什结构式(Mm-kush strue-ture)表示,例如,pantoprazole作为一种常用的抗溃疡药物的化学名称常出现在科研论文中,但在专利说明书中这一词汇很少出现,取而代之的是其马库什结构式,如图1所示:

3.3 专利技术的核心特征词难以被确定

科研论文由作者给出关键词,指明论文的核心知识概念,但专利说明书中没有“关键词”,发明人没有归结出专利的核心技术特征。目前的共词分析主要依据“词频”和词出现在专利说明书中的“位置”来间接推断某术语是否表达了技术的核心特征。但核心特征词的“词频”的分布阈值和词出现在专利说明书中的什么“位置”能否代表技术的核心特征也还是一个争论性话题,如有人重视“标题”、“摘要”位置,也有人重视“权利要求条款”位置。

3.4 语种差异有时会引发技术术语缺失

例如,中国专利中的中医治疗方法专利和中药配方专利所涉及的人体穴位和草药名称等都没有对应的英语词汇。

目前,上述问题都还没有有效的解决方案,这就局限着共词分析法在揭示科学一技术知识关联方面的效度和信度。

4 利用专利引文揭示科学一技术知识关联的优势

本文所讨论的专利引文主要是指专利说明书所引证的相关科研期刊论文。Jaffe等将“专利引文分析法”(patent citation analysis)定义为:利用各种数学与统计学的方法,对专利引文进行分析并揭示其中存在的数量特征和内在规律的方法。1994年Narin首创了“专利计量学”(Patentbibliometric)并构建了专利计量指标(Science Linkage,sL),用以度量技术发明与基础研究之间的关联强度。利用专利引文揭示科学一技术知识关联的方法,以专利引文为纽带,通过专利说明书对科研期刊论文的引证映射,揭示对应的基础研究学科与技术创新领域之间的知识关联,其基本原理如图2所示:

篇7

按照《教育部学科门类、一级学科、二级学科目录》,公共卫生与预防医学的二级学科为:流行病与卫生统计学、劳动卫生与环境卫生学、营养与食品卫生学、儿少卫生与妇幼保健学、卫生毒理学、军事预防医学等。笔者对2006年-2010年间我国部分地区高校公共卫生与预防医学二级学科科技论文统计与分析的文献简要评述如下。

目前,国内外对于2006年-2010年期间,我国高校公共卫生与预防医学二级学科的科技论的统计与分析比较少,仅有山西医科大学孔瑞珍的学位论文《高等院校公共卫生与预防医学科技论文产出的综合评价》对筛选出的27所高校在2003年—2007年间产出的科技论文,经秩和比法逐年统计分析后得知,北京大学、四川大学、复旦大学、华中科技大学等高校具有较高的论文产出能力,提示这些高校在公共卫生与预防医学学科方面具有较强的科研能力,成绩突出。对27所高校预防医学下属二级学科的科技论文产出数量运用秩和比法统计评价后,得出了在各二级学科方面各大学的科研情况以及优势所在:流行病与卫生统计学以第四军医大学和复旦大学为优,劳动卫生与环境卫生学方面复旦大学和华中科技大学表现突出,营养与食品卫生学是第三军医大学和中山大学名列前茅,儿少卫生和妇幼保健学以华中科技大学和安徽医科大学最强,卫生毒理学突出的是第三军医大学和吉林大学[1]。在进行横向比较后发现,各高校5年间每年的论文产出数量相对起伏不大,但高校在各学科的论文产出能力并不均衡,需要发挥所长,弥补不足,既要全面发展,也应重点突出。

其他文献主要是对以某地区的卫生机构或某一高校的公共卫生与预防医学进行研究,例如:温州医学院图书馆赵丽红的《2002-2007年温州医学院医药卫生科技论文产出的计量分析》一文中应用文献计量学的科学方法,对2002-2007年温州医学院(温医)教师在国内生物医药期刊上发表学术论文及SCIE收录国际论文进行定量研究,提供各项指标的统计数据和测评结果。文中利用中国生物医学文献数据库和美国《科学引文索引》按照论文机构分布、论文作者分布、载文期刊分布、基金资助项目产出论文情况统计分析等,得出2002-2007年间,温州医学院国内发文和SCIE论文量均呈现出显著增长的趋势,在数量上和质量上均有很大程度的提高,但就目前而言,与国内一流医学院校尚存在一定的差距[2]。浙江省医学情报所的舒畅和《移植杂志》编辑部的沈敏共同完成的《浙江省各地区医学科技论文计量分析》一文中用中国生物医学文献光盘数据库(CBMdisc)对浙江省11个省辖市在2002-2007年发表的生物医学文献进行统计,按照11个省辖市的总量、省辖市在核心期刊上发表的文献量、11个省辖市排名前五位的学科等进行统计,根据统计结果对浙江省各地区的生物医学水平进行分析,发现浙江省生物医学水平有长足的进步,但地区发展不均衡的现象十分明显,尤其是省属单位占居了主导地位,市级医疗单位难以与他们竞争,该文对以后这些地区的发展提出了建议。

篇8

        1、核心期刊与统计源期刊

         对某一主题而言,将科学期刊按照其登载相关论文数量的减序排列时,可以分出对该主题最有贡献的核心区以及论文数量与之相等的几个区,位于核心区的期刊称为核心期刊。广义的统计源期刊是指被各类检索系统、数据库等收录而作为其文献统计来源的期刊。

       《总览》是国家社会科学基金项目“学术期刊评价及文献计量学研究”的子课题———中文核心期刊评价研究的成果,研究人员采用文献计量统计与定量评价,同时结合学科专家对定量评价结果的定性评审形成最终研究成果。《总览》所确定的核心期刊表在国内具有较强的权威性,应用范围比较广泛。

       《报告》是按照美国科学情报研究所(ISI)《期刊引证报告》的模式,结合中国期刊发展的实际情况,确定了在中国出版(不含港、澳、台)的1576种(2004年版)科技期刊列为《中国科技论文统计源期刊》,又称为中国科技核心期刊,学科范畴主要为自然科学领域,是目前国内比较公认的科技统计源期刊目录。因其受科技部委托,带有官方色彩,权威性名列国内首位,人们习惯称其为“统计源期刊”,下文所说统计源期刊即指此目录。

        2 、《总览》与《统计源期刊》的相同点

        2.1、理论依据相同:两者都以加菲尔德引文分布规律与布拉德福分布规律为理论依据,因此可以认为都是经过严格的文献计量学标准而获得的核心期刊。

        2.2、均采用多指标的定性、定量评价指标体系:2004年版《总览》采用定性与定量相结合的方法,其中定量评价指标体系由7 个评价指标组成。2004《统计源期刊》评价计量指标选择了期刊引用计量指标与来源期刊计量指标两部分共15项指标。

       2.3、两者研究成果均不能作为金标准使用:核心期刊与统计源期刊都是一种相对统计的概念,由于文献计量学理论的局限性、数据采集的不完整性以及统计方法的不全面性,都会使评价出现这样那样的缺点和不足,其研究结果不可能像自然科学那样精密,因此两者只能起参考工具作用,不能作为检验期刊质量的“金标准”,过分夸大其作用只会带来负面影响。

       3、《总览》与《统计源期刊》的区别:

       3.1、编辑出版单位不同:《总览》由北京大学图书馆与北京高校图书馆期刊工作研究会联合研制而成,属于民间性质;而《统计源期刊》由国家科技部委托中国科技信息研究所完成,具有一定官方性质。

       3.2、学科分类原则不同:两者都采用分学科统计评价指标数据的方法。学科划分对期刊评价结果影响很大,学科划分过大,小学科学术性强的期刊会被淹没;划分过细,小学科的一般性期刊就会进入核心区。《总览》基本依据《中国图书馆分类法(第4版)》划分学科,同时考虑学科期刊的数量、期刊性质等多种因素,共设学科类目74个。《统计源期刊》则根据国家技术监督局的学科分类国家标准和《中国图书资料分类法(第4版)》的学科分类原则,同时考虑综合性期刊情况及各学科期刊数量与学科性质差异,增设了综合类和理工大学、工业综合类、管理学类,对农业学科及医药卫生类学科作了进一步细分,共设55个学科类目。

        3.3、期刊的来源与范围不同 《总览》以52种数据库或文摘刊物作为评价指标统计源,统计文献量总计达943万篇,涉及期刊1.2万种,通过多指标综合评价的定量评价方法及定性评价,取各学科专业期刊数量的15%和进入统计的期刊数量的2%,共评选出1798种核心期刊。覆盖的学科范围广泛,包括社会学科(社会学、政治、法律、军事、经济、文化教育、历史等)与自然学科(医药、农业、工业技术等),但未收录港、澳、台及国内出版的英文刊物。

        《统计源期刊》来源期刊的选择综合参考了国外重要检索数据库收录国内期刊的情况及国内已有文献计量分析成果、国内大型检索工具、各学会学报及其重要期刊等各种期刊表,并征询了专家意见,每年根据期刊文献的被引用情况等因素对来源期刊表进行一定的调整。期刊入选原则是:①期刊文献的同行评审;②期刊文献计量指标;③期刊的社会和学科影响;④期刊文献是否反映了本学科的研究成果;⑤照顾新兴学科和高技术学科;⑥ 适当的地区性考虑;⑦在国际和国内的显示度。《统计源期刊》仅包括国内出版的科技类期刊,包括国内出版的英文刊物,但不包含社会学科期刊。

        3.4、评价指标体系不同:《总览》采用定性与定量相结合的方法,核心期刊选择了52种数据库或文摘刊物作为评价指标统计源,评价指标体系由7个评价指标组成:被索量、被摘量、被引量、他引量、影响因子、被摘率、获奖或被重要检索工具收录。专家定性评审力度大,共选聘1871位评审专家参加了核心期刊的评审。而《统计源期刊》定性评价力度相对小,虽然经过一定的同行评审,但以定量研究为主,强调研究结果的客观性。2004年评价计量指标选择了两部分共15 项指标:①期刊引用计量指标:总被引频次、影响因子、扩散因子、引用期刊数、即年指标、他引率、被引半衰期。主要显示期刊被读者使用和重视的程度,以及在科学交流中的地位与作用。②来源期刊计量指标:来源文献量、参考文献量、平均引用率、平均作者数、地区分布数、机构数、国际论文比、基金论文比。通过来源文献的统计分析,全面描述该期刊的学术水平、编辑状况和科学交流程度

         3.5、收录期刊数量:

         《总览》核心期刊表收录期刊总数1798种,其中生物科学类44种,医药卫生类223种。《统计源期刊》收录期刊总数1576种,其中生物科学类51种,医药卫生类423种。223种生物医学期刊既是《总览》中确认的核心期刊,又是统计源期刊。两者在特种医学、耳鼻咽喉、皮肤、神经病学与精神病学、肿瘤学、儿科、妇产科、口腔医学、外科、皮肤与性病等学科类目中所收刊种完全一致。

         3.6、出版周期不同 《总览》每4年出一新版,出版时间比数据统计大约滞后2.5年,反映期刊变化不够及时。《统计源期刊》每年更新,能够较快反映期刊发展动态。

         3.7、对综合性学科与边缘性、交叉性学科期刊评价效果不同,由于《总览》是分学科评价的,因此综合性和交叉学科期刊会因为刊载的论文学科分散而难以进入核心期刊表。2000年版开始通过增加综合性学科类目,将综合性期刊分散在各学科的数据汇总一起进行评价,产生综合性核心期刊表,较好解决了综合性期刊问题。但边缘性、交叉性学科的优秀期刊进不了核心区的问题仍未能很好解决。

       《统计源期刊》选择入选期刊时给新兴学科和高技术学科一定考虑,并适当照顾期刊的地区性。因此诸如《中华男科学》、《颈腰痛杂志》、《循证医学》、《中华航海医学与高气压医学杂志》、《中华老年多器官疾病杂志》、《听力学及言语疾病杂志》等边缘性、交叉性学科期刊能入选统计源期刊。

篇9

[关键词]信息计量学 网络计量学 文献计量学

[分类号]G350

1 引言

“信息计量学(Informetrie)”这一学科名称首次由德国学者O.Nacke在1979年提出,与之对应的英文术语“Informetrics”则最早见于1980年美国科学基金会公布的年度研究项目的标题中,并随后得到了国际文献联合会的认可。1984年,B.C.Brookes撰文提出要大力发展信息计量学,并就信息计量学的一些基本理论问题进行了较详细的论述。1987年,在第一届“文献计量学与信息检索理论”国际研讨会上,布鲁克斯又提议将术语“Informetrics”补充到第二届会议的名称中去,得到了与会学者的普遍赞同,自此每两年举办一届的国际学术会议及其出版的会议论文集都在名称中使用了“信息计量学”。1995年起,会议名称被正式确定为“科学计量学与信息计量学国际会议”,由“国际科学计量学和信息计量学学会”(ISSI)负责主办。1997年,T.C.Almind和P.Ingwersen首次提出用“Webometrics”一词来描述将传统文献与信息计量学方法应用于WWW信息计量研究,使信息计量学的研究活动拓展到了网络空间。2007年1月,由L.Egg―he担任主编的《Journal of Informetrics》创刊,为新世纪更趋繁荣的学术研究提供了独立和更加专业化的国际学术交流平台。

从1979年学科名词的提出,到1987年成为国际学术会议的主题、奠定自身的学科地位,再到1997年“Webometrics”的出现,信息计量学终于从早期对文献计量学和科学计量学的依赖、继承与交流中获得了长足的进步,并在21世纪的网络化环境中开辟出更为广阔的学科发展空间。本文试图对新世纪以来信息计量学的研究活动进行较为全面的概括和评述,但限于篇幅,重点讨论的内容主要包括信息计量学在理论、方法和应用方面取得的重要研究进展,以及当前所面临的问题与挑战。

2 理论研究进展

2.1网络信息计量学研究的全面推进

自1997年“Webometrics”被提出后,基于Web的网络信息计量问题即广受关注。根据作者对中国期刊网全文数据库(2000―2008年)的文献调查,在以“信息计量学”为标题关键词的检索结果中,超过90%的中文文献都是关于网络信息计量的内容。而在2007年4月对Web of Science数据库进行的国外文献调研中发现,网络信息计量主题的核心文献数量呈现逐年激增趋势,其中高品质的学术文献约占18.5%,被同行引用的次数普遍超过了30次。可以说,网络信息计量领域的确立及各项研究活动的全面推进,已成为新世纪以来信息计量学理论研究取得的一个最令人瞩目的重要成就。

目前,大量的网络信息计量研究活动又以“网络链接分析”为中心议题。由于网络链接与传统学术期刊文献之间的引用关系具有某种天然的相似性,研究人员不仅将文献计量学的引文分析思想广泛移植、应用到了网络信息计量研究中,而且赋予了相应的研究工作和成果以极其鲜明的引文分析“烙印”。这种“烙印”从以下网络计量指标的设计和使用上即可得到充分的印证,例如“Sitation”、“Web Impact Factor”、“Webcoupling”、“Co-citation”、“Co-link”、“Co-authorship”、“Self-linking”、“Self-linked”等。另外,在具体的研究成果方面,例如网络链接分析与引文分析的异同、网络链接的目的与类型、网络影响因子的定义与应用、核心网站测定等,也都表现出了与传统引文分析的紧密映射关系。

除借用引文分析法外,近年来网络链接分析开始采用另一种重要研究方法――来自社会学的社会网络分析(SNA),并在具体应用中取得了一定进展。

随着研究活动的深入,Web环境下更多更具挑战性的信息计量问题正在不断被提出,并赋予信息计量学新的研究使命。例如,(具商业价值的)网络流量分析及其软件工具的研制;各种网络用户行为(例如浏览、查询、下载、标注、订阅等)的跟踪、计量与分析;虚拟社区(包括成员角色、社区结构、主题/话题及其态度/倾向性等)的发展、监测和演变趋势分析;网络空间的知识结构及相关站点群落的识别等。面对这些问题与挑战,信息计量学的研究内容将更具交叉性和丰富性。

2.2“信息基本循环图式”的构建及对信息计量学理论基础的探讨

1967年,布鲁克斯曾将情报学的研究任务抽象为如下的基本知识方程:K[S]+I=K[S+S]。2005年,国内学者王宏鑫基于该知识方程,提出“信息基本循环图式”的构建:

图式中各元素含义分别是:W表示人们认识和改造的对象;K’[S]表示社会/他人的主观/客观的知识结构;K[S]表示个人/团体的知识结构;I表示个人/团体从社会实践活动中得到的信息;而K[S+S]则表示吸收I后形成的新的知识结构;“+”表示作用与联系。

这一“信息基本循环图式”的提出,不仅具有较为完善的哲学基础和情报学理论基础,而且为研究人员对信息计量学逻辑起点的认知与理解以及规范、定义、预测信息计量学的研究内容、研究方法、发展方向、学科增长点等提供了较为有效的观察视角。此外,该信息基本循环图式对于形成信息计量学更加多元化的研究范式也很具启发性。例如,可据此分别从传播学、认知科学、经济学、决策学等不同视角展开相应的研究工作。

3 研究方法/工具的集成与创新

在长期的发展过程中,信息计量学逐渐建立了三大核心研究方法:指标计量法、引文分析法和数学模型法。其中,指标计量法简单实用,通过统计某一项或多项指标的数量(累积)值,经数学处理后即可得出不同指标值的关系或指标值的频率、时间等分布规律;引文分析法形成于20世纪50年代,它通过对科学文献之间存在的引用与被引用现象的分析来揭示文献集合的数量特征和内在规律,是信息计量学独有的高效研究方法;而数学模型法则是现代科学的核心方法,并成为研究各种复杂系统和社会问题的关键性方法。在信息计量学中,对“布-齐-洛分布”问题已基于数学模型法取得了一系列重要研究成果,包括:西蒙的斜分布函数组(1955年);普赖斯的累积优势分布(1976年);布鲁克斯的混合泊松模型(1977年);西切尔的通用逆高斯-泊松分布模型(1982年);巴瑞尔的贝塔-负二项分布(1988年);布克斯坦的经验负幂分布(1990年)

等。它们对于完善信息计量学的理论基础,有效解释、预测文献流、信息流的变化及相关现象均具有重要的理论意义。

进入新世纪以来,信息计量学在研究方法和研究工具方面不断取得新的进展,以下主要从4个方面进行说明。

3.1对传统研究方法的综合与集成

不可否认,每一种研究方法都有自身的优缺点。以引文分析法为例,由于文献引用具有一定的滞后性,通过文献之间的共引关系来研究、分析学科发展的前沿与热点问题时,结果很可能会有所遗漏;而随着作者合著现象的日益普及,只针对第一作者进行作者共引分析,研究结论的失真程度也将会日益严重。因此,在近期所进行的文献引文分析研究中,研究人员已越来越多地考虑将多种不同的引文分析方法加以综合利用,例如把共引分析和文献耦合分析、共词聚类、词频统计等方法结合起来;或者同时运用第一作者共引分析和全作者共引分析等。

由于不同方法之间的较强互补性以及不同方法形成结果的可比较性,多种方法的综合运用和集成可以得到更准确可靠的研究结果。调查发现,国内外近年来进行的引文分析研究中,基于不同引文分析指标、集成多种不同引文分析方法的文献占据了大多数,引文分析已进入了一个具有更大规模和复杂性的研究阶段。

3.2社会网络分析方法的引进

社会网络分析(SNA)是20世纪70年代以来在社会学、心理学、人类学、数学、通信科学等领域逐步发展起来的一个新的研究分支。作为一种新的方法论和研究范式,SNA主要使用社群图、矩阵等形式化表达工具和所定义的中心性、权力指数、聚类簇/派系、网络结构、社会角色等基本概念(或指标),从整体网络分析、自我中心网络分析等不同方向开展研究工作。

目前,信息计量学研究对SNA方法的引进和应用,主要表现在对Web环境下较大范围内的网站超链接的分析与计算上,并与基于传统引文分析法建立起来的网络链接分析研究模式形成一种对照和互补。概括起来,基于SNA方法开展的主要研究活动有:基于网站之问的超链接分析,识别社会系统之间的各种联系;基于政府组织、非政府组织和私人公司之间网站的超链接网络分析,发现组织间联合的意向;对某一特殊专题不同类型网站之间的超链接追溯,用以理解问题解决过程、辨别社会热点问题等;基于网站主页内容、链接结构和E-mail成员列表等,预测社会成员之间的联系等。

SNA方法通常涉及大范围内社群网络结构的分析问题,指标计算和数据处理比较复杂,不过相应的软件工具开发已取得了很多成果。以下是几个较为重要的社会网络分析软件:Pajek、Ucinet、NEGOPY、Sociometryplus、Socio Metrica Suite。它们可在SPSS、SAS等统计分析软件功能之外提供更多的专项分析功能。例如,Ucinet软件能够读取多种不同形式的数据,可处理32767个网络节点,同时还能计算各种SNA测度指标值,并能进行凝聚子群和核心一边缘结构分析等。

3.3可视化工具的广泛应用

在早期的信息计量学研究工作中,研究人员为了把经过繁杂数据处理后得到的计量分析结果,进行直观和形象的展示比较重视各种可视化方法(或手段)的运用。MDS散点图、基于等级聚类的树状图、雷达图、切诺夫脸(Chernoff-face)等,都是一些比较常见的可视化展示方法。1997年,T.Braun等人就利用一个4维的切诺夫脸,把多维空间的科学计量指标数据(活动指数、吸引指数、平均期望引文率、相对引文率等)用一个由计算机绘制的卡通脸的面部特征表示出来,成功地完成了对1990―1994年间世界科学发展状况的分析和说明。

各种可视化方法(或工具)充分利用了人类对可视模式快速识别的自然能力,可将人类对信息阅读、判别和理解等认知负担转变为简单、直观的视觉感知,对于科学研究工作的重要性日益凸显。特别是近年来由于问题研究规模和复杂性的日益增长,在对研究结论和成果进行展示、说明时,普遍存在着对各种可视化工具的迫切需求。

当前,各种功能丰富的可视化工具在信息计量学研究中已得到广泛使用,并渐成趋势。如Pathfinder、CiteSpace Ⅱ、HistCiteTM、VxInsight等以及Pajek和Uci―net的使用都是比较流行的。

3.4网络引文分析工具的研制

根据国内学者以Web of Science(WOS)和Google Scholar作为引文分析工具进行的实证研究和结果对照,未来的引文分析研究再单纯依赖传统的WOS等工具,将越来越难以获得全面、真实的引文数据,并会导致引文分析结果产生日益严重的偏差。为此,各种新型的网络化引文索引工具的编制逐渐被提上了议事日程,以适应e-Science时代引文分析的研究需求。

1998年,第一个网络引文索引CiteSeer开始研制,并于1999年正式投入使用。作为一个主要面向计算机和信息科学领域学术资源的网络引文索引与检索工具,CiteSeer主要基于自动引文索引(ACI)技术编制而成。2004年,Google Scholar也在学术搜索服务中成功引入引文分析方法,并提供功能完善的引文链接服务。同年,全球最大规模的文摘和引文数据库服务系统Elservier’s Scopus正式推出,它涵盖了由4000余家出版商出版发行的科技、医学和社会科学方面的15100多种期刊资源,并基于文献计量学原理开发、整合了丰富的学术计量评价功能,可广泛服务于科研人员、图书馆员、编辑和审稿人、学术机构管理者等。

伴随着CiteSeer、Scopus等新型引文分析工具的出现,2004年以来,比较它们和传统WOS工具之间异同的各类研究活动十分踊跃,而目前多数的研究结论是:它们要完全取代WOS或者作为一种权威性的引文分析工具来使用,都面临着一定的困难或障碍,例如:收录范围的不明确;覆盖的学术资源领域受限;回溯年代较短;各学科开放获取运动发展的不平衡;ACI技术与网络搜索技术的缺陷等。

4 主要应用实践及进展

信息计量学的传统应用领域主要涉及文献管理、学科发展分析与评价、科研管理等,而近年来取得的应用进展则大量集中于网络环境,以下选取几个较有影响的网络应用予以说明。

4.1网络流量分析

随着网络发展及其对社会生活的全面渗透,商业网站为扩大自身影响力,吸引更多网络广告客户和电子商务客户,都非常注意对自身网站访问流量进行计量和宣传。早期,网站通常采用自行统计、网络流量分析报告的方式,但由于日志文件数据比较容易篡改,广告客户常常对网站提供的流量数据心存疑虑。另外,各网站在流量分析过程中所采用的标准、计量指

标和工具等的不同,也使得各网站的流量统计结果之间缺乏可比性。为此,制定网络流量分析的行业标准和报告规范,并由此提供第三方流量认证服务,成为随后网络流量分析的发展主流。

目前,市场上专门提供对网站流量和日志数据计量分析的相关软件以及流量认证服务的提供商越来越多,如WebTrends Log Analyzer、FlashStats、AcessWatch、OneStatPro和BPA International、Nielsen//NetRatings等。商业化软件和第三方流量认证服务的推出有效促进并形成了信息计量学的一个网络化新兴应用领域。

4.2核心网站评测

对“核心”问题的研究始终得到信息计量学的高度关注,例如早期对学术期刊、文献作者、词频等分布的集中与离散现象的研究以及由此建立起来的一系列经典定律。进入21世纪以来,对“核心”问题的研究仍在继续,其中尤以核心网站评测最具代表性。

核心网站评测主要由核心期刊评选活动引发而来。除了全面分析和比较核心期刊与核心网站评选方法的异同外,如何建立合理的核心网站评选程序进而形成关于核心网站评选的理论与方法体系更为重要。2005年,国内学者袁毅经过系统、深入的研究,提出了“发现、过滤、评价、扩展和更新”的核心网站评选基本流程,并对该流程进行了实证研究和分析,初步验证了其合理性和有效性。

4.3 网络标签分布的计量分析

网络自由分类法出现于2004年,而大量使用则在2005年以后。基于自由分类法原理提供Web2.0服务的众多新兴网站中用户标签的使用及数量、频率等分布状况逐渐成为网络信息计量研究的一个热点领域。

目前,网络标签计量分析研究主要以Del.icio.us、Flickr、Connotea、CiteUlike、Bibsonomy等网站作为实例,从中抽取一定时间范围内的标签样本数据,利用统计描述、聚类、共词分析等方法进行计量分析,试图揭示、说明自由分类法及其网络协作标注系统的运行机制、用户标注行为规律及行为模式以及互联网环境下新兴的长尾分布现象等。已实施的网络标签计量分析研究主要有:①标签、用户、资源三者之间的关联分析;②各种标签的频率和比例分布分析(包括高频标签与低频标签、规范词与非规范词、拼写变化等);③标签共现分析;④标签词语集合的规模及增长变化;⑤基于标签的用户标注行为和用户相似性分析等。

5 面临的问题与挑战

5.1基本概念缺乏清晰定义,研究内容庞杂,学科边界模糊

信息计量学的基本计量分析对象应是“信息”,但由于“信息”概念的难以定义,时至今日,实际研究工作中大都是以各种各样的信息“替身”为计量对象的。另外,信息(尤其是数字信息)所具备的一些特性,例如无穷性、载体依附性、易复制易传播性、脆弱性等,也为计量分析带来更多的困难。

“信息基本循环图式”对信息计量学理论基础的建立虽然有所贡献,但也存在着明显的缺陷,例如对信息计量与知识计量的关系、各组成要素之间具体的联系与作用方式(即“+”)等都缺乏明确的定义和说明。此外,基于基本循环图式而形成的众多不同的研究范式,也会导致信息计量学研究内容的日益庞杂,并使学科边界相对模糊。如果多元研究范式长期并存不能形成主流(或核心)的研究体系,则有可能使学科研究主题进一步出现被模糊或被淡化的危险。

5.2研究方法有待继续创新,专用研究工具比较缺乏

虽然目前信息计量学在研究方法、工具和指标设计等方面已取得不少进展,研究视野得到拓展,但对传统方法的依赖依然较为严重,尤其是在新兴的网络链接分析方面,引文分析的“烙印”十分明显,而针对网络特性所进行的创新和改进远远不如继承的成分更多。继承之上如何超越正成为信息计量学急需解决的一个方法论难题。

研究工具方面,不论是网络抽样、原始数据下载还是网络链接解析与统计,都还缺乏较为有效的专用工具,很多情况下只能依靠搜索引擎来获取样本数据,由此造成研究中存在种种偏差。

5.3应用研究活跃,但影响力和应用效果都比较局限

与信息计量学研究中存在的理论基础薄弱、方法/工具创新不足形成鲜明对照的是当前各种应用研究活动十分活跃。不过,大部分的应用活动不仅研究方法简单,而且应用效果不确定,难以形成较强的示范效应或者对理论基础和研究方法的完善形成有益的促进。而影响力较大的少数研究活动则仍较多局限于教育、科研等学术性领域,这与网络对当今社会的全方位影响、渗透相比,研究思路还显得过于狭窄。

篇10

关键词:主题词表;词频统计;知识图谱;研究热点;研究趋势

Abstract:Based on word frequency statistics and visualization of knowledge mapping and other methods of comparative analysis and research in two periods of 1980—2003 and 2004—2011, the article shows the areas of research focus and trends of Thesaurus in China. That is: there is a clear dividing line in two periods, and trends show that the evolution process of knowledge organization system, Thesaurus based on semantic description language ontology conversion is currently a focus of academic research and future research trends.

Keywords:Thesaurus; Word Frequency Statistics;Knowledge Mapping;Research Focus;Research Trends

1 引言

主题词表(叙词表)是一种情报检索语言,它在早期情报检索和知识组织中发挥着非常重要的作用。早在1876年,美国图书馆学家卡特发表了他的《字典式目录条例》 [1]。而随着计算机技术的发展,主题词表的功能也发生了相应的变化。另外,不断更新的网络技术,以及语义网等概念的技术实现,也为主题词表的发展注入了活力。

国内主题词表研究虽然起步较晚,但从《汉语主题词表》的问世,到《中国分类主题词表》的出版,均取得了卓越的成就。国内的研究主要集中在主题词表的介绍、评价、编制、修订、标引方法、应用及分类主题一体化等领域[2][3][4],另外,随着计算机网络技术的发展,各类词表被大量应用到了信息检索技术、知识组织与管理等领域之中[5][6]。

那么,这些年来国内对主题词表的研究都触及了哪些主题?其研究的趋势和热点又在哪里?本文试图通过对发表在期刊上的学术论文进行研究,旨在为该领域同行了解和掌握研究方向提供些许帮助。

2 样本获取与研究方法

2.1 样本获取方法。本文获取数据样本的方法是:在 “中国学术期刊网络出版总库”中,用关键词“主题词表 OR 叙词表”,检索出1980年~2011年间发表在“核心期刊”上的论文,因为《中文核心期刊要目总览》第一版在1992年才出版,上述检索结果仅命中了1992年~2011年数据;因此,作者又补充了1980年~1991年的相关主题数据。经过人工筛选,最后,获得样本数为480篇(检索日期:2012年2月12日)。

2.2 研究方法。本文主要应用文献计量学领域的词频统计方法和基于共词的可视化知识图谱方法。

通过关键词词频的动态统计与分析,可以反映出某时间段内研究主题的动态变化过程,如高频关键词的发展期、高峰期及衰退期等。词共现(共词)分析方法最早是在1986年由法国文献计量学家M.Callon等学者提出的[7]。在词共现分析方法的基础之上,我们可以运用社会网络分析方法及软件(如Pajek),绘制出各主题之间的相互联系的学科知识图谱。

3 研究结果

3.1 历年情况

对480篇论文进行按年度统计,见图1。由图1可以发现,论文数量基本上呈上升趋势:1980年~2003年为缓慢上升阶段,但1994年和1999年均有突出表现;2003年以后,呈现出了快速发展的态势。究其原因,一方面,随着计算机技术的发展,出现了诸如本体等语义网概念的应用研究,使得主题词表研究重新得到了重视;另一方面,有关主题词表的研究得到了更多的基金资助,2004年以前,仅有8篇资助论文,而2004年及以后,资助论文达113篇,尤其是近两年,基金资助论文比例均达50%以上。