鳄鱼眼泪范文
时间:2023-03-22 23:31:05
导语:如何才能写好一篇鳄鱼眼泪,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
1、鳄鱼眼泪:传说鳄鱼在吞食人畜时,边吃边流眼泪。比喻恶人的假慈悲。例句:他终于挤出了几滴鳄鱼眼泪。
2、鲸波鳄浪:犹惊涛骇浪。出自清代南荃居士的《海侨春传奇·疯诉》:望鲸波鳄浪连天涌,莽天涯沓沓蒙蒙。
(来源:文章屋网 )
篇2
【关键词】主题爬虫;特征提取;文本分类;向量空间模型
1.引言
随着互联网的大规模普及和各行业信息化程度的提高,与行业领域相关的Web文本信息快速积累,如何从这些海量信息中定向提取符合需要的知识,是当前信息处理研究领域的一个研究热点,该问题涉及到对领域Web文本信息的采集和对采集到的信息进行处理和数据挖掘两方面的内容。在采集领域相关网页的过程中,主题描述及网页内容的相关性判断,都需要用到文本预处理技术,信息采集成功后,又需要通过文本预处理和分类技术对领域文本进行分类。本文对系统设计中的一些关键问题进行了研究,并以机械领域挖掘机为主题,实现了一个机械领域Web文本采集与分类原型系统。
2.主题爬虫的主题确立
对领域Web文本的采集,其实质就是设计针对某一领域的网络爬虫。专业领域用户一般只关心与其领域相关的一些资源,垂直搜索,专精化,行业化。主题爬虫技术可根据一定的分析方法和搜索策略,选择性的获取与主题相关的Web页面。主题爬虫系统一般包括种子模块、主题确立模块、爬虫爬行模块和主题相关性分析模块四个部分。设计高质量主题爬虫的关键问题是如何保证抓取的网页中与主题无关的网页尽可能的少,对待抓取的主题的准确描述是设计主题网络爬虫的首要任务,也是一项关键任务,这点对于主题相关性判断影响重大。常用的主题描述方法一般有两种,一种是根据人工经验,由用户直接给出一组关键字来描述主题,这种方式简单,也比较准确,但是对用户的专业领域知识要求较高。
另外,当知识更新较快时,极有可能出现漏选的情况。另一种方法为主题代表性文档特征抽取。通过用户提供或者选择一些相关主题的实例文档,由爬虫从中提取用户主题,其实质是通过学习相关领域文档并进行自动特征提取的过程。优点是定义精确,但要求所选取的文档和页面必须具有代表性和概括性,否则可能出现偏差。
3.网页正文提取研究
网页正文提取是网页解析模块的一个难点,也是最为核心的部分。大多数网页中除了包含有用信息(正文)外,还包含网站导航信息、广告、脚本语言等许多噪声信息,如果提取不当,则提取结果可能惨不忍睹,根本没有使用价值。只有真正提取出的正文文本,才是最有价值的,后续的网页相关性判别和网页文本分类才更加准确。
目前已存在一些网页正文提取的方法,比较典型的有基于Dom树;基于数据挖掘或机器学习;基于模板、规则;基于网页内容分块等。Dom树方法虽直观有效,但其树的建立,要求html必须合乎规范,且时空复杂度高,树的遍历方法也不具通用性,需根据html标签的不同而变化。用数据挖掘或机器学习的方法来解决该问题,又把简单问题复杂化了。总体来说,这些方法大多不具备通用性,或实现起来较为复杂,准确度不高。
4.领域文本分类
领域文本具有不同于普通文本的特点。1)分词困难。领域文本专业性较强,常常包含大量的专业词汇,这使得领域文本的分词较普通文本而言更具复杂性。如何设计分词算法,使得专业词汇能够尽可能小的不被划分开来,对后续操作影响重大。通过设计专业词库可以解决这一问题。专业词库的制定应确保其权威性和完整性。本文中所采用的机械专业词库中的词条主要来源于机械专业词典、由机械设计制造研究人员收工录入,还有部分来源于搜狗实验室,经过选择,去重得到的。2)已标记样本较少。在机械类别的文本中,由于没有通用的用于机械领域文本分类研究的实验语料,本研究主要的语料来源为主题爬虫程序所采集到的网页文本,一部分专业文档资料和少量电子版用户需求文档。
5.领域web文本采集与挖掘系统设计
根据上述研究内容,本文设计了一个面向机械领域产品用户需求信息的web文本采集与挖掘系统。系统结构如图1所示。
5.1 机械产品信息的主题描述
本系统主题描述步骤如下:
Step1.由领域专家人工给出一组主题词及其对应权值(t1,ω1:t2,ω2:……:tn,ωn)。本文附录给出了一个由领域研究人员提供的机械领域专业关键词库,可以直接从里面筛选。
Step2.收集有代表性的主题相关度较高的文本文档,进行文本预处理,采用向量空间模型将文本表示出来,对这些文本资料进行特征选择,获得共同拥有的特征作为主题特征词集合。这里的特征选择方法采用基于关联规则的专业特征选择方法,通过改进的灰色关联公式进行关联度计算将多个文档表示信息组合在一起,计算非专业术语与专业术语的灰色关联度,获得专业术语的关联度矩阵;对关联度矩阵进行加权计算,提取出需求的专业术语得到专业的需求描述。
Step3.爬虫程序根据主题词ti进行爬行,采集与之相关的网页,对这些网页进行文本特征提取,选择出权重高的特征词,判断是否已包含在专业特征词库中,若没有,则加入专业特征词库。即更新主题候选词集。
Step4.将得到的主题词存放在topic.txt中。
通过以上步骤,得到主题特征。整个过程是一个不断学习更新的过程,从而实现对主题词集合的不断扩充,提高主题描述的精确度。
5.2 页面采集模块
通过HTTP,HtmlParser,Parser类对从待爬队列waitingQueue取得的URL对应的网页解析,得到网页上的所有链接并通过循环对链接对应的网页解析。首先通过MannerGahter类进行礼貌采集判断,服务器允许采集则可解析出网页上的对应P标签和Title标签的文档信息,然后通过Segment类对文档分词。
对标题及正文的特征项的选取是通过分词后与主题集合匹配,并通过词频计算特征选择来得到与主题向量维数相等的标题向量和正文向量。
计算相关性。首先公式1计算两个表示文本的向量之间的相似度。
公式1
分别计算出主题和标题、主题和正文的相关度,然后标题与正文以4:1的比重计算出整个网页与主题的相关度,即4*主题和标题的相关度+1*正文与主题相关度。通过详细计算,设定相关度阈值为75%,网页与主题的相关度大于75%则认为该网页是与主题相关的。最后系统运行界面如图2所示。
6.结语
本文探讨了面向领域的Web文本采集与分类问题,对主题网络爬虫设计中的主题确定,种子URL选择、相关性分析、网页解析与正文提取和搜索策略等问题予以研究,分析行业领域文本的特点,进行恰当的主题描述,选择KNN算法来构造领域文本分类器,设计并实现了一个机械主题Web文本采集与分类原型系统。
参考文献
[1]J.Han et al..Mining frequent patterns without candidate generation.In Proceedings of the 2000 ACM SIGMOD Conference on Management of Data,Dallas,TX,2000:1-12.
[2]魏松,钟义信,王翔英.中文Web文本挖掘系统WebTe-xtMiner开发[J].计算机应用研究,2005(6)211-213.
[3]沈记全,唐菁,杨炳儒.Web文本挖掘系统及其分类算法的研究与实现[J].计算机工程,2009.03(2):13-14.
[4]CHAKRABARTI S,BERG DEN VAN M.Focused Crawling:A new approach to Topic-Specific Web Resourse Discovery[C].In Proceedings of the 8th International WWW conference,Toronto,Canada,1999.
[5]刘国靖,康丽,罗长寿.基于遗传算法的主题爬虫策略[J].计算机应用,2007,27(12):172-179.
[6]Chakrabati S,Punera K,Subram anyam M.Accelerated focused crawling through online relevance feedback,WWW2002,May 7-11,2002,Honolulu,Hawaii,USA.http//csberkeley.edu/-soumen/doc/www2002m/p336-chakrabarti.pdf(Accessed Nov.8,2006)
[9]M.Ehrig,A.Maedche.Ontology-focused Crawling of Web Documents.In Proceedings of the 2003 ACM symposium on Applied computing,Melbourne,Florida,June 2003:1174-1178.
篇3
你好!
在茫茫的人生海洋上,会遇到无数挫折,你像一艘船,乘风破浪,勇敢向前。
但最近你遇到了海上的一簇暗礁,你停止了行进,陷入了沉思。事情是这样的:黑板报的组长——你,有权力管组员,组员分配好了,但没有人把水倒掉,你随便点了一位同学把水倒掉,那个矮矮胖胖的袁斌就是不倒。当老师走进教室,见一桶脏水在墙角,就厉声问:“金潇逸,这是怎么回事?”你恼怒地说:“袁斌,他~”袁斌当场抵赖,无奈无辜的你又遭老师训斥:“为什么没倒掉,你身为组长,没有分配好!即使袁斌不倒,你也可以倒掉!”你气得似狂怒的狮子,两滴委曲的泪珠儿滑落下来,袁斌却露出狡狯的笑。
朋友,不要烦恼,恶人会有恶报的!放开心胸,让小船重新启航,重新启航!这只是生活中一个小小的挫折,让它远去吧!辽远的人生之海,等待你的挑战!
瞧,你的学习成绩不是很好嘛!袁斌和你比真是天差地别,他是个无赖,以干坏事出名,不要跟他赌气,放开点儿吧,朋友。
那艘船仍行驶在生活之海中,忽然,海上刮起一阵风,掀起的浪花摇动着船身,原来勇敢的你被风的巨大和海的气魄所压抑,你又一次停止了行进……
王超是班上有名的“傻蛋”,眼睛一大一小,身上有股狐臭,是班中的“臭屁精”。你,是班上的“诸葛亮”,学习甭说,身体也不错,就是喜欢和人对峙,爱把事弄得乱七八糟。可这却招来“天灾”,王超竟主动和你交手,他还有个绰号“骂人王”,你怎能和这种人接轨???他骂人时总把人骂个狗血淋头,而且用鲁迅的那套“骂法”骂人,把人骂哭了,还说他(她)是鳄鱼眼泪,我看他把学习的力气都用在骂人上了!你准备战斗,上课时,他轻轻地骂你,你马上重重地反击,却被教师叫住,说‘上课不许交头接耳’,你冤啊,很冤啊!!!却是哑巴吃黄连——有苦难言。其实,你也有错,这能怪谁呢?你为什么不能控制自己呢?这也是一个生活插曲,一个小小的挫折,你挺过去了。
海上风停了,浪退了,金黄的太阳射出万丈光芒,你又哼着歌儿远行!你知道前面还会有暗礁,有旋涡,但我相信你定会有勇气闯过去,去迎接光辉灿烂的明天!
祝你:
快乐,永远快乐!
你的朋友:影子
篇4
关键词:数据挖掘;簇;聚类算法
中图分类号:TP301.6文献标识码:A文章编号:1672-7800(2012)010-0033-03
基金项目:湖南省大学生研究性学习和创新性实验计划项目(JSU-CX-2011-28)
作者简介:张露(1991-),女,吉首大学软件服务外包学院学生,研究方向为计算机科学;张彬连(1978-),女,吉首大学软件服务外包学院讲师,研究方向为计算机科学。
0引言
随着信息和科学技术的高速发展,各行业积累的数据量迅速增长,而更重要的是如何从大量的、不完全的数据中提取出有用的信息。而在数据挖掘中充当重要角色的就是聚类,它在识别数据的内在结构方面具有独到的作用。而数据挖掘工具以及工具提供的可选择的算法是实现数据挖掘目的的垫脚石。数据的类型、聚类的目的应用决定了选择哪一类聚类算法,其中聚类是把物理或者抽象对象分组成为由类似对象构成的多个簇的过程,即把数据对象分成多个类或簇,在同一个簇中的对象具有较高的相似度,而不同簇中的对象差异较大。它对未知数据的分析和划分能起到非常有效的作用。此外,通过聚类,能够识别密集和稀疏的区域,发现全局的分布模式,以及数据属性之间的相互关系等。为了找到效率高、通用性强的聚类方法,人们从不同角度提出了许多种聚类算法,大致可分为层次方法、划分方法、基于密度的方法、基于网格的方法和基于模型的方法这五大类。
1典型聚类算法分类及其优缺点分析
1.1基于划分的聚类算法
首先,给定一个样本为n的数据集,然后根据给定要创建划分的数目k,将数据划分为k个组(kn),每个组相应地表示一个簇,同时满足以下的条件:①每个组至少包含一个样本;②每个样本属于且仅属于一个簇。算法要事先给出要创建的划分的数目k,创建一个初始划分,然后采用循环定位技术,通过根据簇类之间的差异把对象从一个划分移动到另一个划分的方法来改善划分质量。评价划分的好坏的标准一般是在同一个类中的对象尽可能“接近”,而不同类中的对象尽可能“远离”。为达到全局最优的目的,基于划分的聚类会要求穷举所有可能的划分。其中包括以下典型的划分方法:k-平均、k-中心点、CLARA、CLARANS等。
1.1.1基于簇的重心技术:k-平均算法
(2)k-平均算法的优缺点:①优点:当满足结果簇是紧凑的,并且簇与簇之间明显分离式的前提条件,k-平均算法能发挥较好的效果,而且在处理大数据集时,是有相对可伸缩的和有效率的;②缺点:该算法有其限制条件,只有在簇的平均值被定义的基础上才能使用,这就使得可能不适应某些应用的数据,要求用户必须事先给出k的取值。在大部分实际应用中,最终的聚类数量并不能得到一个确切的数目,且该算法遇到非凸面形状的簇,或者遇到在大小上存在很大差别的簇时,聚类效果不明显。而且,它对于带有“噪声”的空间数据和离群数据是敏感的。该算法经常止于局部最优。
1.1.2基于有代表性的对象的技术:k-中心点方法
1.1.3基于选择的k-中心点CLARANS方法
(1)CLARANS方法的处理流程:首先,不考虑整个数据集合,用实际数据的抽样来作为数据的样本;然后,用PAM方法从样本中选择中心点;返回最好的聚类结果作为输出。
(2)CLARANS方法的优缺点:①优点:该算法的效率较高,能够发现最“自然的”结果簇数目,且能够检测离群点,且相应地拓展了数据处理量的伸缩范围;②缺点:该方法的聚类质量对采取的抽样方法依赖性强,且最中心点的要求较高。而且对于大数据量、时间复杂度和空间复杂度都很大。
1.2基于层次的聚类算法
根据树的形成过程,层次分解的方向的不同可以分为以下两种类型:
(1)自底向上(凝聚)聚类方法。该方法一开始将每个对象作为单独的一个组,然后继续与相近的对象或组合并,直到所有单独的组都被合并,成为一个整体,或者达到一个终止条件。
(2)自顶向下(分裂)聚类方法。与凝聚法相反,该策略先将所有对象置于一个簇中,在迭代的每一步中,在一个簇的基础上分裂为更小的簇,直到最终每个单独的簇中包含一个对象,或者达到一个终止条件。下面介绍其代表算法。
1.2.1BIRCH算法
(1)BIRCH算法包括阶段:阶段一是BIRCH扫描数据库,建立初始化的CF树,尝试把数据内在的聚类结构保留下来;阶段二是BIRCH算法采用某个聚类算法对CF树的叶节点进行聚类。
(2)BIRCH算法的优缺点:①优点:引入的聚类特征树概括了聚类的有用信息,且占用空间较元数据集合小,只需要一次性访问数据库,速度快,伸缩性好,对增量或动态聚类也非常有效,不需要大量递归运算。②缺点:由于CF树每个节点的大小受限制,并不总是对应于用户所认为的一个自然聚类,而且算法的工作效率依赖于簇的球形要求。
1.2.2CURE算法
(1)CURE算法工作原理:选择了属于聚合方法和分解的中间做法。选择数据空间中具有代表性的点。且在选择簇中分散的对象中产生一个簇的代表点,然后根据一个特定的分数或者收缩因子向簇心“收缩”或移动它们。
(2)CURE算法优缺点:①优点:能识别非球状以及大小不一的聚类,能更好地处理孤立点。对于大型的数据库,它也具有良好的伸缩性,且不影响聚类的质量;②缺点:聚类结果容易受到参数设置的影响,且CURE算法对分类属性不进行处理工作。
1.3基于密度的聚类算法
基于密度的聚类算法并不是基于各种各样的距离而是基于密度的。这样就能克服基于距离的算法只能发现“圆形”类的缺点,它可以发现任意形状类的聚类结果。该方法的思想就是,只要一个区域中的点的密度大于某个阈值,就把它加到与之相近的聚类中。以下介绍其代表算法DBSCAN算法和OPTICS算法。
1.3.1DBSCAN算法
(1)DBSCAN算法思想:首先通过检查数据库中每个点的ε-邻域内的邻居点数衡量改点所在空间的密度。来寻找聚类。如果一个点p的ε-邻域名超过某个指定阈值MinPts个点,则建一个新簇以p作为核心对象,然后再反复地寻找从这些核心对象直接密度可达的对象,当没有新的点可以被添加时,该过程即结束。
(2)DBSCAN算法优缺点:①优点:能够把具有足够高密度的区域划分为簇,对带有“噪声”的空间数据比较敏感,可以发现任意形状的聚类;②缺点:参数的设置难以确定,对参数值是非常敏感的,容易导致误差很大的聚类结果,且全局密度参数不能刻画其内在的聚类结构。
1.3.2OPTICS算法
(1)OPTICS算法思想:采用影响函数,即用一个数字函数来形式化地模拟每个数据点的影响;所有数据点的影响函数的总和可以由数据空间的整体密度模型化得到;可以通过确定密度吸引点来得到聚类,且此时全局密度函数在密度吸引点达到局部最大。
(2)OPTICS算法优缺点:①优点:该算法的数据基础非常坚实,并且概括了其他的聚类算法;其良好的聚类特性在处理有大量“噪声”的数据集合时充分体现出来了;提供了简单而有效的数学技术给高维数据集合的任意形状的聚类;速度较快;②缺点:聚类结果会容易受到密度参数和噪声阈值等参数的影响。
1.4基于网格的聚类算法
基于网格的聚类方法采用的数据结构是一个多分辨率的网格。它将数据空间分为有限数目的单元,形成网结构,所有的处理对象是单个的数据单元,这种处理方法与目标数据库中记录的个数并不存在很大的关系。以下介绍其中的STING算法。
(1)STING算法工作原理:STING是一种基于网格的多分辨率聚类技术,它将空间区域划分为矩形单元,通常存在多个级别的矩形单元,这些单元形成了一个层次结构:高层的每个单元由多个低一层的单元组成,且事先计算和存储关于每个网格单元属性的统计信息,在查询处理时就能使用这些统计参数,达到不一样的效果。
(2)STING算法优缺点:①优点:基于网格的计算与查询是相对独立的;在处理数据和增量更新方面能够更加方便;效率较高;②缺点:最底层的粒度影响算法的质量,且该算法在构建一个父单元时,忽略了子单元与相邻单元间的关系,导致结果簇的形状的边界不稳定。
1.5基于模型的聚类算法
基于模型的聚类算法尝试优化给定的数据和某些数学模型之间的适应性,是基于“数据是根据潜在的概率分布生成的”这一假设而提出的。该方法主要包括统计学方法和神经网络方法这两大类。以下介绍其中的COBWEB算法。
(1)COBWEB算法工作原理:COBWEB算法采用分类属性-值对来描述其输入对象,以一个分类树的形式来构造层次聚类,并且在启发式估算度量方法以及分类效用的指导下开展树的构建工作。
(2)COBWEB算法优缺点:①优点:对划分过程中类的数目能自动修正,不需要用户提供这样的输入参数,可以找到分类对象的最好结点;②缺点:该算法基于的“每个属性上的概率分布式彼此独立的”假设不总是成立的;更新和存储聚类代价相当高,可能导致时间和空间复杂性发生剧烈的变化。
2结语
分层聚类的突出亮点是它能够生成比较规整的类集合,聚类结果不依赖元素的初始排列或输入次序,与聚类过程的先后次序并没有直接的关系,聚类结果相对稳定,不易导致类的重构。但它也存在着部门缺点,如计算开销较大,对异常数据比较脆弱。划分聚类的优点是运算量小,能运用于处理庞大的样本数据,也为实时处理提供了一定的可能性。但要求用户必须预先给出聚类的参数,还要靠度量函数来判定所给出解的优劣程度。网格聚类处理速度快,处理时间与数据对象的数目无关,聚类时间独立于数据规模和数据次序,伸缩性极好。缺点是只能发现边界是水平或垂直的聚类,不能检测到斜边界,也不适用于高维情况,并存在量化尺度的问题。密度聚类多用于时空信息处理、消除奇异值,并且可以在带有“噪声”的空间数据库中发现形状任意、个数不定的聚类,适合大型、高维数据集等方面具有较好的特性。对于所提到的上述聚类算法,可以从可伸缩性、处理不同类型属性的能力、发现任意形状的簇、处理噪声数据的能力、对输入顺序的敏感性、处理高维数据的能力、需要决定的输入参数最少以及对输入记录顺序不敏感这些方面来进行比较分析,以更好地了解这些聚类算法。
参考文献:
[1]HUANGZX,MICHAELK.Anoteonk-modesclustering[J].JournalogClassification,2003(2).
[2]PELLEGD,MOOREA.X-meansextendingk-meanswithefficientestimationofthenumberoftheclusters[C].Proceedingsofthe17thIC-ML,2000.
[3]ERTOZL,STEINBACHM,KUMARV.Findingclustersofdifferentsizes,shapesanddensitiesinnoisy,highdinensionaldata[R].MinneapolisUniversityofMinnesota,2002.
[4]MARQUESJP,WRITTEN,WUYF,etal.PatternRecognitionConcepts,MethodsandApplications(2nded)[M].Beijing:TsinghuaUniversityPress,2002.
[5]DHILONI.Co-clusteringDocumentsandwordsusingbipartitespec-tralgraphpartitioning[C].SanDiegaProceedingsofthe7thACMSIGKDD,2001.
[6]SAMBASIVAMS,THEODOSOPOULOSN.AdvanceddataclusteringminingWebdocuments[J].IssuesinInformingScienceandInformationTechnology,2006(3).
[7]NANNIM,PEDRESCHID.Time-Focusedclusteringoftrajectoriesofmovingobjects[J].JournalofIntelligentInformationSystems,2006(3).
[8]BIRANTD,KUTA.ST-DBSCAN:ANalgorithmforclusteringspatial-temporaldata[J].Data&KnowledgeEngineering,2007(1).
[9]CRISTOFORD,SINOVICIDA.Aninformation-theoreticalapproachtoclusteringcategoricaldatabasesusinggeneticalgorithms[C].ArlingtonThe2ndSIAMICDM,WorkshoponClusteringHighDinen-sionalData,2001.
篇5
眼泪的成语
1、泪眼汪汪 热泪盈眶 嚎天动地 饮恨吞声
2、号G大哭 喜极而泣 泪如泉滴 街号巷哭
3、鬼哭狼嗥 牛农对泣 痛哭流涕 呼天唤地
4、泣下沾襟 泪如泉涌 涕泪交流 涕泪交零
5、哭天抹泪 催人泪下 嚎天喊地 泣不成声
6、涕泗交颐 泣涕如雨 触目恸心 鬼哭神惊
7、号啕大哭 神愁鬼哭 鬼抓狼嚎 涕泪交加
8、泪如雨下 抱头大哭 泪流满面 以泪洗面
9、声泪俱下 泪迸肠绝 擂天倒地 啼天哭地
10、行号巷哭 泪下如雨 老泪纵横 鸟哭猿啼
11、死声G气 鬼哭天愁 行号卧泣 枕戈泣血
12、呼天号地 潸然泪下 凄然泪下 梨花带雨
13、泪干肠断 呜呜咽咽 神号鬼泣 涕泪交垂
14、涕泪交集
眼泪的成语解释
1、潸然泪下:潸然:流泪的样子。形容眼泪流下来。
2、感激涕泗:涕:眼泪;泗:鼻涕。感激得掉下眼泪。形容极度感激。
3、眼泪洗面:泪流满面。形容极端悲痛。
4、愁眉泪眼:皱着眉头,掉下眼泪。形容愁苦悲伤的样子。
5、饮血崩心:血:血泪;饮血:形容极度悲愤。血泪满面,心为之碎。形容极度悲痛。
6、涕零如雨:涕零:流泪。眼泪象雨水一样往下淌。形容思念的感情极深。
7、凄然泪下:凄然:寒凉。形容凄凉悲伤。
8、血泪斑斑:血与泪俱在实证物。
9、吞声忍泪:形容强忍悲伤。
10、吞声饮泪:吞声:咽下哭声;饮泪:忍住泪水。眼泪只能往肚里流,不敢哭出声来。形容受压迫时,忍受痛苦,不敢公开表露。
11、一副急泪:指为了对付应急需要而骤然挤出来的一串眼泪。
12、涕泪交下:鼻涕眼泪同时流下,形容极度哀痛。同“涕泪交零”。
13、鳄鱼眼泪:鳄鱼:一种生性凶残,捕食人、畜的爬行动物。传说鳄鱼在吞食人畜时,边吃边流眼泪。比喻恶人的假慈悲。
14、热泪盈眶:盈:充满;眶:眼眶。因感情激动而使眼泪充满了眼眶,形容感动至极或非常悲伤。
15、雨泣云愁:泪下如雨,愁多如云。形容忧愁深重。
16、泪迸肠绝:指悲痛得泪涌肠断。
17、泣数行下:眼泪接连不断的往下掉。形容非常悲伤。
18、怆然泪下:怆然:伤感的样子。伤感地流泪不止。形容非常悲痛。
19、恸哭流涕:恸:哀痛;涕:眼泪。形容极其悲痛伤心。
20、涕泪交零:鼻涕眼泪同时流下,形容极度哀痛。
21、涕泗流涟:鼻涕眼泪直往下流。形容痛哭流涕。
22、涕泗纵横:眼泪鼻涕满脸乱淌。形容极度悲伤。同“涕泗横流”。
23、泪眼汪汪:汪汪:满眼泪水的样子。两眼充满泪水。
24、涕泪交加:犹涕泪交零。
25、涕泗交下:眼泪鼻涕一起流下。形容痛哭的样子。同“涕泗交流”。
26、泣下如雨:眼泪象雨一样。形容伤心到极点。
27、流涕痛哭:涕:眼泪。形容伤心到极点。
28、夺眶而出:眶:眼眶。眼泪一下子从眼眶中涌出。形容人因极度悲伤或极度欢喜而落泪。
29、涕泗滂沱:滂沱:雨下得很大。雨下得很大的样子。形容哭得很厉害,眼泪鼻涕象下雨一样。
30、泪如泉滴:形容触动伤心事,眼泪象泉水一样流出。
31、潸然泪下:潸然:流泪的样子。形容泪流不止。
32、湿哭干啼:湿哭:有眼泪地啼哭;干啼:没有眼泪地啼哭。形容哭哭啼啼的样子。也泛指因苦楚而呈现出的各种表情。
33、挥涕增河:抹下来的眼泪可以增添河水的分量。比喻行为对个人有损而对国家也无所补益。
34、哭天抹泪:形容哭哭啼啼。
35、涕泪交垂:鼻涕眼泪同时流下,形容极度悲哀。
36、泪出痛肠:痛遥:伤痛的内心。指因心里难过而流出了眼泪。
37、泪如泉涌:眼泪象泉水一样直往外涌。形容悲痛或害怕之极。
38、干啼湿哭:干啼:没有眼泪地啼哭;湿哭:有眼泪地啼哭。形容哭哭啼啼的样子。也泛指因苦楚而呈现出的各种表情。
39、泪干肠断:形容伤心到极点。
40、泣涕如雨:泣:低声哭;涕:鼻涕。眼泪像雨一样。形容极度悲伤。
41、吞声忍泣:吞声:咽下哭声;忍泣:忍住泪水。眼泪只能往肚里流,不敢哭出声来。形容受压迫时,忍受痛苦,不敢公开表露。
42、涕泗横流:眼泪鼻涕满脸乱淌。形容极度悲伤。
43、怆然涕下:怆然:伤感的样子;涕:眼泪。伤感地流泪不止。形容非常悲痛。
44、涕泪交流:鼻涕眼泪同时流下,形容极度哀痛。同“涕泪交零”。
45、夺眶而出:夺:用力冲开;眶:眼的四周。指眼泪无法控制地从眼里流出,形容心情非常激动。
46、垂涕而道:涕:眼泪,鼻涕;道:讲。流着眼泪说话。形容十分沉痛地恳切陈词。
47、悲愁垂涕:垂:垂下。涕:泪。因为悲哀、愁苦而落泪。
48、催人泪下:催:催促,促使。形容事迹十分感人,使人不禁流下眼泪。
49、破涕为欢:涕:眼泪。一下子停止了哭泣,露出笑容。形容转悲为喜。
50、愁眉泪眼:愁眉:紧皱眉头。皱着眉头,掉下眼泪。形容愁苦悲伤的样子。
51、催人泪下:催:催促,促使。形容事迹等十分感人,使人不禁流下眼泪。
52、涕泗交颐:眼泪鼻涕流满脸颊。形容哀恸哭泣。
53、断线珍珠:比喻眼泪像断了线的珍珠一般纷纷落下。
54、吞声饮泣:吞声:咽下哭声;饮泣:忍住泪水。眼泪只能往肚里流,不敢哭出声来。形容受压迫时,忍受痛苦,不敢公开表露。
55、忍泪含悲:忍着眼泪,含着悲痛。形容勉强克制着悲伤。
56、感极涕零:感激之极而流下眼泪。形容极为感激。
57、涕泗交流:眼泪鼻涕一起流下。形容痛哭的样子。
58、垂涕而道:涕:鼻涕,眼泪。流着眼泪说话。比喻十分沉痛地恳切陈词。
59、感激流涕:涕:眼泪。感激得掉下眼泪。形容极度感激。
60、柔肠粉泪:指女子柔弱的心肠和含情的眼泪。形容女性的缠绵情意。
61、一字一泪:一个字就仿佛是一滴眼泪。形容文字写得凄楚感人。亦作“一言一泪”。
62、饮泣吞声:泣:无声的哭;吞声:不敢出声。眼泪只能往肚里流,不敢哭出声来。形容忍受痛苦,不敢公开表露。
63、肚里泪下:眼泪往肚里流。形容有苦说不出。
64、泪下如雨:泪水如同雨水一样流下来,形容十分悲伤。
65、噫呜流涕:噫呜:哭声。噫噫呜呜哭着流泪。
66、泪河东注:眼泪似向东的的河流一样。比喻人极度悲痛。
67、愁眉泪眼:皱着眉头,含着眼泪。形容悲苦的样子。
68、抹泪揉眵:眵:眼屎,此指眼睛。擦着眼泪,揉着眼睛。形容落泪伤心的样子。
69、泪下如雨:眼泪象雨水似的直往下流。形容悲痛或害怕之极。
70、以泪洗面:拿眼泪来洗脸。形容极度忧伤悲痛,终日流泪。
71、抛珠滚玉:抛:抛掷。形容眼泪如同珠玉般滚落。
72、揉眵抹泪:眵:眼屎,此指眼睛。擦着眼泪,揉着眼睛。形容落泪伤心的样子。
73、涕泪交集:眼泪和鼻涕一起流着。形容悲痛到了极点。亦作“涕泪交加”。
74、声泪俱下:一边说一边哭。形容极其悲恸。
75、泪如雨下:眼泪象雨水似的直往下流。形容悲痛或害怕之极。
76、眼泪汪汪:眼中饱含泪水。形容人十分激动或悲痛。
77、饮泣吞声:饮泣:忍住泪水;吞声:咽下哭声。眼泪只能往肚里流,不敢哭出声来。形容受压迫时,忍受痛苦,不敢公开表露。
78、血泪盈襟:血泪:悲痛的眼泪;盈:满。眼泪流湿了衣襟。形容非常悲痛。
79、破涕为笑:涕:眼泪。一下子停止了哭泣,露出笑容。形容转悲为喜。
80、痛哭流涕:涕:眼泪。形容伤心到极点。
篇6
【关键词】拉米夫定;替比夫定;恩替卡韦;HBeAg定量;疗效
【中图分类号】R512 【文献标识码】A 【文章编号】1004-7484(2014)02-0704-02
抗病毒治疗是慢性乙型肝炎(chronic hepatitis B,CHB)治疗的关键,应用核苷类似物抗病毒治疗,有作用快,不良反应少,服用方便的优点,目前应用核苷类似物治疗慢性乙型肝炎的患者为数众多。但核苷类似物普遍存在只能抑制病毒复制,未达到血清学转换不能停药,长期使用还有出现病毒变异和耐药的风险,因此寻找恰当的临床监测指标预测疗效,[1-2]并根据患者应答反应及时调整治疗方案是目前慢性乙型肝炎患者抗病毒治疗的热点和难点问题。我们选择我院66例服用核苷类似物治疗的HBeAg阳性的慢性乙型肝炎患者,观察治疗过程中HBeAg、HBVDNA定量的变化,发现可以根据HBeAg的变化来预测核苷类似物的疗效。现将有关内容报告如下:
1 材料与方法
病例来源2010年1月至2012年12月门诊及住院的66例HBeAg阳性慢性乙型肝炎患者,男45例,女21例,年龄18-36岁,中位年龄为25岁,诊断符合2010年修订的《慢性乙型肝炎防治指南(2010年版)》诊断标准(3),排除甲型肝炎(HAV)、丙型肝炎(HCV)、戊型肝炎(HEV)、人类免疫缺陷病毒(HIV)等其他病毒感染,既往未应用抗病毒治疗及免疫调节剂。66例患者分为三组,应用拉米夫定治疗的36人,替比夫定18人,恩替卡韦治疗的12人,三组患者的性别、年龄差异无统计学意义。
治疗方法 拉米夫定 (贺普丁,葛兰素史克制药(苏州)有限公司) 100 mg,每日1次口服,替比夫定(素比伏,北京诺华制药有限公司)600 mg,每日1次口服,恩替卡韦(博路定,中美上海施贵宝制药有限公司 )0.5 mg,每日1次口服, 根据患者肝功能情况适当应用保肝药物,ALT > 5倍正常值应用甘草酸二铵注射液250 ml静脉滴注每日1次,肝功能好转改为甘草酸二铵肠溶胶囊口服100毫克每日3次,肝功正常再减量为100毫克日2次巩固2周停服保肝药物;ALT < 5倍正常值应用甘草酸二铵肠溶胶囊口服150毫克,每日3次,肝功能好转后减量为100毫克,每日3次,肝功正常再减量为100毫克,每日2次,巩固2周停保肝药物。抗病毒治疗时间观察至2年。
检测方法 使用促凝管抽取5 ml静脉血,立即分离血清,置于2~8 ℃ 保存。HBV DNA定量采用聚合酶链反应(PCR-荧光探针法)(深圳市匹基生物工程有限公司生产的乙型肝炎病毒核酸扩增荧光定量检测试剂盒),检测下限为500拷贝/ml。HBeAg定量采用化学发光法(LiCA)(博阳生物科技有限公司生产的仪器及配套试剂),HBeAg检测范围为0~65 PEIU/ml。
观察指标 观察三组治疗前、治疗24周、52周、72周、104周的HBeAg、 HBVDNA定量,分析早期HBeAg定量的变化与耐药发生的相关性,预测远期疗效。
疗效评价 72周时,HBV DNA低于检测下限并HBeAg消失或血清学转换为有效,否则为无效,72周内再次出现HBV DNA高于检测下限为病毒学突破
统计学方法 应用SPSS 13.0软件分析,计量资料以 ± s表示,组间采用t检验进行比较,P < 0.05为差异有统计学意义。
结果:拉米夫定组、恩替卡韦组未见明显不良反应,替比夫定组有4例出现肌酸激酶增高,其中一例CK最高达1025u/L,均无明显肌肉酸痛,嘱其减少运动量并密切观察,未予停药, 2周后化验CK下降,之后定期检测CK未再出现明显增高情况。66例患者中有效25例,无效41例,24周内所有患者HBV DNA转阴,未发现有原发耐药病例,随访至104周,后期HBeAg变化不显著,病毒耐药病例未有增多。
篇7
关键字:数据挖掘;Web数据挖掘;聚类分析;聚类算法
一、引言
随着计算机技术、数据库技术、网络技术的飞速发展,各种信息知识可以在网络上获得。网络在给人们带来便利的同时也带来了不少弊端,造成了知识的"污染",面临信息的海洋,呼唤一种从数据海洋中去粗取精、去伪存真的技术来准确、快速地获取有用的、隐含的信息,在这种形势下,Web数据挖掘技术应运而生。
近年来,时空数据挖掘已受到国际学术界和工业界的广泛关注,时空信息的认知和数据模型的研究进展是时空数据挖掘研究的基础,时空数据挖掘的理论研究主要受到空间数据挖掘和时态数据挖掘研究的影响,并以经典的数据挖掘理论为基础,挖掘时空知识或规则。
时空聚类分析作为时空数据挖掘的一个主要研究内容,是计算机科学与地球信息科学领域交叉研究中的一个最前沿、最具挑战的研究课题。时空聚类分析旨在从时空数据库中发现具有相似特征的时空实体结合(即时空簇),亦是传统的聚类分析从空间域到时空域的进一步扩展。时空聚类在全球气候变化、公共卫生安全、地震检测分析以及犯罪热点分析等领域具有重要应用价值,有助于更好地发现和分析地理现象发展变化的趋势、规律与本质特征。
本文把时空聚类分析应用在Web数据挖掘中,具有很强的现实意义与理论价值。一方面,通过聚类挖掘可以找空间实体即水性漆生产商的地理分布规律,帮助决策者更快地找到所需的信息;另一方面,对行业数据重新组织,让相邻、相近的数据尽量编排在一块,可以提高访问速度,对于预测整个水性漆行业的发展动态有积极的意义。
二、国内外研究现状及分析
国内外学者已经针对时空聚类分析开展了初步的研究,现有的时空聚类方法主要包括时空扫描统计方法、基于密度的方法以及基于时空距离的方法。最近, Kisilevich[1] 等对时空聚类分析方法进行了较为系统的阐述。时空聚类分析研究虽然已经取得一定成果,但依然面临两方面难点: (1) 时空数据具有时空耦合的特点。 时空数据是空间维与时间维的有机组合, 空间数据与时序数据的一些性质并不能直接推广到时空域。 例如, 空间数据不存在过去、现在、将来的区别, 而时空数据却具有这种特性;(2) 时空数据具有时空相关性与时空异质性两个重要性质。 时空数据的分布在时间和空间上具有关联性, 也会随着时间和空间的变化而产生差异。 此外, 当前的时空聚类分析研究仍没有形成一套具有普适性的理论方法框架。
现有的时空聚类方法主要包括时空扫描统计方法、基于密度的方法以及基于时空距离的方法。 最近, Kisilevich 等对时空聚类分析方法进行了较为系统的阐述,其主要思想是采用一个预设的时空扫描窗口, 即由空间距离定义半径、时间间隔定义高度的圆柱体, 以每个时空实体为中心进行扫描, 借助统计检验的方法确定疾病爆发的聚集区域。 该方法一方面需要预先假定数据的概率分布模型, 且结果受扫描窗口的影响较大, 另一方面不能详细描述时空簇的位置和形状信息。最近, Pei 等发展了一种基于窗口邻近的时空聚类方法, 其主要思想是定义一个圆柱形的时空邻近域, 在每个时空邻域内区分聚集部分和噪声部分, 并采用 DBSCAN 密度相连的策略将聚集部分连接成时空簇。 该方法只能针对仅存在两种 Poisson 分布(簇与噪声) 的时空数据进行时空聚类操作, 且无法顾及时空实体的非空间属性。 基于时空距离的方法可以区分为两类, 一类是从时间、空间两个角度分别定义时空邻近实体; 另一类是综合定义时空耦合距离, 这类方法主要用于地震序列的时空聚集性发现, 在实际中时空属性的融合比较困难。
综上分析, 可以发现目前尚缺乏一种能够同时顾及时空实体的非空间属性和时空实体时空耦合特性的时空聚类方法。 为此, 下面将发展一种时空聚类分析的新策略。
三、时空聚类分析在Web数据挖掘中的研究与应用
1.研究目标:本课题通过在研究空间数据挖掘、XML 数据挖掘、时空数据挖掘基础上,对时空聚类的关键技术进行分析,设计出适合Web数据挖掘的时空聚类挖掘的算法并构建原型系统,实现对行业网站数据时空聚类挖掘。
2.研究内容:(1) 数据的聚集趋势估计,即判断数据能否进行聚类分析; (2) 聚类方法设计; (3) 聚类结果有效性评价。在地理空间中,时间和空间上的相关性是时空实体的基本特征,也是进行时空聚类分析的前提。若实体间没有相关性,则不会产生明显的聚集现象。时空聚类旨在将时空相关性较强的时空实体聚在同一簇,时空聚类过程中必须充分考虑实体间的相关性。因此,时空聚类分析可以归纳为 3 个步骤。
首先,需要对时空数据进行探索性分析,掌握时空数据的特性。其主要包括: (1) 时空相关性分析,判断时空数据是否可以进行时空聚类分析;(2) 时空平稳性分析,分析时空数据的时空异质特征。
其次,根据时空数据的具体特点发展专门性的时空聚类方法。
最后,需要对时空聚类分析的结果进行分析和评价。
拟解决的关键问题:从时空数据的基本特征出发,建立一套时空聚类分析的理论方法框架,并提出一种时空一体化的时空聚类方法,应用于中国水性漆网的Web数据库,确认其有效性。
3.项目研究方案:
第一步:时空聚类分析:包括时空数据探索性分析、时空邻近域构建和时空聚类方法。
第二步:中国水性漆网站数据时空聚类分析,包括数据描述与预处理:选取中国水性漆网站数据库进行实例分析;时空数据探索性分析:首先对数据的空间相关性进行检验,这里借助变差函数来分析空间相关性。进而,采用普通 Kriging方法进行插值;一种基于 LINQ 查询与 K-Means 结合的时空聚类算法:在分析、比较经典聚类算法的基础上,结合水性漆网站时空数据的特点,提出了一种将扩展的 XML 文档查询语言LINQ与经典的K-Means聚类算法相结合的算法,通过实验验证该算法的有效性及优越性。
时空聚类原型体系结构及设计实现:为验证算法的实用性,基于 ArcEngine采用 C#语言开发了水性漆网站数据时空聚类原型系统。
四、结束语
本文提出了时空聚类分析的理论方法框架, 该框架易于推广用于其他类型的时空数据, 具有很强的普适性;很好地顾及了时空数据的时空耦合、时空相关与时空异质特征, 避免了过多人为主观因素的干扰, 时空聚类结果具有较好的可靠性。
参考文献:
[1] 陆玉昌。数据挖掘与知识发现[M]。成都:西南交通大学出版社,2005
[2] 金艳云。Web数据挖掘综述[J]。现代计算机,2012(11)
[3] 庄怡雯。基于聚类算法的Web日志挖掘应用研究[D]。东华大学,2010
[4] 刘小利,刘小辉。数据聚类算法在Web数据挖掘中的应用[J]。科技创新导报,2012(31)
篇8
【关键词】 类风湿关节炎;证候;BP神经网络;非线性建模
证候是一个非线性复杂系统,中医证候的诊断过程,实质上是由临床收集到的各种症状,通过分析归纳,获得证型诊断的过程,这个过程,可以看作是一个从观察指标到证型诊断的非线性映射过程,用非线性数学模型可以充分模拟。基于黑箱结构的人工神经网络(Artificial Neural Networks,ANN)具有强大的非线性拟合能力,能够任意精度逼近非线性函数,因此,我们将其用于类风湿关节炎(rehumatoid arthritis,RA)证候的非线性建模研究。
1 临床资料
本研究采用中国中医科学院望京医院提供的765例RA临床证候资料。参考《中药新药临床研究指导原则(试行)》[1]、文献整理结果及专家经验,制定临床观察表。共观察183个症状、体征,每个症状按无、轻、中、重分别记为0、1、2、3分;并同时给出肝肾不足证、寒湿阻络证、瘀血阻络证、气血两虚证、痰瘀阻络证、阴虚内热证、热毒蕴结证、寒热错杂证、脾肾阳虚证等10个基本证型的诊断。从上述病例中抽取临床症状和证型诊断构成样本集合,作为神经网络的学习和测试样本。在神经网络的训练过程中,症状向量作为神经网络的输入向量,证型诊断分别对应网络的输出向量。
2 研究方法
2.1 数据预处理及病例分组
先对所有数据进行归一化处理,使处理后的输入输出信息均在(0,1)区间。对上述数据进行主成分分析,主成分的选择标准定为95%。数据经过主成分分析,前98个主成分的贡献率涵盖了总共183个指标的95.035%的信息,故我们取前98个主成分作为进一步分析的指标。通过主成分分析,输入向量从183个减至98个。可见原始数据有很大的冗余。
将765例样本随机分为A、B、C 3组,每组255例。依次选取其中两组作为训练集,另一组作为测试集,共循环3次。
2.2 建立基于共轭梯度下降算法的类风湿关节炎证候BP网络模型
2.2.1 类风湿关节炎证候BP神经网络的结构
在MATLAB7.0环境下,建立基于共轭梯度下降算法的三层前向BP神经网络模型。该模型包括输入层、隐层和输出层,其中输入层包含183个输入神经元;隐层有2个,各包含100个神经元;输出层包含10个输出神经元。两个隐层之间通过正切S型传递函数(tansig)连接,隐层与输出层之间用对数S型传递函数(logsig)连接。设定该网络的系统误差小于0.01,最大迭代次数500次。
2.2.2 类风湿关节炎证候BP网络的输出方式
将具有肝肾不足证、寒湿阻络证、瘀血阻络证、气血两虚证、痰瘀阻络证、阴虚内热证、热毒蕴结证、寒热错杂证、脾肾阳虚证等10种证型诊断样本的期望输出值分别定为(0,1,0,0,0,0,0,0, 0,0),……,(0,0,0,0,0,0,0,0,0,1)。预测整合输出值为(0, 0.2,0.4,0.6,0.8,1),这6个数值分别对应原始输出值的(0-0.1,0.1-0.3,0.3-0.5,0.5-0.7,0.7-0.9,0.9-1)区间的数值。整合输出值≤0.4为诊断不成立,≥0.6为诊断成立。
2.2.3 基于共轭梯度下降算法的类风湿关节炎证候BP神经网络模型的训练
网络参数的初始值取为[-0.5,+0.5]上均匀分布的随机数,利用train函数对网络进行训练,第1次训练经过89次迭代以后,网络的系统误差降至0.009 450 59;第2次训练经过56次迭代后,网络的系统误差降至0.009 423 47;第3次训练经过58次迭代以后,网络的系统误差降至0.009 174 36。上述数值均小于规定的最小误差0.01,提示网络趋于稳定,网络性能达标,训练自动停止。
2.2.4 类风湿关节炎证候BP神经网络模型的测试
该网络模型的权值趋稳,训练结束后,分3次分别对1/3测试样本做检验。规定单证阳性诊断的符合情况为单证特异性;所有单证诊断的符合情况为单证准确率;病例的全部证型诊断符合情况为诊断准确率。即:单证特异性(%)=预测输出所有单证阳性符合例数/期望输出所有单证阳性例数×100%;单证准确率(%)=预测输出所有单证符合例数/期望输出所有单证例数×100%;诊断准确率(%)=预测输出符合例数/所有病例数×100%。其中,以整合输出值的大小排序,主证为证候的前2位证类,兼证为第3位证类,第3位以后的证类忽略不计。
3 结果
测试结果显示:3次测试的平均单证特异性为81.31%,平均单证准确率为95.70%,平均诊断准确率为90.72%。结果见表1。表1 RA证候BP神经网络模型测试结果与临床诊断结果的比较(略)
4 讨论
ANN的一个显著特征是它能够通过自动学习来解决问题,对样本的学习过程,即为对网络中神经元间的联系强度(即权重系数)逐步确定的过程,通过对样本的学习,可以学会识别自变量与应变量间的复杂的非线性关系。经过充分学习后的ANN获取了样本的特征规则,并将这些规则以数字的形式分布存贮在网络的连接权中,从而构成了系统的非线性映射模型。用ANN建模,可将过程或对象看成一个“黑箱”,只要测得输入输出数据,就可以建立相应的模型,不必象传统的系统辨识那样把过程或对象分为线性系统还是非线性系统,也不必对过程或对象内部进行分析,这对未知过程的系统辨识是十分方便的。
中医证候体系具有复杂系统的非线性、开放性、层次性、涌现性和高维性特征,是一个多维多阶多变量的非线性复杂系统[2-3]。中医学辨证施治过程,实质上是对大量数据信息作出处理,提取规律的过程。如何从中医学大量现象学描述中寻找其内在规律,是证的规范化研究之热点和难点。以往多采用统计学方法,但效果不够理想。ANN作为一种智能信息处理系统,能够充分逼近任意复杂的非线性关系,获得样本数据的规则,较好避免数据处理中可能掺杂的主观因素,客观如实地反映研究对象[4],因此,可以将其用于中医证候的非线性建模研究。
我们在MATLAB7.0环境下,对一组RA临床证候资料建立了基于共轭梯度算法的BP神经网络证候模型,并用3倍交叉验证的方法进行测试,结果显示:该模型具有很好的诊断、预测能力。说明ANN能够充分模拟症状与证型诊断之间的非线性映射关系。这是目前在不打开人体黑箱的前提下,建立非线性证候模型、反映证候的内在规律和特征的有效方法。
BP神经网络有一个明显的缺点是收敛速度非常慢,为此,我们基于共轭梯度学习算法,采用trainscg函数改进train函数,从而加快了神经网络的收敛速度。我们建立的RA证候网络模型3次训练的迭代次数分别为89、56、58,说明通过改进的BP神经网络具有很好的收敛性能。
另外,针对临床证候资料多存在兼夹证以及各证型之间有主次之分的情况,我们首先将模型的输出采用1个输出节点对应1种证型的方式,比如,RA证候模型共有10个证型,我们将包含10个证型的输出采用(0,1,0,0,1,0,0,0,0,0)的方式,其中,括号内每一个数值代表一种证型,“0”表示诊断不成立,“1”表示诊断成立,这样就可以诊断兼夹证了;然后,我们将整合输出值整理成(0,0.2,0.4,0.6,0.8,1)等6个等级的方式,这6个数值分别对应原始输出值的(0-0.1,0.1-0.3,0.3-0.5, 0.5-0.7,0.7-0.9,0.9-1)区间的数值,并规定整合输出值≤0.4为诊断不成立,≥0.6为诊断成立,这样就进一步根据整合输出值的大小直接判断有几个兼夹证以及各证型的主次地位了。可见,我们建立的RA证候网络模型不仅能够利用神经网络的自主学习能力从大量的样本中抽提出比较全面的证候内在规律,具有良好的诊断、预测能力,而且操作简便,真正实现了证候诊断的智能化。ANN技术是中医证候非线性建模的可行性方法。
虽然我们已经证实了ANN用于证候非线性建模的可行性,但是,以目前的技术,还无法从网络的联接权中抽提出网络通过自动学习所获得的证候规律,今后可以围绕这个关键问题继续开展研究。另外,证候的诊断信息具有模糊性特征,用模糊神经网络理论应更能够逼近证候的全貌,我们曾经试图用模糊神经网络进行证候的非线性建模研究,但是,目前的模糊神经网络还无法处理证候的兼夹问题,模糊神经网络的输出结果只能是多类中的一类,因此,我们暂时未作。今后我们将围绕这方面展开深入研究,力争建立证候的模糊神经网络模型。
总之,一门学科只有不断地吸纳先进的思想与技术,在继承的基础上发展创新,才能真正具有生命力。中医证候复杂系统研究,呼唤非线性科学、人工神经网络、计算数学、模糊数学、信息工程、医学工程、复杂性科学等多种边缘学科、交叉学科理论和技术方法的介入,理论上的探讨和不断切实可行的实践探索并行,才能使中医证候规范研究从量的积累上升到质的飞跃。
参考文献
[1] .中药新药临床研究指导原则(试行)[S].北京:中国医药科技出版社,2002.115-119.
[2] 白云静,申洪波,孟庆刚,等.基于复杂性科学的中医学发展取向与方略[J].中国中医药信息杂志,2005,12(1):2-5.
[3] 白云静,申洪波,孟庆刚,等.中医证候复杂性特征及证候研究思路探析[J].中国中医药信息杂志,2004,11(9):754-756.
[4] 白云静,申洪波,孟庆刚,等.中医证候研究的人工神经网络方法探析[J].中医药学刊,2004,22(12):2221-2223.
3 结果
测试结果显示:3次测试的平均单证特异性为81.31%,平均单证准确率为95.70%,平均诊断准确率为90.72%。结果见表1。表1 RA证候BP神经网络模型测试结果与临床诊断结果的比较(略)
4 讨论
ANN的一个显著特征是它能够通过自动学习来解决问题,对样本的学习过程,即为对网络中神经元间的联系强度(即权重系数)逐步确定的过程,通过对样本的学习,可以学会识别自变量与应变量间的复杂的非线性关系。经过充分学习后的ANN获取了样本的特征规则,并将这些规则以数字的形式分布存贮在网络的连接权中,从而构成了系统的非线性映射模型。用ANN建模,可将过程或对象看成一个“黑箱”,只要测得输入输出数据,就可以建立相应的模型,不必象传统的系统辨识那样把过程或对象分为线性系统还是非线性系统,也不必对过程或对象内部进行分析,这对未知过程的系统辨识是十分方便的。
中医证候体系具有复杂系统的非线性、开放性、层次性、涌现性和高维性特征,是一个多维多阶多变量的非线性复杂系统[2-3]。中医学辨证施治过程,实质上是对大量数据信息作出处理,提取规律的过程。如何从中医学大量现象学描述中寻找其内在规律,是证的规范化研究之热点和难点。以往多采用统计学方法,但效果不够理想。ANN作为一种智能信息处理系统,能够充分逼近任意复杂的非线性关系,获得样本数据的规则,较好避免数据处理中可能掺杂的主观因素,客观如实地反映研究对象[4],因此,可以将其用于中医证候的非线性建模研究。
我们在MATLAB7.0环境下,对一组RA临床证候资料建立了基于共轭梯度算法的BP神经网络证候模型,并用3倍交叉验证的方法进行测试,结果显示:该模型具有很好的诊断、预测能力。说明ANN能够充分模拟症状与证型诊断之间的非线性映射关系。这是目前在不打开人体黑箱的前提下,建立非线性证候模型、反映证候的内在规律和特征的有效方法。
BP神经网络有一个明显的缺点是收敛速度非常慢,为此,我们基于共轭梯度学习算法,采用trainscg函数改进train函数,从而加快了神经网络的收敛速度。我们建立的RA证候网络模型3次训练的迭代次数分别为89、56、58,说明通过改进的BP神经网络具有很好的收敛性能。
另外,针对临床证候资料多存在兼夹证以及各证型之间有主次之分的情况,我们首先将模型的输出采用1个输出节点对应1种证型的方式,比如,RA证候模型共有10个证型,我们将包含10个证型的输出采用(0,1,0,0,1,0,0,0,0,0)的方式,其中,括号内每一个数值代表一种证型,“0”表示诊断不成立,“1”表示诊断成立,这样就可以诊断兼夹证了;然后,我们将整合输出值整理成(0,0.2,0.4,0.6,0.8,1)等6个等级的方式,这6个数值分别对应原始输出值的(0-0.1,0.1-0.3,0.3-0.5, 0.5-0.7,0.7-0.9,0.9-1)区间的数值,并规定整合输出值≤0.4为诊断不成立,≥0.6为诊断成立,这样就进一步根据整合输出值的大小直接判断有几个兼夹证以及各证型的主次地位了。可见,我们建立的RA证候网络模型不仅能够利用神经网络的自主学习能力从大量的样本中抽提出比较全面的证候内在规律,具有良好的诊断、预测能力,而且操作简便,真正实现了证候诊断的智能化。ANN技术是中医证候非线性建模的可行性方法。
虽然我们已经证实了ANN用于证候非线性建模的可行性,但是,以目前的技术,还无法从网络的联接权中抽提出网络通过自动学习所获得的证候规律,今后可以围绕这个关键问题继续开展研究。另外,证候的诊断信息具有模糊性特征,用模糊神经网络理论应更能够逼近证候的全貌,我们曾经试图用模糊神经网络进行证候的非线性建模研究,但是,目前的模糊神经网络还无法处理证候的兼夹问题,模糊神经网络的输出结果只能是多类中的一类,因此,我们暂时未作。今后我们将围绕这方面展开深入研究,力争建立证候的模糊神经网络模型。
总之,一门学科只有不断地吸纳先进的思想与技术,在继承的基础上发展创新,才能真正具有生命力。中医证候复杂系统研究,呼唤非线性科学、人工神经网络、计算数学、模糊数学、信息工程、医学工程、复杂性科学等多种边缘学科、交叉学科理论和技术方法的介入,理论上的探讨和不断切实可行的实践探索并行,才能使中医证候规范研究从量的积累上升到质的飞跃。
参考文献
[1] .中药新药临床研究指导原则(试行)[S].北京:中国医药科技出版社,2002.115-119.
[2] 白云静,申洪波,孟庆刚,等.基于复杂性科学的中医学发展取向与方略[J].中国中医药信息杂志,2005,12(1):2-5.
篇9
中国式英语是一种很普遍的现象。中国学生在英语学习的过程中习惯用汉语的方式来思考问题,并把汉语的应用规律也放到所学的目的语中,母语在外语学习的过程中产生了极大的干扰作用,从而产生了一种不标准的英文变体,这种变体可以表现在语音,词汇,句法,语篇及语用的各个方面,这就是人们俗称的中国式英语。很多学者都认为,中国式英语是由于母语文化与目的语文化之间的差异引起的,普遍认为中国式英语是一种不规范的语言类型(morbid language)。
语言与文化有着密切的联系,由于语言的产生和发展,人类文化才得以产生和传承。中国是一个有着五千年悠久历史文化的大国。中国文化对于世界的影响力自古就有。作为拥有人口数量位于世界第一的中国,语言的传播和影响力是不容忽视的。语言既是文化的载体,又是文化的写照。文化影响语言,语一言反映文化。由于语言和文化密不可分,语言学习和文化学习也是不可分的。语言学习在文化学习中进行。没有语言作为正规非正规的学习手段,就决不可能学到任何文化。任何人习得一种语言的同时,也该学习该语言的文化,因为语言是一种文化的表现形式与承载形式,不了解这个民族的文化,也就无法真正学好该民族的语言。所以我们说,学习英语就需要了解英语国家的文化,传统及风俗习惯,了解中西方文化的差异。
中国式英语最早产生是在文化传输的输入中产生的,其根本原因就是缺乏西方文化知识引起的。绝大多数的中国学生都是在汉语言文化这个环境下学习英语,中西方文化差异就成为了中国学生学习英语过程中面临的最大问题,学生在说英语或在写英语作文的时候所犯的语言错误有不少其实是“文化错误”。所谓“文化错误”,是指学习者所使用的目的语不为口的语国家的人们所理解或接受。以两个最为典型的例子来说明这种情况。
首先是打招呼。用英语打招呼最常用的的是用“hello","good morning","how are you”等用语,随便的一点可以用“Hi"。但是很多外国友人或者外籍教师都发现中国学生不太习惯使用这些打招呼的方式。当那些学生在校园里碰到的时候,更多的是会lb]诸如:"Have you eaten?,,或者“Where are you going to?”一类的问题。这些问题让人很尴尬,也不知道该怎么回答。事实上这些就是中国式英语的表现,中国人见面了,都会用这样的问候语来互相打招呼。中国人无视国外保护隐私的习惯,也把这种打招呼的方法用到交流中,势必会造成误解。
还有一种情况是在面对别人的赞扬的反应。当英语国家的人们听到自己的赞扬的时候,多数是回答“thank you"。但中国人听到赞扬的时候,如果回答谢谢,别人多会认为这个人不怎么谦虚,甚至觉得太自夸了,所以中国人一定会对别人的赞扬表现为自谦或者自我否定。如果不知道中西文化的差异,问题就来了。很多学生在听到别人的赞扬的时候,肯定就会说,"No, I am not good as you say.”等等,初到中国的不了解文化的外教也会觉得不知所云。
因此,由于缺乏跨文化意识而导致的中国式英语的例子还有很多。这一方面说明了在外来语的学习中,文化意识的培养还相当欠缺。用汉语思维来进行英语交流时普遍存在的问题。许多英语老师在讲解英语语言知识和语法知识的时候很熟练,但涉及到跨文化交际能力的时候,就会出现文化知识不够丰富,语用能力随之较弱的情况。随着经济和社会的发展以及国际交往的日益频繁,对英语的实际应用能力的要求越来越高,尊重和接纳他国文化就成为交往中不可回避的内容。
在英语学习中,教师应强调英美文化的导入。学生在教师的引导下,应该逐步积累,意识到学习语言不应该只学习语法句法,更重要的是了解不同的文化,用所学语言传承文化和表达文化,让文化融解于语言之中。这也是为什么很多大学开设《英美文化》等课程,对学生理解所学语言的文化起到了积极的作用,同时也帮助学生更有效的使用语言。
随着中国的改革开放和日益与世界接轨的发展进程,越来越多的外国人在与中国人的接触中开始慢慢的接触中国式英语,并且认可中国式英语的语法规则和意义的表达。
语言习得的完成,是某种思维方式形成的标志。德国语言学家,哲学家洪堡特认为,语言不仅有表达功能,而且还有认知功能,是“一个民族进行思维和感知的工具”,每一种语言都包含了一种独特的世界观。因此当中国式英语在表达中国特点具有中国特色的时候,不可避免的由操汉语的人固有的思维模式和中国特有的传统文化影响,在英语中夹带中国特点,这也是中国式英语的一种特别的表现形式。
要使英语和中国特有的社会和文化也绝不是一件容易的事情。中国环境有的东西要想单纯通过语言让对这一环境一无所知得人了解,往往还是要费一番周折,人们只有通过语言表层,了解其深层的社会文化内涵之后,才能进行真正的沟通和相互了解。这也是将中国传统文化和现在的社会文化介绍并传播的一个有效途径。
从词汇角度出发,中国式英语这时是一种输出性语台,但不可避免的将文化渗透其中,是英语带上明显的中国特色。诸如气功,地方戏曲,传统习俗和日常生活等方面的许多名称或术语,很多是通过音译在英语中使用。事实上,很多的汉语借词早已进入英语辞典中,如:wushu,kungfu,quyi,erhu,yamen mahjong等等。
我国还有丰富的成语,谚语,典故和警句等,怎么样将它们翻译成英语是一个值得探讨的问题。比如如果硬将"papertiger"翻译为“scarecrow"就失去了“纸老虎”这一词本身所具有的文化底蕴。这种情况很多,汉语在外来语的吸入中也注意到了。比如“特洛伊木马”,“潘多拉盒子”,“鳄鱼眼泪”之类的。这样的互相渗透,不仅是思想的交流,也是语言的交流。
中式英语比较成熟,直接了当地说事,不拖泥带水,早就得到国际承认,最著名的当属long time no see。英国作家萧伯纳当年曾说过,中国的洋注洪英语no can(不能)比正宗英语unable (不能)要清晰明了,值得仿效。类似的例子还有“你问我,我问谁”=You ask me, me ask who?
还有些中式英语是在与时俱进的发展中产生的。截取意义完整准确的两个英语词汇的一部分构成新词诊释中文时事词汇。
篇10
关键词: 仿译仿译词翻译原则汉语
一、仿译和汉语仿译词
维基百科里所定义的仿译词(a calque or loan translation)是指通过直译、词对词或者词根对词根的翻译,借自另一种语言的词,或者词组(a calque or loan translation is a word or phrase borrowed from another language by literal,word-for-word or root-for-root translation)[1]。在《牛津高阶英汉双解词典》(第六版),仿译词亦称借译词,或称仿造词,外国词语的字面直译词(a word or expression in a language that is a translation of a word or expression in anther language)。[2]仿译即逐词翻译,仿译词基本上可以保持译出语的句法结构、独特的表达法、意象和附着在其上的联想意义。
语言学家熙认为,汉字是一种语素文字。[3]汉语仿译词通过采用“字面对应”的直译法,即用概念意义对应的或者基本对应的汉语语素(亦称词素;汉语中一般一个汉字就是一个语素)替换译出语的词素,即汉语逐字翻译译出语中的词素。例如:“白领”(white-collar)、“蓝牙”(Bluetooth,一种短距离无线电技术)等。
成为汉语语汇的仿译词,并非只是汉语语素与译出语的词素相对应,它不仅遵循着人们一般认可的翻译的基本原则“真实(faithfulness)、通顺(coherence)和传神(lifelikeness)”:不但能表达原文的概念意义,而且能反映出原文的联想意义;不但呈现了原文的词、词组结构,而且符合汉语词、词组的表达习惯;不但保留了原文的意象,而且这种意象和汉语文化不发生冲突;而且受到汉语语言和汉语文化的制约。此外,仿译词的接受度和使用频率随着人们对译出语语言和文化的认知度的提高而提高。本文依据翻译的基本原则,分析汉语仿译词所遵循的原则,以及影响外来语中的词和词组成为汉语语汇的一些相关因素。
二、翻译的基本原则和汉语仿译词
人们基本达成共识,翻译的基本原则是真实、通顺、传神。
(一)忠实于译出语意义及句法结构的汉语仿译词。真实――理想的翻译的真实,是指译文既忠实于原文所要传递的意义(概念意义和联想意义),又忠实于原文的句法结构。英国语言学家利奇(Geoffery Leech)把语义划分成不同类型:概念意义(conceptual meaning)和联想意义(associative meaning)。他认为概念意义是词义的核心,它直接地、明确地表示所指对象;而联想意义是指词的附带意义,与文化紧密相关;包括词的内涵意义、社会意义、情感意义、反映意义和搭配意义。[4]有的语言学家称“联想文化意义”为“社会文化意义”。如果译出语信息要在译入语中得到尽可能完整而准确的表达,那么译文就应最大程度转化或者再现原文的概念意义、联想意义及主题意义,即组织信息的方式(语序、强调手段)所传递的意义。[5]一方面,得到认可、成为汉语语汇的仿译词能呈现或者基本再现译出语词语的意义,另一方面,仿译词把原文的句法结构、表达方式直接移植到汉语中,因此在句法结构上,汉语仿译词忠于或者接近译出语的结构。例如:仿译自英语词grass roots的“草根”,其构词类型与原文一致,而且“草根”不仅传递着原词grass roots的概念意义“平民百姓”、“基层民众”,而且传递出丰富的联想意义――“平凡、普通、根基、坚强的生命力”等。
(二)通顺的汉语仿译词才可能进入到汉语语汇中。通顺是指译文符合译入语的表达习惯,文理通达,结构清晰。汉语仿译词虽然在形式上逐词地紧随原文,但是由于人类思维存在一定的共性,从原文移植的语言结构和习惯表达方式和汉语有相同或者相近之处。成为汉语语汇的仿译词符合汉语的构词习惯、词组表达习惯。例如:“篮球”(basketball)、“热线”(hotline)、“蜜月”(honeymoon)、“三维动画”(three-dimensional animation)、“白板”(white-board)、“白色污染”(white pollution,指废弃塑料及其制品对环境造成的污染)等。
(三)汉语仿译词可以很好地保留译出语中的意象,传神再现译出语的表达。传神是指译文保留了原文的喻义和意象,表达形象生动,令人回味。得到认可、成为汉语语汇的仿译词保留了原文的意象,并且联想意义丰富,例如仿译词“跳蚤市场”(flea market,指经营廉价商品、旧货物和古物的露天市场)的小、灵活,无固定摊位,所售货物的特点――低廉,与跳蚤的形象很贴切;再如“武装到牙齿”(armed to the teeth,全副武装)、“鸵鸟政策”(ostrich policy,逃避现实;不愿正视现实)都很好地保留了原文的意象,给人生动逼真的印象。
汉语仿译词除了遵循翻译的一般原则外,在汉语语言文化语境中,一个来自外来语的词或者词组能否以仿译的形式融入汉语语汇,与汉语中是否存在与译出语相对应的概念和表达相关,与汉语和译出语中相对应的语素的联想意义相似度相关,与汉语构词习惯和译出语句法结构是否相同、相近相关,与人们对译出语历史文化的熟悉度、认知度相关。
三、影响外语词汇作为仿译词、词组融入汉语的因素
(一)词汇空缺。汉语中如果不存在与译出语相对应或者类似的表达,则仿译词存在的可能性较大。中西方由于地理环境、风俗习惯、传统积淀、历史文化的差异,一种文化里的某种习俗、概念在另一文化里空缺,对应的词汇空缺就不可避免地存在。例如:仿译词“热狗”(hot-dog),虽然“热狗”在一定程度上传递了此种异国食品的形态,较为生动传神,也符合汉语构词法,但是完全不知“热狗”为何物的人,如果按照汉民族“望文生义”的习惯,可能会产生相差甚远的联想意义,但是由于汉语中无此相对应的词汇,仿译词“热狗”填补了这一词语空缺,得到了人们的认可。再如,“车库销售”(garage sale,在私人住宅的车库里进行的旧物销售)、“庭院拍卖”(yard sale,在自家庭院售卖二手家什)这类仿译词不仅填补了概念、词汇空缺,而且相比其意译词而言,更能让人们直接感知译出语的习俗文化。此外,越来越多的汉语仿译词是随着社会、经济和科技领域的发展,在填补不断出现的新概念、新术语所带来的词汇空缺中进入到汉语语汇的。例如:“绿领”(green-collar)、“碳足迹”(carbon footprint)、“空巢症”(empty nest syndrome)、“数字原居民”(Digital native,指一出生就生活在电脑、互联网环境中的一代人)、“数字地球”(digital globe)等。与以上相对而言,如果汉语中存在与原文相对应的概念、词组表达时,虽然汉语表达的喻体与译出语的喻体不同,体现了迥异的文化,但是仿译词出现的倾向性较低。例如:hot air(empty talk,空谈)似乎并没有仿译词“热气”来表示“夸夸其谈”;fish in the air的译文是“水中捞月”而非“空中钓鱼”;spring up like mushrooms(快速生长,迅速发展)的译文是“雨后春笋”而非“雨后蘑菇”;the land of milk and honey(富饶的乐土)的译文是“鱼米之乡”,鲜见仿译词“奶蜜之地”;a piece of cake常译为“小菜一碟”或者“举手之劳”,而非它的仿译词“蛋糕一块”。由此可见,虽然人们习惯使用和自己文化密切相关的词汇,但是汉语仿译词在吸收异域文化、新概念,填补词汇空缺方面,仍有着积极的意义。
(二)联想意义。汉语语素与译出语相对应的语素的联想意义相似度越高,仿译词存在的可能性越大。当汉语仿译的复合词、词组及短语所引起的联想意义和译出语越接近,或者相似度越大时,即在文化层次上不存在冲突的词和词组,仿译词存在的可能性越大。例如:“绿卡”(green card)、“绿色和平”(greenpeace)、“非政府组织”(non-government organization)。相反,如果汉语语素与相对应的译出语语素的联想意义关联度低,甚至相去甚远的话,汉语仿译词出现的可能性甚小。众所周知,black sheep没有如black horse(“黑马”)仿译为“黑羊”,也许除了汉语中的“害群之马”、“败家子”和black sheep(败类,一钱不值)的表达法类似外,还缘于中西方对于“羊”的不同联想。英国古代的迷信传说中认为黑羊是魔鬼的化身,而且英国人总是认为黑绵羊的羊毛不如白绵羊的羊毛值钱。尽管中国人同西方人一样都认为黑代表黑夜,黑色代表“坏”、“狠毒”、“邪恶”,如中文的“黑店”、“黑心肠”,但是古时,中国汉字“羊”同“祥”,意为“吉利”,因此中国人难于产生有关“羊”的不好的联想,哪怕是“黑羊”。也许这就是汉语中不存在black sheep的仿译词的缘故。再如,汉语中似乎无the apple of sb’s eye的仿译词,人们大多依旧使用“掌上明珠”来比喻极受父母宠爱的儿女,或者为人所珍爱的物品。究其原因,apple在西方宗教、神话传说、英美人民生活中的地位所能引起的丰富的联想意义,极难在我们中国人心目中引起相似的共鸣。
(三)词汇结构。汉语构词特点与译出语相似度越大,仿译词出现的可能性越大。尽管中西方思维存在差异性,但是作为人,思维仍存在某些共性。尽管中文和英文来自完全不同的语系,但是在词汇层,复合词、词组结构和搭配上仍存在相同、相似之处。例如:何善芬认为从词与词的关系看,英汉复合名词都有偏正、动宾和主谓这几种类型。[6]当译出语的词、词组结构符合汉语词、词组的结构和表达习惯时,汉语仿译词被接纳的可能性就越大。例如:“超人”(superman)、“高端”(high-end)、“遭遇滑铁卢”(meet one’s Waterloo,最终的失败,毁灭性打击,惨败)等,英汉句法结构相同,表达习惯相似。如果译出语和汉语表达习惯不太吻合,仿译词出现的可能性较低。例如汉民族长久以来有求稳的心态,表现在汉语上,成语多为四字词。例如once in a blue moon强调“极其罕见的,极其难得”,因为“蓝月亮”永远都不可能出现;然而,似乎无人为了保留原文意象译成“一次蓝月亮”,却有人把它意译成“千载难逢”或者“破天荒地”。再如PDA(Personal Digital Assistant),虽然可以仿译成“个人数字助理”,但是人们更倾向使用“掌上电脑”。
(四)语言文化认知度。人们对译出语历史文化的熟悉度、认知度越高,仿译词存在的可能性就越大,仿译词接受度就越大。随着文化接触、语言接触的深入,一些过去不曾或者不太被认可的仿译词业已以更高的频率出现在人们的交际中。例如越来越多的人熟知、运用“鳄鱼眼泪”(crocodile tears,假慈悲),“潘多拉之盒”(A Pandora’s box,表示灾难、麻烦、祸害的根源),“特洛伊木马”(Trojan horse,指潜伏在内部的敌人),“第二十二条军规”(Catch-22,指矛盾双方存在互为前提,从而陷入到一个进退两难的境地,有人意译为“进退维谷”或“左右为难”),“玻璃天花板”(glass ceiling)等诸如此类的仿译词,而不仅仅是它们的意译词。或许有一天as wise as Solomon可仿译成“智如所罗门”,而不是仅仅意译为“很有智慧”;表现英美特定文化背景的仿译词“热砖上的猫”(like a cat on hot bricks),会像“如坐针毡”或“热锅上的蚂蚁”一样出现在人们交际中。然而,如果人们对译出语的习语典故不知晓、不熟悉,仿译词也可能造成交际、理解的困难。例如:如果把back from Boot Hill仿译成“从靴山归来”,可能一些人就难解其意,或许意译为“九死一生”、“东山再起”较为妥当些。随着中西方文化的交流日渐增多,更多文化负载(culturally-loaded)仿译词、词组、短语会逐渐成为汉语语汇的一部分。
四、结语
进入到汉语语汇的仿译词遵循着翻译的一般原则,能否成为汉语仿译词不仅与语言本身相关,而且与两种语言相联系的文化相关。随着不同语言、不同文化之间的人们接触范围的扩展、沟通的进一步加深,更多的仿译词将融入到汉语语汇中。这在一定程度上会使汉语的表达呈现多样化,丰富汉语表达,促进汉语发展。
参考文献:
[1]en.省略/wiki/Calque.
[2]Hornby,A.S.Oxford Advanced Learner’s English-Chinese Dictionary(6th edition)[Z].北京:商务印书馆,2004.
[3]熙.文熙文集(3)[A].北京:商务印书馆,1999:211.