生物信息学的重要性范文

时间:2023-12-21 17:37:31

导语:如何才能写好一篇生物信息学的重要性,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

生物信息学的重要性

篇1

关键词:心理需要 学习兴趣

教育不仅是知识的传播、技能的训练、更是智能的开掘、精神的陶冶和文化的滋润。尤其物理学科本身的特性――难学、难理解、物理概念抽象,在学生中普遍形成物理难学的心理。因此物理教师就更应该满足学生的心理需要,同时注重学生性情的培养和思想的丰富,使学生把学习活动作为一种内在的精神需要。让师生在生动、和谐、愉快的气氛中交流协作,探求新知,体会探索物理知识的艰辛和发现的快乐。从适应中学生身心发展的心理需要为基础来培养他们对物理学习的兴趣,激发他们学习物理的积极性。

1.中学生也有心理需要

需要一般可分为自然需要和社会需要,物质需要和心理需要。中学生年龄段与其他成人阶段一样,既有对物质的需要,也有对精神的需求,尤其社会性需要的发展更为显著。他们往往认为自己“长大了”,不仅需要独立自主,而且还希望得到别人尤其是老师和家长的重视与尊重。学生的行为价值需得到老师和家长的肯定。中学生学习过程中需要轻松愉快,长期处于紧张、焦虑的状态,不利于其身心健康的发展。因此,教师应调节他们的学习与生活,做到劳逸结合,在课堂中让学生轻松愉快地学习。

2.学习兴趣在中学物理教学中所发挥的作用

众所周知,物理学科难学、难教,尤其高中物理更难,物理抽象、概括的特点与中学生年龄,抽象思维尚未形成的生理、心理特点不相适应,学生理解掌握物理知识比较困难,学习过程中分化现象严重,这样学生一旦在物理学习上遇到挫折和失败,就会造成“精神创伤”,形成了心理上的沉重负担,失去学习物理的信心。因此,培养学生学习物理的兴趣是物理教师教学目的的关键。

3.中学生心理需要与物理学习兴趣

鉴于学习兴趣在物理教学中的重要地位,那么我们怎样通过满足学生的心理需要来使学生对物理学习产生兴趣呢?

3.1让学生感到物理知识是学有所用的

当学生感到物理这门学科有价值,能解决生活实践中的问题时,就能引起学生求知的需要和学习物理的动机,从而激发学生学习物理的兴趣,提高学生学习物理的积极性。抓住学生学习需要的心理特点,我们老师就应该在物理教学中贯穿生活实例,体现物理知识的“有用性”。

3.2克服学生对物理难学的心理

3.2.1情景教学

从教学过程实践看,学生对物理情景的分析,对物理概念、物理情景过程的理解,较为突出的问题是容易受表象因素干扰,不善于抽象出问题的本质特征,导致建立模型困难;同时也反映出部分学生只会死记硬背知识,缺乏分析问题的能力。如何在教学中培养学生通过对物理问题情景的分析,快捷地建立物理模型,应用所学的知识去解决实际问题,可以从以下几方面尝试。

(1)利用物理实验展示物理情景,如磁场线的分布,可以用磁铁吸引铁粉来模拟磁场线的分布。

(2)利用图表创设物理情景。如采用电视机的流程图以展示电视机的工作原理。

(3)采用电教媒体模拟物理过程,丰富物理情景。如电子运动,光的折射等。

通过以上的方法,学生通过理解物理知识,在自己的大脑中形成自己的知识体系和物理过程,更容易把握物理知识的内在联系,学起来轻松,从而排除物理难学的心理,为以后的物理学习坚定了信心。

3.2.2教学课程设计

教师要精心设计教学过程,让知识体系适应学生的心理认知层次结构的需要,从而激发学生的学习兴趣。因此,教师在安排课堂内容时就要有一个合理的安排,不一定要跟着教科书走。在课程顺序上可以大胆地进行调整。

利用学生定势思维的正迁移,可以使知识点的传授更适合学生的接受思维。如在高中物理第一册中的第一章――力:在教材中是这样安排的:1力;2重力;3弹力;4摩擦力;5力的合成;6力的分解。如果按照教材的安排进行教学。那么给学生的感觉就相当乱,只会把第5、6节的知识内容与第一节的知识相联系,同时也会感到本章学习了四种力一一把知识点相互独立起来,不易把所学的知识连贯,不会灵活迁移。如果我们把握学生的心理认识特征和认识需要的过渡层次,那么我们就可以把本章的知识做适当的调整,顺序安排如:通过对“第1节力”的学习,给学生一个整体的感知,给出力的概念、力的三要素,然后把第5、6节调上来讲,给学生一个整体的感知和认识,从而知道所有的力都可以合成和分解,这样学习后,再学习第2、3、4节知识,说明重力、弹力、摩擦力是力的几个特例,并在讲述重力、弹力、摩擦力时再分别进行合成或分解。这样有利于学生掌握力的所有知识,并进行迁移应用,让学生能轻松地理解而不会感到物理知识难学和复杂。

3.3克制不合理的需要

学生心理需要有合理和不合理之分,教育要引导学生发挥合理需要,对于不合理的需要,要在教育过程中进行限制和规范。中学生处在一个特殊时期。其思想受传媒和社会的影响很大,由于思想的不成熟,往往会产生一些不现实的幻想,易把成功看得容易,但实际并不像电视上所描写的那样会“天赐良机”,因此,教师要正确引导他们,使他们在物理学习中能坚持刻苦学习,不应该轻易放弃对物理的探索。因此,教师应多与学生进行思想交流,师生间的友好交流和思想沟通能让学生全面认识、分析问题,尽快走出思想观念的误区。

参考文献:

1.郭票岩.心理学.南京大学出版社,2003.7

2.孟昭辉.中学物理教学理论与实践研究.高等教育出版社,2004.5

3.王乐意.情景教学[J].阜阳师范学院学报(自然科学版).2003.9

4.钟启泉.物理教育展望.华东师大出版社,2002.2

5.朱铁成.中学物理研究性学习设计范例与指导.广东教育出版社,2003.5

篇2

生物信息学 生物科学 实践教学

生物信息学作为一门新兴的交叉性学科,综合生物学、计算机科学和信息技术试图,从大量数据中寻找具有指导和开创性价值的依据,为生命科学研究提供必要的、有效的系统模拟和信息预测结果。目前,生物信息学在生物医学、生物工程、植物学、动物学、生态学、遗传学、制药和高科技产业领域中的应用越来越广泛,产生巨大的影响力和推动力。

一、生物信息学在生物科学领域的作用

生物科学是研究生物结构、功能、发生和发展规律,及其与周围环境关系的科学。在分子生物学技术突飞猛进的发展过程中,生物科学从传统的个体及群体表征研究逐步演变为内在分子机制的研究,随着基因测序技术的发展,生物科学领域的研究不仅聚焦于生物个体的内在分子机制,同时还从大量的生物个体的基因数据中获取和解析生命的本质和规律,并以此尝试对生命过程进行干涉和改造。而在获取、解析、干涉和改造的过程中扮演重要角色的就是生物信息学。

生物信息学是在生物科学领域各个学科发展的过程中逐步产生的一门综合性学科,该学科在生物科学领域的应用极为广泛。目前,植物基因组研究取得了重大进展,水稻、大豆、小麦等农作物的遗传图谱、基因序列、基因组注释已公布于美国国立生物技术信息中心(NCBI)的生物信息数据库中。利用生物信息学的相关方法和技术能够对这些数据进行查询、统计和分析,从而更好地理解和认识植物基因组的功能,指导后续的科学研究和生产应用。传统的生物学分类方法已经鉴定及分类了成千上万的物种,但是随着生物科学的发展和认知,越来越多的物种在遗传进化上的分类依据较为模糊,而利用生物信息学结合传统的分类学可以更好的研究生物类群间(植物、动物、微生物等)的异同性、亲缘关系、遗传进化过程和发展规律,这在当今的生物分类学中应用日趋广泛。生物信息学还可以综合利用数学、统计学和计算机等学科对生态系统进行模拟和计算分析,探索物种间基因流动的本质,揭示生态系统的物质和能量循环规律,从而为找到决定生态系统平衡和稳定的根本因素提供重要的依据,帮助生态系统平衡的恢复。此外,通过生物信息学技术构建遗传工程菌,降解目标污染物的分子遗传物质,从而达到催化目标污染物的降解,维护生态环境的空气、水源、土地等质量,也是当今生态环境保护的新兴研究方向。

二、生物信息学的学科内容和课程要求

生物信息学主要由基因组学、蛋白质组学、系统生物学、比较基因组学、计算生物学等学科构成,主要涉及的内容有生物数据的收集、存档、显示和分析,体外预测、模拟基因及蛋白质的结构和功能,对生物的遗传基因图谱进行分析处理,对大量的核苷酸和氨基酸序列进行比对分析,确定进化地位等。从生物信息学的概念及其涉及的内容中可以明确生物信息学不是一门独立的学科,所以要求教师在教学过程中掌握多领域的知识和技能,才能较好地把握该课程。

1.高等数学和统计学基础

生物信息学将数学和统计学作为主要的计算理论基础,主要包括数学建模、统计方法、动态规划方法、数据挖掘等方面。此外还包括隐马尔科夫链模型(HMM)在序列识别上的应用,蛋白质空间结构预测的最优理论,DNA超螺旋结构的拓扑学,遗传密码和DNA序列的对称性方面的群论等。因此,在生物信息学教学过程中要求教师具备数学及统计学的计算方法的基础知识,能够利用牛顿迭代法、线性方程回归分析、矩阵求拟、最小二乘法等进行数学建模和计算,从而对基因和蛋白质序列进行比对、进化分析和绘制遗传图谱等。

2.生物科学基础

生物信息学包含的生物类学科有,生物化学、分子生物学、遗传学等基础学科,基因工程、蛋白工程、生物技术等应用学科。根据其课程特点,学生在学习生物信息学课程前需要学习生物化学、分子生物学、遗传学、基因组学、蛋白质组学等基本生物学课程,对于基因序列、蛋白质序列、启动子、非编码区等概念有深刻的理解,同时需要对一些重要的生物学数据库有一定的了解,如美国基因数据库(GeneBank)、欧洲分子生物学实验室数据库(Embl)和日本核酸数据库(DDBJ)等。此外,要求学生能够利用生物学数据库查找基因序列、蛋白质序列、基因及蛋白质结构模型,能够读懂数据库中基因和蛋白质的信息注释,能够计算蛋白质序列的分子量和等电点,能够为扩增特定的基因片段设计引物,能够对特定物种进行系统发育分析等。

3.计算机科学基础

计算机是生物信息学的主要辅助工具,利用生物信息学研究生物系统的过程需要能够熟练使用计算机对大量的生物信息数据进行处理和分析,这主要包括对数据信息进行搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。所以,学生在学习生物信息学的过程中需要了解和掌握一些常用的生物信息学软件,如BLAST和FASTA序列比对分析软件,Oligo和Primer引物设计软件,VectorNTI、DNASTAR、DNASIS等综合分析软件。此外,学生还需要学习和掌握一些常用的计算机语言,如正则表达式、Unix shell脚本语言和Perl语言。

利用生物信息学在处理和分析海量生物数据的过程中,计算机软硬件资源需要配合处理分析软件的运行,因此要求计算机操作系统使用Unix和Linux操作系统,这些操作系统需要大量的操作命令进行输入执行过程,对于经常使用Windows操作系统的学生来说是一个较难跨越的障碍。

三、生物信息学课程教学中存在的问题

目前国内大多数高校的生物信息学教学采用传统的教学模式,即以课堂式的理论教学为主,缺乏必要的实践教学。理论教学模式固定、教学方法单一、教学内容狭窄,通常是介绍性、科普性的课程,甚至作为公选课程。少数高校开展生物信息学的实践课程教学,但多以验证性实验为主,缺乏和专业相适应的综合性、设计性实验,而开放性实验更无从谈起。

1.教学模式固定单一

生物信息学在内容层面涵盖诸多学科领域,注重应用性和实践性。然而,目前大部分高校把生物信息学作为一门孤立的课程,这导致教师需要将大多数课程内容压缩到一门课程进行教学,在有限的教学时数下灌输大量内容,增加了学生学习的难度,降低了教学质量。再者,大多数高校仅开展生物信息学的理论教学,忽视实践教学过程,造成生物信息学理论与实践内容的脱节,使学生在学习完理论知识后难以深入理解和吸收,无法将所学的知识应用到后续的工作和学习中,最终未能体现出该门课程的价值。

2.教师专业背景薄弱

作为一门交叉学科,生物信息学的教学要求教师具有较强的数学、生物学和计算机科学背景。然而,目前从事生物信息学教学的教师即便具备深厚的生物学背景,但是多数教师在数学和计算机方面较为薄弱,并不具备完整的生物信息学知识体系,对生物信息学发展趋势也了解不多。在师资缺乏的情况下,院系开设生物信息学课程,教师为了完成教学任务,仅仅在教学中进行介绍性的讲解,在课程考查方式上通过小论文、综述和课外活动等方式完成该课程的学习。因此,无论是理论教学还是实践教学均无法实现该课程大纲的要求,从而影响学生对生物信息学课程的理解和掌握,生物信息学的实践操作能力更无从谈起。

3.实践教学薄弱,专业教材缺乏

生物信息学实践课需要学生在网络环境下用计算机学习NCBI数据库的检索与使用、序列比对分析软件的应用、蛋白质空间结构图视软件的应用、序列拼接软件的应用等。但是目前,大多数高校开设的生物信息学课程多以理论教学为主,实践教学课时非常少或者为零,学生对于生物信息学课程的学习仅仅通过教材上抽象的文字描述进行理解和掌握,这导致学生在理论课中学到的知识无法在实践课中进行验证或操作,严重影响了生物信息学的教学质量,也偏离了教学大纲中强调的重在培养学生实践操作能力的培养目标。

另外,目前还没有适用于生物科学专业的生物信息学教材。国内各大高校使用的教材多为国外教材的影印版或者中文翻译版本,这些教材偏重介绍生物信息学的理论和方法,涉及的实践内容较少,学生需要具有较高的相关知识才能接受和使用这些教材。因此,部分高校在生物信息学教学过程中往往使用自家编写的简化教材,从而造成生物信息学教学内容不统一,教学大纲混乱等情况。

4.实践课程经费不足,实践教学环境落后

当今,许多发达国家都很重视生物信息学的教学和研究,积极开展各种生物信息资源的收集和分析工作,培养大量生物信息学人才,为整个生物学的理论研究及其相关产业创新(主要是医药和农业)提供指导和支撑。国内对生物信息学的关注和认识起步较晚,其发展落后于国际发达国家。国家和高校对生物信息学的教学和科研资金投入力度不大,缺乏必要的仪器设备,生物信息学的实践教学条件得不到保障,比如大多数高校的生物科学专业没有相应的计算机实训室,配套软件也相对匮乏,落后于国际发展水平。

四、生物信息学教学模式改革的探索

1.修改理论和实践教学大纲,编写适用的实践教材

根据当今生物信息学的发展方向,制定和修改理论教学大纲,除了引物设计、基因和蛋白质序列比对、基因和蛋白质结构功能预测等基本内容外,还需添加系统进化树分析、聚类分析、蛋白质互作网络谱图等较为综合的内容。另外,增加实践教学课程比例,充实实践教学内容,结合理论教学内容增加综合性、设计性实验,适当提供科研环境,鼓励开展开放性实验。

目前国内并没有系统的、专业的生物信息学实践教材,因此针对高校生物科学专业方向的特点,联合多学科领域(数学、生物科学、计算机科学)编写相应的生物信息学实践教材,在制定、修改实践教学大纲和编写教材的过程中结合学生的接受能力,由浅入深,多设实例和相关练习,使学生循序渐进的理解和掌握生物信息学的原理和方法,掌握更多的生物信息学工具。

2.紧密联系科研、基于实践问题开展教学

通过实践教学把生物信息学教学与科研有机结合起来,能够促进教学与科研的共同发展。在紧密联系科研的过程中,采用基于问题的教学(PBL)方法,通过实践教学环节,培养和训练学生把所学的生物信息学的知识和方法应用于各种生物科学领域的科研活动中,通过解决实际问题训练学生的实践技能,从而促进教学与科研的双重发展。例如,在生物信息学实践教学中多加入生产和科研中遇到的经典实例,鼓励学生利用相关的生物信息学软件及相关的理论和方法解决问题。学生也可以选择自己感兴趣的课题,利用自己熟悉的、合适的生物信息学软件和相关知识开展课题研究。此外,专业教师在指导学生课题研究的过程中还可以发现理论和实践教学的不足,不断的完善生物信息学理论和实践课程大纲和内容,提高教学质量。

3.开展多学科实践结合的教学模式

生物信息学属交叉学科,包含了不同领域的专业知识和技能,为使生物信息学教学达到教学的目标,该课程教学需要采用多学科实践结合的教学模式。

多学科实践结合的教学模式是指联合不同领域、不同学科、不同专业的课程在教学的过程中结合生物信息学涉及到的知识和技能进行基础性、铺垫性教学。比如,在高等数学和统计学的教学过程中,针对生物信息学的需求,适当增加数学建模、统计方法、动态规划方法、数据挖掘等方面的基础内容,同时,开设实例实践教学,使学生理解和掌握隐马尔科夫链模型,牛顿迭代法、最小二乘法等方法的应用原理和规则;在生物科学专业课程设置上,尤其是实践课程的教学过程中,结合生物信息学涉及的引物设计、序列比对分析、基因及蛋白质结构功能预测等方面开展相应的设计性、综合性、开放性实验项目,使学生了解和掌握基本的生物信息学原理及软件的应用;在计算机科学的教学过程中,应根据生物信息学的需求,开设正则表达式、Perl语言、R语言等课程学习,以及增加Linux和Unix操作系统课程学习,使学生在学习生物信息学前打好坚实的基础。

值得注意的是,生物信息学课程与其他课程的开设时间和顺序需要有一定的探索和评估,对于开设该课程的时间把握是开展多学科实践结合的教学模式的关键因素。过早开设生物信息学则会导致学生在不具备相应学科基础的条件下跨越式的接触生物信息学,无法理解和掌握相关的知识和技能;过晚开设则会使学生学习了相关学科知识和技能后,由于课程衔接不紧,导致在学习生物信息学时出现理解滞后和无法适应的现象。因此,针对不同专业和学科的特点,根据具体情况进行统筹安排,使生物信息学和其他相关学科课程有很好的衔接和过渡,以确保和提高生物信息学的教学质量。

五、结语

生物信息学是现代基因组学时代的开阔者,也是生物科学研究的重要的工具和载体。针对生物信息学的特点,高校生物科学专业课程设置、教学方法、教学模式和教学软硬件等需进行一定的改革,将多学科实践结合的教学模式运用到生物信息学的教学实践中,在提高教学质量的同时将更好的提升学生科研、应用和创新能力。

参考文献:

[1] 郝柏林,张淑誉.生物信息学手册[M].上海:上海科学技术出版社,2002.1-10.

[2]GUYD, NOELE, MIKEA. Using bioinformatics to analyse germplasm collections [J]. Springer Netherlands,2004.39-54.

[3]王春华,谢小保,曾海燕.深圳市空气微生物污染状况监测分析[J].微生物学杂志,2008,28(4):93-97.

[4]张菁晶,冯晶,朱英国.全基因组预测目标基因的新方法及其应用.遗传,2006, 28(10):1299-1305.

[5]周海延.隐马尔科夫过程在生物信息学中的应用.生命科学研究,2002, 6(3):204-210.

篇3

关键词 计算生物学;教学现状;体会

AbstractThe status of undergraduate course about computational biology was introduced. The teaching experience was summarized from different teaching steps in computational biology education.Besides,the beneficial exploration was carried out to improve teachers’ performance and train interdisciplinary talents for bioinformatics to promote the teaching reform of compulational biology.

Key wordscomputational biology;teaching status;experience

计算生物学是指开发和应用数据分析及理论的方法、数学建模和计算机仿真技术,用于生物学研究的一门学科。计算生物学正在成为现代生物学研究的核心方法之一,它们的重要性和复杂性在当前生物学数据量的不断增长中日益彰显,要回答的问题越复杂就越显得突出,使得计算生物学成为当今生命科学最具活力的新兴前沿学科之一。计算生物学是一门概念性学科,以生物信息学为基础,以计算为工具,解决生物学问题。与生物信息学的定义类似,只是侧重点有所不同。计算生物学侧重于计算,通过计算来解决问题,并使用计算技术对生物学问题进行研究。生物信息学主要侧重于对生物学中所得信息的采集、存贮、分析处理与可视化方面[1-2]。

运用计算生物学,科学家有望直接破译在核酸序列中的遗传语言规律,模拟生命体内的信息流过程,从而认识代谢、发育、进化等一系列规律,最终为人类造福。目前,计算生物学在国内外受到高度重视。在国内,我国国家自然科学基金委员会将计算生物学作为重点资助的研究方向之一。许多科学家敏锐地意识到生物信息学必将会在生物学中发挥重要的作用,而计算生物学作为生物信息学专业的主干课目前处于创立阶段。

自从湖南农业大学2005年开设生物信息专业以来,计算生物学一直是该专业学生的专业主干课程,经过3年的理论与实践教学,笔者将发现的问题及获得的经验进行初步总结,以供商榷。

1教学现状

(1)缺乏合格的生物信息学师资。教师队伍的整体数量和质量与我国生物信息学教育快速发展的规模极不相称。湖南农业大学由生物安全与科学技术学院的生物信息系专业开设了计算生物学这门课程,尽管从开设这门课程至今,一直由生物信息学教研室教学经验最丰富、学术造诣高的教师主讲,但目前教研组中只有一位生物信息学专业毕业的博士,大部分教师为理学或农学专业的硕士或博士,不具备计算机及算法的良好基础知识,使该专业仍缺乏良好的学缘结构。

(2)计算生物学教育与其他专业的合作还有待加强。尽管计算生物学是一门新兴学科,但与其他专业之间存在不少联系。现阶段的问题是不同专业学科的教师之间缺乏交流与合作,难以满足计算生物学教学的需求。据不完全统计,我国超过30个高校或科研机构开设生物信息学专业课程。不同学校根据自身的情况,在开设计算生物学这门课时,侧重点都不一样。如果由医学院的教师授课,则侧重点可能在致病基因的研究方面,计算机专业教师授课则可能侧重于数据库的构建、查询等方面,理学院的教师授课则可能侧重于生物信息学中的数学问题。计算生物学侧重于算法,从而利用计算技术对生物学问题进行研究。因此,各相关专业的教师需要加强这方面交流与学习[3]。

(3)在教学方法上,重视系统知识的传授和授课计划的完成,忽视学生能力和素质的培养。此外,缺乏理论教学与实验教学的有机整合,实验教学只是以验证理论为目的,内容单一,无创新点,忽视对学生实际操作能力的培养。

(4)教学中还缺乏适合的理论和实验教材。授权影印国外原版教科和翻译书籍仍占主导地位,而国人自编的教材寥寥无几。此外,系统性不强也是目前计算生物学教材中普遍存在的一个问题。

2教学经验及心得体会

(1)规范计算生物学教学大纲和计划是开好本课程的前提。根据前2年的实验开展情况和该专业人才培养定位,制定了详细的理论和实验大纲,组织老师编写实验计划和教材。紧跟专业发展前沿,改革教学内容,大纲中概括了理论课每个章节的基本内容、教学基本要求、教学重点难点以及教学建议。实验教材中明确了实验名称、实验时间、实验学时、分组人数、实验目的和要求、实验原理、实验方法与步骤、结果记录及分析、思考题等内容。实验计划和教学大纲的制定把握以下几个原则:减少重复性,体现连贯性,实现整体性。

(2)针对不同的教学内容和教学需要,采取不同的教学方法。计算生物学是一门多学科交叉的科学,涉及的知识面既深又广,学生难以独立自学。尤其是计算生物学涉及到的数学知识,诸如穷举搜索、贪婪算法、动态规划算法、分而治之算法、图算法、组合模式匹配、聚类和树、隐马氏模型、随机化算法等。

对于理论课,在教学过程中主要采用教师主导的传统讲授方法。课堂上,运用多媒体授课并结合当前科学研究中的最新进展。利用多媒体课件以弥补书本教材呆板、抽象的缺点。在计算生物学教学课件中可以利用大量图片生动地展示当前计算生物学研究领域的最新进展。收集或制作动画、视频教程在课堂上进行演示。由于理学学科的学生,未系统且详细地学习代数、概率论等数学知识,要很好地理解计算生物学中的各种算法存在一定的困难,因此,每堂课要采取以简单有趣的故事或数学游戏为开端,引导学生理解每种算法的基本原理,再结合生物学问题,将算法与生物学问题结合起来,探讨如何利用不同的算法解决生物学问题,深入浅出地阐明各章节的重点难点。最后,定期布置一定的思考题,引导学生在课堂外积极探索问题,鼓励学生通过各种途径自觉的关注学科发展动态,拓宽知识面,培养学生的自学能力和创新意识。采用这种授课方法,一方面大大提高了学生的积极性,另一方面使学生脱离了枯燥的数学公式学习,加强了对算法和生物学问题的理解,从而达到使学生学有所获、学有所用的目的。

(3)优化计算生物学实验教学内容,发挥网络教学优势。计算生物学实验是生物信息学专业一门重要的实验技能课,通过实验课程的学习,使学生计算生物学的研究方法,能够运用相关软件如Perl、Matlab等进行简单的编程,解读包含在生物信息序列的信息,推测基因的功能,具体包括EST序列聚类、构建进化树、识别转录银子结合位点、RNA二级结构预测、蛋白质二级结构预测等[3]。该系研究室以适应学科发展要求与培养创新性复合型新世纪人才为目标,建设优质的计算生物学本科教学和计算生物学网络课程。在充分调研的基础上进行详细规划,课堂教学精益求精,实验教学突出学生的创新能力培养,促进教学质量更上一个台阶。该系现已建立了良好的实验平台,所有实验课程可实现网络教学资源共享。计算生物学实验教学以互联网为媒介、计算机为工具,全部在计算机网络实验室内完成。在教学中,充分利用网络的交互特点实现信息技术与课程的结合[4]。教师将实验教学内容、实验序列、工具等上传到服务器,再由学生将资料下载到本地机进行学习、实验。学生同样通过上传服务器,将实验报告、作业、问题和意见等反馈给教师,教师在网上批改实验报告后将成绩和评语发送给学生,让学生及时了解自己的学习情况。

总之,计算生物学教学是网络环境下生物教学的全新内容。通过上述教学措施,提高了学生的学习积极性、实践操作能力、解决实际问题的综合应用能力及创新能力,收到了良好的教学效果,受到学生的普遍欢迎,具有较强的可操作性和实践性。在今后的教学实践中,随着教师自身素质的提高和进一步的教学改革,将会不断完善计算生物学教学,培养具有跨越生命科学、信息科学、数理科学等不同领域的“大科学”素质和意识的生物信息学人才。

3参考文献

[1] 程妍,刘仲林.计算生物学——一门充满活力的新兴交叉学科[J].科学学与科学技术管理,2006(3):11-15.

[2] 高亚梅,韩毅强.《生物信息学》本科教学初探[J].生物信息学,2007,(1):46-48.

篇4

在出国前,我已基本联系好一个继续从事分子生物实验研究的博士学习的单位。在最初1个多月的学习中,通过上课和讲座了解到生物信息这个前沿的交叉学科,我这才突然间发现这个新兴的学科正是我的兴趣所在。

在国内攻读硕士学位期间,我经常需要在实验后进行大量的数据分析,可同时也感觉到无从下手。那时我已隐隐地体会到系统的生物实验数据分析方法和理论的重要性。所以我毅然放弃了在芬兰申请到的博士学习资格,加入到一个生物信息学的硕士学习项目中。仅用半年时间我就以优异的成绩完成了该硕士项目三分之二的课程,掌握了大量生物信息学必备的知识,并同时在另一所大学(坦佩雷工业大学)申请到了攻读计算系统生物学博士的学习资格,从而真正开始了从事生物信息学领域的研究生涯。

因为抱负满怀,我总有做不完的事情。转眼间,我在芬兰工作、学习已经到了第四个年头。在半年前,我已同时获得了生物信息学的博士和第二个硕士学位。回想起这些年在芬兰的留学之路,我感慨万分。

芬兰是个美丽而纯净的国度,虽然它远离世界的中心,但它完善的教育体系和举国上下对科学技术的重视,使它成为了可以潜心进行科学研究的一片净土。在将近4年时间里,从一开始对它一无所知,到慢慢了解,再到现在心怀感激之情,我已慢慢喜欢上了这个纯洁的国度。它不仅使我接触并掌握了许多国际最前沿的科学技术,同时也让我在这几年的留学生活中对生活、对人生有了更多的感悟,也对自己有了更深的了解。

不同于欧美大国,芬兰这个偏安一隅的北欧小国没有挪威的石油,也没有瑞典、丹麦,以及西欧诸国那样完善的工业体系和几百年的资本积累,但这个最初的农业小国在过去的60年间能迅速崛起,其国家竞争力能排在世界前列,并催生出像诺基亚这类引领技术变革的跨国企业,归根结底是其举国上下对教育的重视,和通过几十年时间完善起来的灵活务实的教育体系和教育制度。

芬兰从初等教育到高等教育是完全免费的,这个贯彻始终的制度,经过一两代人的演变和普及,使得芬兰社会整体的受教育水平相当高,并且同时吸引了大量外国学生学者参与到其经济建设中。在实施免费教育并贯彻始终的基础下,芬兰的教育体制也非常灵活。本科学生可以夏季假期以夏季工的形式参与到真正的科研活动中,因此学生往往在很早的时候就具备了一定的工作实践能力,并深知自己的兴趣和专长,同时专业间的调换也非常灵活。芬兰的企业也承担着相当的责任并提供一些临时职位,使得大学生有更多的机会接触到社会的需求,并为今后的职业生涯奠定相当的基础。因此,这里大多数人都接受过良好的教育,真正做到了学有所长,学有所用。

除了高等教育外,芬兰的职业教育也很发达。在芬兰,人们几乎感觉不到职业歧视。人们大多根据自己的兴趣和特长选择职业,充分发挥了每个社会个体的创造力,为芬兰社会的发展提供了源源不断的强大动力,这也是芬兰能始终保持并提高其自身竞争力的根本之道。

芬兰全民素质的提高,使得社会的发展也步入良性循环,诚实守信成为芬兰社会的共识,进而演化成一种社会责任和处世准则。这一点不仅体现在科研工作中,更渗透于人们日常生活的点点滴滴中。在这里,超市买东西需要自己称重,公交、地铁完全看不到人检票。举一个我身边的例子,这里有一家德国超市,东西比芬兰本地超市种类多,价格便宜,因此吸引了许多外国人,可是芬兰人却大多不愿光顾。一次我与同事聊天问及此事,才知道芬兰人觉得如果连称重都需要服务员来监督的话,那么这家店就不值得他们光顾,因为他们缺乏对顾客最起码的信任。

芬兰人诚实的天性并不是所有民族所拥有的,即使在那些西方老牌资本主义发达国家,这种对顾客的完全信任也是无法落实的。可是芬兰这个偏僻的小国却做到了。再比如,赫尔辛基的公共交通很少有人查票,可是人们却经常见到年迈的老人从车厢一头挤到另一头划卡买票。我在芬兰充分享受着诚信社会带给个人的被尊重感。少了人与人之间的提防,多了人与人之间的信任,很多社会日常事物的开展都简单高效。

建立诚信社会正是当前中国大力推行的国策之一。虽然,中芬两国存在很大差异,两国的人口、地域分布上都有很大分别,照搬芬兰的国策必然不切实际。但同样起步于上世纪中后期,芬兰的成功必然有值得我们借鉴的可取之处。我认为,归其根本应该是始终把教育放在首位,尽量在广度深度上普及教育,并不断探索完善适合中国国情的教育制度,并把它作为国策贯彻始终。与此同时,在大力开展经济建设的同时,藏富于民,还教育以清纯,以育民为本,授民以诚信而立足。

篇5

关键词:计算机应用;中文信息处理;生物信息学;文本挖掘;信息抽取;机器学习

中图分类号:TP391 文献标识码:A

1 引言

当前,生物医学领域的研究正在飞速发展,大量的生物医学知识以非结构化的形式存在于各种形式的文本文件中。国际上生物医学领域的权威数据库MEDLINE(Medical Literature Analysis and Retrieval System Online)的文献总数目前已达到1600万篇,近年来年均发表文献超过60万篇。如何才能有效地利用这些文本中所蕴含的生物医学知识无疑对分析海量的生物医学数据是非常重要的。常用方法是通过关键词在MEDUNE中或者互联网上进行检索,但是这只能从大量文档集合中找到与用户需求相关的文件列表,而不能从文本中直接获取用户感兴趣的事实信息。因此,提供从大规模生物医学文献中自动获取相关知识的有效工具是一项迫在眉睫的任务。

文本挖掘技术在文本知识自动获取中起到了重要作用。文本挖掘通常包括信息检索、信息抽取、数据挖掘三个步骤。其中信息检索(Information Retrieval,IR)用于识别相关文本,信息抽取(Information Extraction,IE)用于识别实体、关系、事件等信息,数据挖掘(Data Mining,DM)则从结构化信息中识别出相互间的关联。生物医学文本挖掘的研究重点主要由信息抽取和数据挖掘两方面的研究组成。具体来说,包括生物医学领域命名实体识别、同义词和缩写词识别、关系抽取、利用推理进行关系抽取的假设生成、文本分类以及上述工作的集成框架等。该领域研究的主要方法是通用的机器学习方法、领域知识、面向任务的前处理和后处理技术的相互结合。

文本挖掘在生物医学领域中的应用,可以提高生物医学信息建设和管理的效率。生物医学数据库的建设是最早推动生物医学文本挖掘的动力。通过信息抽取技术可以建设以疾病诊断、药物设计为目的的专用蛋白质作用关系数据库。例如建设特定疾病如乳腺癌、老年痴呆症的蛋白质作用关系相关数据库。通过数据库描述的蛋白质作用网络,将极大地有利于疾病诊断、药物设计,促进相关生物医学研究的进展。近年来文本挖掘技术在生物医学领域中的应用多是通过挖掘文本发现生物学规律,例如基因、蛋白质及其相互作用的关系,进而对大型生物医学数据库进行自动注释。例如:现有研究成果已经可以对蛋白质数据库加注功能关键词,并利用这项功能发现大分子问的相互作用关系。使用标准词汇对实验数据统一标注,架起了生物医学文献与生物医学实验数据的桥梁。借助生物医学文本挖掘技术进行数据标注的方法,广泛应用在功能基因组学数据上。经过人手工核对,正确的标注信息将赋予实验数据,有效的文献信息也将作为标注依据链接到实验数据。

生物医学文本挖掘的更大意义在于可以通过对文本分析研究帮助人们发现在文本中隐含的知识,从文献中挖掘出来实验假设和实验建议,以便生物学家验证得到新的科学发现,从而提高人们对生物医学现象的认识。例如,运用分子生物学文献的信息抽取技术来分析海量的生物医学数据,可以帮助分子生物医学专业人员理解分子生物学实验数据,研究分析实验结果。

生物医学文本挖掘是生物信息学研究的分支之一,是生物学研究中不可缺少的环节,它汇集着具有不同专业背景研究者的共同努力,推动和促进了生物医学的发展,对实现疾病的辅助诊断、预防和治疗,新药的辅助发现等起到了重要的作用,为人类对生命的探索做出了重要贡献。生物医学为文本挖掘技术提供了大量的验证数据,对文本挖掘技术起到了反推动作用。这是一种跨学科性研究,涉及到自然语言处理、机器学习、生物信息学等方面的技术,非常具有挑战性。目前,该研究领域吸引了来自计算语言学、生物信息学、机器学习等方面研究者的广泛关注,本文侧重介绍生物医学命名实体识别、缩写词和同义词识别、生物医学实体关系抽取、建立相关资源以及技术评测等。

2 命名实体识别

生物医学文本挖掘的基本任务之一是生物医学命名实体识别(Biomedical Named:Entity Recognition,Biomedical NER),其目的是从生物医学文本集合中识别出指定类型的名称,如蛋白质、基因、核糖核酸、脱氧核糖核酸等。这是进一步抽取关系和其他潜在信息的关键步骤。

生物医学领域的命名实体具有如下特点:新的命名实体不断出现,目前并不存在一个完整的包含各种类型的生物医学领域命名实体的词典,所以简单的文本匹配算法已经失去了作用;很多生物医学命名实体都是多词短语,有些有前置修饰语,例如:activated B cell lines,有些名称很长,例如:47kDa steroI regulatory element binding factor,这些特点给确定命名实体的边界带来了很大的困难;相同的词或者短语可以表示不同类别的生物医学命名实体,要依据上下文才能推断出来,例如:IL-2既表示蛋白质名称,又表示DNA名称;很多生物医学命名实体拥有多个不同的书写形式,例如:N-acetyl-cysreine,N-acetylcysteine,NAcetylCysteine等表示同一命名实体;很多生物医学命名实体是用“and”或者“or”连接的并列结构,它们共享同一个中心名词,例如:91 and 84 kDa proteins,这样的命名实体也很难正确识别;生物医学命名实体还存在着嵌套现象,例如:<PROTEIN><DNA>kappa 3</DNA>binding factor</PROTEIN>,因此还要解决候选命名实体的重叠问题;缩写词占有较高的比例,例如:IFN,TPA等等。很多缩写词的形成是没有规律可言的,并且缩写词还具有高度的歧义性,一般情况下,扩展形式比缩写词形式有更多的证据确定它的类别,缩写词形式和它的扩展形式相比更难分类。总之缩写词的识别很大程度上依赖于上下文,而不能依赖于现存的生物词典。因此,生物医学命名实体识别是富有挑战性的一项研究。

目前,生物医学命名实体识别的方法分为以下 三类:基于启发式规则的方法,基于字典的方法和基于机器学习的方法。基于规则的方法需要耗费大量人力建立识别规则库,而基于字典的方法存在着名称冲突和覆盖率受限的不足。目前研究的重点主要是基于机器学习的方法。

机器学习方法是从样例数据集合中统计出相关特征和参数,以此建立识别模型。目前已经有很多机器学习方法应用到生物医学命名实体识别当中,如贝叶斯模型、隐马尔可夫模型(HMM)、支持向量机(SVM)、条件随机场(CRFs)、最大熵(ME)等。基于机器学习的方法依赖于大量的标注语料,因此所面临的问题是如何获得廉价的大量训练数据。

支持向量机方法是一种比较有效的学习方法,已经成功应用到自然语言处理的多项任务中。Ka-zama等应用支持向量机来识别生物医学命名实体并使用GENIA语料作为训练语料。Lee等提出了一种基于支持向量机和查找字典的两阶段生物医学命名实体识别的方法,在第一阶段,使用SVM分类器识别命名实体并且用简单的字典查找作为后期处理来校正由SVM模型识别带来的错误;在第二阶段,把识别后的命名实体用SVM划分成语义类。该方法把任务划分成以上两个子任务,能够针对每一个任务选择更相关的特征,选择更为合适的分类方法,减轻了不平衡的类分配问题所产生的影响,提高了整体任务识别的精确率。AbGene系统是比较成功的生物医学命名实体识别系统之一,曾被多个研究者作为命名实体识别组件用于关系抽取研究当中。该系统使用7 000个手工标注命名实体类别的句子作为贝叶斯模型的训练语料,并采用手工统计规则作为后处理,同时使用命名实体所在的上下文来帮助校正识别错误。该系统达到了85.7%的精确率和66.7%的召回率。Chang等设计的GAPSCORE系统考虑到单词的出现次数、词形和上下文并以此为句子中每个词分配一个得分,然后使用基于词形和上下文等特征来训练N-gram模型,具有高分的单词更可能是基因和蛋白质名称。Zhou等人使用基于丰富特征集合的方法训练隐马尔可夫模型,他们在GENIA语料上获得了66.5%的精确率和66.6%的召回率。Yi-Feng Lin等使用基于特征的最大熵模型并结合后处理过程,在分类为23个实体类别的genia语料上获得了72.9%的精确率和71.1%的召回率。Tzong-hanTsai等使用条件随机域模型结合丰富的特征集合和后处理过程在BIONLP2004测试语料上获得了69.1%的精确率和71.3%的召回率。

近两年来,生物医学领域命名实体识别的研究不断扩展和深入。一是命名实体识别扩展到新的语义类型,如临床术语、化学名词语义类等。二是各种新方法的应用,如自动构建训练语料的bootstrapping方法,多分类器结果的重新排序(reranking)方法等。此外还有嵌套命名实体识别。

目前性能最好的生物医学领域NER系统的F测度已经达到80%以上,但与通用领域NER结果(90%以上)还存在一定差距,还需要研究人员的进一步努力。

3 缩写词和同义词的识别

很多生物医学命名实体存在多个名称和缩写形式,因此必须有效地识别这些同义词和缩写词,目前大部分研究工作都集中在未登录的基因名同义词和命名实体缩写词的识别上。

抽取生物医学命名实体缩写词及其全称形式,所用方法依赖于全称和缩写词的接近程度。一般而言,全称或者缩写词通常在括号里,因此,识别缩写词被简化为寻找最佳的缩写词和对应全称的对齐过程,这样的对齐过程在很大程度上依赖于上下文。

大部分缩写词的识别方法属于以下三种方法之一:首字母匹配法、首字母和其他字母匹配法、特定模式匹配法。首字母匹配法最简单,即匹配缩写词每一个字母和周围文本中若干词的首字母。第二种方法是放宽条件,即允许匹配首字母之外的其他字母,这种方法一般使用启发式规则进行识别。第三种方法是识别那些后面还添加一定模式的缩写词,这也需要手工建立一些规则。

Liu和Friedman在大量MEDLINE文本中统计缩写词和全称的搭配,以此作为规则来检测缩写词与全称的配对,取得了96.3%的精确率和88.5%的召回率。在应用手工规则识别缩写词和全称的研究中,Yu等获得了95%的精确率和70%的召回率,Schwartz和Hearst在1000篇MEDLINE摘要的集合上识别与酵母有关的缩写词,获得了96%的精确率和82%的召回率。Chang使用缩写词特征训练逻辑回归模型,并且用这些特征评价缩写词的候选全称形式,在Medstract语料上获得了80%的精确率和83%的召回率。就目前识别精度来看,在单篇文章中自动识别生物医学缩写词和相应全称的问题已经基本解决,上述识别系统都取得了较高的精确率和召回率。今后的研究将把缩写词识别与其他文本挖掘任务结合,并应用到实际的生物医学文本挖掘系统当中。

同义词识别是建立一个能自动更新的同义词词表的基础,具有重要的应用价值。虽然从在线数据库中能获得基因名称的同义词列表,但这些数据库中多数为基因的正式名称,因此相对于文献中的实际基因名称,其数据并不完整。为了建立出现在文献中有代表性的基因和蛋白质名称同义词列表,需要从生物医学文本中自动抽取基因和蛋白质名称同义词。

Yu等人结合了AbGene基因命名实体识别系统,采用统计方法、基于支持向量机的分类器、基于自动生成模式和手工生成规则等算法相结合,同义词识别的召回率为80%,精确率为9%。Cohen采用自动模式抽取方法对MEDLINE摘要进行同义词抽取,通过分析同义词共现网络结构选取最佳同义词模式,获得的精确率为23%,召回率为21%,该系统可以根据文本中出现的词间的明确逻辑关系来推断它们是否为同义词,与没有类似推断的系统相比,召回率提高了10%。

基因和蛋白质名称的同义词抽取研究结果的精度普遍还较低,因此更具挑战性。目前,一种新的基因蛋白质名称的标准化工作正在开展,其研究步骤是首先进行基因和蛋白质名称的识别,然后再进行基因名称的规范化(Gene Name Normalization)。此外,使用Ontology方法用于同义词识别也是最新的研究趋势。

4 关系抽取

生物医学文本中关系抽取的目的是从多个给定类型的命名实体如基因、蛋白质和药物名称等当中检测是否存在预先指定类型的关系,如蛋白质之间的抑制关系,实体之间的从属关系等。大多数生物医学命名实体关系抽取系统主要抽取特定命名实体之间的二元关系,即两类命名实体之间的关系。

生物医学文本中的关系抽取还存在相当的困难,主要原因包括:文本中陈述同一事实有多种不同的陈述方式;文本中并不仅仅是简单的语法类型; 文本中包括很多未登录命名实体;关系信息存在于多个句子之中;存在很多不能抽取出任何关系信息的句子。

目前生物医学领域命名实体关系的抽取主要使用了以下方法:共现方法、关键词方法、机器学习方法和自然语言处理方法。

共现方法认为离得越近的命名实体越可能相关,越经常一起出现的命名实体越可能相关。PubGene系统使用共现方法建立了一个包含基因和基因交互关系的数据库,实验结果达到了60%的精确率和51%的召回率。当仅考虑出现在5篇或5篇以上文章中的基因对关系时,精确率上升到72%。还有研究者在同一个短语中或者同一个句子中查找共现的基因对。Ding等做了一项全面的量化研究实验,发现用共现方法识别关系在同一摘要中得到的精确率为57%,召回率为100%;而在同一句子中精确率为64%,召回率为85%;在同一短语中精确率为74%,召回率为62%。

为了识别关系的类型,识别算法必须检验相关的信息。一种简单的推断方法是识别那些可以区分特定类型关系的关键词或者短语,这就是关键词方法,其具体应用是使用词模式。在此方法中,研究者给出了一些生物医学命名实体模式和区分特定类型关系的常用词。这些模式通常比较简单,不需要更多的词性信息或者复杂的语义信息,如<protein A><action><proteinB>,这里的<action>是由14个词及其变体组成的词表;Ono等的方法中则使用了20个模式。

在基于机器学习方法的关系识别中,把句子中的关系共现表示成向量空间模型,然后使用分类器给句子中可能存在的关系打分。Eskin和Agichtein使用SVM算法和基因序列kernel来预测蛋白质在细胞质中的位置,其性能达到87%的精确率和71%的召回率;而预测蛋白质在过氧化物酶体中的位置,其精确率为44%,召回率为21%。JuanXiao等使用基于特征的最大熵模型识别蛋白质的交互作用关系(Protein-Protein Interaction,PPI)获得了88.0%的精确率和93.9%的召回率。Ameet SoniC343使用条件随机域模型识别PPI并和基于规则的系统作了对比,实验证明基于CRFs的系统比基于规则的系统识别性能有很大的提高。

用于关系抽取的自然处理方法一般要使用领域Ontology和句法结构分析。简单的方法可以只考虑词性,如在识别蛋白质和蛋白质的关系中,句子中的蛋白质名称都必须是名词。Thomas等仅使用词性作为是否存在关系的评分标准。句法分析器是生物医学文本中进行关系抽取的有利工具。如使用浅层句法分析器(Shallow Parser)确定已知动词的主语和宾语,使用完全句法分析器(Full Parser)确定句子中所有组成部分的关系。Park等使用句法分析器,使关系抽取结果达到了80%的精确率和48%的召回率。Zhongmin Shi等使用统计句法分析技术同时识别生物医学命名实体及其间的功能关系,通过使用有噪音标注数据的半指导学习方法获得了83.2%的F测度值。

Stephens等提出了使用向量空间模型从文本中识别基因对关系及其共现强度的方法,使用了TF-IDF计算公式和用户定义的阈值来挖掘命名实体之间的关系。文献中提出一种无指导的关系抽取方法,该方法使用了类似于互联网页面重要性评价HITS算法的思想,称为基于图的交互增强方法。

5 语料库建设和领域本体知识库

统计机器学习方法需要大量的已标注文本数据作为学习器的训练语料,所以,生物医学文献语料库的标注成为相关研究的基础。生物医学文本标注的内容主要包括命名实体、命名实体关系。目前国际上可以公开获取的生物医学文本挖掘的标注语料库有:GENIA语料库、GENETAG语料库(也是BioCreAtlve Task 1A的评测语料)、Medstract语料库、Yapex语料库、Protein Design Group(PDG)语料库和University of Wisconsin语料库等。表1中列出了每个语料的发行时间,语料内容的切分单位(以句子或摘要为单位),语料的大小(以词为单位)。表2中列出了各个语料可以应用的文本挖掘任务。

GENIA语料库是标注规模最大、语义分类最多、应用最广泛的标注语料库。该语料库标注包括词切分、句子切分、词性标注。语料中标注了关于人类血细胞转录因子领域的基因和基因产物命名实体,由2000篇MEDLINE摘要组成,共有18545个句子,39373个命名实体,36个语义类。它也是JNLPBA语料库的母语料库。需要指出的是:PDG和Wisconsin语料库中只列出所包含的命名实体,但没有指出所在文本中的位置,无法实现正确的评价,因此较难应用于一般的命名实体识别任务。Medstraet是这些语料中唯一有指代消解标注的,并且给出了缩写词的扩展形式。

上述语料库的原始语料皆出自国际权威的生物医学数据库MEDLINE,信息检索和文本挖掘研究主要集中在该数据库上。MEDLINE中生物医学文献数量目前已超过1 600万篇文献,其中超过300万篇文献是近5年内出版的。美国国立医学图书馆的Entrez-PubMed提供了免费的MEDLINE检索服务,是世界最著名和使用最广泛的MEDLINE网上检索系统,于1995年7月推出,已经成为科研人员获取医学文献信息的首选。PubMed提供了主题词检索和自由词检索。

MeSH(Medical Subject Headings)是美国国家医学图书馆(NLM)用以分析生物医学期刊文献等资源的主题内容的控制语汇表,也是NLM出版的MEDLINE数据库主题检索的索引词典。MeSH由22 995个主标题(Descriptors,main headings)组成,分为15个层次。MeSH主标题层级结构安排的目的是为信息检索提供服务。生物信息学中最具有权威性的本体论是基因本体论(Gene Ontology,GO),由基因本体论协会建立。其目标是建立一套结构化的、精确定义的、通用的控制性词汇,使其在任何生物体内都能描述基因和基因的产物所表现的角色。GO构建了3个相对独立的本体,即生物过程(Biological Process)、分子功能(Molecular Function)和细胞成分(Cell),它们是基因和基因产物的所有属性。

6 评测会议和相关学术会议

文本信息处理技术的评价通常包含两个部分:标准的评测数据集和评价标准。标准评测数据集一般由领域专家通过手工标注相关文本来获得,这样的数据集通常称为金标准(Golden Standard)。其中比较流行的金标准语料库是GENIA语料库。将 自动识别结果与标准数据集相比较,就可以评价某个文本挖掘技术目前所达到的水平。

生物医学文本挖掘评价标准与通常的文本挖掘评价标准类似,也是由精确率(Precision),召回率(Recall)和F测度(F-score)来评价的。

近年来出现了很多公开评测生物医学文本挖掘算法的国际会议,对本领域研究的发展起到了重要推动作用。表3列出了当前国际上主要的评测会议。

在近年来举行的竞赛和评测中,最有影响力的是TREC Genomics Track,该评测由美国国家技术标准局(National Institute of Standards andTechnology)支持。Genomics Track从2003年开始,以后每年一次,评测任务主要为分子生物学领域的文本检索和分类。2004年有29个研究组参加,2005年有41个研究组参加。我国大陆有复旦大学、清华大学、大连大学等几家单位先后参加这两届评测。

JNLPBA/BioNLP 2004(Joint Workshop onNatural Language Processing in Biomedicine andits Applications)评测是与国际计算语言学会议同时召开的研讨会,其主要评测任务是生物医学命名实体识别,共有八个参赛系统参加评测。BioNLP 2007的评测任务是临床医学文本多标记分类,共有50个参赛系统参加评测。BioCreAtlve(Critical AssEssment of Information Extractionsystems in Biology)也是一个重要的生物医学文本挖掘评测会议,由西班牙国家癌症研究中心CNIO、美国MITRE公司、美国生物技术信息中心NCBI等5个机构负责组织。该评测包括两个任务:其一是识别文本中的基因和蛋白质名称,除了识别命名实体外,各参评系统还要识别出这些命名实体的同义词;其二是用GeneOntology codes注释蛋白质,识别出蛋白质的功能。目前该评测已经举行了两届,2004年评测包括多种文本挖掘任务,共有10个国家的27个研究组参加了此次评测。2006年评测的总结会议在ACL2007上进行。

KDD(Knowledge Discovery and Data Mining)挑战杯是一个公开评测数据挖掘算法的竞赛。尽管KDD的传统任务既和文本无关也和生物医学领域应用无关,但是从2002年已经开始了生物医学文本挖掘任务的评测,这也是最早的关于生物医学文本挖掘的评测。KDD竞赛包括两部分:第一部分是识别基因功能;第二部分是预测基因对信号传输路径的影响。第二个任务可以作为一个统计分类问题来处理,其中涉及到基因功能信息、蛋白质定位以及蛋白质交互等。参赛者所建立的系统用来帮助FlyBase数据库管理。

生物医学文本挖掘是一个跨学科的交叉领域,自然语言处理、生物信息学、机器学习领域都召开了关于这个主题的学术研讨会(Workshop),在自然语言处理领域已经发展成为一个相对独立的研究分支。表4给出了各领域中相关学术会议情况。2000年以来,国际计算语言学界的两个主要学术会议ACL(Annual Meeting of the Association for Computational Linguistics)和COLING(InternationalConference on Computational Linguistics)的每届会议都有相关文章发表;从2003年起,每届会议均设有一个相关主题研讨会(Workshop)。生物信息学领域与生物医学文本挖掘相关的学术会议主要有从1996年开始每年一月在夏威夷举行的Pacific Symposium on Biocomputing(PSB)会议和始于1993年Intelligent Systems in MolecularBiology(ISMB)年度会议。从PSB2000开始,该会议几乎每届都把文本挖掘作为会议主题之一;PSB2007则提出了“New Frontiers in BiomedicalText Mining”的主题。和PSB差不多同时,ISMB也在每届会议发表了这方面的文章,并且近几年把文本挖掘和信息抽取列为会议主题之一。国际生物信息学杂志Bioinformatics近年来开辟了数据和文本挖掘专栏,每期均有此类文章发表。

国际机器学习研究领域也对生物医学文本挖掘表现了很大兴趣,2005年国际机器学会ICML(International Conference on Machine Learning)的一个Workshop是LLL05(Learning Language inLogic),其主题为:Challenge task:Extracting Relations from Bio-medieal Texts。会议为关系抽取提供了训练和测试语料、评测程序,有5个国家的6个研究小组参加了评测。

7 国内相关研究

目前国内在生物医学文本挖掘领域的研究相对还比较少,主要有清华大学和哈尔滨工业大学,均取得了一定成果。清华大学研究者在蛋白质关系抽取方面做了深入研究,其主要工作包括:基于动态规划算法的模式匹配方法,用于抽取蛋白质交互作用关系,取得了80%的召回率和精确率;在此基础上采用最小描述长度原理进行模式优化,进一步提高了抽取精度。他们还将模式匹配与浅层句法分析结合起来,通过句法和语义约束,很好地识别了生物医学文本中的同位和并列句,将原模式匹配方法的精确率和F测度提高了7%。哈工大研究人员主要致力于生物医学命名实体识别和关系的识别的研究,先后尝试了多种机器学习方法。先后应用SVM算法、Generalized Winnow、CRF等方法进行命名实体识别,在实现中选择了丰富特征并结合后处理过程,在相同测试集上取得了优于国际同类研究的结果。目前,他们在综合多种统计学习方法进行多分类器融合的研究上取得了一定的成果,进一步提高了生物医学命名实体识别的精确率和召回率。在关系识别的研究上主要应用基于特征的机器学习方法并取得了一定的成果。

8 结论与展望

篇6

【关键词】 检验;免疫;临床;实践;研究

doi:10.3969/j.issn.1004-7484(s).2014.03.726 文章编号:1004-7484(2014)-03-1762-02

临床医学和免疫学通过临床免疫学连接起来,免疫学原理是免疫学检验的根本。本文结合自己从事免疫学检验的多年经验,阐述一下临床免疫学和免疫检验的相关知识。

1 临床免疫学概念

在免疫学中,临床免疫学占有重要的一席之地,是免疫学和临床医学的有机结合。当前,在临床上检验项目越来越多,患者本身和临床医生也都已离不开临床检验,对其具有更高的期待和要求,需求是技术发展的动力源泉,在这种背景下,需要其迅速全面发展,与医疗科技发展同步,满足临床应用,开创临床免疫学技术的新篇章。

2 临床免疫学促进新技术发展

DNA的双螺旋是分子克隆和PCR等技术的理论基础,这些技术对于分子生物学和遗传学来说,具有划时代的重要意义。同时,免疫学抗体理论和抗原推动了凝集和沉淀以及标记等,这些临床免疫学新技术的产生和发展。近年来,由于分子生物学和细胞生物学对免疫学的渗透,再加上免疫学的自身发展,免疫学理论有所创新。

3 临床免疫学新技术发展特点分析

3.1 多学科交融 数据多且复杂是免疫学检测的特征,而对于医务人员来说,对数据进行有效分析,对结果的正确应用,是最关键所在。因此说,加强临床免疫学、医学统计学以及生物信息学等学科之间的深入交流和合作,并在临床检验和科学研究中,以它们为基础上,广泛创新和应用新技术,将是充分发挥免疫学检测作用的关键环节。

3.2 高通量、智能化、自动化的免疫新技术 自动化和智能化以及同步化是临床免疫学检测的特点,毛细管电泳技术和电化学发学分析技术,以及微粒子酶免疫技术等,这些免疫新技术远远先进于传统手工操作,而在整个检验医学检测中,生物芯片技术的运用使高通量和平行化以及大规模成为现实。

4 免疫学检验存在的问题

4.1 定位 目前,在一部分医疗单位中,免疫学检验专业还没有设立,因此,就更谈不上实验室和专业检验设备了,而专业的检验人员也没有固定,在生化和微生物实验室分散进行免疫学检验中的一些项目,从而影响到免疫学检验专业的发展。

4.2 质量管理分析 在国家卫生部相关室间质量评估活动中,各大医学中的免疫学检验的大部分项目都已参加,但控制室内质量仍处于薄弱状态。国内还没有彻底的做到有效统一大部分免疫学检验项目的质控品和标准品,所供应的部分,存在项目不全和价格昂贵的弊端。这是造成大多数试验室达不到质量控制标准,检验质量出现波动的原因所在。当前,缺乏充足的试剂是普遍存在的问题。而且,研究内容与临床也没有实现有效结合,这些是造成免疫学检验在诊治疾病中,其作用没有得到有效发挥的关键因素。

5 发展建议

医院领导和检验科应充分的认识到免疫检验的重要性,设置免疫学检验专业,积极引进设备,展开定位项目,并配备专业人员,加强对人员的培训,把室内质量控制健全起来,成立免疫检验学小组,负责分析相关问题和制定解决方案,强化管理参考品和质控品,竭力把检验效果提高上来,真正发挥出临床免疫学的作用。

6 小 结

在临床免疫学中,临床检验占有重要的一席之地,而所研发的各项技术有效的推动了临床检验学的发展,并使检测时间被缩短,样本用量也被节约,从而在诊断上实现了无创和快速以及准确。但也存在困难,我们应该予以正视,即需要有效合理的把复杂的数据应用起来,从而能够把患者负担减轻,有利于成本的控制。同时为达到临床免疫检验的要求,需要强化交流和合作基础研究项目,调动在岗员工学习各种技术的积极性,努力把自身综合素质提高上来。

参考文献

[1] 史俊敏,吴晓勇.临床检验质量管理的重要性[J].检验医学与临床,2011,12(8):2377-2378.

[2] 张伟民,宋超.落实质量考核与监督措施,促进独立实验室健康发展-对医学独立实验室管理模式的设想与探讨[J].浙江检验医学,2009,7(3):285-287.

[3] 师建国,田玉梅,郭芝芳,等.量子共振检测在精神分裂症诊断中的应用(摘要)[C].中国心理卫生协会残疾人心理卫生分会第八届学术交流会论文集,2010:288-289.

篇7

蒙语授课“生物统计学”课程教学团队有能力建设课程系列教材菊林花教授自1982年就用蒙汉双语讲授“生物统计学”、“生物统计附试验设计”、“试验设计”等课程。多次出国学习,积累了30年的丰富经验,在2012被评为校级名师。金凤副教授自1985年开始用蒙汉双语讲授“生物统计学”、“生物统计附试验设计”、“试验设计与统计分析”等课程,已有28年教学经验。自1988年开始自编、参编、主编多部教材的丰富经验。2009~2010年在日本京都大学农学部统计教研室与佐佐木教授共同研究完成了“地方品种遗传参数估计模型”。玉荣讲师自2004年以来用蒙汉双语讲授"生物统计附试验设计"、"试验设计与统计分析"等课程。2010年到中国农业大学研修学习,积累了可喜的教学经验。教材是有效补充课堂内容的工具、技术手册,要及时关注本领域科学发展的前沿动向生物统计学是一门探讨如何从事生物学研究的设计、取样、分析、资料整理与推论的科学,它作为边缘交叉学科,已经在生态环境保护、生物资源保护与利用、畜禽生态学研究、分子生物学研究、高科技农业研究、生物制药技术、流行病规律研究与探索、畜禽数量遗传学研究、畜禽遗传繁育、生物信息学研究等领域有着广泛的应用。目前基因组学,蛋白质组学与生物信息学的蓬勃发展,使得“生物统计学”在这些突破性生物科技领域上扮演着不可或缺的角色。在课程建设中,随时注意增加生物统计在前沿领域研究应用的内容,增强课程的活力,提高教师和学生面向生物产业时的解决实际问题的能力。传统的统计学教学模式主要以课堂讲授为主,以教师为主体和中心,教师是主讲者,学生被动接受,教学效果主要取决于教师的课堂组织能力与语言表达能力。从我讲授蒙汉语“生物统计学”课程28年的教学实践经验看,课堂上老师讲授,学生做笔记的教学模式存在一定的缺陷,阻碍了学生独立分析与解决实际问题能力,影响了学生真正掌握统计分析的方法。因此,我们在生物统计学教学过程中结合高校自主学习为主的教育特点,充分利用学生课余时间,将传授知识和提高素质有机结合起来,摸索出一套对教学内容有效补充作用的教材,同时可作为少数民族地区科技工作者从事科学研究的工具。

蒙语授课“生物统计学”教学团队主编、参编的蒙汉双语系列教材

1.金凤、菊林花主编的蒙文版教材《生物统计学》2000年由内蒙古大学出版发行。是根据1999年修订的全国高等农林院校本科教学大纲,依据同年11月召开的全国农林院校教材会议上讨论的动物科学、动物医学专业教材编写大纲编写的。是动物科学、动物医学专业的本科生必修课程教材。当时在内容的编排上也相应照顾到了生物工程、食品工程等专业的需要,将案例和例题略加增删或改动,并对个别专题内容加以补充。因此,本教材在2008年前一直作为生物工程、食品工程试用教材。教材的编写,保持本学科的系统性和科学性的前提下,力求做到内容的先进性与针对性的统一,循序渐进、简明易懂,特别注重了对学生的动手能力的培养。各章都有明确的教学目标,介绍本课程中的基本概念、着重对基本分析方法的详细介绍,每一种分析方法都有相应的例题,其过程详细,步骤完整。每章后配有习题,供读者实践。一直用作为畜牧兽医专业成人教育、自学考试教材。2004年,该选题被内蒙古大中专蒙古文教材编审委员会审批为“普通高等教育‘十一五’规划教材”。为了使其成为名副其实的规划教材,以及贯彻落实教育部有关教改精神,进一步提高教材质量,使“生物统计学”课程教材符合新形势下的教学要求及国家教委新制订的课程教学基本要求,在广泛征求兄弟院校如内蒙古大学、内蒙古民族大学的相关老师的意见基础上,总结以往成功经验,采纳有关兄弟院校师生的建议,并针对使用中存在的问题,对《生物统计学》教材进行了全面修订。2.金凤、何金山(内蒙古大学)主编的蒙文版教材《生物统计附试验设计》2004年由内蒙古大学出版社出版发行。本教材在2008年内蒙古大中专蒙古文教材评比中获优秀奖。与《生物统计学》教材相比较,新版教材保证了学科的系统性、完整性和实用性,突出体现了本课程的先进性、技能性与前沿性。具体内容如下:对第一章、第二章的内容做了次序上的调整。第三章“平均数、标准偏差、变异系数”改为“数据特征值”。第四章补充了二项分布应用案例。第五章“两个样本平均数差异显著性检验”改为“假设检验”。第六章方差分析的第四节中增加了两个因素系统分组方差分析方法。第七章第二节中增加了检验是否符合某种分布的案例题。第八章第四节增加了直线相关与直线应用案例。第九章第三节增加了案例分析。第十章第十一章分别增加了对应案例。第十二章试验设计原理与常用方法(新增)。第十三章常用统计应用程序简介(新增)。该教材及时引入了现代运算工具,将常用的设计与分析方法与优秀统计应用软件融为一体,使统计知识与计算机应用有机结合,为生物统计学技术的实际应用提供了方便与快捷的手段。已经连续8学年在10多个专业1000多人中使用,被相关专业师生广泛采用,反响良好,已多次印刷,为生物统计学课程教学质量的提高做出了积极贡献。目前,本教材已被列入自治区规划教材。它的出版不仅解决了内蒙古农业大学蒙语授课“生物统计学”课程学生和内蒙古民族大学畜牧专业蒙语授课学生的资料问题,而且可作为牧区畜牧兽医技术工作者、动物科学研究者、动物医学研究者及相关专业研究生、博士生用来进行整理分析复杂的生产一线数据并找出数据潜在的规律提供参考书。3.金凤、成格尔、玉荣主编的全国高等学校蒙文版教材《试验设计与统计分析方法》2008年由内蒙古大学出版社出版发行。随着科学事业的发展,“统计学”已大步跨进了一个又一个相关学科领域,而每个学科领域在其自身发展过程中都会产生大量的数据,需分析揭示其内在规律。统计学作为分析方法,食品科技工作者越来越清醒地认识到其重要性,开设“食品试验设计与统计分析方法”课程。目前为止,蒙文版教材《试验设计与统计分析方法》是唯一的一个专门给蒙语授课食品科学专业学生所使用的“统计学”类教材。同时也是那些从事相关专业的技术工作者的理想参考用书。4.金凤参编国家十一五规划教材《食品试验设计与统计分析》(汉文,第二版),2010年由中国农业大学出版社出版发行。承担第七章的编写,该教材为目前我校食品科学各专业课程教材。5.金凤参编国家十一五规划教材《生物统计附试验设计》(汉,第四版),2008年由中国农业出版社出版发行。它荣获全国高等农业院校优秀教材奖。承担第三章、第四章的编写,该教材为目前我校动物科学、动物医学、生物工程等院系课程教材。6.金凤参编全国统编教材《田间试验与统计分析》(汉文,第二版),2008年由科技出版社出版发行。承担第十一章的编写,该教材为目前我校农学、生态环境等学院课程教材。7.金凤参编面向21世纪教材《生物统计学》(汉文),2005年由内蒙古大学出版社出版发行。承担第六章的编写,该教材为内蒙古农业大学(生物制药)、内蒙古大学、内蒙古师范大学相关课程教材。8.金凤参编国家十一五规划教材《生物统计附试验设计》(汉文,第三版),2002年由农业出版社出版发行。承担第四章编写,该教材为2008年前我校动物科学、动物医学、生物工程等院系课程教材。9.金凤主编校级教材《统计分析SAS应用上机指导书》(汉文),2010年内蒙古农业大学出版。该教材为目前我校动物科学、动物医学、生物工程、食品科学各专业学生的上机实践教材。

本系列教材主要解决的教学问题

1.“生物统计学”是数理统计分析方法在生物学中的应用。我们编写教材时不仅保持本学科的系统性,知识性,而且注重了与现代计算技术的有机结合。因此解决了蒙汉双语授课学生因认知差异引起的教学效果有差异的问题。2.虽然电子课件因其信息量大而受到大家好评,但是学生上课时更多的时间忙于抄课件,忽略了教师的讲解,而教材恰可弥补多媒体教学的这些不足。有了教材学生通过阅读教材可获得试验设计模板与方法、经典分析案例的详细步骤、显著性检验临界值等。3.本系列教材在辅助科研水平提升的同时,促进了科研成果进一步支撑统计分析案例教学,解决了今后修订教材时的实际案例问题,实现了科学研究与结果统计分析相互辅助的良性循环。蒙汉双语《生物统计学》系列教材编写过程中不仅突出了“生物统计学”是方法论、工具论的特色,而且顾及到了蒙汉双语授课学生的认知差异,及地区特色,内容编排上多为草原畜牧业案例,从而促进了他们的学习兴趣。

教学效果及社会效益

篇8

1.1定量生理学课程简介

定量生理学是生物医学工程专业的核心专业课程。该课程以物理学原理和数学方法学为基础,从工程技术讨论人体的生理过程,学习并掌握生物膜与生物膜电位原理和方法,进一步学习并掌握基于电生理测量技术的原理以及相关技术,使学生建立起从基础理论学习到实际生物医学工程中有关生物电信号测量以及应用之间的桥梁;并且能够运用物理学和数学的观点和方法论进行多个层次和水平上探索生命现象及其规律性,培养学生对生理系统进行定量分析的基本方法,培养跨越生命科学、计算科学、数理科学等不同领域的“大科学”素质和意识,为今后选择新兴交叉学科领域进行深造和工作奠定基础。因此,该课程的实验教学任务不仅重要而且要求极高。

1.2实验教学方式改革

长期以来,许多高等院校对实验教学重视不够,重理论轻实验的传统观念依然存在。由于不重视实验教学的重要性,资金投入相对不足,有些陈旧或损坏的仪器设备没有及时更新,这无形中就影响了学生的实验兴趣;而且传统的实验教学过分强调教师的中心地位,学生的主动性、探索性受到一定限制。许多实验项目与当今飞速发展的前沿科学新理论、新技术严重脱节,使得实验教学存在很多问题。而且传统实验教学的最大弊病就是开设的实验往往只是一个“装配”实验,培养的也只是一个装配工,不能锻炼和培养学生解决问题的能力,创新更无从谈起。实际上实验技术人员的工作是实验教学顺利完成的重要保障。实验技术人员的日常工作繁杂、琐事多、重复性强,每天除了要为即将进行的实验教学完成大量的准备工作外,还要做好实验所用仪器设备的维护保养、修理、保管等工作。这些工作看似简单,但对实验技术人员的要求也比较高,然而目前实验技术人员在职称评定、进修以及工作量待遇等方面明显处于弱势,不利于发挥实验技术人员的主观能动性。这两方面因素严重影响了目前高等实验教学的质量及效果,因此现有实验教学急需改革。为了解决上述传统实验存在的两个主要问题,我们提出将科研创新引入到实验教学中,结合科研进展不断更新完善实验教学内容,使实验教学与科研创新相结合,使其更具有前瞻性和可持续发展性。一方面,我校的科研创新生物医学实验室注重开放和创新实验的建设,彻底改变“照方取药”的被动实验方式,采取“引、点、拨”的实验教学方式,让学生自己提出需要解决的问题、达到的目标,自己设计实验方案,引导学生独立思考、大胆动手,充分发挥学生的主动性和创造性,给学生充分施展个性的余地,从而达到弥补现有实验教学的不足。另一方面,以教学科研型教师为实验教学主要人员,构建教学科研互动基地,使其成为培养学生实践能力、研究能力和创新能力的新型教学实验平台,让学生在本科基础学习阶段能较早地开展带有课题研究性质的实验活动,更多地接触科研实践,提高工作能力和科学素养,培养学生的科研创新能力。

1.3将科研创新引入实验教学

随着知识经济和技术经济的飞速发展,创新已成为时展的要求和社会进步的动力,而科研创新是创新的一个极为重要的方面。高校尤其是大量地方本科院校作为高等教育的主阵地,在本科生教学中将科研创新引入实验教学,有利于培养本科生的创新意识和科学精神;有利于培养本科生将理论与实践相结合的意识和能力;有利于促进师生的共同发展;有利于促进地方本科院校加快学科和专业的建设;有利于为地方培养大量的创新型人才,因而具有重要的现实意义。借助于生物医学高水平实验室,我们通过开展综合性实验、科研训练计划、学科竞赛、课外科技活动等方式,激发了学生学习知识的热情,引导学生参与科研创新过程,为学生科研创新能力的培养提供了一个重要平台。

1.4开放实验教学

在增加理论课综合性实验的同时,由于课程实验学时的限制,学生能够亲自动手的实验远远不能满足人才培养的要求,因此,我们开设了“开放性实验”,这样就起到了很好的补充作用。例如,“数字脑电图仪的使用与EEG采集”“蛋白质-核酸复合物氢键与范德华力作用位点分析”“脑电信号的Hurst指数研究”等多项开放实验。此外,我们一般从大二学生中选取有科研潜力的学生,开展“本科生科学研究训练计划”教学,如国家级“基于GIS的移动生理信号监测管理平台的设计与实现”“基于JSD的注意力脑电研究”“基于超临界新技术的石墨烯功能化及生物传感器应用研究”。本科生在确定课题,进入实验室后,将由指导教师对其直接负责。在指导教师指导下,会学习很多课堂上不教的东西,提高学生学习、科研的兴趣、具备一定的科学思维和分析能力、激发对所学专业的兴趣、坚定从事相关工作的信心和决心,一些本科生发表或录用了第一作者或并列第一作者SCI/EI刊源杂志论文多篇。在此基础上,鼓励学生参加各种学科竞赛、科技创新等活动。因为有了开放实验及本科生科学研究训练计划教学的推动,我们学院的科研氛围浓厚了许多。因此很多本科生有了要进实验室的要求,这样本科生的日常学习变得充实,许多学生一有时间就去实验室看文献做实验,并在实验中体会了科学研究的乐趣和魅力,培养学生动手、创新、协作能力,对学习能力的提高、团队精神的培养、心理素质的锻炼有着不可替代的作用。这些都说明依托科研创新生物医学实验室的开放实验教学对学生创新能力有较大的贡献,对新时期的大学生培养意义重大。

2结束语

篇9

【关键词】 药物靶标;靶标发现;靶标验证

Abstract:Drug target discovery and verification is not only the first step of investigation of new drug, but also one of the most important factors in drug screening and directional synthesis. With the fast development of genomics, proteomics, bioinformatics and the advancement of new techniques, such as RNA interference and bacteriophage display, the discovery and verification of drug target is changing with every passing day. In the present paper, the development and successful cases of drug discovery and verification were reviewed.

Key words: Drug target;Target discovery;Target verification

药物靶标是寻找药物的基础,在过去的几个世纪中,人们很大程度上是依赖目前已知的五百多个药物靶标来发现药物。基因组研究表明,人类有3~4万个基因和更多的蛋白质,其中许多蛋白质是控制人类疾病的潜在的药物靶点,因此至少有 9/10 的药物靶点蛋白尚未被发现。发现并验证药物新靶标对阐明疾病原因、药物作用机制具有重要意义,是产生“重磅炸弹”式创新药物的源头。近年来,随着基因组学、蛋白组学、生物信息学的快速发展,以及RNA干扰、噬菌体展示等新兴技术的出现,新的药物靶标搜寻和验证方法不断出现。因此,本文拟从基因水平、转录水平和蛋白水平,就药物靶标发现和验证技术的研究进展作一综述。

1基因水平的药物靶标发现和验证

1.1从基因数据库中搜寻药物靶标20世纪90年代以来,表达序列标签(expressed sequence tag,EST)数据库被广泛应用于新基因搜寻,如成功搜寻到了组织蛋白酶K 和阿立新受体等[1]。相对于EST 数据库,人类基因组数据库的序列信息更为完整,但它不能提供不同组织的表达信息,因此人们开始将EST 数据库与基因序列数据库结合起来搜索新的药物靶标。2001年,3个不同研究小组分别应用不同方法,以H3 受体为参照,利用BLAST,FAST-PAN 和TFAST 程序,搜索到5 种新的H4 基因,这些基因都以标准分子生物学方法确认,可作为疾病治疗候选药物靶标。

1.2基因芯片技术基因芯片技术是在微小的基片表面集成了大量的分子识别探针,应用已知核酸序列作为探针与互补的靶核苷酸序列杂交,通过随后的信号检测进行定性与定量分析。基因芯片技术可以同时筛选、鉴别药物或疾病相关基因,同时将这些基因与之功能联系起来,因此在药物靶标发现和验证过程中是一个强有力的工具。但是由于芯片技术本身尚不十分成熟,在大量数据处理之后还需要大量的验证工作;它反映的是mRNA 表达水平,而这未必与蛋白表达和功能一致,这使它在药物靶标发现和验证领域的应用受到一定限制。虽然如此,仍有许多成功应用的例子[2]。此外,基因芯片技术在阿尔茨海默病[3]、帕金森病[4]、恶性肿瘤[5]等疾病的药物靶标研究中也发挥了很大作用。

1.3基因敲除技术基因敲除(gene knockout)是指对一个结构已知、而功能未知的基因,从分子水平上设计实验,将该基因去除,或用其它序列相近的基因取代,然后从整体观察实验动物,推测相应基因的功能。基因敲除模型在发现基因功能和药物作用新靶点的发现方面具有高度价值,同时也有助于确定药物作用于特定靶点后的不良反应。目前,研究者正在系统地敲除鼠固有基因,并根据哺乳动物生理学特点确定它们在体内的功能,这一研究足已覆盖几乎所有的蛋白质和可用于药物研究的基因家族,如离子通道、核激素受体、蛋白酶、磷酸二酯酶、激酶、磷酸酶及其它关键的酶类。同时,基因敲除技术也已广泛应用于确证药物在免疫[6]、动脉粥样硬化[7,8]、高血压病[9]、糖尿病[10]和肿瘤[11]等疾病中的作用靶点。

2转录水平的药物靶标发现和验证

2.1反义寡核苷酸技术反义寡核苷酸技术是利用反义寡核苷酸或修饰的寡核苷酸与特定靶mRNA 的一部分互补,抑制mRNA 的翻译和剪接,从而抑制其编码的蛋白质的表达。与基因敲除技术相比,尽管这种方法是一种更加省时省力的研究目的基因的强大工具,但还是有局限性,如体内应用时生物利用度有限,毒性较大。利用反义技术验证药物靶标也有一些成功的例子。如Jarvis等[12]利用磷酸化的反义序列作用于P2X3 受体的1100~1119 和1166~1185 位点序列,证明P2X3 受体是慢性炎症和神经痛的重要角色,据此为靶点发现了一种小分子A-317491。Okabe 等[13]利用cDNA 芯片技术分析临床肝癌样品发现,DDEFL1(development and differentiation enhancing factor-like 1)基因在肝癌组织中表达异常,进而以硫代反义核酸抑制此基因的表达,结果肿瘤细胞的生长受到抑制,提示DDEFL1 可以作为肝癌的潜在治疗靶点。

2.2RNA干扰 (RNA interference, RNAi) 技术

2.2.1RNA干扰用于发现新药靶RNA干扰技术自诞生以来,已被广泛应用于药物靶标的发现与确证,这主要是由于该技术具有很多其他技术所无法比拟的优点:能特异高效地抑制基因表达,获得去基因功能表型;仅需要少量的核酸序列信号,而且不被蛋白结构影响;siRNA 的合成和控制较基因敲除或其他方法简单易行、资金消耗少、周期短,使得我们能够在短时间内大规模筛选靶点,而且可以通过质粒或病毒载体表达的小发卡RNA(small hairpin RNA, shRNA)干扰目的基因,从而达到了在细胞水平和动物水平筛选药物靶标的目的[14, 15]。研究表明,RNAi 技术能快速有效地鉴别药物新靶点,RNAi 文库的应用将为肿瘤和感染性疾病等的发病机制和治疗研究提供理论依据和新的切入点。

2.2.2RNA干扰辅助药物靶点的确证高通量筛选技术可以发现和某种疾病相关的药物靶点库,然而要完全确定某蛋白在某种疾病中的重要性或某种蛋白在某种药物发挥药效中的作用,要看在动物模型内阻断候选基因是否能减缓病症或拮抗药物原有的药理活性,甚至在人体内验证。鉴于近来向活体中转染siRNA 技术的不断提高,在动物模型中的应用也取得进展,于是利用RNAi 阻断模拟人疾病状态的动物模型中的基因的表达,对靶点进行深入的鉴定和评价呈现出潜在的优势。Brummelkamp 等[16]通过逆转录病毒载体介导的shRNA 表达系统靶向K-rasV12 的mRNA,转染人胰腺癌细胞,结果验证了K-rasV12 是胰腺癌中一个很好的抗肿瘤药物靶点,同时也说明RNAi 可以验证药物筛选中候选靶点在活体内的功能,为鉴定候选靶点最终是否能作为新药靶提供了有力的证据。

3蛋白水平的药物靶标

发现与验证人类基因组计划大规模测序为创新药物的研究提供了前所未有的机遇,但是生命活动是通过DNA 到RNA 到蛋白质来实现的。药物作用的基础也是蛋白质而非 RNA/ DNA [17]。蛋白水平的药物靶标研究具有更加重大的意义。迄今,已发现的大部分药物靶标都是来自蛋白水平研究。蛋白水平药物靶标的研究方法也是层出不穷,人们不仅通过蛋白质组学[18, 19]、蛋白芯片[20]、噬菌体展示[21, 22]等技术大规模筛选药物靶标,而且还利用亲和色谱[23~25]、酵母三杂交系统[26,27]、磁性纳米探针技术[28]等发现了很多天然活性化合物或其衍生物的作用靶点。

3.1亲和色谱技术在药物靶标研究的漫长发展历程中,亲和色谱技术是最经典的一种技术。由于它具有能直接分离各种组织、细胞中的天然状态蛋白、操作方便、稳定性强等优点,长期以来被广泛应用于药物靶蛋白的分离。迄今为止,亲和色谱法已成功应用于FK506[23]、环孢菌素[24]等多种药物靶蛋白的搜寻。常用的亲和色谱法包括固相洗脱、药物竞争法等,如果亲和柱(柱材——药物)与靶蛋白解离过慢,则很难洗脱下来,须制备无活性结构类似药物的对照柱;如果药物溶解性差,蛋白会随不溶的药物沉淀,则无效。2006-05报道的一种称为“系列亲和色谱法”的改良亲和色谱法,则不受药物溶解性、配基-蛋白复合物解离速度的影响,适合于溶解性较差的化合物,该方法已经甲氨喋呤、FK506 等药物的靶点寻找上得到了验证[25]。作者也采用系列亲和色谱法首次发现了麦冬活性成分——鲁斯可皂苷元的特异性结合蛋白(另文发表)。

3.2噬菌体展示技术噬菌体展示技术是一种有效的药物靶点筛选工具,它可以将外源蛋白或多肽呈现在噬菌体表面,利用外源蛋白或多肽与待筛选药物的特异性亲和作用,通过吸附-洗脱-扩增的筛选富集过程,将表达与药物特异性结合的外源蛋白或多肽的噬菌体大量富集,然后通过测序分析即可得到与药物特异性结合的外源蛋白或多肽。这一技术将基因型和表型、分子结合活性和噬菌体的可扩增性巧妙的结合起来,是一种高效的筛选体系,同时也是一种探讨受体和配体之间相互作用的结合位点、寻求高亲合力结合配体的有力工具。据报道,Rodi[21]等利用噬菌体展示技术,对抗癌药物紫杉醇进行筛选,获得了紫杉醇在体内的药物作用的靶点Bcl-2 蛋白。Jin[22]等利用噬菌体展示技术,通过固定化阿霉素筛选T7噬菌体人类肝脏的cDNA 文库,得到了阿霉素的靶点蛋白hNopp140。

3.3三杂交系统三杂交系统(three-hybrid system)是近几年在酵母双杂交技术的基础上发展的由活性小分子鉴定靶蛋白的方法。其基本原理与酵母双杂交类似,只是在“钩”与“鱼”之间加了“饵”构成三杂交中的3个组分:其中的“饵”是一种修饰过的活性小分子,是由活性小分子和配体A 连接而成:“钩”是由配体A 的受体蛋白与DB 融合而成;“鱼”是由cDNA 库中的蛋白融合在AD 上构成。当待筛选靶组织的cDNA 库中的某一蛋白与小分子相互作用时报告基因的转录被启动,这时细胞可被明显检测。Becker 等用周期素依赖性蛋白激酶(CDK)抑制剂作为饵,采用该方法从人cDNA 库中筛选到多种CDK抑制剂的靶蛋白[26]。此外,在哺乳动物组织细胞中采用三杂交系统筛选活性小分子的靶蛋白也已获得成功[27]。

3.4蛋白芯片技术蛋白质芯片是一种类似于基因芯片的高通量筛选方法。利用蛋白质芯片技术可以从正常细胞和病变细胞的蛋白质的变化中发现疾病相关蛋白,这些相关蛋白经研究筛选后可能成为药物的新靶点。Fong 等[20]借助蛋白质芯片发现TROP2 将成为口腔鳞状上皮细胞癌的诊断治疗和抗口腔鳞状上皮细胞癌药物研究的新靶点。

4展望

虽然目前确定的药物靶点还很少,药物靶标的发现与验证的各种方法也存在种种不足,毫无疑问人类基因组框架图的绘制完成,功能基因组研究的深入,为发现更多药物靶标提供了可能,这将有利于药物发现和开发的进程。同时,生命科学与化学、物理学、信息学等其他学科进一步的交融,将为各种技术方法不断发展完善奠定基础。相信随着功能基因组研究的深入及生物技术的快速发展,人类将能够更加明确地阐明疾病的病理生理机制、药物治疗作用及其毒性作用的分子机制,发现更多可以治疗疾病的药物作用靶点或靶点组合,进而发现更好的药物,提高人类的生活质量。

参考文献

[1]Sakurai T, Amemiya A, Ishii M, et al. Orexins and orexin receptors: a family of hypothalamic neuropeptides and protein-G coupled receptors that regulate feeding behaviour [J]. Cell, 1998, 92 (4): 573.

[2]Jayapal M, Melendez AJ. DNA microarray technology for target identification and validation [J]. Clin Exp Pharm Physiol, 2006, 33 (5):371.

[3]郑越, 程肖蕊, 周文霞, 等. DNA微阵列技术在阿尔茨海默病及其防治药物研究中的应用[J]. 生物技术通讯, 2007, 18 (2): 320.

[4]Grunblatt E, Mandel S, Maor G, et al. Gene expression analysis in N-methyl-4-phenyl-1, 2, 3, 6-tetrahydropyridine mice model of Parkinson′s disease using cDNA microarray: effect of R-apomor-Phine [J]. J Neurochem, 2001, 78 (1): 1.

[5]Stam RW, den Boer ML, Meijerink JP, et al. Differential mRNA expression of Ara-C-metabolizing enzymes explains Ara-C sensitivity in MLL gene-rearranged infant acute lymphoblastic Leukemia [J]. Blood, 2003, 101(4): 1270.

[6]Thal MA, Carvalho TL, He T, et al. Ebf1-mediated down-regulation of Id2 and Id3 is essential for specification of the B cell lineage [J]. Proc Natl Acad Sci. USA, 2009, 106 (2): 552.

[7]Tanaka R, Miwa Y, Mou K, et al. Knockout of the l-pgds gene aggravates obesity and atherosclerosis in mice [J]. Biochem Biophys Res Commun, 2009, 378 (4): 851.

[8]Cao RY, St. Amand T, Gr?bner R, et al. Genetic and pharmacological inhibition of the 5-lipoxygenase/leukotriene pathway in atherosclerotic lesion development in ApoE deficient mice [J]. Atherosclerosis, 2008, 203 (5): 395.

[9]Sun Z, Cade R, Zhang Z, et al. Angiotensinogen gene knockout delays and attenuates cold-induced hypertension [J]. Hypertension, 2003, 41(2):322.

[10] Chen WS, Peng X, Wang Y, et al. Leptin deficiency and beta-cell dysfunction underlie type 2 diabetes in compound Akt knockout mice [J]. Mol Cell Biol, 2009, 29 (11): 3151.

[11]Rao CV, Lei ZM. Consequences of targeted inactivation of LH receptors [J]. Mol Cell Endocrinol, 2002, 187 (1): 57.

[12] Jarvis MF, Burgard EC, McGaraughty S, et al. A-317491, a novel, potent and selective non-nucleotide antagonist of P2X3 and P2X2/3 receptors reduces chronic inflammatory and neuropathic pain in rat [J]. Proc Natl Acad Sci USA, 2002, 99 (26):17179.

[13]Okabe H, Furukawa Y, Kato T, et al. Isolation of development and differentiation enhancing factor-like 1 (DDEFL1) as a drug target for hepatocellular carcinomas [J]. Int J Oncol, 2004, 24 (1): 43.

[14]Brummelkamp TR, Bernards R. New tools for functional mammalian cancer genetics [J]. Nat Rev Cancer, 2003, 3 (10): 781.

[15]Hannon GJ, Rossi J. Unlocking the potential of the human genome with RNA interference [J]. Nature, 2004, 431 (3): 371.

[16]Brummelkamp TR, Bernards R, Agami R. Stable suppression of tumorigenicity by virus-mediated RNA interference [J]. Cancer Cell, 2002, 2 (3):243.

[17]Latterich M, Abramovitz M, Leyland-Jones B. Proteomics: New technologies and clinical applications [J]. Eur J Cancer, 2008, 44: 2737.

[18]Celis JE, Rasmussen HH, Vorum H, et al. Bladder squamous cell carcinomas express psoriasin and externalize it to the urine [J]. J Urol, 1996, 155 (6): 2105.

[19]Zhou C, Nitschke AM, Xiong W, et al. Proteomic analysis of tumor necrosis factor-alpha resistant human breast cancer cells reveals a MEK5/Erk5-mediated epithelial-mesenchymal transition phenotype [J]. Breast Cancer Res, 2008, 10 (6): R105.

[20]Fong D, Spizzo G, Gostner JM, et al. TROP2: A novel prognostic marker in squamous cell carcinoma of the oral cavity [J]. Mod Pathol, 2008, 21 (2): 186.

[21]Rodi DJ, Janes RW, Sanganee Hitesh J, et al. Screening of a library of phage-displayed peptides identifies human Bcl-2 as a taxol-binding protein [J]. J Mo Biol, 1999, 285 (1):197.

[22] Jin T, Yu J, Yu Y. Identification of hNopp140 as a binding partner for doxorubicin with a phage display cloning method [J]. Chem Biol, 2002, 9 (2): 157.

[23]Kuramochi K, Miyano Y, Enomoto Y, et al. Identification of small molecule binding molecules by affinity purification using a specific ligand immobilized on PEGA resin [J]. Bioconjugate Chem, 2008, 19 (12): 2417.

[24]Tanaka A. Identification of the specific binding proteins of bioactive small compound using affinity resins [J]. Methods Mol Biol, 2009, 577: 181.

[25]Yamamoto K, Yamazaki A, Takeuchi M, et al. A versatile method of identifying specific binding proteins on affinity resins [J]. Anal Bioch, 2006, 352 (1): 15.

[26]Becker F, Murthi K, Smith C, et al. A three-hybrid approach to scanning the proteome for targets of small molecule kinase inhibitors [J]. Chem Biol, 2004, 11 (2): 211.

篇10

关键词 病理学 病例教学法 教学改革

中图分类号:G424 文献标识码:A

Practice and Significance of the Case Teaching Method in Pathology Teaching

LIU Shuangping[1][2], LI Zhuhu[1], JIN Tiefeng[1], LIN Zhenhua[1][2]

([1] Department of Pathology, School of Medicine, Yanbian University, Yanji, Jilin 133000;

[2] Ministry of Education Key Laboratory of Natural Resources of Changbai

Mountain and Functional Molecules, Yanbian University, Yanji, Jilin 133000)

Abstract Pathology teaching is an important part of pathology teaching reform. Mainly through the selection of typical cases in pathology teaching practice, combined with the new teaching model conducted clinical pathology practice content. This way of teaching the teacher can give full play to both teaching and student learning initiative, to change the current status of a single teaching, students' imagination and logic ability to change the current mode of teaching, and provides kinds of new ideas on teaching reform of Pathology.

Key words pathology; case teaching method; teaching reform

1 方法概述

病理教学法是通过对典型病例进行分析、推理和判断,来学习病理知识的一种方法。这种方法的创立是在充分采纳学生教学要求的基础上,开创的一种理论联系实际的教学方法,因此表现了生动、直观、易理解、便于记忆等优势。比如在学习动心肌梗塞时,首先灵活运用各种教学方法精讲心肌梗塞的病理基本理论知识,再让学生对一个典型的心肌梗塞病例进行分析,并推断出该病例的病因、病变、诊断等,使学生通过实际的病例分析,对心肌梗塞的病理理论知识理解更为准确透彻,做到在理解的基础上加强记忆。

2 病例选取要点

根据病理学教学特点,每个章节都有不同的侧重点,选取病例时应当选择可以概括该章节主要知识点,并具有一定趣味性和推理性的案例。应注意避免少见病例或者诊断难度较大的病例。无论选择什么病例,都应当包括患者的一般情况、病史、体格检查、辅助检查、临床表现、病理图片等几个部分真实而准确的描述。当教师在讨论课之前将材料发放给学生的时候,使每个学生在阅读病历时产生作为医生的责任感,对其作为医生的身份生出自豪感,可以投入地结合已经学过的知识进行诊断。例如,在呼吸系统疾病这一章节中,课题组选择的病例为62岁老年男性因糖尿病住院期间,出现咳嗽,咳脓性痰,发热等症状,X光片显示肺部有小片散在不规则阴影,同学们在课堂上经过讨论,诊断为小叶性肺炎。本病例的症状与体征与大叶性肺炎及病毒性肺炎等均有异同,却又在高发人群及X光片显示上具有自身特点,选择该病例,学生不但可以复习小叶性肺炎,还可以同时回顾支气管炎,大叶性肺炎,支原体肺炎及病毒性肺炎等疾病的病征。同学们在课后纷纷表示,通过具体病例分析才真正了解医学生扎实学习理论知识的重要性,也为他们培养出诊断和鉴别诊断的思维方式。

3 充分利用多媒体进行病例教学

在病例选取后,传统的病理学教学模式因无法形象描述病案 ,大大影响了病理学教学效果。因此,利用现代多媒体技术,综合图像、动画、音视频等多媒体资源,可将病案有逻辑性、条理性、形象生动地逐一展现在学生面前,提高学生的认知效果,加深感知度,激发学生的学习兴趣和热情,将使学生更好地参与到课堂,大大提高教学效果。结合多媒体技术,知识讲授中用病例导入教学内容,并以病例贯穿于整个教学过程,能够使学生对病例有很好的感性认识。由于多媒体技术的特点是直观、形象,在此基础上结合病例提出问题,易使学生高度集中注意力,加深对问题及相关理论知识的理解。理论知识的学有些枯燥乏味,但在具体病例、及其引发的病理问题带动下,辅助以多媒体音像图片等的生动演示,大大提高了学生的学习兴趣、积极性。比如在讲“肝硬化”一章时可以利用动画列举肝硬化腹水的形成过程,以及许多临床上常见肝硬化引发的蜘蛛痣、肝掌等体征,并具体用图片表现临床谵妄等表现,让学生立体掌握病例的具体病理变化和发病机制。根据学生的调查结果显示,学生普遍反映通过多媒体病例教学后,在今后的临床课程中再次遇到相同病例,(下转第160页)(上接第140页)可以充分回忆起病理变化过程、基本病变和临床病理联系,收到教学生动、深入浅出等良好教学效果。

4 学生代表发表病理诊断并讨论

在病理课进行一半以后,学生基本接受并熟知病例教学法的进行方式。病理学各论讲解开始后,可以在病例教学时段开展分组讨论。基本方式为:提前提供详尽的病例资料,以小班为单位,由学生自荐或由本班学生推荐宣讲人,在课堂上以报告方式讲解分析病情并作出诊断。一般几个班组间的推理和诊断可能不尽相同,再以自由发言的形式向宣讲人的论断提出质疑,说明理由并展开讨论。这一过程的开展,大大激发了学生的团队精神,学习热情和动脑能力。在前期课堂中,学生都表现出极大的积极性,纷纷就病例资料查阅大量相关文献,并利用互联网等生物信息学手段进行判断和佐证。在前期开展的教学实践中可以发现,临床病例讨论课时气氛十分活跃,学生学习兴趣浓厚,争论激烈,有时甚至达到白热化程度,在最后教师做课堂总结并揭示最终诊断结果时,同学们的听课精力都非常集中,并对本次课程的相关知识点以及扩展知识掌握牢固,触类旁通。

5 根据讨论课内容布置技术思考路线类作业

在活跃的课堂气氛中结束教学时,要求学生将本次课的内容从病史,体征,症状,到诊断过程的思考路线总结成线性图表,并根据课堂中各小组诊断的异同分析该种疾病的鉴别诊断要点。例如,在讲述结核病的病理过程时,同学们基本可以总结出从结核杆菌感染宿主肺部结核原发灶淋巴管炎淋巴结结核淋巴道/血道播散这一过程,可以强化教学效果,让同学们温习所学内容的同时,养成良好的逻辑思维习惯。在每学期教学结束时,学生都可以根据这些教师批改过的作业总结出重点难点内容,对病理学课程知识的掌握是一种有效总结和促进。此外,在常见病多发病的病例讨论后,还会布置学生进行临床病理联系及思考,例如目前发病率明显增高的甲状腺肿瘤,在病例讨论后,布置甲状腺肿瘤高发原因探讨的作业,很多学生利用分子生物信息学、网络连接等手段,可以从多个角度充分分析这一现象,大大提高学生的综合思考能力,学生反映良好。

总之,通过课题组多年的教学实践,在开展新的教学方法-病例教学法过程中,不断根据教学反馈和学生调查来调整和优化教学方法,充分利用教研组具有尸体解剖实例和临床教学医院的具体案例优势,可以将典型病例从临床检验数据、病理取材信息、病理镜下标本、病理诊断到临床预后评估一系列连续的病例过程详尽讲解给学生,能够收到很好的教学效果,对培养具有综合素质的临床医生具有良好的推进作用。

*通讯作者:林贞花

基金项目:国家自然科学基金(No.31301065)及延边大学教研课题病理解剖学教学方法改革的实践与研究(2012-28)

参考文献

[1] 黄宁波.病理教学中的病例教学法初探[J].现代中西医结合杂志,2009.18(8):957-958.