语音识别技术范文10篇
时间:2024-04-28 08:14:01
导语:这里是公务员之家根据多年的文秘经验,为你推荐的十篇语音识别技术范文,还可以咨询客服老师获取更多原创文章,欢迎参考。
语音识别技术在电网的应用
摘要:语音识别技术在车载等领域得到了广泛的应用,随着智能电网建设推进,基于智能化的语音识别技术也将得到重点研究。阐述了语音识别的基本原理,分析了语音识别技术在电力调度、设备巡检等领域的应用情况。
关键词:语音识别;电网应用;深度学习;电力生产
语言是人类社会中交流的重要手段,也是最为有效的途径之一,而语音是语言的声学表征,从20世纪50年代开始,语音识别技术概念被提出并得到重视,随着计算机技术的快速发展与深入应用,同机器开展语音交流成为现实。到20世纪90年代后期,人工神经网络的应用使得语音识别系统真正开始实用化,通过对人类语音的容错性与自适应识别,使得计算机认知人的真实意图,从而完成一系列的相关执行动作[1]。近些年车载语音识别技术得到了较为广泛的开发与应用,也使得语音识别向其他行业逐渐扩展开来。对于电力系统而言,尽管语音告警、语音合成等带有语音的相关技术应用时间较长,但是针对语音识别技术的应用与开发同其他成熟行业相比来说,还较为浅显。随着智能电网建设的快速推进,语音识别技术这一具有明显智能特征的前端技术,必将在电网应用中得到较为广泛的应用与研究。
一、语音识别原理
从浅显角度上来看,语音识别就是人的声音信号转换为文字或者指令的相关过程[2],是语音信号处理的重要研究方向之一,它不仅是人工智能单个方向,是综合了微机技术、信号分析处理、模式识别、声学等多个学科的综合研究方向。针对不同限制条件下的相关领域,语音识别系统可划分为孤立词、连接词以及连续语音识别方式,而根据对语音产生对象的依赖程度,可划分为特定人以及非特定人两个层次,根据对语音词汇量的程度,可划分为小级别、中等级别、大级别以及无限制等多种程度的语音识别系统。从本质原理上,语音识别系统的基础主要为统计模式识别,综合了语音学以及语言学的大量信息,将语音输入对象特征向量序列进行一系列的转化,形成待处理的声学模型。在建立模型之后,开展相关的特征提取、模型搜索求解等相关操作。简单来说,就是将获取的语音信息进行模块处理,对相关的语音特征参数结合数据块进行模块匹配并识别,最终输出相应的识别结果,开展下一步的应用分析。根据语音识别的基本步骤分析,一般分为语音信号的获取、预处理、特征提取、相似性度量与模块匹配、数据后处理、识别结果输出等多个基本步骤。由于语音信号本质上属于非平稳信号,目前对语音信号的分析是建立在短时平稳性假设之上的,同时声学模型又是系统中最为重要的部分之一,主要存在建模单元选择、状态聚类、参数估计等多个方面。随着语音识别系统研究逐步深入,现阶段对于,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基于深度学习的声学模型说话人自适应和基于深度学习的端到端语音识别均得到了重点关注[3]。
二、语音识别在电网中应用分析
语音识别研究论文
摘要:语音识别技术是一门涉及面很广的交叉学科。随着新理论的提出和应用,语音识别技术取得了很大的进步,许多产品已经得以实际的应用,但在其进一步的发展进程中,还有许多棘手的问题有待解决。
关键词:语音识别;动态时间规整算法;人工神经元网络
1背景介绍
语言是人类特有的功能,是人们思维最重要的寄托体,是人类交流最主要的途径。语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。语言和语音与人类社会科学文化发展紧密相连。
语音识别技术是让机器接收,识别和理解语音信号,并将其转换成相应的数字信号的技术。它是一门交叉学科,涉及到语音语言学、数理统计、计算机、信号处理等一系列学科。
2发展历史
广播电视音频监测技术研究
广播电视的不问断和安全播出始终是广播电视机构要完成的首要任务。随着基于电子管、晶体管等设备的退役和计算机软硬件技术、微电子技术和数字化技术的应用普及,广播电视设备的故障率已经降到了非常低的水平,在节目播出过程中由于设备故障造成的停播、错播现象已很少发生。近年来,信号的安全播出问题,尤其是信号的被干扰、被破坏和被插播的现象屡见不鲜。广播电视的安全监测技术逐渐成为广播电视制播技术的研究焦点。本文将针对以上问题加以探讨,并对解决问题所用到的关键技术和算法进行简要的分析和论述。
1监测业务和技术的现状及分类
目前国内大多数广播电视台站的自动监测系统都只针对音频信号的质量好坏和信号的有无进行监测,而对于音频信号的来源及内容等安全方面的监测任务则更多地采用循环播放、人工监听的方式…。人工方式不仅效率低,而且不及时。应州于广播电视安全监测系统的音频信号监测技术从业务层面上可分为音频的内容监测和音频的质量监测。音频的内容监测主要是对采集的信息的收集、整理、解析和应用等过程中所出现的错误、疏漏、不当及不和谐、敏感信息的检查和把关,它关注的是音频所表述的具体内容。音频的质量监测主要是对已经制作完成的广播电视节目在音频信号的生成、处理、传输和收发过程中出现的干扰、噪声、电平过低、中断和信源突变等状况所进行的实时监控和更正,它注重的是音频信号的质量及来源的正确性。二者虽然针对的业务层面不同,却彼此依赖相互联系。音频内容的好坏会直接影响到音频质量的高低,音频质量的高低也会直接影响终端听众对信息内容的获取量和正确率。总之,对音频内容和质量的监测都是为了保证听众能收到正确、优质和不间断的音频信号。目前,可应用于音频信号监测任务的技术可分为音频比对技术、音频识别技术、数字水印技术这三大类。
2音频比对技术
音频比对技术是利用数字音频的时域或频域特征或属性来分析两段音频序列的相似度,再相似度的大小来判断这两段音频序列播放的是否是相同或相似的内容。其大概流程如图1所示。首先,将要处理的2路音频序列通过多路音频采集卡采集到设备中,并进行滤波、增益补偿等处理;其次,将得到的2路音频信号进行模数转换,再对得到的数字信号进行压缩处理;然后,提取2路信号的特征参数或者属性;最后,比较提取出来的参数或者属性,得出2路音频信号的相似度,再由相似度来判断2路信号是否相同或者相似。滤波和增益补偿等预处理是为了滤除音频中的噪卢、干扰脉冲及平衡音频的电平差等。
压缩处理是为了减少音频中相关性较低和不相关的参数,减少后续工作量,提高处理的实时性(目前比较流行的压缩算法是利用小波函数压缩)。参数和属性的提取是从音频流中以帧为单位提取出2路音频的质心、均方根、Mel倒谱系数以及音高、振幅、带宽、能量等。音频比对是利用上一步提取的参数或属性进行计算和比较,将比较结果同预先设定的阈值进行对比,得出最终结果。音频比对技术在实现时不考虑音频的具体内容,它只注重音频序列的关键参数和属性的相似度。目前对音频技术的应用需求更多的还是涉及到音频的语意和具体内容方面,这项技术的适用领域相对来说比较小,但是它基本上能满足广播电视的质量监测的任务需求。
智能语音识别在广播电视监测的应用
摘要:随着媒体深度融合不断推进,各类新兴媒体持续涌现、遍地开花,广播电视内容监测从传统的广播、电视频道监测扩展到了互联网新兴媒体视听内容。海量、多元的互联网视听内容给监测监管工作带来了巨大的挑战,如何适应这一新形势是各级监管机构面临的共性问题。本文旨在探讨将自动语音识别和智能语义分析技术结合起来应用到监测监管工作中的可行性及优势。
关键词:智能语义分析;自动语音识别;内容监测
1引言
随着互联网技术的发展普及,手机、电脑逐渐成为了人们获取信息、学习娱乐的主要渠道,与之对应的各类互联网新媒体传播平台(短视频、直播、视频网站等)不断涌现,海量的网络视频、网络广播等互联网视听内容都成为了广播电视监测监管对象,使得监测监管工作变得更加艰巨和复杂,对监测监管从业人员的专业素质和监测技术手段提出了更高的要求。传统广播电视内容监测是将音视频节目录像先存贮,再通过图像识别、关键帧对比、语音特征识别等技术手段进行监测监管,存在监测时效性差、计算存贮资源需求高、违规识别准确率低等问题。随着互联网视听监测业务的不断拓展,这些劣势越发凸显,实现快速、实时、准确的对巨量、多元的互联网视听内容进行监测监管的需求变得越来越迫切。
2自动语音识别和智能语义分析技术
2.1自动语音识别。语音识别(ASR)是语音交互中最基础的一个AI技术环节,就是将一段语音信号转换成相对应的文本信息,系统主要包含特征提取、声学模型、语言模型以及字典与解码四大部分。此外,为了更有效地提取特征,往往还需要对所采集到的声音信号进行滤波、分帧等音频数据预处理工作,将需要分析的音频信号从原始信号中合适地提取出来。特征提取工作将声音信号从时域转换到频域,为声学模型提供合适的特征向量;声学模型再根据声学特性计算每一个特征向量在声学特征上的得分;而语言模型则根据语言学相关的理论,计算该声音信号对应可能词组序列的概率;最后根据已有的字典,对词组序列进行解码,得到最后可能的文本表示,连续语音识别原理框图如图1所示。当前,该技术发展已非常成熟,车载语音助手、智能语音输入等都已经普及在我们的各种生活场景中。2.2智能语义分析。智能语义分析是自然语言理解(NLP)的关键,自然语言理解是人工智能领域中的核心课题之一。当前,智能语义分析可以对文本进行自动化处理,主要应用于要素抽取、智能审核、舆情分析、知识搜索、自动写作等,在分析歧义、词语省略、代词所指、意图识别等的理解方面依然存在不足。但是,随着近年来人工智能技术的迅猛发展,经过不断的演化迭代,其智能化、类人化的理解能力已经越来越高,按照这个趋势,未来计算机一定能够逐步接近甚至达到类人自然语言处理能力。通过以上介绍不难发现,将语音自动识别和智能语义分析结合起来,运用到广播电视内容监测中,从技术实现上来说已经没有障碍,首先通过自动语音识别将音视频内容文本化,然后再利用智能语义分析对文本化的音视频内容进行分析监测,输出监测预警信息。当前,语音识别速度和准确率早已达到应用层面的标准,为音视频内容文本化的准确率提供了保障,通过样本库关键词句进行文本检索,就可以快速准确识别一般违规信息,这只是快速发现的第一步。对于较为复杂的违规信息,智能语义分析系统在不断的使用优化过程中,通过长期连续的神经网络训练和人工纠偏,逐步提高对长文本、复杂结构句式、特殊发声等各种定制监测需求违规信息的理解识别准确率,由文本内容检索逐步进化到拟人化的感知思考,应用前景明朗。
单片机控制智能语音刷卡系统设计探讨
摘要:阐述STM32单片机控制的智能语音刷卡系统中的内部结构、语音识别功能,智能语音刷卡系统的功能模块,包括中央控制系统、语音识别模块、电平串口模块、蓝牙模块、显示模块、刷卡模块、供电模块,探讨智能语音刷卡系统的程序设计。
关键词:STM32单片机,智能语音控制,程序设计,语音识别
STM32单片机控制的智能语音刷卡系统当前被越来越多的应用于各个领域,该系统能够在消费者进行刷卡消费时使用语音功能输入消费价格,在使用过程中更加方便快捷。该系统主要具有强大的语音识别功能和刷卡功能,在执行语音功能时可以将其悬挂在腰间,或者其他位置。语音系统内部结构包括一个麦克风以及连接线,系统主要是通过挂在腰间的语音识别装置进行语音识别和转换,然后将信息上传至系统内部,从而智能控制刷卡机达到语音识别目的。本系统可以在刷卡成功后通过电子屏显示消费者银行卡的余额等信息,通过对这一系统的推广和应用极大地提高了商场等收银工作的工作效率以及准确率,减少误差。本文通过对STM32单片机控制的智能语音刷卡系统的运行原理、结构分析和讨论,希望能够更好地将该系统推广到各个领域当中,提高其使用价值。
1研究背景
以STM32单片机控制装置为主要部分的智能语音刷卡系统,能够更好地施展其语音识别功能,该系统是通过内部特殊装置来对语音进行分析和定位,最终完成识别工作,然后将识别后的信息传送至中央系统,通过中央系统对刷卡装置发送指令最终完成语音刷卡任务。这一系列的操作过程都要利用电脑程序编排,只有经过软件对该系统进行科学合理的编程,对STM32单片机装置进行严谨的数据分析和处理,才能够是中枢控制系统接收到准确无误的信息数据,从而保证系统能够更好地完成刷卡任务。我国STM32单片机智能语音刷卡系统应用已经十分普遍,各大商场甚至中小私营门面都引进该系统,用于店铺收银工作,该系统具有生产成本低,操作简单,小巧方便便于携带等诸多优点。因此,为了更好地将该系统应用在各个领域当中,我们应该更加清晰明了的掌握该系统的内部结构以及运行理论,充分的改进和完善该系统,使其能够更好地为我们提供服务。
2STM32单片机控制的智能刷卡系统
计算机人工智能识别关键技术探讨
受社会经济水平提升的影响,计算机技术的开发越来越深入,尤其是人工智能识别技术的开发与应用,应用范围越来越广,真正提高了生活与工作的便捷性。当前人工智能技术已经在机器人、智能语音识别、人工神经等多个领域得到运用,充分发挥计算机技术的优势提高计算机人工智能识别水平。下面重点围绕计算机人工智能识别关键技术的应用展开分析。
1计算机人工智能识别技术
所谓智能识别技术,即立足于计算机系统、扫描设备、照相机技术等先进技术的基础上,对目标指令、数据信息展开智能识别,提高识别准确性与效率,从而满足目前社会发展过程中对智能识别提出的严格要求。人工智能识别技术是在语音识别技术的基础上延伸而来,语音识别技术主要是在手机控制中得到运用,为人民群众的生活提供高质量服务。随后技术人员开发了人工智能识别技术,在运行过程中更多利用语音识别,语音内容、手机发出的指令比对之后展开分析,从而保证选择的有效性。在实际应用中渗透人工智能识别技术,能够真正减少工作量,提高工作效率,这对于社会的飞速发展有重要作用。
2计算机人工智能识别关键技术现状
目前我国人工智能识别技术的研发、应用依然处于发展阶段,与国外对比还没有非常完善且成熟的技术体系。同时,各个国家就人工智能识别技术展开交流与合作,这为我国研发人工智能识别技术新的机遇。通过不断实践与研发,人工智能识别技术水平显著提升,同时也为人们的工作与生活带来诸多便利。改善了生活条件。同时,我国相关部门对人工智能识别技术给予足够的重视,投入大量资金,市场规模不断扩大。2016年市场规模为16亿元,2017年增加到21亿元,2018年为26亿元,预计2019年和2020年有望突破40亿元。但是,人工智能识别技术在实践应用的过程中依然面临问题,和国外整体发展水平有一些差距,以上便是目前需要解决的解决重点问题。
3计算机人工智能识别关键技术运用
AI在安全播出领域的应用
摘要:随着互联网和大数据的发展,人工智能技术(AI)得到了高速和深入的发展。在有线电视安全播出领域运用AI技术,将会显著提升安全播出工作效果。本文对安全播出中的内容安全审播现状进行了总结,对AI技术发展进行了介绍,并对如何将AI应用于安全播出领域进行了详细分析,提出具体技术部署方案和相关建议,对AI技术运用于数字电视安全播出具有启示价值。
关键词:AI;安全播出;大数据
1引言
随着我国经济发展和社会进步,人民群众对精神文化生活的需求日益增长。广播电视播出机构通过不断增加播出频道数量和节目内容来满足用户这方面需求,这对作为广播电视产业发展的基础和广播电视工作生命线的安全播出工作提出了更高要求。在我国,广播电视承担了党、政府和人民宣传喉舌的特殊功能,是舆论引导的主要工具。安全播出是广播电视运营商的首要任务,而内容安全是安全播出的重点之一,特别是涉及政治、外交、军事、国计民生大政方针等内容时,更加不能有丝毫差错。
2内容安全审核与播出现状
对于有线电视运营商来说,安全播出包括电视节目的播出、传输与覆盖等网络传输环节,也包括点播形式的媒资和页面海报等内容呈现环节。其中,媒资内容安全涉及意识形态和舆论导向,是安全播出重中之重的环节。针对媒资内容的安全播出措施主要包括播出前审核和播出过程中监听监看。目前,对媒资内容的审核由审核专家采取人工方式进行,人工审核的特点是审核效率有限。播出过程中对媒资内容进行监听监看以人工方式为主,但这种方式存在明显不足:第一,对内容安全的认知取决于人员业务素质、主客观判断等因素,不同人员对同样内容的认知结果存在差异;第二,栏目数量和点播媒资内容日益增多,需要增加具备安全播出业务素质的人员数量,相应的人力成本也会大幅增加;第三,监听监看人员值守期间安播压力大,精神高度紧张,工作体验不佳,专业人员流失严重。针对内容审核以人工方式为主存在的问题,通过引入AI技术,基于智能算法,辅助内容安全审核,可以大幅度减轻目前内容安全审核压力,提升安全播出的工作效果。
计算机人工智能识别技术应用思考
摘要:随着计算机、人工智能技术的快速发展和普及,计算机人工智能识别技术也不断地推陈出新,并在许多领域得到了推广和应用,为人们的生活和工作带来了极大的便利。对计算机人工智能识别技术进行了阐述,并就当前的技术应用实践展开分析,对其应用瓶颈和解决对策给予分析和探讨。
关键词:计算机;人工智能识别技术;应用实践;瓶颈
目前,计算机人工智能识别技术的应用范围较广,比如无生命特征的技术实践领域有二维码识别、机器翻译和基于神经网络的类型识别等;有生命特征的技术实践领域诞生了语音识别、面部识别和指纹识别等。这些技术的应用满足了现代社会发展的相关需求。但计算机人工智能识别技术诞生较近,技术还不够成熟,所以在应用中存在一些亟需突破的瓶颈问题。突破这些瓶颈以促使该技术得到更好的发展和应用,将是该领域未来发展的重中之重。
1计算机人工智能识别技术
计算机人工智能识别技术的核心是用计算机对人类智能进行模拟,进而促使计算机通过模仿人类的判别思维来达成识别的目的。例如人类看到了一个熟悉的面孔,会通过大脑的思维判别,自主识别出对方的身份,而利用人工智能技术进行面部识别与之类似,也是通过扫描被识别者的面部信息,然后将其与已纳入面部模型库中的“熟悉面孔”进行对比,进而实现身份的识别确认。将计算机人工智能识别技术广泛应用于生活和工作,可以实现对人力资源的解放,很多识别确认类的工作交由系统自动完成,极大地提升了工作质量和效率。与欧美等发达国家相比,我国对计算机人工智能识别技术的研究起步较晚,但因为国家和相关企业高度重视,目前我国在该技术的研究方面,尤其是在实践应用领域取得了很多积极成果,推动了该技术在我国的应用水平的提升。但目前该技术在应用过程中还存在一些瓶颈和难点,比如成本较高、可靠性不足等等,对技术的应用深化形成了一定的阻碍,也是现阶段亟待解决和攻克的问题。
2计算机人工智能识别技术的应用实践
多媒体技术的应用与发展前景
1多媒体技术涉及的内容
多媒体是一种较为泛泛的称呼,其主要是通过计算机的交互式综合技术以及数字通信网络处理技术等多种科技手段,将多种形式的信息集中在一起,从而形成一种交互式的系统。通过多媒体技术,人们能够对生活中的多种工作进行更加方便的执行。目前,多媒体技术主要涉及以下一些方面,且在这些方面中具有非常广阔的应用前景:首先是对图像信息的处理,通过多媒体的压缩功能,能够将图像信息进行各种形式之间的转换,从而保证图像信息的传递性。然后是对音频信息的处理,多媒体技术能够通过音频的合成产生人们需要的一些特定语音信息,此外,当前非常流行的语音转换功能能够实现语音信息和文本信息之间的良好转换,从而大大方便了人们的生活和工作。还有多媒体的数据库和著作工具等,通过这些多媒体技术,能够使人们的生活和学生更加简单便捷,提高人们的生活质量。
2多媒体技术的应用现状
2.1多媒体数据处理技术的应用
对于计算机多媒体技术来说,其包含的内容非常丰富,像文字、图像和声音等的处理等,通过多媒体技术能够对各种数据进行快速的转换,满足人们工作学习的需要,且多媒体在进行信息转换时能够大批量的进行,从而更好的解决了当前存在的存储器存储容量问题等。对于多媒体数据处理技术来说,其涉及的技术和内容非常多,主要包含以下几种:第一,视频技术。视频技术主要由两个方面组成,分别是视频的数字化和视频的编码两种,所谓的视频数字化指的是多媒体能够将得到的模拟视频信号经过内部的转换系统,使其变为能够被计算机读取和存储的数字信号,然后通过计算机对该数字信号进行其他的一些处理,使其便于存储和使用。而视频的编码技术则是针对数字化的视频信号的一种处理手段,其将转换完成的数字信号进行编码处理,使其变为能够被计算机进行再处理的视频信号,像录制和播放等,根据其应用环境的不同,可以将其分为不同的编码技术,比较常见的有电视广播中的广播编码,其能够将视频信号变为能够被所有用户接收的视频信号。第二,音频技术。音频信号是人们日常生活中最常见的信息,其包含的内容非常丰富,比较常见的音频技术主要有以下几种:音频的数字化、语音信息的处理、语音识别功能以及最后的语音合成功能。音频技术的发展远远早于视频技术,因此,目前已经具有非常多的音频产品,并进入了量产化。随着计算机技术的不断发展,音频技术在存储和传输方面迎来了一个新的发展高潮,为人们日常生活中的音频信息传递提供了更加简便的方式。当前,人们正在逐渐尝试实现语音的识别,将简单的语音信息输入给电脑,使其能够按照人们的思想进行运行,这是人类长久以来的美好梦想。伴随着计算机技术的成熟和普及,越来越多的人将计算机当做日常生活中的一种重要交流工具,因此,如何使不熟悉计算机的人能够正常使用计算机,正在逐渐成为人们感兴趣的话题之一,而语音识别技术的出现,为人们的梦想实现提供了一种有效的手段。目前,语音识别技术正在迅速发展,但由于这一技术出现的时间较短,大部分的研究还在试验阶段,出现了非常多的新思想和新算法,为这一技术的发展提供了广阔的空间。另外,语音识别技术的研究正处在一个重要的瓶颈期,世界各国的研究人员正在尝试将计算机的语音识别功能推广到所有人都能使用,且对于一些大量的词汇或者连续的语音都能进行很好地识别,实现人们期望的语音识别技术的真正应用,提高人们的生活水平和质量。目前,对于一些世界应用较多的语言,语音识别技术已经进行了简单的应用,该技术的使用在许多领域取得了较好的成果。第三,数据压缩技术。数据压缩技术主要是通过对图像和视频等信号的处理,将其进行压缩和存储,这是实现计算机图像处理的最基础内容,且是当前进行图像处理的热点技术之一。目前,比较常见的图像压缩技术有两种,分别是JPEG和MPEG,这是ISO制定的两个重要标准,大部分的图像处理都是通过这两种方式。另外,压缩技术还在音频的处理和视频的处理上具有重要的应用,通过这种处理方式,能够将具有较高质量的音频和视频信息进行播放,满足人们的日常生活需要。
2.2计算机多媒体通信技术的应用
人工智能在外语教学的应用
一、引言
人工智能(ArtificialIntelligence,简称AI)近年来成为了人们关注的焦点,最初这个概念是在1956年达特茅斯会议上提出,并被正式确立为一门学科,历经三次高潮三次低谷的发展。1997年,IBM开发的人工智能“深蓝”打败人类的国际象棋冠军。2016年3月,谷歌开发的AlphaGo以4:1的明显优势战胜多次荣获世界冠军的李世石。自此人工智能在学术研究、行业发展和资本市场表现活跃。伴随神经网络、脑科学研究的迅速进步,人工智能在云计算和大数据等相关技术的支持下,迅速被运用到各个领域。以人工智能为核心的新技术与教学融合将成为下一个核心驱动力。在2018年的《人工智能发展白皮书》[1]中,提到教育智能化将会成为教育领域的发展方向,人工智能将会引发教育理念和教育生态的深刻变革。全球主要发达国家当前都在加速教育教学创新,积极开发教育新产品,推进教育教学创新。2018年4月,《高等学校人工智能创新行动计划》[2]提出了未来的人才培养新模式,要增设“人工智能+X”的复合专业培养,众高校也相继成立了人工智能学院和相关专业,如南京大学、中国科学院大学、西安电子科技大学、上海交通大学等,结合近几年教育部“新工科”教育改革的背景,为外语教学与研究带来了新的契机。传统的外语教学中一直存在教学质量和效果不理想的困境,我们要充分利用日趋成熟的人工智能技术开展一场深层次的变革,重塑外语教育的时代性、个性化的新形态。人工智能在神经网络、深度学习和蒙特卡洛数搜索法等技术使用后,逐步形成神经网络“大脑”来进行复杂精准的数据处理,初步有了人类高级智能的“学习能力”。人工智能在教育中所需用到的技术主要包括[3]:①自然语言理解技术,这让计算机与人之间能用自然语言来有效沟通,包括机器理解、机器翻译等。②人机交互技术,包括语音识别、语音合成、情感交互等。③知识图谱技术,指建立语义网络,使用网络中的关系来分析解决问题。④生物特征识别技术,包括指纹识别、语音识别、人脸识别等。
二、人工智能支持下的外语教学改革
我国外语教学的整体效率近年来一直不高,大学生的英语学习效果主要是通过全国大学生四六级考试的成绩来体现,虽然近年来加入了口语考试,但是学生的英语沟通交流水平总体还是令人担忧,应用能力远没有达到熟练实用水平。大学英语的发展方向是要提高质量,增强实效。大学英语的改革目标是要将人文性、实效性、数字化与工具性相结合。随着00后即将成为大学校园的主力军,他们在学习和认知模式、信息技术运用习惯方面有着鲜明的特色,技术、阅图、创新、急切成为了他们的标识,被认为是“数字原住民”[4],他们更倾向于用智能化方式去获取数字化资源学习。但是面对海量且品种繁多的外语学习资源,如何满足个性化学习需求,提高学习效率,重构有效适切的外语教学新模式成为了外语教师们探索科研的新目标。目前市场上比较普遍的在线教育大多是一对一视频,或者把一些教师的课做成视频放在线上播放,这其实只是教学场所的改变,教育方式并没有发生本质变化,如果学生不自觉,效果有时候还没有线下的实体课程好。人工智能则可以使用语音识别和自然语言处理技术来解决口语语音和文本的词法、语法分析和语义理解,增加多元交互的学习环境,极大提升学习效果[5]。随着人工智能研究的日益成熟,“智慧学习”和“深度学习”被赋予了新的内涵,智慧学习以建构主义、混合学习和现代教学学习理论为理论基础,整合增强现实、云计算、移动通信、大数据等先进信息技术的增强型数字学习[6]。深度学习可以通过神经网络来模拟人脑的学习过程来抽象表达现实世界的大量数据。目前典型的深度学习模型有递归神经网络(RNN,RecurrentNeuralNetworks)、卷积神经网络(CNN,ConvolutionalNeuralNetworks)以及深度信念网络(DBN,DeepBeliefNet-works)等,其中由于RNN多用于处理时间序列,所以其较多应用在口语训练、口语测试等方面[7]。近几年,从市场中已知的人工智能运用于外语教育的产品来看,主要分为几类:英语语音测评、智能批改+习题推荐、教育机器人、智能陪练,其中前三类较多,而分级阅读和智能陪练的较少。比如语音测评类的有科大讯飞、流利说、驰声、朗播网等,智能批改类的有极智批改、批改网、作业盒子、狸米教育等,教育机器人类的有寒武纪智能、UBTECH、LEZHI、好儿优等。1.英语语音评测———AI口语老师和智能口语考试系统。英语口语学习与测评是我国英语教育中的重要组成部分。为了测评学习者的口语语音语调、标准度、流利度以及口头表达能力,通过NLP(自然语言处理)以及语音识别等技术开发,外语教学市场上出现两类“英语语音评测”的产品:AI口语老师和智能口语考试系统。这两类产品可以替代教师对学生的口语陪练、口语考试测评及评分统计等相关工作,通过机器辅助学习,极大提高了教师的工作效率,同时实现了口语自适应学习。人工测评往往伴随着一些主观因素,智能评测可以有效地避免这类问题,更具客观性、稳定性,高效完成自动评分和成绩统计以及学情分析任务。从目前英语语音测评产品的现状来看,优点是分析结果相对准确,覆盖多种口语类型,从发音到对话、朗读涵盖多种口语学习和考试类型,包括音标发音、短文朗读、看图说话、口头作文等。短时间可以做出反馈,快速给出评分,同时给出精细的分析。当然,这类产品也会有一定不足,受口语发音本身的不确定性和语音采集的设备条件等因素的影响,英语语音测评结果会出现一定的偏差,但总体结果相对准确。现阶段此类产品的测试结果是反馈学生发音中的单词读错、遗漏或者语法有误等问题,但是无法检测出学习者的语调和连读等错误。这类产品虽然会根据学生口语情况进行个性化教学和测评,但互动性仍不足,模式化明显,长时间练习只是几种方案方式在循环,多样性和互动性还有待提高。以目前市场上较为知名的英语流利说为例,流利说开发了世界领先的多粒度和多维度的实时语音识别和评估引擎和游戏化教学,让各水平语言爱好者轻松练口语。每日更新地道美语对话提供好玩上瘾的对话闯关游戏,通过硅谷的实时语音分析技术,让用户轻松愉快练口语。目前有超过3000万人使用流利说,积累了中国人2.75亿分钟口语数据。2.智能批改+习题推荐。智能批改如图1所示,可以部分减轻教师批改作业的繁重任务。完整的流程是教师先从线上布置作业,系图1智能批改图统地利用丰富的语料库资源,使用自然语言处理、图像识别以及数据挖掘等人工智能技术把学习者的作业与语料库进行检测对比,进行自动批改,给出个性化的学情分析报告,对拼写、语法、句型和搭配方面能够迅速地标注错误部分和错误原因,在作业量巨大的情况下,会比教师的批改结果更为细致,教师和家长能在学习者的作业提交后马上得到反馈并了解最新的学习进展,并据此来实时调整学习进度和难度并推荐合适的习题。当然,也会有一些美中不足,如学生作业的主题相关性、篇章结构和内在逻辑性、思想的创新性等方面提示还略有欠缺。iWrite2.0英语写作与评阅系统,通过在大型语料库中来挖掘联想词库,运用大数据技术,同时探索基于人工神经网络的深度学习来提高作文评阅的智能程度[8]。科大讯飞开发的产品在2015年某国家级英语考试中在翻译题和作文题的评分准确度比大多数专家教师的评分准确度还要高,同时评卷系统还指出具体语法格式错误和措辞不当等问题。3.分级阅读。英语分级阅读,可以根据学生的不同认知水平来选择阶梯式的读物,匹配适合学生个人的书目,解决了学生阅读太难的书会失去阅读兴趣、阅读难度低的书无法提升阅读能力的问题,使其感受阅读的乐趣。全世界时下有几种热门的阅读分类体系:蓝思分级(Lexile)、AR分级法(AcceleratedReader)、A-Z分级法(GRL/GuidedReadingLevel)。国内目前在分级阅读方面的产品主要有:ReadingPro、新东方旗下的多纳学英语、叽里呱啦、英语总动员、巴布阅读等,各有其产品的优势和不足。在国外,以美国为例,已有70%的美国公办学校使用Newsela,有40万教师和超过400万学生用户,阅读文章数超过5700万。Newsela通过自适应的真实内容分级阅读将新闻聚合并分级,为不同阅读水平的学生提供阅读内容。人工智能的分级阅读相较于传统分级阅读,可更为高效地测定分析,依据不同学生的兴趣爱好和阅读能力的学习数据挖掘行个性化精准阅读,使学生阅读兴趣明显提高,学生阅读习惯大为改进,大大提高了教师的工作效率,把教师从收集和推荐书目,阅读监督学生等大量机械式重复性工作解放出来,同时实现了学生自适应阅读,达到了分级阅读的核心目的。教师和家长也可快捷精准地全方位监测分析学生的学习情况。4.智能学情分析和智能情绪识别。智能学情分析是指在积累了学生学习成绩、学习进度、学习习惯等数据后,对其进行智能分析,并给出分析报告,协助教师对学生学习情况进行管理,设计个性化教学方案,为学生量身定制不同于他人的学习策略和学习方法,让孩子更为有效地学习。做智能学情分析的如极客大数据的“极课EI(EducationIntelligence)”是采用“IPH适应性教学模型”和“集中式动态学业档案管理”两大专利技术,采集作业和考试中动态化的海量数据并进行大数据智能算法分析,基于行为和关系数据的知识图谱来制定学生的具体自适应学习方案[9]。根据官方数据,“极客大数据”的活跃使用学校已超过1800所,收集3200万份学生作业考试数据,180万教师、学生及家长的使用习惯。每个孩子都是与众不同的,有自己独特的天赋特性、偏好和天生优势,也有不同于别人的弱点。解决孩子的学习问题,应当用个性化的方法适应其在学习上的要求。因而这种学习活动对于每个学生而言都是有意义的,因为是由学生自发的兴趣来驱动的。智能情绪识别目前主要由教育培训机构和技术公司合作开发,如好未来、VIPKID,通过人工智能图像识别技术,智能情绪识别可以识别学生课堂表情来判断学生学习的兴趣、困难点和集中度。2018年10月,新东方正式的首款AI类教育产品BlingABC“AI班主任”[10],可以通过人脸属性分析和检测、语音识别、NLP(NaturalLanguageProcessing)等人工智能技术来发现学生在语言学习中的问题,根据学生上课时的参与度、回答时长、情绪表现和学习结果来进行量化分析。5.教育机器人。教育机器人除了在科学、技术、工程和数学(STEM)教育方面起着重要作用,在外语教学中的应用也越来越普遍。机器人可以根据学生的认知能力来为其定制学习内容,引导互动学习来营造母语式的外语学习环境,在潜移默化中提高外语语言能力。从早期2016年简单的聊天学习机器人如著名语言学习AppDuolingo(多邻国)的永久免费的外语学习chatbox[11],开始只允许用户打字对话,到拥有智能复杂功能的机器人,如科大讯飞的“阿尔法大蛋”,好未来旗下励步英语联合机器人领域领先的ROOBO公司推出的小布机器人[12],与此配套的Let’sChat系统,可以进行进行语音识别、口语评测、绘本伴读等功能,能够智能适配学生的学习水平来进行因人施教。通过教育机器人的辅导和在线教育的讲解,可以精准定位学生的薄弱知识点到纳米级别来实现因材施教的“智适应”的理想学习方式[13]。借助自然语言处理和情感机器人,通过陪伴学生的成长来增加其对人的关怀[14]。
三、人工智能在外语教育中的研究热点方向
查阅各种资料发现,人工智能近几年在外语教育中的研究热点方向主要有:①知识表示与教育知识图谱,其研究热点是以知识点及课程为中心的图谱和以教学及资源为中心的图谱。②认知诊断,其研究热点是使用大数据分析技术弥补传统IRT模型的不足。③学习者建模,其研究热点是针对学习主体对象的学习者进行建模,对学习者知识状态的识别和诊断。④教育试题资源表征,其研究热点是使用深度学习模型对多源异构教育资源进行深度表征。⑤机器阅读理解与批阅,其研究热点是基于深度学习的机器阅读理解。⑥智能教育系统,其研究热点是教育机器人、游戏化教学、对话形式的学习,建立动态模型。⑦脑科学与教育的结合,其研究热点是交叉学科研究,教师对“神经神话”的认知,对脑科学的信念,以及教师自身的脑科学素养。人工智能在外语教育中的运用将推动外语学习的精准测评、个性教学和因材施教。配合直播、游戏、VR等技术的教育人工智能可以极大提高学生的兴趣,提高外语的学习效率,有着巨大的应用发展空间。如何融合教育测量、教育理论与人工智能,分析学生的学习效率、能力和水平及目前的知识状态将成为教师学习研究的方向。