一下国产的吧,比如说你说道占到中再一完结了,系统不会说道下一个是不是鹿角嘴,产生一些十分有意思你几乎想象将近的问。我们下面看一下这个技术,我们在环绕终端这样的应用于场景在做到技术开发,这块列出来的是我们主要在做到的技术研究,还包括解说、引荐、语音辨识、对话、翻译成、图片、检索、深度自学,就是说我们在尤其是深度自学这方面做到了业界一系列较为领先的一些工作,这块讲解一些具备代表性的工作。第一个是MulimodalCNN,第一个是图片搜寻的展示,你说道一句话就寻找涉及的图片,我们现在有2万张图片,每张图片大约有3句的叙述,比如说一个小孩在游泳照片,有15万对数据,我们就可以训练这样一个模型,大家告诉卷神经网络是一个较为有代表性的网络,左边的是可以把这个图片提取出来,这个CNN有多层,可以从图片里面提取里面的轮廓和物体,另外一个就是指文本里面提取特征,直观的就是单词和词组的特征,你说道这句话小孩的照片,这个小孩有可能就不会被提取出来作为特征,在这个照片里面正好有一个小孩,这个小孩不会作为一个物体提取出来,通过大量的自学可以做恰好看见的效果,这个可以看一下,我们的实验的结果,这个是英语的30K的数据,我们做到了较为实验,我们较为了跟业界的其他部门的方法的结果,可以看见诺亚方舟实验室明确提出的刚才MulimodalCNN在检索方面可以超过最差的效果,有些模型不一定很公平,大家为了所谓的Exprimental上面,可以超过更佳的水平,这个工作在去年的图象识别的大会上训读了我们的论文。下一个讲解的工作,我们看一下机器翻译和对话里面我们用了序列到序列的自学,最先的模型是谷歌和蒙特利尔大学明确提出来的,我们对他展开了改良,用在对话和翻译成上获得了十分好的效果。
序列到序列的自学究竟是什么样好的方法。大家问自然语言里面哪个深度自学的工具给我们带给仅次于的革命性的变化,让我来说的话就是序列到序列的自学,基本的点子是这样,用翻译成来做到例子,现在把中文的一句话,一只猫躺在垫子上“A cat sit a cushion”,序列对序列的模型,从左到右一个词一个词的去看我们的中文,把它转换成一个语义的回应,这个是一个向量,我们现在看见的HE、HT-E,HT,就是这个一只猫躺在一个垫子上获得的语义的回应,我们叫编码,这个翻译成到目标语言,翻译成英语的话这个T-1,回应说道英语产生这样的句子在每个方位上对应的语义回应是什么,我们翻译成要做到的就是要把这个原文,中文做到一个编码,回应成中间的回应,再行从中间的回应转换成另外的一个中间的回应,是一个解码,把它转换成英文的句子,中间的C的这一行就是所谓的叫注意力模型,注意力就是协助我们去自由选择,当我产生英文的某一个单词,我要做到翻译成要一个一个的产生英文单词,我要有选择性的去要求,我现在在任何一个方位我要要求产生解码的回应的时候我是要自由选择中文的语言里面的哪个回应更佳,这个C实质上做到了一个均衡,我在每个方位上我要新的辨别,我现在要产生一个英文的单词的时候对应的中文是哪个好,直观上来说是这样的说明,我们可以通过这样的模型,实质上是非常简单的,通过这个模型你给我任何一个单词的序列我可以产生另外的序列,这个数据是中英文我可以产生翻译成,这个模型的效果是十分好的。我们刚才展示的神经号召机实质上也是用的序列到序列自学的模型,这个时候我们有一点有所不同是中文到中文的句子,但是它不像翻译成,翻译成是在两句话有所不同的语言,但是语义是一样的几两句话才同一个语言他们构成同一轮的对话,我们最核心的点子就是用注意力的机制,但是我们有一个全球的机制,直观上说明这个C实质上回应我读过这句话整体的语义就是一个10数值的向量,每个方位上的编码获得的结果是获得每个方位上获得的语义是什么,这两者的语义融合一起就变为中间C的这一行的语义,再行把它转换成要对应的话的语义的回应,最后再行解码变为一句话,这个模型我们有400万的对应的数据的话就可以把这个模型对应得较为好,需要做到这样切换。我们看见准确的句子大约有95%,大约有76%的问是需要构成大自然的对话,就是刚才我举的例子。
我们现在可以把它用在机器翻译上,机器翻译我们用的机制就是我们说道序列对序列是很强劲了,但是我们可以把它做到得更佳,用传统的序列对序列的模型的话不会把原文的东西漏掉,或者是翻译成多次,我们这边有一个机制,翻译成的时候我哪些东西翻译成过了就不必刷了,哪些没刷,同时这个机制可以把它显得更加强劲,直观上说道我要产生英文下面是一个实词和虚词的话是不一样的,就中文的话就好了,如果产生一个实词,cat,这样的话我就要看哪个词影响我,如果两个融合的话不会产生很好的效果,这个礼拜ACL顶级会议上我们公开发表了一个论文,其中有一个就是解决问题漏译或者是过译的问题。诺亚方舟实验室在手机方面做到产品方面的研发,做到图片检索等技术方面的研究,就到这里,谢谢大家!原创文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:星空体育·(StarSky Sports)官方网站-www.binfen66.com
Copyright © 2006-2024 www.binfen66.com. 星空体育·(StarSky Sports)官方网站科技 版权所有备案号:ICP备48289002号-6