名奢网 名表 名表鉴赏 查看内容

36氪研讨企业调研 | 人工智能翻译企业-新译科技

2022-12-4 10:15| 发布者: fuwanbiao| 查看: 73| 评论: 0

放大 缩小
简介:文 | 36氪研讨院 李晓晓讲演要点:人工智能翻译目前是机器翻译的两大流派之一,主要经过以深度学习算法为基础的神经网络增强翻译的流利性机器翻译(Machine Translation),是应用计算机把一种自然言语转变为另一种 ...

文 | 36氪研讨院 李晓晓


讲演要点:


人工智能翻译目前是机器翻译的两大流派之一,主要经过以深度学习算法为基础的神经网络增强翻译的流利性


机器翻译(Machine Translation),是应用计算机把一种自然言语转变为另一种自然言语的过程,普通指自然言语之间句子和全文的翻译。智能翻译,就是充沛计算机言语学、人工智能和数理逻辑学科技术经过特定的计算机程序将一种书写方式或声音方式的自然言语,翻译成另一种书写方式或声音方式的自然言语,并经过机器、参与的人和互联网构建出一个智能的生态系统。


机器翻译可运用场景普遍,语音、语义、图像辨认技术类企业展开成熟


随着人工智能文本技术的不时展开,智能翻译能够与相对比较成熟的语音、图像等技术中止深度分离,拓展翻译的应用场景。目前国内机器翻译范畴中,除了BAT等巨头规划的、用以满足自身各个模块需求的强技术应用的翻译公司,大多数是学术派创建的实验室转向公司运营类型的,在技术上相对展开较快。这些企业既为B、G端提供定制化翻译系统和云平台,同时也经过翻译耳机等智能硬件产品规划C端市场。


新译科技采用限定性神经网络智能翻译的技术,为B、G端客户提供人工智能翻译处置计划的同时经过耳机等智能硬件产品开发C端市场


新译科技成立于2014年12月,不时不时研讨和完善自然言语处置技术,聚焦AI文本智能翻译,效劳于言语效劳、专利、法律、医疗和金融行业,构建沟通无障碍效劳体系。2017年公司智能翻译产品经过国度科技成果认定,并取得深圳青年技术奖,以及人工智能最高奖——吴文俊人工智能科学技术奖。


新译科技先后成立北京、深圳、新疆和澳门公司,以软、硬件为载体,为国度“一带一路”多语传播平台树立提供效劳;为金融、专利、法律、医学等垂直范畴提供全球化基础性多语沟通提供效劳;为政府公共效劳、旅游效劳、会议效劳树立事业做贡献,并不时完善多语大数据平台。


以下为讲演正文 (完好版讲演点此下载)


1.行业概略


1.1 人工智能翻译是机器翻译展开的最新阶段


机器翻译(Machine Translation),是应用计算机把一种自然言语*转变为另一种自然言语的过程,普通指自然言语之间句子和全文的翻译。机器翻译运用言语学原理,经过辨认语法、词汇,调用存储词库,自动中止对应翻译。但由于这种基于统计模型的机器翻译采用的是规则的对应翻译的措施,因而当各种语法、词法、句法发作变更或者不规则时,每一步的错误率会像滚雪球一样使最终结果有很大的倾向;同时,调序模型的不完善掩盖不到全局特征也会招致统计机器翻译阅读流利性差。所以在最新的技术中主要就是要突破规则性翻译带来的生硬的、阅读不畅的问题,使句子变得愈加通畅,契合人们讲话的思想。


标注*:自然言语在这里泛指一切由人类发明和运用的言语。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:基于统计模型的机器翻译


2016年前后呈现的神经网络机器翻译(Natural Machine Translation)能够锻炼一张能够从一个序列*映射到另一个序列的神经网络,输出的能够是一个变长的序列,在对话和文字概括方面取得较好的表示,能够处置机器翻译的流利性差等问题。NMT其实是一个encoder-decoder系统,encoder把源言语序列中止编码,并提取源言语中信息,经过decoder再把这种信息转换到另一种言语即目的言语中来,从而完成对言语的翻译。但是,神经网络翻译机器有时分会呈现漏译、过译、短少语义信息等问题。


标注*:文中序列即指输入和输出的语句。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:基于神经网络的机器翻译 来源:36氪研讨院依据公开资料整理

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:智能机器翻译生态贴图

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:机器翻译展开进程 数据来源:36氪研讨院依据公开资料整理


1.2 不时改造的技术和宽广的市场需求是人工智能翻译行业展开的主要驱动力


机器翻译经过半个多世纪的展开,往常曾经构成一个既包含传统的、基于实例的机器翻译(EBMT),也包含目前主流的SMT、NMT等技术在内的综合线上翻译效劳系统生态圈,每个系统的改造都随同着技术的改造和各种需求的推进。


1.2.1 语音辨认、语义辨认、图像辨认和大数据算法是关键技术驱动力


往常的人工智能和大数据技术能够为翻译系统带来新的改造,例如突破规则性的机器翻译只擅长短句翻译的局限性,在原始数据量够大的状况下经过增加网络层数进步NMT的运算效果等。但是人工智能翻译依旧存在较大的难点,需求新的技术来处置。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:统计模型与神经网络模型的优缺陷对比 来源:36氪研讨院整理


1.2.2 市场需求和人才稀缺是往常智能翻译行业的主要驱动力


随着“一带一路“政策的开放,国内外的外交、贸易、旅游往来频繁,国内B端G端出海业务越来越多,对翻译人员以及软硬件的需求量也大幅增长,极大地推进了翻译企业的业务展开。


另外,我国的细分行业专业的翻译人才稀缺、人才专业性不强的现状也不能满足市场的庞大需求,好比工程类、医疗类、高新技术类等科目的翻译专业缺乏、小语种学科不够丰厚都从侧面推进了智能翻译的展开。


最后,人们的消费水平以及生活质量大幅度进步,对外来的文化和言语学习曾经成为生活必要的技艺,而且追求新技术产品成为往常新青年的生活标记,这也构成了包含智能翻译APP、翻译笔、手表、耳机等在内的智能翻译产品C端庞大的市场需求。


1.3 机器翻译随着人工智能技术应用的不时深化,将会越来越智能,应用场景也会愈加普遍


1.3.1 人工智能翻译国内外现状


目前,国内外做智能翻译的企业偏重点有明显的差别。国外的企业偏重底层研讨、重技术研发,整体而言技术先进精深,但是展示方式相对较弱、产品类型较少,应用场景和范围也较少。而国内的智能翻译企业则愈加偏重上层应用,产品类型较为丰厚、应用较普遍,用户基数大与数据量较大。这一方面是由于暂时国内没有数据维护相关条例,另一方面是学问产权维护认识较弱。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:国内外产品及技术对比 来源:36氪研讨院整理


1.3.2 市场范围及投融资现状


据中国智能制造网统计,2017年全球仅传统的翻译产业范围就抵达445亿美圆,2020年有望突破500亿美圆。假如能够充沛应用人工智能等前沿科技的推进力,继续释放出庞大的潜在需求,翻译市场将迎来更大范围的爆发。据鲸准数据显现,目前国内做机器翻译的企业有22家,其中属于人工智能翻译的企业有13家,主要包含五大类型的企业:语音同传翻译、图像翻译、穿戴翻译工具(耳机、手表等)、智能翻译系统以及定制化计划提供商。其中,有融资记载的企业占五成,处在A轮级的企业相对较多,主要的投资机构有微软创投、Funders Club、力合科创、凯泰资本、博将资本等。


接下来,对人工智能翻译的需求将随着全球化的加速不时增加,市场空间将越来越大,B端和C端等细分范畴的应用也会越来越普遍;另外,深度学习算法的深度应用将为智能翻译进步语义了解的水平,提供更接近人类自然言语表白的翻译成果。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:各阶段获投机器翻译企业占比 数据来源:鲸准,36氪研讨院整理


1.3.3 机器翻译的优势及痛点剖析


机器翻译能够完成世界上不同国度不同言语间的低成本交流,其主要优点表示有:成本低,相关于人工翻译来说,机器翻译需求人工参与的程序少,基本上由计算机自动完成翻译;易把控,机器翻译的流程简单快捷,在翻译时间的把控上也能中止较为精准的预算;速度快,计算机程序的运转速度十分快,其速度是人工翻译速度不可比较的。


固然机器翻译技术越来越成熟,但是翻译大行业依旧存在一些痛点。首先,市场的需求量很大,但是翻译人力缺乏;其次,高校教育对言语类学生的培育并不能掩盖全行业人才的需求,学校里教的偏文科类型,处置不了工科类企业的翻译需求;然后,C端的产品类型不够多样化,目前最多的是穿戴翻译耳机;最后,行业内没有界定规范的仲裁机构和统一的评价规范体系,何为精确的“信达雅”规范值得等候。


另外,还有一些技术上的痛点。目前的技术能够将文本、语音和图像辨认并翻译出来,但是语义的辨认和翻译依旧不能够精准表白和原文主题思想一样的意义,这方面还需求技术的突破;另外,在完成产品的离线化和行业数据范围化方面的技术也相对不够完善,目前缺乏能够应用在各个场景下的多种类言语相互翻译的离线翻译器。


最后,由于国内关于数据保险维护这方面的法律条文比较稀少,翻译系统和应用产生的大量用户语料数据得不到维护,因而软件付费、数据去中心化、完成数据共享显得尤为紧迫。


1.3.4 行业未来展开趋向


目前,机器翻译在细致应用上普通分为四种,分别是:词典翻译软件、计算机辅助翻译软件、机器翻译软件以及智能硬件。而随着全球化和互联网疾速展开,跨言语的网络资源不时呈几何级数增长,疾速改动着信息传播的方式,也极大地刺激了全球人工智能翻译产业的展开。


总得来说,人工智能翻译的展开将呈现以下趋向:适用化,未来翻译将以商业化展开为主要方向,并且完成离线化、多言语、全局化;去中心化,完成数据共享;网页端向移动端转移,进步运用方便度;保险化,构成数据维护;垂直范畴分离紧密化,构成行业翻译语料数据库;多模态化,产品多模态化能够完成文本、言语、图像全翻译,商业多模态化平台则能够提供给客户定制化的处置计划。未来,将会有越来越多的传统翻译机构转型应用人工智能技术做智能翻译,进步翻译效能降低人工成本。


2. 新译科技


新译科技成立于2014年12月,不时完善自然言语处置技术,聚焦AI文本智能翻译,不时为言语效劳、专利、法律、医疗和金融行业效劳,构建沟通无障碍效劳体系。2017年公司智能翻译产品经过国度科技成果认定,并取得深圳青年技术奖,以及人工智能最高奖——吴文俊人工智能科学技术奖。公司成立以来以国际化的视野为目的,先后成立北京、深圳、新疆和澳门公司,目前公司把智能翻译以软、硬件为承载体,效劳于国度“一带一路”多语传播平台树立;为金融、专利、法律、医学等垂直范畴提供全球化基础性多语沟通效劳;为政府,旅游,会议等效劳,并不时完善多语大数据平台。


2.1 新译科技独有的技术支持使翻译更方便


限定性神经网络机器翻译:限定性神经网络翻译是新译科技自主研发的最新翻译技术,它能够干预输入的句子,然后让底层神经网络的模型参数中止调整,较为精确地恢复干预部分的译文表白。


专有翻译引擎:新译科技的智能翻译系统具有大量数据支持,是基于检索和神经网络的自主翻译引擎,高稳定性的架构可稳定效劳全球用户。新译科技的智能翻译能够思索到个人用户和企业用户对专有翻译引擎的需求,以及对数据保险的顾忌。新译科技搭建的智能翻译系统除了面向通用范畴外,也面向主流专业范畴:专利、法律、议会讲演、电商、医学、航空航天、军事等。


CAT辅助翻译:新译科技提供定制化效劳器和云端两个版本供用户选择,用户享用24小时企业级保险保障。受维护的企业帐户具有灵活的系统管理权限,可按用户、按角色来自定义访问级别。


专业言语检索:新译科技言语效劳平台是面向政企及译员,提供全线上多言语翻译系统、言语资产买卖和定制智能言语机器人的全综合效劳平台。平台从买卖的保险方便、资源共享和智能应用等方面,促进企业和个人对言语多样化需求体验的全面提升。


语音辨认、图像辨认、问答系统:新译科技具有智能的垂直语音辨认和流利的语音合成,支持多种主流言语辨认;具有大量图像数据,专注文本辨认,深度学习作为底层算法支持。可瞬间辨认图像中的文字,分离智能翻译,完成图像瞬时翻译;新译科技的语义剖析系统,允许用户以自然言语的方式查询各行业信息,为用户提供精确、简约的答案。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:新译科技在AI范畴触及的技术与应用 来源:36氪研讨院依据公开资料整理


2.2 面向B端、G端、C端的软硬件产品体系完好全面


新译科技的B端和G端产品主要是面向大型央企、军工企业、互联网媒体、大数据行业及政府机关等提供软硬件翻译产品。软件产品有定制化机器翻译(限定性神经网络翻译)、辅助翻译系统以及智能翻译插件等。


定制化机器翻译是一个混合神经网络翻译引擎,该技术不只进步了翻译的速度与精确率,还能统一管理企业语料,给企业特定的数据和管理账号,满足个性化、精密化、专业性的需求,抵达维护企业数据隐私和数据保险维护的效果。


辅助翻译系统包含定制化的效劳器和云端双重计划,它能够提供与之配套的一切产品,能够抓取互联网端爬不到的企业锻炼数据,还能借助海外数据,突破局域的限制,打通管理员和译员的两端沟通通道,促进新的功用创新,处置翻译的质量、效率与成本难题。


智能翻译插件包含有办公翻译插件和网页翻译插件,办公翻译插件能够在WPS和office两大办公系统上运用,满足多言语文档的快速转换和阅读;网页翻译插件支持各大阅读器网页翻译,一键转化母语阅读。硬件产品有翻译盒子,能够翻译十几种主流语种,曾经完成离线化,可快速阅读翻译文本,减少沟通障碍。


新译科技的C端产品主要面向大众消费者,包含在线文档翻译、PC端翻译、智译APP以及穿戴式翻译产品耳机和手表。


在线文档翻译支持10种常用格式,支持通用范畴、专业范畴,价钱低、质量高、速度快。


智译APP可完成同传、语音、文本多语智能翻译,应用在旅游、社交、住宿、商务等范畴。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:新译-智译APP


新译翻译耳机曾经在国外上市,包含两只耳机、一个充电盒以及一个专用APP,基于自研的智能算法,可完成实时唤醒耳机,同时判定发言语种,无需手动切换操作,经过初始配置后,用户只需求将另一只耳机分享给对方,即可展开自然、自由的交流。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:新译智能翻译耳机

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:新译科技产品体系 来源:新译科技


2.3 新译科技具有较强的技术优势和资源


技术优势:四个实验室分离研讨,提供前沿技术支持。澳门大学自然言语处置与葡中智能翻译(NLP2CT)实验室、葡萄牙里斯本L2F语音实验室、美国卡耐基梅隆大学LTI实验室的最新的自然言语处置技术、新译-澳大-清华人工智能研讨院这四个实验室为新译科技提供技术人才和原创技术;另外,新译科技会将研讨课题带到国外实验室共同开发新技术,在具有更多的学问产权的同时,还能紧缩新译科技内部的研发成本。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:新译-澳大-清华人工智能研讨院


资源优势:首先,企业最初的语料来源于澳门大学提供给创业企业的平行和单语语料库;其次,借助B、G端效劳以及军工体系下的自有云效劳器上的数据构成大语料资源库。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


图示:澳门大学自然言语处置与葡中智能翻译(NLP2CT)实验室


3.商业方式


新译科技的商业方式主要有两种:一种是项目制,项目制就是单一售卖某一种翻译系统,采用一次性买断收费的方式;一种是多模态化方式,提供给客户一个包含一切产品的平台,客户在平台库里选择自己所需求的翻译系统,满足客户各个部门或各个范畴所需求的产品形态和专业度,具有定制化和个性化的特性。其直接盈利方式有三种:第一,定制化效劳收费,主要是机器翻译、辅助翻译等文本翻译应用层衍生品开发效劳;第二,赋能型效劳费API,例如机器人、手机端特定的收费项目;第三,自有产品,就是文本翻译和言语翻译衍生品及效劳费。


在未来,新译科技还会在以B、G端产品为主的同时,向C端硬件产品延伸,为普通消费者提供多样化的翻译产品。


4. 公司运营战略及数据


新译科技的运营战略主要分产品和品牌两个方向。未来新译科技的产品主要以B、G端软件系统为止,C端硬件为辅,低调规划国外旅游市场,高调规划国内云端产品。往常内部正在搭建运营团队,借B端打造C端线上产品,今年在国内首先由三大运营商带动C端产品销售,经过运营商集中采购,然后作为顾客选购通讯套餐做赠送礼物的方式翻开市场。此外,新译科技的产品也将逐步从描画性言语和非描画言语两方面抵达信达雅的境地,新译科技将会从以下四个方面提升翻译水平:提升限定性神经网络翻译技术、增强交互式辅助翻译水平、进步语义翻译的技术、改进自动修正技术进步后编译才干水平。品牌也主要由C端产品的上市来带动。


新译科技的目前具有30多家央企和政府机构等客户,提供给他们翻译软件系统,此部分收入占全年总收入的70%-80%。去年的总收入达8000万,今年上半年曾经完成亿元营收,估量今年利润达1500万。企业盈利才干较强,营收增长速度较快。

36氪研讨企业调研 | 人工智能翻译企业-新译科技


数据来源:新译科技


5. 公司团队


新译科技目前具有近百人的团队,中心技术研发人员主要在清华大学自然言语处置研讨中心,澳门团队主要开发机器翻译的各个衍生品,深圳团队做自然言语处置底层设计,北京团队担任前端、产品和销售。


田亮,新译科技CEO,澳门大学博士,主攻自然言语处置机器翻译课题研讨,领团队充沛应用机器翻译、语义检索、神经网络、语音辨认等自然言语处置技术,构建新型的言语生态效劳圈,重构新型言语生态商业方式,改造当前翻译行业效率低下和全球沟通不方便的问题。


关于36氪研讨院


36 氪研讨院是 36 氪子品牌,专注于一级市场的行业研讨,经过定性定量分离的方式研讨新兴行业与企业,欢送大家积极与我们交流讨论。


剖析师: 李晓晓 lixiaoxiao@36kr.com Wechat:15011504594 ; 长期关注教育、 人工智能行业,并关注文娱、消费等热点范畴。



路过

雷人

握手

鲜花

鸡蛋
已有 0 人参与

会员评论

文章排行

  • 阅读
  • 评论

最新文章

文章列表

 名表回收网手机版

官网微博:名表回收网服务平台

今日头条二维码 1 微信公众号二维码 1 抖音小程序二维码 1
浙江速典奢贸易有限公司 网站经营许可证 备案号:浙ICP备19051835号2012-2022
名表回收网主要专注于手表回收,二手名表回收/销售业务,可免费鉴定(手表真假),评估手表回收价格,正规手表回收公司,浙江实体店,支持全国范围上门回收手表
返回顶部