百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

谷歌开放语音识别 API,与 Nuance 展开正面较量

yuyutoo 2024-12-26 17:34 1 浏览 0 评论

谷歌今天向第三方开发者开放了语音识别 API,计划与 Nuance 和其他语音识别公司展开正面竞争。为了吸引开发者,Google Cloud Speech API 一开始将免费提供,以后再进行收费。

过去几周,我们听说了大量有关这项服务新进展的传言。谷歌今天在 NEXT 云计算大会上正式宣布了这一举措,此外它还在大会上公布了其他一些与机器学习技术有关的 最新动态,但最重要的则是推出了一个新的机器学习平台。

据谷歌介绍,Google Cloud Speech API包括 80 多种语言,将可以在实时流媒体或批处理模式下支持任意应用,为应用提供全套 API,让它们可以“看到、听到和进行翻译”。它是基于神经网络技术开发的,而谷歌搜索应用中的语音搜索和键盘应用中的语音键入都是基于相同技术打造的。此外,Google Cloud Speech API 还有其他一些令人感兴趣的功能,比如说可在噪音环境下工作,而且支持实时功能。

谷歌此举将会对整个行业带来巨大的影响,尤其是对 Nuance——Nuance 长期以来认为自己提供的是行业内最好的语音识别技术,也是最大的语音技术服务提供商。由于谷歌的加入,Nuance 的众多客户(包括创业公司)有可能会转而选择谷歌的技术——谷歌的技术不仅体验优于当前服务提供商,而且成本更低。

为了吸引开发者,谷歌最初将免费提供语音识别技术,以后会收费,但我们认为收费价格有可能会低于行业平均水平。按照谷歌的惯例,在占据行业主导地位以后,该公司也许会上调收费价格。

到目前为止,谷歌只是将语音技术有限地整合到旗下产品中。例如,开发者可以将 JavaScript 应用于 Chrome API,然后再导向语音识别 API。谷歌在 2015 年 I/O 开发者大会上发布了 VoiceInteraction API,让安卓开发者可以在应用中集成语音功能。但谷歌迄今尚未直接向开发者开放语音识别 API。

谷歌发布语音识别技术 API,不仅会对 Nuance 和其他语音识别服务提供商带来冲击,而且苹果也会受到冲击。一方面,苹果虚拟助手 Siri 的语音识别功能远远逊色于谷歌的同类产品。另一方面,苹果也未向开发者提供 API,让他们在自家应用集成 Siri 技术。

种种迹象表明,苹果将会进一步加强语音技术。例如,谷歌 在今年 2 月份宣布,将允许 Google Docs 用户通过语音编辑文件并设计版式。

题图来源: 布莱恩·杰克逊(BRIAN A JACKSON)/SHUTTERSTOCK

翻译:皓岳

相关推荐

了解一点ESB 了解一点点的意思的成语

如何进行系统集成?点对点方式VS数据总线方式企业服务总线,即ESB全称为EnterpriseServiceBus如上图所示,企业服务总线是将多个系统(一般是公司内部的多个系统)进行集成,避免服...

基础回顾Servlet系列:request,response,ServletContext

Servlet系列:(HttpServletRequest、HttpServletResponse、ServletContext、ServletConfig)详解HttpServletRequestH...

主动写入流对@ResponseBody注解的影响

作者:京东零售柯贤铭问题回溯2023年Q2某日运营反馈一个问题,商品系统商家中心某批量工具模板无法下载,导致功能无法使用(因为模板是动态变化的)商家中心报错(JSON串):...

setCharacterEncoding和setContentType的区别

setCharacterEncoding:只是设置字符的编码方式response.setCharacterEncoding("utf-8");...

重定向与转发 重定向和转发的区别及应用

请求转发(forward):发送一次请求,将表单数据或封装到url中的数据一并转发到新页面。...

多人同时导出 Excel 干崩服务器!参考阿里大佬给出的解决方案

前言业务诉求:考虑到数据库数据日渐增多,导出会有全量数据的导出,多人同时导出可以会对服务性能造成影响,导出涉及到mysql查询的io操作,还涉及文件输入、输出流的io操作,所以对服务器的性能会影响的比...

一篇文章弄懂Request和Response(建议收藏复习)

一:HttpServletRequest1.简介:HttpServletRequest是专用于HTTP协议的ServletRequest子接口,它用于封装HTTP请求消息。它在每次请求serv...

谷歌Chrome 130稳定版登场:改进文档画中画、增强CSS嵌套声明

IT之家10月16日消息,谷歌公司今天(10月16日)发布新闻稿,面向安卓、ChromeOS、Linux、macOS和Windows系统,正式推出Chrome130稳定版浏览...

Google发布新版Gmail API gmail update apk

今天的I/O大会,Google发布了新版的GmailAPI(Beta),相比以往的IMAP,新API的最大优势就是资源获取速度的提高。通过以往的IMAP,第三方App每执行一次操作都需要全盘调用用...

谷歌开放语音识别 API,与 Nuance 展开正面较量

谷歌今天向第三方开发者开放了语音识别API,计划与Nuance和其他语音识别公司展开正面竞争。为了吸引开发者,GoogleCloudSpeechAPI一开始将免费提供,以后再进行收费。过...

谷歌Gemini 2.0发布,引入代理AI 谷歌mini diva

谷歌宣布对AI模型Gemini进行重大更新,发布“2.0”更新。更新后的AI模型具有更广泛的多模式推理,并在其软件包中引入了代理AI。Gemini2.0Flash是Gemini2.0完整套件的低...

Google这款工具再次限免,需要的速度了。再次错过就可惜了

Google将恢复对GoogleTranslate网站翻译器小部件的支持,并将其免费提供给非商业用途。  Google再次支持GoogleTranslate网站翻译工具,以帮助人们在COVID-1...

谷歌地图API的三大开源替代品 谷歌地图开发

CSDN移动将持续为您优选移动开发的精华内容,共同探讨移动开发的技术热点话题,涵盖移动应用、开发工具、移动游戏及引擎、智能硬件、物联网等方方面面。如果您想投稿、寻求《近匠》报道,或给文章挑错,欢迎发送...

Go 官宣:新版 Protobuf API protobuffer golang

原文作者:JoeTsai,DamienNeil和HerbieOng原文链接:https://blog.golang.org/a-new-go-api-for-protocol-buffer...

全自动翻译国际化(支持一键翻译多国语言,不入侵业务代码)

前言Hi~大家好,今天给大家介绍一个关于国际化的vite插件vite-plugin-auto-i18n,一个自动翻译的关于i18n的vite插件。做过国际化的朋友都知道,国际化通常都是用i18n...

取消回复欢迎 发表评论: