首页 > 新闻中心 > 人工智能 > 正文

多语种语音识别,多领域语音转写|灵云乐识重磅升级
2019-09-10 12:03   牛华网      我要评论()
字号:T|T

会议领导讲话录音整理、采访谈话录音整理稿件、课堂录音追溯老师讲解知识,拖音频条人工去听,一直是件费时又磨人的事。

为了方便大家将录音转为文本,去年,捷通华声推出了灵云语音云(speech.aicloud.com),为记者、学生、秘书等提供免费录音转写平台。语音识别率高,音字同步校对,灵云语音云广受用户的喜爱。

近日,灵云语音云重磅升级,新增英文与四川话的识别,并通过大量后台数据聚类分析,对所有的专业领域进行重新划分。用户可选择用通用、政府、教育、金融等专业领域模型转写录音,实现更高的语音识别率。

多语种语音识别  多领域语音转写

灵云乐识已支持中文、英文,还有四川话语音转写。普通话识别,用户可以选择细分领域:通用聊天领域、电话客服热线、教育学习成长、金融财经投资、政府党政会议、恋爱心理情绪、哲学思想领域、电台广播领域、企业办公会议、国学历史领域、旅游景点地理、网课教学领域、医疗健康养生。

选择对应领域模型,语音识别效果更佳。转写速度快,1小时的录音几分钟即可转写完成。

中文转写结果

对于转写出来的结果,可在线进行编辑。用户点击任意需编辑的文字,系统会实时对应到选中文本的音频,边听音频边修改,极大的节省了编辑修正的时间。

英文转写结果

此外,灵云乐识还支持自动过滤语气词,自动分段等功能。从各个方面优化录音转写结果,提升文本整理效率。转写结果,可以直接进行下载或分享。

使用指南

用户可直接输入网址:speech.aicloud.com即可进入语音云网站,另外也可以登录灵云平台(www.aicloud.com)点击语音云服务按钮进入。

完成注册流程之后,即可免费使用语音云服务。在网站上点击上传音频,通过选取相应的语音识别模型领域,并选择文件进行上传,目前支持mp3、wav、m4a、spx、opus、amr的音频格式。点击“创建任务”后,只需喝杯咖啡等待几分钟,几个小时的采访稿整理重任就这样完成了。

灵云乐说提供语音合成服务,可以将想要合成的文字直接粘贴或导入到网站上,即可合成出优美动听、媲美人声的声音。声音文件可直接导出,也可链接分享。 

投稿:news@newhua.com

关键词: 语音识别

责任编辑:新闻中心

我要评论

已有位网友参与评论

网站地图

牛华网

华军下载 | 牛华网 | 盒子 | pcsoft | 论坛

实用工具

关于我们 | 新闻投稿 | 软件发布 | 版权声明 | 意见建议 | 网站地图 | 友情连接 | RSS订阅 | 总编信箱 | 诚聘英才 | 联系我们

苏ICP备11016551号-2  苏公网安备 32132202000111号 本站特聘法律顾问:于国富律师

Copyright (C) 1997-2018 newhua.com 宿迁市牛华网络科技有限公司 版权所有