Whisper语音识别系统是什么?

2022年9月21日,OpenAI 发布了一个名为「Whisper 」的神经网络,声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。
「Whisper 」是一个自动语音识别(ASR)系统,研究团队通过使用从网络上收集的68万个小时 (相当于77年 时间)语音和多任务监督数据,来对其进行训练。
“录音啦”如何运用该技术?
“录音啦”在软件中增加了“专家模式 ”,采用“whisper ”中目前准确率最高的模型【large-v2 】对您提交的录音进行转写

“录音啦”的【专家模式】转写准确率和测试效果如何?
“Whisper”这是目前“录音啦”在整个语音识别行业,测试结果中,“语音转写准确率非常高”的系统,所以我们技术团队花了很长时间进行研磨,终于上线了此项技术,欢迎大家前去尝试。
该技术【非即时反馈】识别文本,正常在24小时内返回识别结果
常规1个小时的录音,系统需要花费【35分钟】进行语音转写
(来源:新视线)