十月份,微软推出了一种转录功能,即Word中的转录功能,旨在让用户利用云的功能来转录音频。经过近一年的开发,Word中的转录功能现已普遍以美国英语提供,而现有的Microsoft 365订户无需支付任何费用。它将在今年晚些时候登陆Android和iOS。
您可以说微软晚会晚了-毕竟,语音转文字并不是很新颖。但是微软项目经理丹·帕里什(Dan Parish)表示,该公司处于“独特位置”,可以提供一站式的转录服务。他在向记者作简报时说:“您不必担心会忙于使用不同的Windows应用程序。”“我们在自然用户界面空间中所做的所有投资,无论是触摸还是语音,您都在尝试做,这使每个人都能以最适合他们的方式工作,从而提高他们的工作效率。 ,他们可以花费更少的时间和精力来创造出最好的作品,并且他们可以真正专注于最重要的事情。”
使用Edge或Chrome的Microsoft 365订阅者现在从Office.com创建新的Word文档时,将在“主页”选项卡下看到“听写”菜单。选择“转录”将开始记录,可以随时暂停,同时单击“立即保存并转录”按钮会将记录发送到Azure云以进行转录。可以通过新的“上载音频”选项上载.wav,.mp4,.m4a和.mp3格式的预录文件。
转录过程完成后,来自录音和上载音频的转录本会显示在“转录”窗格中-快捷方式使用户可以将部分或整个转录本快速插入Word文档。生成成绩单所需的时间取决于互联网速度和音频文件的大小,音频文件的大小限制为200MB,每月录制音频的时间为五个小时;上传的音频是无限的。(微软表示,正在考虑将来增加选择的上限。)录音存储在OneDrive的“转录文件”文件夹中,可以在其中重命名或删除它们,并且有一个编辑工具可用于更改发言人姓名。对于某个部分,请将所有出现的发言人标签更改为名称,或修正名称和拼写错误。
当被问及Transcribe in Word的隐私含义时,Parish说,Microsoft不会保留录音或转录结果,而是将其存储在用户的个人OneDrive文件夹中。记录仅发送到Azure后端以执行转录,而不用于任何类型的分析。教区还声称,基于“文字”转录的语音识别模型已经在“多样化”的数据集上进行了训练,以确保他们能够识别出包括不同种族背景的男女说话者。
除了转录之外,Web上的Word现在还可以识别基本的语音命令,例如“开始列表”,“开始编号列表”,“添加斜体/粗体/下划线”和“添加椭圆/和号/百分号”。完整列表位于帮助面板中,无需单击转录模式即可在其中进行检查。
这些命令是由Dictate提供的,该附件是Microsoft于去年10月退休的,它支持本机Office 365 Web和移动集成。听写支持29种口头语言,实时翻译为60种语言以及两种标点模式。它还可以识别自然语言命令,例如“添加点圆点”(用于椭圆),“暂停听写”和“添加注释”,以及非正式命令,例如“插入笑脸/心脏表情符号”。(微软表示,北印度文,韩文,俄文,波兰文,泰文,其他西班牙文和其他中国语言环境正在发展中。)