扫码登录
IT之家 9 月 11 日消息,微软近日为其 Copilot 工具新增了一项名为“Copilot 音频表达式”的功能。该功能基于微软自研的 MAI-Voice-1 模型打造,目前向用户提供三种不同的语音模式选择。
这三种语音模式分别为:“有感染力模式(Emotional Mode)”,支持富有表现力的自由表达,适用于传递情感的场景;“故事模式(Story Mode)”,可用于讲述包含多个角色的故事,提供更具沉浸感的听觉体验;“脚本模式(Script Mode)”,能够实现逐字精准播报,尤其适合需要准确传达信息的场合。
此外,微软还为每种模式配备了多种语音类型和风格,涵盖从经典的莎士比亚作品朗读风格到充满激情的体育解说风格等多种选项。
目前,这一新功能已在 Copilot Labs(Copilot 实验室)中上线,用户可前往体验。值得注意的是,微软近期还推出了其首款大型语言模型 MAI-1,并与 Anthropic 达成协议,计划将后者的模型集成至 Office 应用中。这一系列动作表明,微软正积极拓展其在人工智能领域的技术布局,逐步降低对 OpenAI 的依赖。