查看内容

OpenAI推出GPT-RealTime语音模型，升级功能并降价，语音大战再升级
===2025/8/31 20:59:34===

国口音富有同情心地说话”。同时，该模型还能捕捉笑声等非语言线索，在句子中切换语言，并调整语气，为用户提供更加愉悦的对话体验。在构建语音转语音应用时，开发者通常需要向模型提供一系列行为指令。OpenAI此次专注于改进模型对这些指令的遵循程度，使得即使是微小的指令也能为模型传递更多信息。这一改进将使得GPT-RealTime在处理复杂的多步骤请求时更加得心应手。OpenAI还改进了异步函数调用功能。长时间运行的函数调用将不再中断会话流程，模型可以在等待结果时继续流畅地对话。这一功能的提升将使得GPT-RealTime在处理需要等待外部响应的场景时更加自然、流畅。与传统将语音转文本和文本转语音的多模型链式流程不同，Realtime API通过单个模型和API直接处理和生成音频。这一创新的设计减少了延迟，保留了语音中的细微差别，并使得其响应更加自然、富有表现力。同时，Realtime API还新增了远程MCP服务器支持、图像输入功能以及SIP电话呼叫支持等实用功能，为开发者提供了更加便捷、高效的开发体验。为了防止实时语音对话被滥用，Realtime API包含了多层安全防护和缓解措施。OpenAI对Realtime API会话采用主动分类器进行监控，一旦检测到有害内容，将立即中止对话。开发者还可以使用Agents SDK添加自己的额外安全防护措施，确保对话的安全性和合规性。

=*=*=*=*=*=
当前为第2/2页
上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页