logo
OpenAI推出GPT-RealTime语音模型,升级功能并降价,语音大战再升级
===2025-8-31 20:59:34===
国口音富有同情心地说话”。同时,该模型还能捕捉笑声等非语言线索,在句子中切换语言,并调整语气,为用户提供更加愉悦的对话体验。在构建语音转语音应用时,开发者通常需要向模型提供一系列行为指令。OpenAI此次专注于改进模型对这些指令的遵循程度,使得即使是微小的指令也能为模型传递更多信息。这一改进将使得GPT-RealTime在处理复杂的多步骤请求时更加得心应手。OpenAI还改进了异步函数调用功能。长时间运行的函数调用将不再中断会话流程,模型可以在等待结果时继续流畅地对话。这一功能的提升将使得GPT-RealTime在处理需要等待外部响应的场景时更加自然、流畅。与传统将语音转文本和文本转语音的多模型链式流程不同,Realtime API通过单个模型和API直接处理和生成音频。这一创新的设计减少了延迟,保留了语音中的细微差别,并使得其响应更加自然、富有表现力。同时,Realtime API还新增了远程MCP服务器支持、图像输入功能以及SIP电话呼叫支持等实用功能,为开发者提供了更加便捷、高效的开发体验。为了防止实时语音对话被滥用,Realtime API包含了多层安全防护和缓解措施。OpenAI对Realtime API会话采用主动分类器进行监控,一旦检测到有害内容,将立即中止对话。开发者还可以使用Agents SDK添加自己的额外安全防护措施,确保对话的安全性和合规性。

=*=*=*=*=*=
当前为第2/2页
上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页