logo
计算机行业点评:豆包突破视觉理解,垂类和终端AI再定义
== 2024-12-19 10:14:35 == 热度 187


(以下内容从德邦证券《计算机行业点评:豆包突破视觉理解,垂类和终端AI再定义》研报附件原文摘录)投资要点:豆包大模型家族全面升级,正式发布视觉理解模型,起步晚但跑得快。2024年12月18日,2024火山引擎FORCE原动力大会·冬正式召开,火山引擎带来豆包大模型家族全新升级,重磅推出视觉理解模型。据火山引擎总裁谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,有着细腻的视觉描述和创作能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。再则,豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App;3D生成模型也首次亮相,该模型与火山引擎数字孪生平台veOmniverse结合使用,成为一套支持AIGC创作的物理世界仿真模拟器。谭待表示,豆包大模型虽然发布较晚,但一直在快速迭代,目前已成为国内最全面、技术最领先的大模型之一。豆包大模型12月日均tokens使用量超过4万亿,较5月发布时期增长超过33倍。字节AI再次掀起价格战,视觉理解模型进入“厘时代”,爆款应用有望加速涌现。2024年5月15日,在2024春季火山引擎FORCE原动力大会上,字节跳动自研大模型家族全体亮相,豆包通用模型pro(32k)的价格为0.0008元/千tokens,使得语言模型进入“厘时代”。与32k及以下模型的业内价格相比,豆包比行业价格低99.3%。此次冬季大会,字节AI再次将视觉理解模型价格带入“厘时代”。豆包·视觉理解的输入价格为每千tokens0.003元,比行业平均价格降低85%,相当于一块钱可以处理284张720P的图片。同时火山引擎还将提供更高的初始流量,RPM达到了15000次,TPM达到120万,让企业和开发者用好视觉理解模型,找到更多创新场景。豆包·视觉理解模型在教育、旅游、电商等场景有着非常广泛的应用,“厘时代”价格将伴随着视觉理解模型能力的提升,低成本挖掘更广阔的应用场景,有望提高大
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页