比DeepSeek快吗?腾讯与Hunyuan Turbo S的AI战争重新点燃
中国科技公司Tencent刚刚推出了其最新的大型语言模型Hunyuan Turbo S,其响应时间明显更快,而无需牺牲复杂的推理任务。
Tencent声称,与以前的型号相比,其新的AI使单词生成速度增加了一倍,并将头号延迟延长44%。在微博上分享.
该模型使用似乎是混合体系结构,结合了Mamba和Transformer Technologies,这是这些方法在专家(MOE)模型的超大混合物中的首次成功集成。
这种技术融合旨在解决困扰AI开发的基本问题:Mamba有效地处理长序列,而变压器捕获了复杂的环境,可能会降低培训和推理成本。混合意味着该模型将推理能力与提供立即响应的常规LLM的传统方法相结合。
腾讯在宣布模型时写道:“快速思考和缓慢思考的结合和补充可以使大型模型更加聪明,更有效地解决问题。”官方微信频道。该公司从人类的认知过程中汲取灵感,设计了Hunyuan Turbo S,以提供人类直觉等即时反应,同时保持复杂问题所需的分析推理能力。
性能基准显示在各种测试中的Hunyuan Turbo的匹配或超过顶级模型。它在MMLU上得分为89.5,略高于OpenAI的GPT-4O,并在数学推理基准数学和AIME2024中获得了最高得分。对于汉语任务,它在中文simpleqa上达到了70.8,表现优于DeepSeek的68.0。但是,它在某些领域落后于SimpleQA和LiveCodebench,其中GPT-4O和Claude 3.5的表现更好。

该版本加剧了中国技术公司之间正在进行的AI竞争。 DeepSeek是一家中国初创公司,因其具有成本效益,高性能的模型而引起人们的关注,他一直以其高效且超高效的模型对中国科技巨头和OpenAI等美国公司施加压力。
据报道,DeepSeek的型号的训练费用约为600万美元,运行型非常便宜,每百万个象征的产出与OpenAI的GPT-4.5及其昂贵的价格约为1110美元。每百万美元产出代币150美元.
腾讯价格的价格为0.8元(约0.11美元),每百万个代币的投入量为0.8元(约合0.11美元),每百万个元代币(0.28美元)每百万个代币的产出,比以前的Turbo型号便宜。该模型在技术上可以通过API在Tencent Cloud上获得,该公司提供了一周的免费试用版,但仍无法公开下载。
尽管宣布了这一消息,但Hunyuan Turbo S尚未广泛访问以供下载,但可以通过腾讯铸入式经验地点。有兴趣的开发人员和企业需要加入等待清单通过Tencent Cloud访问模型的API。该公司尚未通过通过Girub.
该模型对速度的关注可以使其非常适合虚拟助手和客户服务机器人等实时应用程序 - 在中国非常受欢迎,如果Hunyuan Turbo S可以提供其承诺的功能,则它可以提供显着优势。
中国在AI领域的竞争继续升温,政府推动了更多采用当地模型。除了腾讯之外,阿里巴巴最近推出了其最新的最新型号QWEN 2.5最高2.5,而DeepSeek之类的初创公司最近在近几个月来发布了越来越强大的模型。
编辑安德鲁·海沃德(Andrew Hayward)
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。