首页产业新闻 OpenAl采用智谱标准评测GPT-4.1系列大模型

OpenAl采用智谱标准评测GPT-4.1系列大模型

产业新闻 1年前(25-04-15) 258

4月15日消息，OpenAI发布的了最新GPT-4.1系列大模型，其中在评测函数调用能力时采用了ComplexFuncBench。

ComplexFuncBench是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。

据悉，ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准，ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解，并在此基础上进行多步带推理的函数调用，这对模型的函数调用能力提出了更高的挑战。（果青）

OpenAl采用智谱标准评测GPT-4.1系列大模型

相关推荐

热门文章

侧栏广告

文章目录

标签列表