首页 产业新闻 阿里巴巴推出通义千问2.5 号称性能超越GPT-4 Turbo

阿里巴巴推出通义千问2.5 号称性能超越GPT-4 Turbo

产业新闻 21

    在人工智能领域,阿里巴巴再次取得重大进展,于5月9日正式发布了通义千问2.5版本。该版本在模型性能上全面超越了GPT-4Turbo,标志着阿里巴巴在AI技术发展上的又一重要里程碑。

    通义千问2.5的主要提升包括:

    理解能力提升9%:在文本理解方面,相较2.1版本有了显著增强。逻辑推理能力提升16%:在处理复杂逻辑问题时表现更加出色。指令遵循能力提升19%:更好地理解和执行用户的指令。代码能力提升10%:在编程相关任务中展现出更强的能力。在权威基准测试OpenCompass上,通义千问2.5的得分与GPT-4Turbo持平,显示出其卓越的性能。

    理解能力提升9%:在文本理解方面,相较2.1版本有了显著增强。

    逻辑推理能力提升16%:在处理复杂逻辑问题时表现更加出色。

    指令遵循能力提升19%:更好地理解和执行用户的指令。

    代码能力提升10%:在编程相关任务中展现出更强的能力。

    在权威基准测试OpenCompass上,通义千问2.5的得分与GPT-4Turbo持平,显示出其卓越的性能。

    开源模型Qwen1.5-110B的亮点:

    阿里巴巴还发布了1100亿参数的开源模型Qwen1.5-110B,在多个基准测评中超越了Meta的Llama-3-70B模型,成为开源领域的新星。

    在HuggingFace推出的Open LLM Leaderboard上,Qwen1.5-110B模型荣登榜首,证明了通义系列在业界的竞争力。

    通义千问的其他专长:

    通义千问的视觉理解模型Qwen-VL-Max在多模态标准测试中超越了Gemini Ultra和GPT-4V,已在多家企业中得到应用。

    通义千问的代码大模型CodeQwen1.5-7B在HuggingFace的Big Code模型榜单中排名第一,拥有国内最大的用户规模。

    通义大模型的广泛应用:

    自问世一年多以来,通义大模型已经发展出包括文生图、智能编码、文档解析、音视频理解等在内的多项能力。企业客户和开发者可以通过API调用、模型下载等方式接入通义,而个人用户则可以通过通义APP、官网和小程序免费使用通义家族的全栈服务。

    阿里巴巴的这一新发布再次证明了其在AI领域的领导地位,并且通过不断的技术创新,为各行各业的智能化转型提供了强有力的支持。

广告

文章目录

    标签列表