首页 产业新闻 阿里云宣布Qwen2开源 性能超美国开源模型Llama3

阿里云宣布Qwen2开源 性能超美国开源模型Llama3

产业新闻 6

    6月7日消息,阿里云今日宣布,比美国开源Llama3和中国闭源模型们更强的Qwen2今日开源,免费下载。

    阿里云表示:历经数月努力,我们很高兴迎来了Qwen系列模型从Qwen1.5到Qwen2的重大升级。这一次,我们为大家带来了:

    * 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;

    * 在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;

    * 多个评测基准上的领先表现;

    * 代码和数学能力显著提升;

    * 增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。

    Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务;Qwen2-7B-Instruct几乎完美地处理长达128k的上下文;Qwen2-57B-A14B-Instruct则能处理64k的上下文长度;而该系列中的两个较小模型则支持32k的上下文长度。

    目前,上述Qwen2系列模型已在Hugging Face和ModelScope上同步开源。

    阿里云强调,此次采用不同的模型许可。除了Qwen2-72B依旧使用此前的Qianwen License外,其余模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B以及Qwen2-57B-A14B在内,均采用Apache 2.0的许可。我们希望本次开放程度的提升能够加速Qwen2在全球各地的落地及商业应用。

广告

文章目录

    标签列表