白交发自凹非寺

量子位 | 公众号 QbitAI

阿里大模型，再次开源大放送——

发布Qwen1.5版本，直接放出六种尺寸。

最大的Qwen1.5-72B-Chat模型，在MT-Bench和Alpaca-Eval v2上，超越Claude-2.1、GPT-3.5-Turbo-0613。

甚至在部分任务中，得分已经超过前几个版本的GPT-4。

各地的开发者前来祝贺，其中0.5B的迷你版让不少人都迫不及待想试试。

并且还顺便问问，那个多模态大模型Qwen-VL-Max有可能开源吗？

除此之外，还集成到了Hugging face transformers，以及同主流的十余个框架合作，从微调、部署、量化到本地推理一步到位。

Qwen1.5开源

此次开源发布，主要有四个方面值得关注。

首先，模型系列很多，直接开源了6种尺寸（0.5B、1.8B、4B、7B、14B、72B）的基础模型（base）、聊天模型（chat）以及量化模型（包括Int4 和 Int8 GPTQ 模型，以及 AWQ 和 GGUF 量化模型）。

其次，更多的生态融入。

目前，Qwen1.5的代码合并到Hugging Face transformers，使其transformers>=4.37.0而无需trust_remote_code。

此外，还同主流的第三方框架，比如vLLM、用于部署的SGLang 、用于量化的AutoAWQ、AutoGPTQ 、用于微调的Axolotl、LLaMA-Factory以及用于本地 LLM 推理的llama.cpp等进行了合作。

Qwen1.5系列可在Ollama、LMStudio等平台上使用。此外，API 服务不仅在 DashScope 上提供，而且在Together.ai上也提供，具有全球可访问性。

再者，性能更强。

比如在基本能力的评估上，包括MMLU（5-shot）、C-Eval、Humaneval、GS8K、BBH等基准测试中可以看到，Qwen1.5-72B一些分数上已经超过了GPT-4。

在长上下文支持上，全系列模型的能力都有一定的拓展。尤其Chat模型，像Qwen1.5-7B-Chat这样的小模型，在5个任务中有4个表现与GPT-3.5相当。

而Qwen1.5-72B-Chat的性能，则明显优于 GPT3.5-turbo-16k，略微落后于 GPT4-32k。

在代码执行上，72B聊天模型在数学以及可视化方面离GPT-4还有一定的差距，但代码可执行率超过GPT-4。不过他们表示，会在在未来的版本中得到增强。

除此之外，此次功能也得到了升级和统一。

全系列均统一支持至少32k的最大长度；
多语言能力全面提升并提供了更丰富的多语言评测；
全系列统一支持system prompt;
统一具备强链接外部系统能力（agent/RAG/Tool-use/Code-interpreter）

One More Thing

这两天，与阿里大模型的进展还不少。

比如前几天，其多模态大模型Qwen-VL-Max登顶OpenCompass榜首。

以及在通义千问APP上，上线了不少春节免费新应用，比如全家福、拜新年、万物成龙等图像生成的功能。

此外，还有网友反馈说，通义千问2.0版本升级之后，能力提升得很明显。

你有感受到吗？

项目链接：

https://huggingface.co/collections/Qwen/qwen15-65c0a2f577b1ecb76d786524

https://qwenlm.github.io/zh/blog/qwen1.5/

参考链接：

[1]https://twitter.com/JustinLin610/status/1754538215959335100

[2]https://twitter.com/huybery/status/1754537742892232972

[3]https://twitter.com/_akhaliq/status/1754545091434139732

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

阿里大模型春节大礼包：代码可执行率超GPT4，1.5版本全系列开源

Qwen1.5开源

One More Thing

友情提示

马斯克晒选举夜与特朗普“同框”曾跟着他收购推特的水槽再现，配文：你细品

AI独霸“贴吧”？17 个大模型在人类止步板块疯狂盖楼

《边水往事》导演算加入阿里大文娱成立三边坡工作室

“三边坡”入驻优酷，《边水往事》导演加入阿里大文娱

以军称对黎巴嫩首都贝鲁特发动“精准”空袭

京东入选世界500强超越腾讯、阿里蝉联国内行业首位

儿子月薪8000，偷偷给父母300，媳妇得知后将公婆扫地出门。

大爷这操作是真虎！黑龙江野生老虎进村完整视频！

大姐回乡下老家定居，结果刚进院子就懵了，清理出来后傻眼了

故宫开门前为什么要大喊三声？#方言

传递爱国正能量，从我做起，刘老师好样的！

化痰特别厉害的一味药，对咽喉也特别好，学会运用能治很多病

美总统之子亨特·拜登就9项税务指控罪名认罪

7球惨败擦亮伊万眼睛国脚说下半时实在太煎熬了

观察：不怕万一就怕伊万，国足0比7输日本创耻辱纪录，主教练就是木桶最短板

观察｜美官员称拟向乌提供隐身巡航导弹，将显著改变冲突格局？

多地探索按住房套内面积计价销售：“所见即所得”，避免公摊比例过大

乌克兰政坛地震，余震要到泽连斯基访美以后

阿里大模型春节大礼包：代码可执行率超GPT4，1.5版本全系列开源

Qwen1.5开源

One More Thing

友情提示

马斯克晒选举夜与特朗普“同框”曾跟着他收购推特的水槽再现，配文：你细品

AI独霸“贴吧”？17 个大模型在人类止步板块疯狂盖楼

《边水往事》导演算加入阿里大文娱成立三边坡工作室

“三边坡”入驻优酷，《边水往事》导演加入阿里大文娱

以军称对黎巴嫩首都贝鲁特发动“精准”空袭

京东入选世界500强 超越腾讯、阿里蝉联国内行业首位

儿子月薪8000，偷偷给父母300，媳妇得知后将公婆扫地出门。

大爷这操作是真虎！黑龙江野生老虎进村完整视频！

大姐回乡下老家定居，结果刚进院子就懵了，清理出来后傻眼了

故宫开门前为什么要大喊三声？#方言

传递爱国正能量，从我做起，刘老师好样的！

化痰特别厉害的一味药，对咽喉也特别好，学会运用能治很多病

美总统之子亨特·拜登就9项税务指控罪名认罪

7球惨败擦亮伊万眼睛国脚说下半时实在太煎熬了

观察：不怕万一就怕伊万，国足0比7输日本创耻辱纪录，主教练就是木桶最短板

观察｜美官员称拟向乌提供隐身巡航导弹，将显著改变冲突格局？

多地探索按住房套内面积计价销售：“所见即所得”，避免公摊比例过大

乌克兰政坛地震，余震要到泽连斯基访美以后

京东入选世界500强超越腾讯、阿里蝉联国内行业首位