阿里(09988)推出开源推理模型QwQ-32B 其性能接近DeepSeek R1
在AI领域,阿里阿里云于3月6日宣布开源新推理模型通义千问QwQ-32B。推出推理该模型拥有325亿参数,开源XM原油其性能与6710亿参数的模型DeepSeek-R1满血版相媲美,并优于OpenAI的其性o1-mini。此外,阿里这一模型以Apache 2.0开源协议推出,推出推理用户可以免费商用。开源阿里在港股市场表现出色,模型XM原油目前股价为138港元,其性涨幅达6.24%。阿里
早在去年11月28日,推出推理阿里已开源预览版QwQ-32B-Preview,开源并在三个月后正式发布QwQ-32B,模型标签已去除。其性正式版在上下文长度和AIME评分方面明显提升,具体上下文长度从32K增加到131K,AIME评分提高了50%。
QwQ-32B在多个基准测试中表现优异,测试包括数学推理、编程能力及通用能力。与DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini和原始DeepSeek-R1的比较显示,QwQ-32B在数学能力的AIME24评测集及编程的LiveCodeBench测试中表现不逊于DeepSeek-R1,且优于o1-mini及同尺寸的R1蒸馏模型。在更严苛的评估中,如LiveBench和IFEval,QwQ-32B的得分也超越了DeepSeek-R1。
目前,QwQ-32B已在Hugging Face和ModelScope开源,采用Apache 2.0协议,用户可以免费体验其推理能力。阿里云计划通过结合更强大的基础模型与规模化计算资源的强化学习(RL),朝着实现人工通用智能的目标前进,同时探索智能体与RL的集成以实现长时推理。