Qwen2 模型图标 - Search News

News

新浪网19d

阿里通义千问 2.5-Omni-3B AI 全模态登场：7B 版 90% 性能，显存占用减少 53%

IT之家 5 月 1 日消息，阿里巴巴持续发力 AI 领域，其 Qwen 团队于 3 月发布 Qwen2.5-Omni-7B 模型后，昨日（4 月 30 日）再次发布 Qwen2.5-Omni-3B，目前可以在 ...

搜狐19d

Qwen推出2.5-Omni-3B模型，可在消费级PC和笔记本上运行

就在几天前，阿里巴巴的Qwen团队发布了最新的开源Qwen3大型推理模型系列，今天又推出了Qwen2.5-Omni-3B，这是其前代多模态模型架构的轻量级版本，旨在在消费级硬件上运行，同时不牺牲文本 ...

凤凰网20d

小米首个推理大模型开源数学与代码测评超越OpenAI

值得注意的是，小米官方表示，MiMo-7B在相同强化学习训练数据下，数学与代码领域的表现显著优于当前业界广泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B ...

人民网20d

阿里巴巴开源新一代通义千问模型Qwen3

仅激活3B就能媲美上代Qwen2.5-32B模型性能；千问3的稠密模型性能继续突破，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。同时 ...

新浪网20d

Qwen3 发布，第一时间详解：性能、突破、训练方法、版本迭代…

对于小一点的 MoE 模型：Qwen3-30B-A3B，其激活量只有 QwQ-32B 的 10%，其表现超过 DeepSeek V3/GPT-4o Qwen3-4B 这样的小模型，也能匹敌 Qwen2.5-72B-Instruct 「思考 ...

marktechpost20d

Multimodal AI on Developer GPUs: Alibaba Releases Qwen2.5-Omni-3B with 50% Lower VRAM Usage and Nearly-7B Model Performance

In response to these constraints, Alibaba has released Qwen2.5-Omni-3B, a 3-billion parameter variant of its Qwen2.5-Omni model family. Designed for use on consumer-grade GPUs—particularly those with ...

蓝鲸财经21d

阿里发布最强开源模型Qwen 3，参数量仅为DeepSeek-R1的1/3

成为了全球最强的开源模型。通过模型架构的改进、训练数据的增加以及更有效的训练方法，Qwen3实现了模型体积更小情况下，性能表现也比更大参数规模的Qwen2.5基础模型要好。特别是在 STEM ...

36氪21d

Qwen3深夜炸场，阿里一口气放出8款大模型，性能超越DeepSeek R1，登顶开源王座

甚至像 Qwen3-4B 这样的小模型，也能达到 Qwen2.5-72B-Instruct 的水平。除了上述两款 MOE 模型，此次还发布了 6 款 Dense 模型，分别是：Qwen3-32B、Qwen3-14B ...

Business Standard21d

Alibaba launches Qwen3 AI, claims it's better than DeepSeek R1: Details

"Notably, our smaller MoE model, Qwen3-30B-A3B, surpasses QwQ-32B, and even the compact Qwen3-4B rivals the performance of the much larger Qwen2.5-72B-Instruct," the company added in a blog post on ...

腾讯网21d

阿里Qwen3问鼎开源王座！8款模型全面开放，最大杯全方位超越R1

首先在数据上，Qwen3预训练使用的数据约是Qwen2.5的2倍，达到36万亿token，涵盖119种语言和方言。并使用Qwen2.5处理数据。用Qwen2.5-VL提取PDF中的文本 ...

中华网21d

比DeepSeek R2先发！阿里巴巴Qwen3登顶全球最强开源模型

其中，千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升，仅激活3B就能媲美上代Qwen2.5-32B模型性能；千问3的稠密模型性能继续突破，一半的参数量可实现同样的高性能，如32B版本的千问3 ...

IB资讯21d

阿里Qwen3系列模型震撼发布，8大版本集成MCP，性能超越业界标杆

在推理能力方面，Qwen3系列在数学、代码生成和常识逻辑推理方面超越了QwQ（在思考模式下）和Qwen2.5 instruct models（在非思考模式下）。Qwen3系列还支持MCP（模型上下文协议），增强了Agent能力 ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results