qwen - 搜索 News

据统计，阿里通义团队已开源大语言模型千问Qwen及视觉生成模型万相Wan两大系列共计200余款模型，覆盖从0.5B到110B等最全尺寸，屡次斩获Chatbot Arena、司南OpenCompass等权威榜单「全球开源冠军」、「国产模型冠军」。目前，通义千问Qwen的衍生模型数已超10万个，超越美国Meta公司的Llama模型系列，成为全球第一开源大模型。

红板报 on MSN23 小时

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已 ...

赵学亮投稿量子位 | 公众号 QbitAI 大模型架构研究进展太快，数据却快要不够用了，其中问题数据又尤其缺乏。为此，港大和蚂蚁的研究人员反向利用思维链，提出了PromptCoT方法，并基于Llama3.1-8B训练了一个问题生成模型。实验结果表明，合成的问题难度较开源数据和已有算法有显著提升，接近了AIME水平。研究团队利用问题生成模型构造了400k SFT数据。基于这份数据，团队训练 ...

4 天

经纬恒润：公司已部署了DeepSeek、Qwen

经纬恒润在投资者互动平台表示，公司已部署了DeepSeek、Qwen，并基于这些大模型进行了面向多个业务领域的专业AI应用开发。例如，软件、硬件等开发过程的智能辅助、智能设计、智能测试，产品设计的优化和检查，业务流程的智能化执行，基于大模型的专业知识库，面向日常研发及办公的智能问答和检索，等等。通过大模型的部署及专业AI应用的开发部署，公司可以显著提高各个业务域的工作效率和工作质量，并降低综合成本 ...

4 天

被网友获取运行代码后，Manus终于披露基座模型是哪家

此前Manus处于“神秘”状态，外界主要通过产品体验与复刻产品，倒推猜测其底座模型。此次Manus终于揭开谜底，季逸超在社交平台评论区回复网友称：Manus目前使用的是Claude与阿里旗下不同的Qwen微调模型。团队早期只能使用Claude 3.5 ...

4 天on MSN

Manus背后的基础大模型首次公布！基于美国Claude和阿里Qwen开发

快科技3月10日消息，Monica联合创始人、首席科学家季逸超（Peak）今日在社交平台透露，Manus使用了Claude大模型和不同的阿里千问大模型（Qwen）的微调模型开发。 “当我们构建Manus时，只拿到了Claude 3.5 Sonnet ...

4 天

外媒：Manus 可能不是中国的第二个“DeepSeek 时刻”

3月5日，一款名为“Manus”的AI智能体产品正式发布其早期预览版，迅速在网络上走红，并于次日登上微博热搜。这款由中国创业公司Monica研发的产品，被誉为全球首款通用Agent，其强大的功能和独特的定位引发了科技界的广泛关注。随着技术的不断进步和应用场景的不断拓展，相信未来会有更多像Manus这样的优秀AI产品涌现出来，为人们的生活带来更多便利和惊喜。

知乎 on MSN6 天

为什么Qwen能自我改进推理，Llama却不行？斯坦福找到了原理

机器之心报道，编辑：张倩、泽南。给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，把性能提升一大截，而有的模型就不行？当遇到困难问题时，人类会花时间深入思考以找到解决方案。在 AI ...

品玩7 天

中国 AI 确实又“炸裂”了硅谷一回，不过是因为通义QwQ开源版

这家硅谷明星的AI Infra公司，号称要做到“最快的推理平台”，目前已经吸引了百万开发者，平台已经渐渐与开源模型包括LLma、DeepSeek、Qwen模型系列深度绑定。而且，它是一个拥有自己芯片产品的公司。Groq 创始人是谷歌专用芯片NPU 发明者之一Jonathan Ross。它创办的Groq，设计了与GPU不同的LPU ...

8 天

阿里半夜开源全新推理模型，QwQ-32B比肩DeepSeek-R1满血版

今天凌晨 3 点，阿里开源发布了新推理模型 QwQ-32B，其参数量为 320 亿，但性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。千问的推文表示：「这次，我们研究了扩展 RL 的方法，并基于我们的 Qwen2.5-32B ...

8 天

中国团队研发Manus走红：用Claude和Qwen后训练，二手邀请码炒至10万？

近期，一款由中国团队精心打造的通用Agent产品——Manus，在网络上迅速走红，吸引了众多目光。据“赛博禅心”披露，通过与Manus团队的深入交流了解到，该模型巧妙融合了Claude与Qwen进行深度后训练，单次任务执行成本仅为约2美元，性价比极高。

8 天

阿里Qwen发布320亿参数QwQ-32B大语言模型，实力强劲挑战DeepSeek-R1

在2025年3月6日，阿里Qwen团队如约带来了其最新的科研成果——QwQ-32B大语言模型。这一模型以320亿参数的规模，惊艳亮相，并在性能上与参数高达6710亿的DeepSeek-R1不相上下。值得注意的是，尽管QwQ-32B的参数量仅为DeepSeek-R1的约1/21，但通过巧妙的强化学习技术，它在性能上实现了逆袭，成功提升。

on.cc东网8 天

阿里曾涨7%！全新推理模型QwQ-32B媲美DeepSeek R1

人工智能 (AI)大战日日上演！阿里巴巴 ( 09988 )的通义千问Qwen团队周三 (5日)晚间发文宣布最新研究成果—QwQ-32B大语言模型，在仅有DeepSeek-R1约二十分之一参数量的情况下，用强化学习 (Reinforcement ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果