据统计,阿里通义团队已开源大语言模型千问Qwen及视觉生成模型万相Wan两大系列共计200余款模型,覆盖从0.5B到110B等最全尺寸,屡次斩获Chatbot Arena、司南OpenCompass等权威榜单「全球开源冠军」、「国产模型冠军」。目前,通义千问Qwen的衍生模型数已超10万个,超越美国Meta公司的Llama模型系列,成为全球第一开源大模型。
红板报 on MSN23 小时
AI能自主出“竞赛题”了!港大&蚂蚁让大模型学会生成难题,水平已 ...赵学亮 投稿量子位 | 公众号 QbitAI 大模型架构研究进展太快,数据却快要不够用了,其中问题数据又尤其缺乏。 为此,港大和蚂蚁的研究人员反向利用思维链,提出了PromptCoT方法,并基于Llama3.1-8B训练了一个问题生成模型。 实验结果表明,合成的问题难度较开源数据和已有算法有显著提升,接近了AIME水平。 研究团队利用问题生成模型构造了400k SFT数据。 基于这份数据,团队训练 ...
经纬恒润在投资者互动平台表示,公司已部署了DeepSeek、Qwen,并基于这些大模型进行了面向多个业务领域的专业AI应用开发。例如,软件、硬件等开发过程的智能辅助、智能设计、智能测试,产品设计的优化和检查,业务流程的智能化执行,基于大模型的专业知识库,面向日常研发及办公的智能问答和检索,等等。通过大模型的部署及专业AI应用的开发部署,公司可以显著提高各个业务域的工作效率和工作质量,并降低综合成本 ...
此前Manus处于“神秘”状态,外界主要通过产品体验与复刻产品,倒推猜测其底座模型。此次Manus终于揭开谜底,季逸超在社交平台评论区回复网友称:Manus目前使用的是Claude与阿里旗下不同的Qwen微调模型。团队早期只能使用Claude 3.5 ...
快科技3月10日消息,Monica联合创始人、首席科学家季逸超(Peak)今日在社交平台透露,Manus使用了Claude大模型和不同的阿里千问大模型(Qwen)的微调模型开发。 “当我们构建Manus时,只拿到了Claude 3.5 Sonnet ...
3月5日,一款名为“Manus”的AI智能体产品正式发布其早期预览版,迅速在网络上走红,并于次日登上微博热搜。这款由中国创业公司Monica研发的产品,被誉为全球首款通用Agent,其强大的功能和独特的定位引发了科技界的广泛关注。随着技术的不断进步和应用场景的不断拓展,相信未来会有更多像Manus这样的优秀AI产品涌现出来,为人们的生活带来更多便利和惊喜。
6 天
知乎 on MSN为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理机器之心报道,编辑:张倩、泽南。 给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。在 AI ...
这家硅谷明星的AI Infra公司,号称要做到“最快的推理平台”,目前已经吸引了百万开发者,平台已经渐渐与开源模型包括LLma、DeepSeek、Qwen模型系列深度绑定。 而且,它是一个拥有自己芯片产品的公司。Groq 创始人是谷歌专用芯片NPU 发明者之一Jonathan Ross。它创办的Groq,设计了与GPU不同的LPU ...
今天凌晨 3 点,阿里开源发布了新推理模型 QwQ-32B,其参数量为 320 亿,但性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。 千问的推文表示:「这次,我们研究了扩展 RL 的方法,并基于我们的 Qwen2.5-32B ...
近期,一款由中国团队精心打造的通用Agent产品——Manus,在网络上迅速走红,吸引了众多目光。据“赛博禅心”披露,通过与Manus团队的深入交流了解到,该模型巧妙融合了Claude与Qwen进行深度后训练,单次任务执行成本仅为约2美元,性价比极高。
在2025年3月6日,阿里Qwen团队如约带来了其最新的科研成果——QwQ-32B大语言模型。这一模型以320亿参数的规模,惊艳亮相,并在性能上与参数高达6710亿的DeepSeek-R1不相上下。值得注意的是,尽管QwQ-32B的参数量仅为DeepSeek-R1的约1/21,但通过巧妙的强化学习技术,它在性能上实现了逆袭,成功提升。
人工智能 (AI)大战日日上演!阿里巴巴 ( 09988 )的通义千问Qwen团队周三 (5日)晚间发文宣布最新研究成果—QwQ-32B大语言模型,在仅有DeepSeek-R1约二十分之一参数量的情况下,用强化学习 (Reinforcement ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果