超碰人91,精品一区二区国产在线观看,波多野结衣中文字幕无码,波多野结衣超碰一区二区

IT之家 2 月 4 日消息，阿里巴巴千問宣布推出 Qwen3-Coder-Next，一款專為編碼代理與本地開發(fā)打造的開放權(quán)重的語言模型。

該模型基于 Qwen3-Next-80B-A3B-Base 構(gòu)建，采用混合注意力與 MoE 的新架構(gòu)；通過大規(guī)?？蓤?zhí)行任務(wù)合成、環(huán)境交互與強(qiáng)化學(xué)習(xí)進(jìn)行智能體訓(xùn)練，在顯著降低推理成本的同時(shí)，獲得了強(qiáng)大的編程與智能體能力。

【資料圖】

IT之家附官方詳細(xì)介紹如下：

擴(kuò)展智能體訓(xùn)練

Qwen3-Coder-Next 不依賴單純的參數(shù)擴(kuò)展，而是聚焦于擴(kuò)展智能體訓(xùn)練信號。我們使用大規(guī)模的可驗(yàn)證編程任務(wù)與可執(zhí)行環(huán)境進(jìn)行訓(xùn)練，使模型能夠直接從環(huán)境反饋中學(xué)習(xí)。訓(xùn)練過程包括：

在以代碼與智能體為中心的數(shù)據(jù)上進(jìn)行持續(xù)預(yù)訓(xùn)練
在包含高質(zhì)量智能體軌跡的數(shù)據(jù)上進(jìn)行監(jiān)督微調(diào)
領(lǐng)域?qū)＞膶＜矣?xùn)練（如軟件工程、QA、Web / UX 等）
將專家能力蒸餾到單一、可部署的模型中

該配方強(qiáng)調(diào)長程推理、工具使用以及從執(zhí)行失敗中恢復(fù)，這些對現(xiàn)實(shí)世界中的編程智能體至關(guān)重要。

在編程智能體基準(zhǔn)上的表現(xiàn)
面向智能體的基準(zhǔn)結(jié)果

下圖匯總了在多個(gè)廣泛使用的編程智能體基準(zhǔn)上的表現(xiàn)，包括 SWE-Bench（Verified、Multilingual、Pro）、TerminalBench 2.0 和 Aider。

圖中表明：

使用 SWE-Agent 框架時(shí)，Qwen3-Coder-Next 在 SWE-Bench Verified 上達(dá)到 70% 以上。
在多語言設(shè)置以及更具挑戰(zhàn)的 SWE-Bench-Pro 基準(zhǔn)上保持競爭力。
盡管激活參數(shù)規(guī)模很小，該模型在多項(xiàng)智能體評測上仍能匹敵或超過若干更大的開源模型。

效率與性能的權(quán)衡

下圖展示了 Qwen3-Coder-Next 如何在效率與性能之間取得更優(yōu)的帕累托權(quán)衡。

這一對比清晰體現(xiàn)了效率優(yōu)勢：

Qwen3-Coder-Next（3B 激活）的 SWE-Bench-Pro 表現(xiàn)可與激活參數(shù)量高 10 到 20 倍的模型相當(dāng)。
盡管專有的全注意力模型在絕對性能上仍然領(lǐng)先，Qwen3-Coder-Next 在面向低成本智能體部署方面處于強(qiáng)勢的帕累托前沿。

總結(jié)與未來工作

Qwen3-Coder-Next 在編程智能體基準(zhǔn)上展現(xiàn)出良好前景，在實(shí)用場景中具備不錯的速度與推理能力。盡管其表現(xiàn)可與部分更大的開源模型競爭，仍有很大改進(jìn)空間。

展望未來，我們認(rèn)為強(qiáng)大的智能體能力 —— 如自主使用工具、應(yīng)對難題、管理復(fù)雜任務(wù) —— 是更好編程智能體的關(guān)鍵。接下來我們計(jì)劃提升模型的推理與決策能力、支持更多任務(wù)，并根據(jù)使用反饋快速迭代更新。

開源地址

ModelScope：

Hugging Face：

關(guān)鍵詞：編程推理智能體 qwen 阿里千問 coder

阿里千問發(fā)布Qwen3-Coder-Next：低推理成本編程智能體模型

最近更新

獨(dú)家推薦

江西省科技型中小企業(yè)群體持續(xù)壯大

每日看點(diǎn)!研報(bào)掘金丨東吳證券：招商蛇口業(yè)績有望逐步修復(fù)，維持“買入”評級

焦點(diǎn)關(guān)注：2月3日生意社PTA基準(zhǔn)價(jià)為5173.91元/噸

熱點(diǎn)評！PriceSeek重點(diǎn)提醒：上海賽科丙烯腈價(jià)格上調(diào)分析

新聞排行