首页 > 新车测评 > 新车测评 > Agentic Coding表现创新高,全新KAT系列模型强势霸榜SWE-Bench

Agentic Coding表现创新高,全新KAT系列模型强势霸榜SWE-Bench

发布时间:2025-09-26 20:43:41来源: 15210273549

近期,快手 Kwaipilot 团队推出了KAT 系列两款突破性 Agentic Coding 大模型开源 32B 参数模型 KAT-Dev-32B闭源旗舰模型 KAT-Coder

这两款模型在 Code Intelligence 领域分别体现出轻量级的超强表现和极致性能。其中,在 SWE-Bench Verified 上,KAT-Dev-32B 展现出强劲性能并取得了 62.4% 的解决率,在所有不同规模的开源模型中排名第 5。与此同时,KAT-Coder 以 73.4% 的解决率在 SWE-Bench Verified 上取得了极佳的单模型表现,比肩全球顶尖闭源模型。



图 1:在 SWE-Bench Verified 上,和全尺寸开源模型对比,KAT-Dev 用极小的模型尺寸取得了第一梯队的性能



图 2:在 SWE-Bench Verified 上,KAT-Coder 取得极佳的单模型表现,比肩全球顶尖闭源模型性能

模型开源和 API 开放

KAT-Dev-32B 已在开源模型托管平台 Hugging Face 上线,可供进一步研究和开发使用。KAT-Coder 模型的 API 密钥近期也在 “快手万擎” 企业级大模型服务与开发平台上开放申请,用户将能够通过 Claude Code 等工具直接访问并进行编码。

新车测评更多>>

里程碑:AMD x86处理器总份额首度突破25% 1299元起!iPhone Pocket手机包正式开售 苹果:限量发售抢到就是赚 第17次双11大促,一次远场与近场的混战 球爆了!樊振东4-2逆转王楚钦,17板对拉炸场全运会 金鸡奖2025爆点,倪妮冲上主持台!明星阵容曝光、谁能夺大满贯? 00后女孩每月花五千买“秒回师”引热议:快节奏生活的新体现 泉州惠安第一民企迎来80后女总裁,身家260亿,曾为福建女首富 东风日产N6预售,10万级插混市场迎来“全能选手” 创维鸿途混动版正式申报,侧滑门,车长5490mm,7/9座布局 Similarweb 报告全球 AI 流量:Gemini 成 ChatGPT 最强劲对手 2025年天猫“双11”:实现四年来全周期最好增长 消息称三星三折叠屏手机已生产2万到3万部 有望年内发布 iPhone Pocket1299元起售,可当围巾甚至发绳,你会买吗? 威海瑞威房车:“产品+场景”打造“一站式户外生活”新生态 顶流IP下凡!特斯拉电摩曝光,4972元起售,这波品牌加持谁能拒绝 家用车天花板!全新丰田卡罗拉曝光,混动4L油耗+纯电 600km 轴距超3米1大SUV,承接尊界S800与问界M9中间空白? 丰田全新“小陆地巡洋舰”亮相,非承载式车身+四驱,混动系统兼 理想i9谍照首曝!明年亮相或许要成MPV“卷王” 300多项技术突破!中国6G领跑全球,但真正的标准大战才刚开始 高通推出跃龙IQ-X系列处理器 赋能工业PC与边缘智能升级 巅峰对决!江苏女排3-0完胜河南锁定头名,张常宁:珍惜每一场 我国完成第一阶段6G技术试验,形成300多项关键技术储备 马龙首秀胜利!赛后居然拍王楚钦屁股 没想到大头还调侃马龙 太逗了 英国男子垃圾桶 “寻宝” 上瘾!月赚 5600 元,捡过 1.4 万 Gucci 包 七星山荒野求生唯一女选手“冷美人”退赛 水下憋气4分钟!“水上芭蕾”是如何练成的? 全运男篮:四川逆转辽宁获季军,胡金秋主导战局,周琦末节定乾坤 银杏黄金周倒计时!6大秘境+2个宝藏地的终极玩法,错过再等一年 全运会游泳赛场:张展硕破纪录夺冠,潘展乐摘铜引热议