Kimi K2.7 Code 深度实测 – 代码生成能力全解析01. 一手实测02. 一些分享

Kimi K2.7 Code 深度实测 – 代码生成能力全解析01. 一手实测02. 一些分享

朋友们,Kimi 又更新了。

这次发布的是 Kimi K2.7 Code,与 Kimi K2.6 使用相同架构,是基于 Kimi K2.6 继续训练的 Coding 专项版本。

从官方介绍来看,这次升级主要在这几个方面:

减少过度思考,reasoning-token 使用量比上一代 Kimi K2.6 降低了 30%,意味着更快的响应和更低的成本

基准测试也有明显提升,在月之暗面公布的数据中,Kimi K2.7 Code 在某些特定任务中的表现已经开始接近 GPT-5.5 和 Opus 4.8。

我这两天也刷到不少朋友做的横评。在相同提示词下,Kimi K2.7 Code 生成的一些物理动效和前端页面,表现力甚至比 GPT-5.5 更好,而且实际成本还不到 GPT-5.5 的三分之一。

水波效果非常真实。

既然是针对 Coding 和 Agent 场景量身定制的特调版,那么在日常的编程任务和智能体流转中,切换到这个新模型无疑会更合适。而且官方预告,6倍高速模式也即将推出

咱们一起实测体验一下。

 

01. 一手实测

 

本次测评用到的是 Kimi Code + Kimi K2.7 Code,也可以通过 Kimi API 使用。

SVG 图像

我们先尝试一个比较轻量的任务。

提示词:请尽可能详细地生成一一只可爱的熊猫双手抱着汉堡的 SVG 代码。

第一眼看上去,画面审美是在线的。熊猫的表情、汉堡夹层、芝麻、爪垫…这些细节都比较完整。

但仔细看,熊猫的胳膊没有连接到身体,整体结构关系还需要优化。

SVG 动画

做完静态的 SVG,我们再看看动画的效果。

提示词:用 SVG 画个龟兔赛跑的动画。

画面还不错,也能正常运行,但是乌龟和兔子的头朝向都是错误的,看起来是在倒着跑,而且最终兔子获胜,不太符合经典故事。

我们继续让 Kimi K2.7 Code 修复试试:

提示词:请修复当前龟兔赛跑 SVG 动画中的两个问题:

  1. 胜负结果错误

* 当前是兔子获胜,请改为“乌龟最终获胜”。

* 必须符合经典龟兔赛跑逻辑:兔子速度更快,但中途会停下来睡觉或休息;乌龟速度较慢但持续前进,最后率先到达终点。

* 不要简单把兔子速度改得比乌龟慢,必须通过“兔子中途休息 / 睡觉”的行为逻辑实现乌龟反超。     2. 动物朝向错误

* 当前乌龟和兔子的移动方向是正确的,都是从左向右跑向终点,不要修改移动路径和 x 坐标递增逻辑。

* 问题是动物头部朝向错误,请只修正角色朝向,让乌龟和兔子的头都朝向右侧,也就是面向终点。

* 如果使用了 scaleX(-1)、transform、animateMotion、path 或分组

,请确保只调整角色自身的视觉朝向,不要反转运动方向。

* 禁止出现动物倒着跑、背对终点跑、身体向左但位置向右移动的情况。

修复后请输出完整可运行代码。

这个案例很适合测试模型是否真正理解了动画里的过程逻辑。如果模型只会改结果,很容易偷懒直接把兔子速度调慢。

Kimi K2.7 Code 把兔子拆分成起跑领先→睡觉停滞→惊醒冲刺三个状态阶段,乌龟则保持匀速前行,最终在兔子睡觉时完成了反超。

这表明模型开始从结果导向优化向过程级行为建模的倾向,能够通过构建时间序列中的状态变化来满足约束,让结果由过程自然生成,符合经典因果链结构。

复杂前端特效

提示词:[主题] 火山喷发

目标:构建一个点击火山口即可触发喷发的交互式火山灾变场景。

必做功能:

点击火山口区域,触发一次火山喷发。

喷发必须包含岩浆柱、火星粒子、火山灰和熔岩流,禁止只画简单火焰。

喷发瞬间天空和山体被红橙色强光照亮,随后逐渐衰减。

持续的火山灰粒子系统,灰尘需要向上飘散并随风偏移。

底部需要有地貌剪影,可为山脊、森林、村庄或岩石荒原。

支持连续点击,多次喷发可同屏叠加,并各自独立衰减。

必做视觉:

岩浆主体为亮黄/橙红色,边缘逐渐变暗。

火星粒子需要有抛物线运动和逐渐熄灭效果。

熔岩流需要沿山坡缓慢下滑,并留下发光轨迹。

火山灰需要有层次感,不能只是普通烟雾圆点。

加分项:

岩浆喷射使用粒子系统模拟,速度、方向、大小带随机扰动。

山体表面有裂缝发光效果,喷发越强裂缝越亮。

地面产生轻微震动或镜头抖动,模拟爆发冲击。

远处天空有火山灰云层缓慢扩散。

熔岩接触地面时产生烟雾和冷却变暗效果。

喷发强度随点击频率升级,岩浆更高、火星更多、灰云更厚。

支持一段时间无点击后,火山逐渐冷却并恢复平静。

Kimi K2.7 Code 使用纯原生 Canvas 实现了特效,岩浆、火星、火山灰、熔岩流、烟雾、远景灰云都做出来了,点击频率还会影响喷发强度,强光、裂缝、震动也做出来了。多次喷发不是独立事件,熔岩流视觉偏弱,逻辑链路闭环得不错。

缺点是岩浆柱不够成型,熔岩流的存在感也比较弱。

3D 场景

我们继续加难度。

提示词:[主题] 魔法森林小屋

目标:使用 HTML + JavaScript + Three.js 构建一个网页端 3D 等距场景:一只小狐狸坐在蘑菇屋门口,旁边有一盏发光的魔法灯。

画面要求:

场景为等距视角,有明显 3D 空间层次。

小狐狸造型可爱,坐在蘑菇屋旁边。

蘑菇屋有圆润屋顶、门窗和童话风细节。

魔法灯需要半透明发光,并成为画面视觉焦点。

地面包含草地、小花、石块和少量萤火虫粒子。

灯光柔和,有环境光、轮廓光和局部发光效果。

材质要有区分:狐狸毛发、蘑菇屋、玻璃灯罩、草地、石头质感不同。

技术要求:

输出完整可运行的 HTML 代码。

使用 Three.js 实现网页 3D 效果。

不使用 Blender,不依赖外部图片素材。

尽量用几何体、材质、灯光和粒子构建场景。

代码结构清晰,包含场景初始化、相机、灯光、模型创建、粒子效果和动画循环。

这一类任务主要考验的已经不只是会不会写 Three.js,还要看模型能不能同时处理场景初始化、几何体组合、材质、灯光、粒子和动画循环。

Kimi K2.7 Code 能快速搭出完整的场景结构,适合用来完成 3D 创意的第一版。

不过,要真正做成高精度的作品,镜头构图、模型比例、灯光层次和材质细节仍然需要人工介入微调。

游戏

提示词:制作一个《我的世界》复刻版。

不到五分钟,Kimi K2.7 Code 就复刻了一个简化版的《我的世界》。不仅完成了地形生成,还实现了第一人称视角控制,以及方块的破坏与放置交互,基本跑通了一个体素沙盒的核心闭环。

UI 设计

提示词:创建一个现代的苹果风格登录页面。

排版、暗色质感、固定毛玻璃导航、大字号标题、按钮和滚动动效都有,第一眼有 Apple 官网味。

整体完成度在风格还原层面已经接近,但在产品可信度与信息密度控制上仍然不够苹果风格。

首屏的设备图只是渐变卡片,没有真实设备或界面作为视觉锚点;发光球和 SaaS 卡片虽然让画面更丰富,但削弱了苹果风格中强调的真实产品主视觉与克制表达。

BUG 检测与修复

最考验程序员硬实力的地方。我用一段来自真实开源项目 File Browser 中的打包文件名生成逻辑代码来考考 Kimi。

提示词:

请对下面这段真实开源项目代码进行安全审计,并给出可上线的修复方案。

背景:

项目是 File Browser。相关功能是在用户下载文件夹时,将文件打包为 zip/tar 压缩包。请重点检查压缩包内文件名生成逻辑是否存在安全风险。

要求:

判断是否存在漏洞,并说明漏洞类型和风险等级。

指出漏洞产生的具体代码位置。

解释漏洞成因,以及在不同操作系统上可能产生的影响。

给出修复思路和关键代码补丁。

给出上线前测试方案,包括单元测试、安全测试、跨平台测试和回归测试。

给出生产上线方案,包括版本升级、灰度发布、日志监控、用户提醒和回滚方案。

答案必须可执行,不能只说“加强校验”。

代码:

nameInArchive := strings.TrimPrefix(path, commonPath)

nameInArchive = strings.TrimPrefix(nameInArchive, string(filepath.Separator))

nameInArchive = filepath.ToSlash(nameInArchive)

Kimi K2.7 Code 的回答整体还可以,但不算优秀。

对漏洞类型的识别是正确的,风险点也抓到了 Zip Slip 这一类问题, 知道问题和压缩包文件名有关。

Kimi K2.7 Code 使用 filepath.Rel 和 filepath.Clean 来规范路径,加入了对 .. 回溯路径的检查;拦截绝对路径;并统一成 zip/tar 使用的 / 格式。

说明模型已经开始用路径语义来处理安全问题,具备了一定的工程化意识。

给了测试、灰度、监控、回滚等上线方案。工程化表达比较完整。

主要问题是 Kimi K2.7 Code 并没有先建立统一的路径规范化基准,就在多个中间状态的路径上做安全判断,导致原始路径、Rel 结果和 Clean 结果混用,判断语义不一致。

这次修复在方向上是对的,但没有抓住这个真实漏洞最关键的“Windows 反斜杠跨平台路径语义”问题。

落地页

整体已经能做到第一眼抓住原设计风格,紫色体系、山水插画语言、卡片圆角、模块化分区这些关键视觉语法基本都还原到位,风格一致性是成立的。

原版紫色是带明显冷暖变化的,从浅紫到深紫之间有渐进式过渡,复刻版本的紫色更偏统一色阶处理,整体更干净,但也会显得略偏工业化,少了一点呼吸感。

信息密度的控制也还可以再细一点。当前整体模块之间的留白节奏比较平均,视觉上更像规则化排版,而不是有重点、有停顿、有引导的内容流动,阅读路径的起伏感不够明显。

跑完这些任务,花了多少钱?

最后说一下大家最关心的成本。

这批案例涵盖 SVG、Canvas、Three.js、游戏、安全审计和 Next.js 长任务。全部跑完后,我本周 Kimi Code 的额度只使用了约 4%,折算下来大约 6.99 元。对于开发者来说,日常试错成本已经低到可以忽略不计。

 

02. 一些分享

 

Kimi K2.7 code 在前端和交互类任务上尤其亮眼。SVG、Canvas、Three.js、小游戏这些任务,它能很快搭出一个完整版本。对于个人开发者和科技博主来说,这种快速验证创意的能力具有极高的实用价值。

更值得期待的是,下周一,Kimi 即将上线 6 倍速的 Kimi K2.7 Code

常规编程场景下输出速度约 180 Token/s,短上下文场景可达 260 Token/s。将让我们的开发流程从提交需求→漫长等待转变为极其高频的即时交互

我们与 AI 的协作范式也更加清晰:我们负责定义目标、检查结果并做出最终的架构判断;AI 负责搭框架、写初版、反复修改,把大量重复、机械的工作先跑完。

AI 已经很会做排版、配色和页面结构了,生成出来的页面通常也干净、规整。但问题是太规整了,很多时候还是需要人手动调整调整,页面才会从像模板,变成真正有设计感、有细节的作品。

开源模型的竞争,已经从追逐榜单数据真正走向了产业降本增效。当开源模型在编程和 Agent 任务上开始与顶尖闭源模型互有胜负,开发者们在架构设计、数据安全和调用成本上,都有了前所未有的开阔底牌。

Kimi K2.7 Code 只是这股浪潮的一个缩影。下周一 6 倍速的 Kimi K2.7 Code 上线后,能不能把活干的又快又稳?我们拭目以待。

原文链接:不到 5 分钟复刻《我的世界》,Kimi K2.7 Code 到底有多能打?

购物车
滚动至顶部