• 请不要在回答技术问题时复制粘贴 AI 生成的内容
aohan0905
V2EX  ›  程序员

Kimi K2.7 Code 发布了,有人已经替换 Claude Code / Codex 了吗?

  •  
  •   aohan0905 · 7 days ago · 4716 views

    刚刚看到 Kimi 发布了 K2.7 Code 。

    官方给的数据:

    • Kimi Code Bench v2 +21.8%
    • Program Bench +11.0%
    • MLS Bench Lite +31.5%
    • 推理 Token 消耗降低 30%

    有没有已经体验过的大佬说说感受?

    31 replies    2026-06-13 15:53:30 +08:00
    cuebyte
        1
    cuebyte  
       7 days ago
    Kimi 的思考一直是一个痛点,会在同一个地方反复思考多次,浪费 tokens ,降低输出质量。
    不知道这一版有多大进步。
    yuhaofe
        2
    yuhaofe  
       7 days ago
    @cuebyte 降 30%说的就是这点,不过没实测,蹲个测评
    feelapi
        3
    feelapi  
       7 days ago
    aohan0905
        4
    aohan0905  
    OP
       7 days ago
    @feelapi 我也发现了, 不到十分钟, 199 档 5h 花了 15%, 是 coding plan 额度降了吗?
    kneo
        5
    kneo  
       7 days ago via Android
    @cuebyte 这不和 deepseek 一样吗?
    qian33
        6
    qian33  
       7 days ago
    @aohan0905 意思是 coding plan 不耐用了吗 🤣
    aohan0905
        7
    aohan0905  
    OP
       7 days ago
    @qian33 至少体感是的, 我没准确看时间, 写了个计划, 开了 goal, 然后看下面 hud active 7m 的时候, 消耗了 20% 左右
    herozzm
        8
    herozzm  
       7 days ago   ❤️ 3
    不要相信国产,试都不用试,这点时间可以干点别的
    aohan0905
        9
    aohan0905  
    OP
       7 days ago
    @qian33 我重新确定了下, 看控制台是这样, 然后 5h 额度花了接近 25%?
    ```
    ● ✓ Goal complete.
    Worked 1 turn over 11m00s, using 4.4M tokens.
    ```
    Alwaysonline
        10
    Alwaysonline  
       7 days ago
    Kimi 有买 199 元的套餐,唯一的好处就是用来写前端页面,比 Codex 要漂亮些。
    python35
        11
    python35  
       7 days ago   ❤️ 1
    我曾经试过写一个在家里 openwrt 上的 captive portal 系统做黑白名单、基于页面的授权码、对接 radius 系统、防火墙放行等功能, 基于 cc 的 glm5.1 和 deepseek v4 pro 都没写成功,最后是 codex 写成功了,可以正常使用, 至此投入 o 家的怀抱,开了 5x pro, 国产的确实还有差距; 如果你们有 openwrt 也可以试试写写看
    qian33
        12
    qian33  
       7 days ago
    @aohan0905 那消耗过大了 感觉 199 套餐也要不够用了
    ebushicao
        13
    ebushicao  
       7 days ago   ❤️ 1
    我打开 kimi 官网,还没看到 kimi-k2.7 ,倒是弹出一个 kimi 信用卡... 就不能先把模型能力搞上去吗...
    JasonYip
        14
    JasonYip  
       7 days ago via Android
    @python35 国模需要有一个详细的 spec 能够执行的比较好,如果想省钱可以 chatbox 和 gpt 聊清楚然后生成详细的 spec ,让国模去做,其实效果还可以
    Ericcccccccc
        15
    Ericcccccccc  
       7 days ago   ❤️ 2
    gpt 5.5 的好用我只能说是有目共睹,这种不是跑分啥的可以植入的印象
    wengjin456123
        16
    wengjin456123  
       7 days ago via iPhone   ❤️ 1
    我感觉挺好用的,199 套餐也够用,比我的 codex plus 量大的多,2.7 code 明显好用一些,工具调用 skill 调用也很积极,思考也没 2.6 那样很久很久
    ilikexff
        17
    ilikexff  
       7 days ago
    虽然相信国产,但是实力真的是硬伤,每一个过程模型出来的时候,口号都喊的牛逼哄哄的,不是碾压这个就是吊打那个,各种所谓的专业测评成绩粉漂亮,但是当你真实的使用的时候发现,还是依托💩
    billzhuang
        18
    billzhuang  
       7 days ago   ❤️ 2
    @ilikexff 你这叫啥相信
    Absofknglutely
        19
    Absofknglutely  
       7 days ago
    你这叫啥相信
    win8en
        20
    win8en  
       7 days ago via Android   ❤️ 1
    @ilikexff 这个里面没有小粉红,不要怕 大胆点,没必要带前面那一句😂
    maolon
        21
    maolon  
       7 days ago
    我更好奇是 composer 2.5 强还是 2.7 code 强,
    要是 2.7 code 还比不过 composer 2.5 这个 k2.5 的继续训练版本就搞笑了
    iorilu
        22
    iorilu  
       7 days ago
    跑分是跑分, 实际干活另一回事
    XProxyAi
        23
    XProxyAi  
       7 days ago
    除了 SOTA 别的不建议用,浪费钱的同时 还在浪费生命
    ebushicao
        24
    ebushicao  
       7 days ago
    刚看到 opencode go 订阅能用 Kimi K2.7 Code 就直接开始测试了,结果上来就拉了个大的。
    在一个刚初始化的 pnpm workspace 下,默认有一个 packages 目录。我的提示词是“使用 pnpm create vite 选择 react-ts 模板创建一个 web 项目,web 项目直接放在根目录 web 文件夹,移除 packages”,deepseek-v4-flash 都能正确完成的事,直接给我把 pnpm-workspace.yaml 删了,还问我要不要删除根目录的 package.json 和 node_modules 。

    再结合我一打开 kimi 官网给我弹什么 AI 信用卡,我觉得 kimi 拉完了。
    Blutbad
        25
    Blutbad  
       7 days ago
    目前下来我觉得还行,给我做报告用的 html 页面比 2.6 快多了。2.6 经常深度思考开始套娃,一个跳转都能把页面干崩溃了,还修不好
    aohan0905
        26
    aohan0905  
    OP
       7 days ago via iPhone
    @Blutbad 认同,2.7 感觉要比 2.6 体感上好不少
    mashimaroinfo1
        27
    mashimaroinfo1  
       7 days ago
    @JasonYip 一样, 早试过了。

    一线模型强思考下写的 spec, 国模无法遵守。

    核心问题是国模的理解水平极差。在这个前提下, 你编程多强, 数学多好, 都没有意义。因为无法根据用户指令发挥出来。这根本就是一个语文问题。
    photolife
        28
    photolife  
       6 days ago
    不知怎么回想起各种红旗 linux 时代
    youngxhui
        29
    youngxhui  
       6 days ago via iPhone
    2.7 比 2.6 感觉快了很多。价格上我看官网输入输出和 2.6 是一样的,缓存价格反而提升了
    SiWXie
        30
    SiWXie  
       6 days ago via iPhone
    用的 199 套餐➕Claude Code ,一个任务 10%额度没了,它一直在跑,不停的跑
    hackroad
        31
    hackroad  
       6 days ago
    有好的不用,为什么用这种垃圾。。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2674 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 6b34f497 · 62ms · UTC 03:45 · PVG 11:45 · LAX 20:45 · JFK 23:45
    ♥ Do have faith in what you're doing.