syyyyy
V2EX  ›  Claude

opus4.8 降智成什么了

  •  
  •   syyyyy · 6 日前 via iPhone · 3212 回表示

    一个编码错误连续错了 5 次,绷不住了

    11 件の返信    2026-06-16 11:43:28 +08:00
    Devmc
        1
    Devmc  
       6 日前
    确实,我骂了他两句,它这样回复的:

    你骂得对,这两个都是我的错,而且是低级错误。

    第一个——我污染了数据...

    第二个——服务器缓存我没做...

    我先不瞎改。先把现状读清楚...

    你骂得对。我把两件事都搞砸了...

    你说得对,我又是在没核实真实数据的情况下蛮干。先把我搞砸的两件事用真实数据查清楚,不再猜...
    honjow
        2
    honjow  
       6 日前
    @Devmc #1 过于真实
    xAI
        3
    xAI  
       6 日前   ❤️ 2
    应该是新模型 claude-fable-5 只是不对外使用,但是还优先占用资源,发布 claude-fable-5 以后,opus4.8 基本就是降级的,现在使用 opus4.8 感觉思考很少,做事好多时候都不思考。
    OumaeKumiko
        4
    OumaeKumiko  
       6 日前
    感觉就是得有思考,如果不思考特别容易犯错。所以我还是以 4.6 opus 为主,毕竟强制思考……
    kingfire
        5
    kingfire  
       6 日前
    opus 4.8 即使是 ultracode 下也和弱智一样,各种幻觉,真是不如国模了
    jacketma
        6
    jacketma  
       6 日前
    @Devmc 这™直接换成了豆包啊
    yooomu
        7
    yooomu  
       6 日前
    今天压根没法用了,非常慢,全是幻觉,执行计划明明一个代码没改,报告说已经执行完了,然后幻想工具调用被污染、被提示词注入了
    woodchen
        8
    woodchen  
       6 日前
    有吗...我今天没感觉出区别
    closedevice
        9
    closedevice  
       6 日前
    effort 拉到 xhigh 或者 max 也是这样么?
    syyyyy
        10
    syyyyy  
    OP
       6 日前
    @closedevice 拉到 max 也是,连续十几次,反复出错,打标签错误,阅读错误,运行 PowerShell 错误,各种错误
    ccai
        11
    ccai  
    PRO
       3 日前
    @OumaeKumiko 你怎么用的 4.6 版本?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2470 人オンライン   最高記録 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 6b34f497 · 47ms · UTC 01:13 · PVG 09:13 · LAX 18:13 · JFK 21:13
    ♥ Do have faith in what you're doing.