
[新智元导读]就在刚刚,Anthropic的全新巨兽Oceanus遭内鬼倒卖,官方立马停用。更淘气的是,这个被囚禁的Mythos竟达到80刀天价输出,自归式自我矫正的大模子,很可能等于它。
Anthropic,又发生沿途严重的泄密事件。
在6月3日,传闻中才调过于刚劲而被「囚禁」的Mythos(里面代号Oceanus),被曝行将发布。

一般而言,发布前7天,AI公司会对红队东说念主员灵通,测试新模子。
但放只是几小时后,竟被里面「内鬼」暗暗打包,径直倒卖给了API代购做事商。
发现此过后,Anthropic经管层立即全面叫停红队测试。
关系词,纸包不住火。
同期,Mythos的天价账单和超高否认量,仍是在X上传遍了。
凭据各方音问:Mythos巨兽,粗略率在6月16日世界杯全球运动用品供应平台发布。

内鬼倒卖,红队至暗时刻
当先让咱们看一下,这场「泄密风暴」是若何回事。
事情源于Anthropic的Claude赞成者后台(Console)中,倏地暴露了一个从未见过的奥妙型号:claude-oceanus-v1-p。

凭据多位硅谷内线以及爆料博主的谍报,这个带有「-p(Preview/Previewprogram)」后缀的模子,恰是Anthropic正机要筹备发布的Mythos郑再版大模子的中枢查验点。
本来,这是一场践规踏矩的上线前红队测试。

可Anthropic万万没意象,高薪礼聘的红队测试员里,确实出了个「生意鬼才」。
这位「内鬼」在拿到claude-oceanus-v1-p的API看望权限后,第一时代不是在测漏洞,而是径直把这个通说念转手打包,高价转售给了某国的API代理做事商。

一些赞成者已而发现,某个奥妙渠说念里确实能跑出从未见过的Claude反映。
漏洞被堵得很快,但代价极高。
Anthropic发现API极端流量后,艰难暂停了统统这个词项策动红队测试,模子停用。
有东说念主示意:「通过外部代理进行转售会导致官方的矫枉过正。预测下一批红队测试东说念主员的限制会更小、截止更多、审查更慢……这会是善事吗?」

固然红队测试被艰难叫停,但Oceanus的各项「降维打击」般的参数,仍是被全寰宇看到了。
「否认量52Token/s+80好意思刀天价」
新模子凭什么这样贵?
在这场泄密风暴中,滚球app中国官网下载入口最显眼的,照旧Oceanus流出的价钱表和性能实测数据。

咱们径直来看被曝光的Mythos/Oceanus订价对比表:

最彰着的,等于Oceanus的每百万OutputToken,确实高达80好意思元!
这实在是现在市面上主流生意大模子价钱的3倍以上。
在各家大模子狂卷廉价的今天,Anthropic确实逆势掏出了一个「天价怪兽」。
甚而有圈内大V预测,改日若是OpenAI和Anthropic正面硬刚10T级别的终极磋磨模子,最坏的情况下,OpenAI的订价可能会飙到$100,而Anthropic甚而可能开出$150/百万Token的天地级高价!


直到2027年底英伟达VeraRubin架构显卡全面莳植,资本才可能降回粗鄙的$15。
但,贵有贵的意念念。
它输出收尾,让东说念主咫尺一亮:

只须5万token,ClaudeMythods复刻了macOS!

与崇高价钱相匹配的,是Oceanus展示出的恐怖否认量:实测速率高达每秒52个Token!

巨大的参数目(可能高达十万亿)下,还能保握52Token/s的狂飙速率,这意味着Anthropic在底层推理架构和算力优化上,粗略率已毕了大限制突破。

Oceanus,是Mythos的实足体
为什么这个模子代号叫「Oceanus」?为什么说它曾被「囚禁」?
这要回首到Anthropic里面一个绝密安全容貌——ProjectGlasswing。
在硅谷的传闻中,世界杯下单平台Oceanus的前身(Mythos早期预览版)在进行里面测试时,展现出可怕的破解零日漏洞才调。一朝透露,可能会对大家互联网基础设施形成不幸性打击。
因此,它被无尽期「囚禁」在断绝汇注会,只允许少量数签署了严苛守密条约的信贷伙伴构兵。
而此次透露的claude-oceanus-v1-p,恰是这头巨兽在经过多轮安全对王人后,试图戴着枷锁走出践诺室的「实足体升级版」。
透露数据太反常
Oceanus背后三大硬核手艺推演
52Token/s超高否认,这个数据看起来极其反常。Anthropic究竟是若何作念到的?
伙同他们此前发布的RL强化学习论文,咱们在这里进行了三大硬核手艺推演。
Oceanus能在后台狂飙12小时不坍塌,粗略率动了三处系统工程级的大手术。

推演一:System2慢念念考落地(MCTS+PRM架构)
传统的Claude或GPT在生成代码时,选拔的是「自回来」机制,即凭据前一个Token盲猜下一个Token。
这种情势下AI念念维是单向直线,Agent任务时长不时卡在几分钟。

很有可能,Oceanus透澈引入了访佛于AlphaGo的MCTS(蒙特卡洛树搜索)算法与PRM(进度奖励模子):
MCTS(树状检索):迎濒临一个复杂的软件工程任务时,模子不再径直输出代码,而是在后台生成成百上千条不同的解题「念念维分支」。
若是A决议跑了半小时发现是死巷子,它会主动回溯,砍掉这个分支,换B决议不绝跑。
PRM(进度奖励模子):传统的评估只看终末收尾对不合(ORM),而PRM会对AI念念考的每一步进行打分。
这等于为什么它的输出价钱飙到80好意思元的原因——你在前端看到它吐出了1个Token,它在后台其实仍是悄悄生成了100个Token用来作念旅途搜索和自我打分。
实质上,你是在为后台烧毁的「测试时规画」算力付费。

推演二:冲破物理截止的动态MoE与线性注释力
按照常理,模子念念考得越深、模子参数越大,反映速率应该越慢。
关系词Oceanus的参数目若是达到10万亿级。在如斯广泛的身躯下,它是若何砸出52Token/s的极高否认量的?

很可能Anthropic选拔了两项大刀阔斧的矫正。
动态拓扑的MoE(搀和大家模子)架构:粗鄙的MoE是固定激活Top-2大家,而Oceanus极有可能已毕了动态路由。
泛泛对话时只激活1%的子大家汇注,否认量狂飙;只须插足复杂的代码重构时,才会逐级叫醒深层的「高才略大家核」。
线性注释力机制:在12小时的超长任务中,代码量会拉得极长。圭臬Transformer架构的O(N^2)显存占用会激发KVCache瓶颈,径直导致显存爆炸或速率断崖式下落。
Oceanus势必会通了LinearAttention或访佛Mamba/SSM的搀和架构,保证了长文本景色下的否认速率不发生衰减。

推演三:内置REPL自主沙箱环境
素材中提到,Oceanus能让SWE-bench在两年内达到敷裕,这意味着它能全自主贬责GitHub真确开源容貌里的复杂Bug。
资深设施员都显然:写代码弗成只靠盲猜。代码无论多竣工,只须一跑编译,可能就因为一个第三方库的版块冲突径直挂掉。
因此,Oceanus里面粗略率集成了一个刚劲的REPL(读取-求值-输出轮回)自主沙箱环境。

它领有一个实足断绝的编造机或容器空间,能够自主拉取代码库、装配依赖、启动单位测试。
它的Debug历程是实足闭环的:写代码->启动->看报错日记->自动重写。
这个计算,跟玻璃翼筹算中知道的内容亦然相吻合的。
硅谷巅峰贤良打架
撞车GPT-5.6,谷歌Gemini迎来死活考
蓝本,Oceanus的守密责任作念得语焉概略。
但跟着此次内鬼事件,外界多量推测,Anthropic将加速门径,该模子的大家首秀极有可能定在6月16日独揽。
这一下,统统这个词硅谷的科技巨头们全部被逼到了墙角。
首当其冲的等于OpenAI。有音问称,OpenAI蓝本筹算在秋季(9月/10月)才祭出其基于十万亿参数的GPT-6或是传闻中的GPT-5.6。
如今Oceanus的提前登场,逼得OpenAI不得不接洽加速速率。
而压力最大的,莫过于刚刚发布不久的Gemini3.5Pro。
濒临Oceanus每秒52个Token的速率、12小时的超长续航以及降维打击般的软件工程才调,谷歌若是再拿不出点绝活,惟恐会在三巨头「死活大考」中被透澈旯旮化。
当AI的王人集自主责任时代从4分钟径直拉长到12小时,那些低级赞成和运维东说念主员,护城河正在赶紧隐藏。
6月16日,巨兽出笼。由Anthropic掀翻的海啸,很快就要来了。