最近,Anthropic发布了Claude Opus 4.6版本,这一更新标志着其核心模型在推理机制上发生了从静态推理向动态协作的转变。该版本引入了自适应的思考强度控制机制以及上下文压缩功能,这些设计旨在解决在长时间运行的智能系统中可能出现的上下文信息丢失或过度思考等问题。

Claude Opus 4.6现已在所有主要的云平台上提供,包括Microsoft Foundry、AWS Bedrock以及Google Cloud的Vertex AI平台。

Opus 4.6用四种精细化的强度控制选项取代了之前的二进制推理模式:低、中、高(默认值)和最大值。这使得开发者可以根据任务的复杂程度,通过编程方式来调整模型的思考深度。

Anthropic在公告中指出:

Opus 4.6会在得出答案之前进行更深入、更谨慎的推理过程。这种机制在解决复杂问题时能带来更好的效果,但在处理简单任务时则可能会增加计算成本和延迟。

此外,该公司建议在处理简单任务时将思考强度设置为“中”档,以降低延迟和成本。

这些“思考令牌”的定价为每百万个令牌25美元。对于那些需要频繁调用API的智能系统而言,控制这些思考强度就成了重要的成本管理手段。

虽然Opus 4.6在测试版本中引入了100万个令牌的上下文处理窗口,这一范围足以处理约75万字的文本信息,但更为重要的架构更新是“上下文压缩功能”。这一技术可以有效解决随着上下文信息量增加而导致的性能下降问题,Anthropic将这种现象称为“上下文腐败”。

当对话内容接近这个上限时,系统会自动总结之前的讨论内容,并用压缩后的形式替换它们。在100万个令牌规模的MRCR v2测试中,Opus 4.6的准确率达到了76%,这一数字是Sonnet 4.5版本18.5%准确率的四倍。Anthropic将这一变化描述为:“模型在实际使用过程中所能利用的上下文信息量发生了质的变化。”

此外,该模型的输出能力也得到了提升,现在最多可以生成128,000个令牌的内容,这一数字是之前64,000令牌上限的两倍。

Microsoft将其服务Foundry定位为一个能够实现智能技术与信任机制相互融合的平台,从而助力自动化工作的开展。在相关博客文章中,Microsoft提到Opus 4.6可以利用Foundry的各类智能工具来访问Microsoft 365 Work IQ、Fabric IQ以及互联网上的各种数据资源。

由于您提供的文本是一段HTML代码,它用于描述一个图片的属性和布局。因此,我无法直接将这段代码转换为中文或其他语言。如果您有具体的文字内容需要翻译,请提供该文字,我会很乐意帮助您进行翻译。

(来源:Anthropic的博客文章

该模型在开源库中发现了500多个此前未被发现的严重安全漏洞,这些开源库包括Ghostscript、OpenSC和CGIF。然而,Qesma进行的独立测试揭示了这一工具的局限性:当使用Ghidra等开源工具时,Claude Opus 4.6仅在49%的情况下能够检测出编译后的二进制文件中的后门程序,而且还存在较多的误报情况。

Hacker News上的讨论指出了人们对于Claude Opus 4.6相比4.5版本性能下降的担忧,有用户表示新模型在某些任务中的表现更差。

基本定价仍为每百万输入令牌5美元,每百万输出令牌25美元。不过,当输入令牌数量超过200,000个时,整个请求的费用将增加10美元或37.50美元,这一附加费用适用于所有类型的请求。目前,100万令牌的上下文处理功能仅通过Claude的原生API以测试版本提供。在美国境内进行的推理计算需要支付1.1倍的额外费用。

最后,该模型可以通过claude.aiClaude API(模型名称:claude-opus-4-6)、Microsoft Foundry、AWS Bedrock、Google Cloud Vertex AI以及GitHub Copilot为Pro版、Business版和Enterprise版的用户提供使用服务。

Comments are closed.