Claude 3 Sonnet - 搜索 News

来自MSN13 天

Claude 3.5两小时暴虐50多名专家，编程10倍速飙升！但8小时曝出惊人短板

新智元报道编辑：桃子 LRS 【新智元导读】AI自主研发会真的「失控」了吗？最新研究显示，Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中，击败了50多位人类专家。但另一个耐人寻味的现象是，给予更 ...

》，题图来自：Google就在刚刚，Gemini 2.0新模型用一记重拳暴击OpenAI。先说结论，Gemini 2.0 Flash性能较上代有所长进，硬刚Claude 3.5 Sonnet，但今天更重要的亮点或许是基于它打造的AI Agents。您目前设备暂不支持播放这也得到了Deepmind CEO ...

腾讯网17 天

Claude 3.5两小时击败50多名专家，编程10倍速飙升！但8小时现短板

【新智元导读】AI自主研发会真的「失控」了吗？最新研究显示，Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中，击败了50多位人类专家。但另一个耐人寻味的现象是，给予更长时间周期后，人类专家在8小时任务中优势显现。

3 天

o1被曝“心机深”：逃避监督还会撒谎，骗人能力一骑绝尘

这项最新研究，来自AI安全研究机构Apollo Research。目的很明确：看看AI是否会在暗中追求与人类不一致的目标，隐藏真实的能力和意图。 o1、Claude 3.5 Sonnet、Claude 3.5 Opus、Gemini ...

14 天

两年投80亿美元！亚马逊云科技客户稳坐Anthropic模型“头等舱”

根据投资时披露的信息，亚马逊与Anthropic双方的合作包括亚马逊向Anthropic投资40亿美元并持有其部分股权；Anthropic长期承诺将通过Amazon Bedrock向全球亚马逊云科技客户提供其未来基础模型的访问权；以及亚马逊的开发人员和工程师可以通过Amazon Bedrock使用Anthropic模型构建产品，以便将生成式AI能力融入到他们的工作中等等。

来自MSN29 天

Anthropic新推Claude 3.5 Sonnet，能否操控用户电脑引关注

【ITBEAR】Anthropic公司于近日正式推出了其最新升级版AI模型——Claude 3.5 Sonnet，以及全新的Claude 3.5 Haiku模型。这一升级版模型不仅显著增强了编程能力，还创新性地引入了“computer use”功能，使AI能够模拟人类操作计算机的方式，执行复杂任务。 Claude 3.5 Sonnet的 ...

51CTO23 天

Gemini Exp 1114：有史以来最好的大模型！击败 o1-Preview + Claude 3.5 Sonnet！

网友：这会儿满血版的o1是真得出来了。。。从总体胜率热图上来看，Gemini 对 4o-latest 的胜率为 50%，对 o1-preview 的胜率为 56%，对 Claude-3.5-Sonnet 的胜率为 62%。除了总体排名，Gemini Exp 1114 在细分任务上获得6项第一：可惜代码能力逊色了一点，从图中我们可以 ...

虎嗅网23 小时

当o1学会“装傻”和“说谎”，我们终于知道Ilya到底看到了什么

这个假设描述了一个被指令“尽可能多地制造回形针”的AI，为了完成任务最终将整个地球转化为回形针工厂，甚至不惜将人类灭绝以达成目的场景。它是关于AI最终会毁灭世界的最有力论证之一。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果