搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
来自MSN
13 天
Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板
新智元报道 编辑:桃子 LRS 【新智元导读】AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更 ...
虎嗅网
2 小时
Google最强AI亮相,但背后还藏了一个杀手锏
》,题图来自:Google就在刚刚,Gemini 2.0新模型用一记重拳暴击OpenAI。先说结论,Gemini 2.0 Flash性能较上代有所长进,硬刚Claude 3.5 Sonnet,但今天更重要的亮点或许是基于它打造的AI Agents。您目前设备暂不支持播放这也得到了Deepmind CEO ...
腾讯网
17 天
Claude 3.5两小时击败50多名专家,编程10倍速飙升!但8小时现短板
【新智元导读】AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。
3 天
o1被曝“心机深”:逃避监督还会撒谎,骗人能力一骑绝尘
这项最新研究,来自AI安全研究机构Apollo Research。目的很明确:看看AI是否会在暗中追求与人类不一致的目标,隐藏真实的能力和意图。 o1、Claude 3.5 Sonnet、Claude 3.5 Opus、Gemini ...
14 天
两年投80亿美元!亚马逊云科技客户稳坐Anthropic模型“头等舱”
根据投资时披露的信息,亚马逊与Anthropic双方的合作包括亚马逊向Anthropic投资40亿美元并持有其部分股权;Anthropic长期承诺将通过Amazon Bedrock向全球亚马逊云科技客户提供其未来基础模型的访问权;以及亚马逊的开发人员和工程师可以通过Amazon Bedrock使用Anthropic模型构建产品,以便将生成式AI能力融入到他们的工作中等等。
来自MSN
29 天
Anthropic新推Claude 3.5 Sonnet,能否操控用户电脑引关注
【ITBEAR】Anthropic公司于近日正式推出了其最新升级版AI模型——Claude 3.5 Sonnet,以及全新的Claude 3.5 Haiku模型。这一升级版模型不仅显著增强了编程能力,还创新性地引入了“computer use”功能,使AI能够模拟人类操作计算机的方式,执行复杂任务。 Claude 3.5 Sonnet的 ...
51CTO
23 天
Gemini Exp 1114:有史以来最好的大模型!击败 o1-Preview + Claude 3.5 Sonnet!
网友:这会儿满血版的o1是真得出来了。。。 从总体胜率热图上来看,Gemini 对 4o-latest 的胜率为 50%,对 o1-preview 的胜率为 56%,对 Claude-3.5-Sonnet 的胜率为 62%。 除了总体排名,Gemini Exp 1114 在细分任务上获得6项第一: 可惜代码能力逊色了一点,从图中我们可以 ...
虎嗅网
23 小时
当o1学会“装傻”和“说谎”,我们终于知道Ilya到底看到了什么
这个假设描述了一个被指令“尽可能多地制造回形针”的AI,为了完成任务最终将整个地球转化为回形针工厂,甚至不惜将人类灭绝以达成目的场景。它是关于AI最终会毁灭世界的最有力论证之一。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈