Lhama Logol - 搜索 News

本项目主要支持基于TencentPretrain的LLaMa模型量化推理以及简单的微服务部署。也可以扩展至其他模型，持续更新中。特性 Int8推理支持bitsandbytes库的int8推理，相比tencentpretrain中的LM推理脚本，加入了Batch推理。优化推理逻辑在Multi-head Attention中加入了key和value的 ...

EDN电子技术设计9 小时

Nvidia Omniverse：物理人工智能后面的“软核心”

GPU的进步正深刻重塑着众多行业，英伟达凭借其技术创新不断拓展产业边界。继 CUDA 之后，Omniverse 极有可能成为 Nvidia 的下一代 “软核心”，在 3D 设计、模拟仿真、工业制造以及人工智能等领域掀起一场深刻变革。

腾讯网3 天

蓝戟锐炫B570 Photon 10GB评测：1949元超值主流显卡只减规格不减特性

1080乃至2K分辨率下，它都能以中高画质流畅运行，整体已经非常接近RTX 4060，而后者的价格要贵四五百元，尤其是160Bit的显存位宽让它在2K分辨率下同4060的差距反而更小了一些，而且对DirectX 12 ...

9 天

CES2025|一览NVIDIA在CES带来的重磅发布！

NVIDIA 创始人兼首席执行官黄仁勋在北京时间 1 月 7 日发表了 CES 开幕主题演讲，介绍了加速计算技术在 AI、机器人、游戏和自动驾驶领域取得的突破性进展。主题演讲展示了 NVIDIA 如何通过新产品、世界模型、工具和工作流推动 AI 变革 ...

腾讯网5 天

致态TiPro9000 2TB SSD评测：14GB/s满血PCIe 5.0的极致享受

其实PCIe 5.0接口早在2021年就随Intel的第12代酷睿进入消费级市场，但发布将近两年时间内都没有对应的可用产品，直到2023年初跳票多时使用群联E26主控的PCIe 5.0 ...

13 天

NVIDIA 推出面向 RTX AI PC 的 AI 基础模型

这些基础模型以 NVIDIA NIM™ 微服务的形式提供,由全新 GeForce RTX™ 50 系列 GPU 加速,提供*高可达 2375 AI TOPS 和 32GB 显存。基于 NVIDIA Blackwell 架构的 RTX 50 系列 GP ...

来自MSN6 天

我们现在距离实现真正的通用型人工智能还有几步?哪些方面要进一步 ...

官方似乎改问题了，那么原始答案可能就不完全适配了。个人观点：算法：更通用的颠覆型算法架构，能够支持很好的相对低成本 scale，现在堆叠成本限制了更多玩家入场，以及能够和更快提升知识密度，降低厂商独门配料的比重 ...

14 天

英伟达进军AI PC市场；AMD首次布局生命科学；特斯拉上新放狠话，雷 ...

本周（2025.1.6-1.12）硅谷科技要闻包括：特斯拉在华推出焕新版Model Y，起售价26.35万元；英伟达发布第一款台式电脑；AMD首次布局生命科学领域；ChatGPT参与策划拉斯维加斯Cybertruck爆炸案；马斯克向OpenAI发起 ...

来自MSN10 天

中国MoE一夜爆火！大模型新王暴打GPT-4o，训练成本仅600万美元

编辑：桃子好困【新智元导读】600万美金训出击败GPT-4o大模型，竟被中国团队实现了！今天，DeepSeek-V3在全网掀起巨大风暴，仅凭671B参数在数学代码性能上，堪比国外大模型Claude 3.5 Sonnet。一夜之间，来自中国的大模型刷屏全网。 DeepSeek-V3，一个拥有671B参数的MoE模型，吞吐量每秒高达60 ...

来自MSN16 天

2025开年第一弹，它们重写「AI眼镜」行业新标准

文/VR陀螺冉启行 2025年，AI大模型全面迈入第二产业阶段。从早期的基础数据采集、模型训练、多模态接入、高速扩张，大模型厂商，已然发展到亟需商业化落地、规模化变现，以形成良性可循环时期 ...

新浪网9 天

“地球是不是平的？”清华团队揭示GPT等大模型面对“认知冲突”的 ...

古希腊著名思想家亚里士多德（Aristotle）在《修辞学》中提出了三种说服策略：理性诉求（Logos）、人品 ... 图丨 Llama-3-8B 在自我纠正和拒绝纠正之间 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果