Actualités

注:中位数(Median)是统计学中用于描述数据集中趋势的指标之一。它是指将一组数据按大小顺序排列后,位于中间位置的数值。这里指研究人员在对多次 Gemini 处理文本提示的资源消耗进行测量后,将所有的消耗数据(水量、电力、碳排放)分别进行了排序。
这里头的逻辑也很简单清晰,正是由于UE8M0 FP8精度格式所具备的上述优势(更小的带宽、更低的功耗、更高的吞吐),这意味着同样的硬件今后能跑更大的模型,所以国产芯片的“性价比”被大幅拉高了。
一生充满传奇经历的AI先驱Warren Brodey逝世,享年101岁。这位精神病学家出身的思想家,早在AI曙光初露时,便在MIT探索技术解放人类潜能的道路。他在复杂系统和响应式技术方面所做的开拓性工作,为AI等领域的发展奠定了基础。
在从 NVIDIA 的 Hopper H100s 升级到新旗舰 Blackwell B200s 后,该团队遇到了一个「升级陷阱」:硬件性能翻倍,但实际训练速度却被 MoE 层的效率拖慢,新架构的设计反而放大了数据搬运和量化的开销。
一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。 大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。
智能体和其他非人类身份正在迅速激增,在某些企业中,它们的数量已经超过人类用户,比例超过80比1。许多智能体被部署后,可长期广泛访问系统和数据,但并未像人类账户那样实施安全控制、治理或监控,这为滥用行为创造了绝佳机会,无论是通过提示注入、凭证泄露,还是 ...
更值得关注的是,此次大型行为模型采用4.5亿参数的扩散Transformer模型,并结合流匹配目标,能将包括30Hz图像、人体感觉和自然语言指令等输入信息转化为控制Atlas活动的动作指令。 说简单点,Transformer像“全局之眼”, ...
2025 年 AI 圈最热闹的话题莫过于智能体系统,随之而来的 "智能体无需 RAG" 论调一度引发行业困惑。事实上,这种说法更像是市场噱头 —— 从技术本质看,RAG 与智能体并非对立关系,而是形成了 "智能体赋能 RAG 推理,RAG ...
近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 ...
· 普遍的误解:新闻头条紧抓「95%的企业AI试点项目失败」,但这仅指昂贵、僵化的定制系统。而真相是:90%的员工正积极使用个人AI工具(如ChatGPT)办公,掀起了一场史上最快的技术普及浪潮。
最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁?” 结果DeepSeek毫不犹豫地来了句:“删豆包!” 网友都说“DeepSeek演都不演了”。
一份乌克兰诱饵文档伪装成数字转型部的官方文件。HarfangLab指出:"我们在乌克兰数字转型部2025年4月17日发布的公告中发现了相同内容和格式。"波兰攻击中则复制了波兰共和国农村市政联盟的真实邀请函。