您的当前位置:首页 >事秀

  • 谁将替代 Transformer?谁将替代 Transformer?

    【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...

    时间:2025-07-12 15:23
  • RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理

    清华和上交的最新论文中,上演了一场“学术打假”的戏码。文中研究者们对当前“纯 RL 有利于提升模型推理能力”的主流观点提出了相反的意见。通过一系列实验,他们证明引入强化学习的模型在某些任务中的表现,竟 ...

    时间:2025-07-12 14:58
  • Anthropic AI 最新研究成果发布:揭示大模型中的注意力回路Anthropic AI 最新研究成果发布:揭示大模型中的注意力回路

    语言模型怎么“知道”乔丹是篮球运动员的?近日,Anthropic通过构建归因图呈现了语言模型处理这一问题时的底层机制。由下图可以看到,对于"Fact: Michael Jordan play ...

    时间:2025-07-12 14:52
  • 重温!中国动画电影经典之作重温!中国动画电影经典之作

    来源标题:重温!中国动画电影经典之作综合频道CCTV-1)动画电影展播将在暑期《第一动画乐园》集中推出中国动画电影的经典之作,它们承载着几代人的童年回忆和对未来的梦想,也鼓舞着几代人在成长中砥砺前行。 ...

    时间:2025-07-12 14:30
  • 大模型时代的三道鸿沟:数据、成本与想象力大模型时代的三道鸿沟:数据、成本与想象力

    跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融 ...

    时间:2025-07-12 14:29
  • 三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少

    近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验:提供相同的提示词,让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSee ...

    时间:2025-07-12 14:27
  • OceanBase一体化架构再升级,业内首发“共享存储”产品OceanBase一体化架构再升级,业内首发“共享存储”产品

    5月17日,OceanBase在第三届开发者大会宣布一体化架构再升级,全新推出“共享存储”产品。该产品开创性实现对象存储与事务型数据库TP)的深度集成,创新构建存算一体与分离的多云原生架构,不仅大幅提 ...

    时间:2025-07-12 14:18
  • 国产 AI Infra 变革进行时:新势力正在崛起国产 AI Infra 变革进行时:新势力正在崛起

    作者丨朱可轩编辑丨陈彩娴近日,“源神”Deepseek 密集开源了一系列代码库,包括FlashMLA、DeepEP、DeepGEMM、DualPipe 等项目及 3FS 系统,几乎实现了对 AI In ...

    时间:2025-07-12 13:40
  • 中方敦促也门胡塞武装维护红海水域航道保障中方敦促也门胡塞武装维护红海水域航道保障

    来源:财联社财联社7月10日电,据新华社报道,中国常驻联合国副代表耿爽9日在安理会也门问题公开会上发言,敦促也门胡塞武装维护红海水域航道保障。耿爽说,中方对日前两艘货轮在红海水域遭遇武装袭击深表关切, ...

    时间:2025-07-12 13:38
  • 全国首个官方Cosplay大赛——上海市民文化节妆造大赛启动全国首个官方Cosplay大赛——上海市民文化节妆造大赛启动

    来源标题:全国首个官方Cosplay大赛——上海市民文化节妆造大赛启动在首个国际动漫月期间,全国首个官方Cosplay大赛——上海市民文化节妆造大赛在第二十届中国国际动漫游戏博 ...

    时间:2025-07-12 13:27