Anthropic AI 最新研究成果发布：揭示大模型中的注意力回路-聚焦爆料汇- 揭开文化视角，发现独家生活

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
时间：2025-07-16 16:58
人大 Sora 思辩：Sora 到底懂不懂物理世界？
Sora 发布至今，虽然仍未正式对外开放，但对其技术细节、切实影响的讨论从未停歇。讨论的背后，是为了探索人工智能的更本质问题。对旧有视觉生成思路的检验和校正，是 Sora 带来的直观影响。在此基础上， ...
时间：2025-07-16 16:53
上海AI实验室开源发布高质量语料“万卷CC”
近日，上海人工智能实验室上海AI实验室）发布新一代高质量大模型预训练语料“万卷CC”WanJuan-CC），首批开源的语料覆盖过去十年互联网上的公开内容，包含1千亿字符100Btoken），约400G ...
时间：2025-07-16 16:50
刚刚，云天励飞上市！
ChatGPT的横空出世，重燃了人工智能赛道的火，一边是狂热投资者纷涌而至，一边是大国博弈下，国家战略层面的高度关注。最近，云天励飞CEO陈宁博士忙得不可开交，前脚接待了省级领导，后脚又赶去接待科技部 ...
时间：2025-07-16 16:09
女子孕前期长时间休假，“副处老公”扮演什么角色
撰稿/新京报评论员马小龙编辑/迟道华校对/王心据九派新闻报道，近日，有网友在社交平台发文称，其在小县城的文旅局工作，现已怀孕20周，孕早期请假2个月，之后也有一段时间在家没有上班，老公是市里副处领 ...
时间：2025-07-16 16:00
阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
时间：2025-07-16 15:59
被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前，马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看，Grok-1 超越了 70B 的 LLaMA 2，是当前开源模型中最 ...
时间：2025-07-16 15:36
用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑
作者：赖文昕编辑：郭思、陈彩娴说起扩散模型生成的东西，你会立刻想到什么？是OpenAI的经典牛油果椅子？是英伟达Magic3D生成的蓝色箭毒蛙？还是斯坦福大学和微软Folding Diffusion生 ...
时间：2025-07-16 15:30
大模型时代的三道鸿沟：数据、成本与想象力
跨入2023年，大模型兴起、诸多公司「跑步进场」的头几个月，大模型一边倒向 C 端类 ChatGPT 的研发，对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月，情况发生了变化。基于医疗、金融 ...
时间：2025-07-16 15:00
对话零一万物：大模型产品要找到 TC
【雷峰网(公众号：雷峰网)】近日，大模型独角兽零一万物又开发布会了！上次零一万物以下简称“零一”）开发布会还是在 2023 年 11 月，宣布成立后的模型首秀：发布中英双语大模型“Yi”，并将其开源。 ...
时间：2025-07-16 14:58

1 2 3 4 5 6 7 8 9 10

推荐

热门