您的当前位置:首页 >快瓜 >国内首个医疗专科推理信息集开源,蚂蚁百灵大模型助力行业落地 正文
时间:2025-07-12 05:06:11 来源:网络整理编辑:快瓜
12月28日,由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将有助于提升大模型在医疗领域的专业 上海大学实拍体验
12月28日,国内由信通院主办的医疗源蚂蚁百“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,专科助力蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理信息集,推理这将有助于提升大模型在医疗领域的信息行业专业性。 蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理信息集
在医疗行业,通用型语言模型在应对医疗问诊时,模型会直接给出答案,国内而医生则会根据专业知识进行反复的医疗源蚂蚁百症状探讨,才能给出答案。专科助力另外,推理大模型的信息行业幻觉问题和推理能力不足,当前高质量的集开中文医学专科信息集又较为稀缺,这对训练出色的灵大落地医疗领域大模型提出了挑战。
为克服这些难题,蚂蚁集团与上海仁济诊所泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例信息的西安学院实拍地址方式,推出了首个中文医疗专科问答推理信息集RJUA-QA,这也是业内首个临床专科信息集。
信息集由训练、验证、测试三部分组成,包含2132个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了97.6%以上的泌尿科就医人群,能真实复刻诊疗场景。信息集能提高大模型在医疗鉴别推理方面的能力,并作为在严肃可控场景下应用的评测基准。
顾进杰进一步介绍了蚂蚁百灵大模型在医疗领域的工艺进展。“专业性、可控性、轻量化是大模型工艺在医疗行业落地的三个关键挑战和机会。”顾进杰说道。
专业性上,由于医疗行业有超百个科室,每个专科和病症,都需要专业的调试。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎,进一步推动中国专业医疗信息集的构建与开放。
在可控性方面,百灵大模型结合知识图谱工艺,让大模型的每一个回答都有据可依。“生成内容可以满足不同诊所、不同科目的定制需求,包括风格与调性等”,顾进杰说。蚂蚁集团在超大规模图学习和知识图谱工艺长期积累,今年联合OpenKG发布的OpenSPG开源项目,重新定义了工业界的知识图谱语义架构,知识检索增强工艺也是大幅提升大模型正确性与可控性的关键课题。
医疗行业有信息隐私、专业知识和系统自主性的需求,考虑到机构的算力成本与便捷部署,百灵大模型还攻坚了轻量化工艺。在12月份开源的模型轻量化框架(PIA)中,集成了模型剪枝、压缩、量化、推理加速等全链路环节的优化,具备开箱即用、功能无损、低代码接入等优点,可在天级别完成10倍以上压缩比。
据雷峰网(公众号:雷峰网)了解,目前,蚂蚁百灵大模型在中英文的医疗考试以及基准测试达到或超过了GPT4水准,例如,在中文医疗LLM评测榜单promptCBLUE上,取得A榜第一,B榜第二的成绩;在国际医疗问答榜单PubMedQA中,以80.6%的准确率取得了前五的成绩,而且是前十中参数量最小的模型,更适合被机构部署和使用。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
四天六轮谈不拢?加沙停火谈判卡在这三件事2025-07-12 04:59
Hammerspace携手驿心科技,为中国打造超大规模AI存储解决方案2025-07-12 04:57
万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live2025-07-12 04:21
美食纪录片《味道大师》上线,八大基础口味皆是时代镜像2025-07-12 04:20
航拍洛杉矶一隧道坍塌致15人被困 塌方疑损毁通信线路与被困者断联2025-07-12 04:16
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?2025-07-12 04:14
共和报:曼城准备激活邓弗里斯2500万欧解约金2025-07-12 04:12
指数科技AFH技术打造AI生成硬件范式,做垂直领域“刚需”2025-07-12 04:08
Gair 大咖说:AI 的兴起是否意味着 Web3 的衰落?2025-07-12 04:02
魔法吉伊卡哇系列中国大陆线下首发,7月5日起登陆上海百联!2025-07-12 03:33
大模型落地,向量数据库能做什么?2025-07-12 05:05
重温!中国动画电影经典之作2025-07-12 05:00
三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少2025-07-12 04:16
受台风“丹娜丝”作用,福建江西部分旅客列车停运2025-07-12 04:09
第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕2025-07-12 03:55
斯坦福 AI 指数报告发布:2024年美国 AI 私人投资约为中国的 12 倍、GPT3.5 级别模型推理成本下降 280 倍2025-07-12 03:13
抖伽传媒聘请张绍飞担任首席健康形象官,共筑大健康赛道新生态2025-07-12 03:02
“歌游内蒙古”听乌兰图雅《摘朵马兰你就走吧》围着篝火 唱着想念2025-07-12 02:55
抖音辟谣:“花费9位数与周杰伦签约”为谣言2025-07-12 02:43
“歌游内蒙古”听乌兰图雅《摘朵马兰你就走吧》围着篝火 唱着想念2025-07-12 02:41