5月29日,江苏省“人工智能+医疗健康”系列主题沙龙活动在苏州举行。来自数坤科技、蚂蚁集团、讯飞医疗等40余家省内外AI医疗、医药企业,“人工智能+医疗健康”领域专家学者、省“人工智能+医疗健康”工作专班部分成员单位等共160余名嘉宾齐聚一堂,围绕医疗健康高质量数据集建设、搭建可信数据空间、医学领域AI模型训练等相关话题展开深入交流。
医疗健康高质量数据集建设:
不止是“集数据”,更是“炼数据”
“高质量数据集不是简单地把医疗数据收集在一起,而是经过清洗、整理、标注和治理之后,真正能够支撑人工智能模型训练与应用的数据资源。”北京大学软件工程国家工程研究中心研究员、国家重点研发计划项目首席科学家黄雨在沙龙上说到。他认为,真实准确、安全合规、专业标注是高质量数据集的价值之基,“数据质量往往决定了模型能走多远、用得多稳”。
然而,高质量数据集的建设并非一蹴而就。杭州医策科技有限公司CEO王晓梅将当前行业的痛点概括为三个“难”——难在标准、难在闭环、难在持续。她解释道,数据来自不同医院、不同设备、不同录入标准,一个典型的痛点就是数据“多而不精”,尤其是病理与影像数据标注不一致、缺乏“金标准”,直接影响AI产品的安全性与泛化能力。
真正高质量的数据集,不仅要“量大”,更要“质优”——包括标注的准确性、数据的完整性、场景的代表性,以及能够反映真实临床逻辑。王晓梅认为,构建高质量数据集的关键路径是建立“医—工—政”协同的共建共享机制,单靠企业或医院都难以走通。她希望通过本次沙龙能推动形成包括数据标注规范、隐私计算框架、质量评估体系在内的区域共识。
1343亿条数据筑牢底座
“红蓝绿”分级给数据上“安全锁”
苏州作为国家新一代人工智能创新发展试验区、国家生物医药技术创新中心。目前,苏州市拥有三甲医院17家,年诊疗人次突破1.1亿,集聚AI医疗企业超300家,积累了海量、多维、优质的医疗健康数据资源。去年3月启动运营的苏州健康医疗数智创新实验室,已归集临床诊疗、公共卫生等各类数据超1343亿条,高效融通医院临床、药企研发等多源异构数据,搭建起城市级健康医疗数据“资源池”。
数据要“活”起来,首先要“安全”地流通。苏州创新推行医疗健康数据“红蓝绿”分级分类分区管控体系:红区存放原始数据,严格访问管控;蓝区存放脱敏数据,仅限专网访问;绿区存放样本与仿真数据,支持互联网访问。苏州市卫生健康信息中心副主任王宝燕介绍,依托健康医疗行业可信数据空间,这一机制正推动高质量数据实现“安全合规、可管可用”,在保护隐私底线的前提下,释放数据要素价值。
从“集数据”到“用数据”
医院里的AI已经“跑”起来了
苏州大学附属第一医院信息处处长程思民介绍,该院正以骨科、血液科为重点,有序推进十余个高质量数据集建设,为临床科研与AI应用筑牢数据底座。
对普通患者而言,这些变化可能体现在更具体的细节里。通过高质量数据集训练的预问诊系统,患者预约挂号后即可在线完成精准预问诊,大幅减少门诊沟通成本,让医生更快抓住病情关键。未来,苏州市民实名认证后,还可通过个人端健康助手查看自己的健康画像,进行健康咨询、导诊和康复提醒。
江苏系统推进
力争2027年建成50个以上专病数据集
一场主题沙龙折射出江苏布局“人工智能+医疗健康”的坚定决心。江苏省卫生健康委主任、党组书记谭颖表示,省卫生健康委联合省发改委等7部门印发《关于推进江苏省“人工智能+医疗健康”发展实施方案》,今年以来进一步成立工作专班,组建创新实验室、创新联盟及专家组,开展卫生健康领域算力需求测算,扎实推进省医疗健康数据开放平台建设(目前已进入测试阶段),并配套制定了相关管理办法。同时,组织开展了行业可信数据空间建设,苏州市行业可信数据空间已进入试运行阶段;推动苏州、常州两市开展“三医”协同与跨部门数据共享省级试点;深化场景应用,推动全省统一的高水平居民健康助手、基层医疗卫生一体化信息系统等项目建设;遴选了80个“人工智能+医疗健康”应用场景典型案例,分批向全省推广。值得一提的是,经过努力,苏州市卫生健康领域数字化转型及东台市紧密型县域数智化医共体建设成效,获得了世界卫生组织认可,成为数字化赋能公平可及医疗卫生服务的典型样板。
据了解,江苏省已建成危急重症、造血干细胞等21个专病高质量数据集基础上,成功研发了13个专病专科垂类大模型。当前,正组织各牵头医院全力推进急性心梗、脑卒中等15个专病高质量数据集的建设,力争到2027年建成50个以上专病高质量数据集。
“数据是燃料,算力是引擎,算法是方向盘。”谭颖强调,高质量数据集是医疗健康人工智能发展的关键。而这场沙龙的意义,正在于搭建起医院、企业、科研机构与政府部门之间的桥梁,让卡点从“各说各话”变为“共同解题”。
据悉,此类主题沙龙还将在江苏全省各地有序举办,以沙龙聚合力、以平台促交流,进一步增进互动、深化合作、共享成果,推动“人工智能+医疗健康”发展迈上新台阶。