页。
“整体思路很好,结构清晰。”他先肯定,然后话锋一转,“但这个93.5%的准确率数据,我有疑问。
他指着图表上的一个数据点:“这是基于哪个数据集测的?”
"COCO-Medical,公开数据集里质量最高的之一。”兰芊翊解释道,“我对比了五篇顶会论文,这个数据是平均值。”
苏宁微微蹙眉,兰芊翊注意到这是他思考时的习惯表情。
“公开数据集和医院实际数据差异很大。COCO-Medical的数据经过严格清洗和标注,但医院实际数据噪声大,标注不一致。同样的算法,在公开数据集上准确率能到95%,在实际医院数据上可能只有80%出头。”
兰芊翊一愣,这个角度她确实没考虑到。
“我查过几篇临床验证研究。”苏宁调出自己的笔记,“比如这篇今年二月发表在《Radiology》上的文章,同一个肺结节检测AI,在公开数据集上灵敏度97.2%,但在三家医院的实际临床数据上,灵敏度分别只有89.1%、8
5.7% 82.3%, "
他把屏幕转向兰芊翊,密密麻麻的文献笔记,标注着重点和数据对比。
“这个差距会影响商业化前景。”苏宁继续说,“如果只宣传公开数据集上的高准确率,医院采购后发现实际效果打折,会产生信任危机。我们应该区分理想场景性能’和“实际场景性能。”
兰芊翊脸有些发烫,这是她疏忽了。
太依赖学术论文数据,忽略了临床落地的复杂性。
“对不起,我重新做这部分分析。”她诚恳地说。
“不用道歉。”苏宁语气平静,“研究本来就是不断迭代的过程。我们一起把这块补上。”
“我联系了复旦医学院的一个师兄,可以拿到一些脱敏的实际医院数据做对比分析。大概明天能拿到。”
兰芊翊惊讶地看着他:“你什么时候联系的?”
“前天晚上,看到你初步框架时就想到了这个可能性。”苏宁说得轻描淡写,“刚好他最近在做类似的研究,数据可以共享。”
这一刻,兰芊翊心里涌起一种复杂的感受。
这个搭档,不仅能在她出错时指出问题,还能提前准备好解决方案。
不是指责,而是建设性的帮助。
太可靠了。
“谢谢。”她由衷地说道。
“互相补位而已。”苏宁关掉文档,“接下来我们分一下工:你继续完善技术发展脉络这部分,我负责临床数据对比分析。周五前合稿,怎么样?”
“好。”
随着合作的深入,兰芊翊开始不自觉地在工作中观察苏宁。
发现苏宁对数据有种近乎偏执的严谨。
每个数字都要追溯原始来源,每个结论都要有至少两个独立信源的佐证。
有一次,为了确认某省医疗AI采购政策的出台时间,他打了三个电话,查了政府网站、新闻报道和行业内部通讯,最后精确到年月日。
发现苏宁虽然年轻,但看问题的角度常常很“老道”。
周四讨论商业模式时,兰芊翊提出了一个基于订阅费的收入模型,计算出的市场规模相当可观。
“理论上可行。”苏宁看完后说,“但忽略了几个实际约束。”
“什么约束?”
“第一,医保支付问题。目前大部分AI辅助诊断项目不在医保报销范围内,患者自费意愿有限。第二,医院采购流程。公立医院采购需要招标,周期长,决策链条复杂。第三,医生培训成本。AI工具需要医生花时间学习,这
个成本谁承担?第四,责任界定。如果AI漏诊,责任是医生,医院还是厂商?”
他一口气说完,兰芊翊愣住了,这些都是她没考虑到的。
“那......你有什么建议?”她虚心问。
“分阶段推进。”苏宁在白板上画起来,“第一阶段,以科研合作形式进入医院,积累临床证据。第二阶段,申请医疗器械注册证,进入部分试点医院的采购目录。第三阶段,推动进入医保,实现规模化。每个阶段的商业模式
都不同。”
他边画边讲,逻辑清晰得像一份完整的商业计划书。
兰芊翊听着,突然好奇他过去的经历………………
这种对产业落地的深刻理解,不像一个普通实习生该有的。
但她没问,工作场合,不合适。
周五晚上,为了赶进度,两人加班到九点。
报告主体部分基本完成,还差最后的总结和建议。
兰芊翊揉了揉太阳穴,感觉有些疲惫。
“今天就到这吧!明天再继续。”她说。

