第64章 陈风被退学与花瑶的医疗与ai结合(2/2)
花瑶指着电脑屏幕上一堆di格式的ct影像文件,
愁眉苦脸地对林寻和张宇说,
“这些影像数据包含了海量的信息,比如像素值、灰度、纹理特征……
哪些是对诊断有意义的?哪些是噪声?
我完全不知道该如何筛选和量化。
而且,医生看片时会结合临床经验进行主观判断,
这种‘经验’怎么教给计算机?”
她又调出另一个文档:
“还有这些临床数据,
有的是数值型(比如年龄),
有的是分类型(比如是否吸烟),
还有的是文本描述(比如症状)。
不同类型的数据如何标准化,
如何融合到一个模型里,
也是个大难题。
我试了几种特征工程的方法,效果都不理想。”
张宇凑过去看了看代码:
“你用的是传统的特征提取方法?
对于医学影像这种高维数据,
可能需要用深度学习,
比如卷积神经网络n)来自主学习特征。”
“n需要大量标注好的数据进行训练,”
花瑶无奈道,
“我们医院的ct数据倒是不少,
但患者隐私保护很严格,
获取标注数据的流程非常繁琐。
而且,我对深度学习框架也不太熟悉……”
看着花瑶有些沮丧的样子,林寻拍了拍她的肩膀:
“别灰心。跨学科研究就是这样,会遇到各种意想不到的困难。
我们一起想办法。”
三人围坐在电脑前,开始了热烈的讨论。
张宇从计算机角度建议:
“数据标注的问题,可以先考虑用公开的数据集,
比如lidc-idri(肺结节影像数据库),
虽然规模有限,但可以用来初步验证模型的可行。
等模型框架稳定了,再想办法申请医院的数据授权。
至于深度学习框架,
我可以教你用tensorflow或者pytorch,
入门很快的。”
林寻则结合ai启明的能力补充道:
“启明的图像识别模块经过优化,对医学影像的特征捕捉可能有帮助。
我们可以尝试用迁移学习的方法,
先在通用图像数据集上预训练模型,
再用医学影像数据进行微调。”
花瑶眼睛一亮:
“对了!我可以请教我们医院的放射科王主任,
他是阅片专家,让他指导我们哪些影像特征是诊断的关键,
这样就能在模型设计时加入医学先验知识,减少盲目性!”
思路逐渐清晰,花瑶脸上的愁云也散去了。她感激地看着林寻和张宇:
“太好了!有你们帮忙,我感觉信心十足!”
“我们是一个团队嘛!”
张宇笑道,
“你的医学知识是核心,我的计算机技术是工具,
林寻的ai启明是加速器,
三者结合,没有解决不了的问题!”
林寻点点头,眼中闪烁着智慧的光芒:
“我们可以先搭建一个最小可行模型(mvp)。
花瑶,你负责整理和初步清洗临床数据,并联系医院专家获取专业指导;
张宇,你负责搭建深度学习模型的框架,选择合适的网络结构;
我让ai启明辅助进行影像数据的预处理和特征初步筛选。
我们每周碰一次头,同步进展,解决问题。”
窗外夜色渐浓,实验室的灯光却格外明亮。
花瑶看着身边这两个并肩作战的伙伴,心中充满了温暖和力量。
一个融合医学与人工智能的创新种子,
已在这片协作的土壤中,悄然生根发芽。