数据挖掘在医学大数据研究中的应用

2018-06-04

数据挖掘随着计算机技术得到了广泛应用ju111官网ju111官网ju111官网,从而提高了数据利用效率ju111官网,拓展了知识发现的广度与深度ju111官网ju111官网ju111官网。数据挖掘已有较多成熟方法ju111官网ju111官网,并在医学大数据挖掘中取得了一定成果ju111官网ju111官网。数据挖掘是指从数据库中ju111官网ju111官网,提取隐含在其中的人们事先未知、潜在的有用的信息和知识的过程ju111官网。目前ju111官网ju111官网,医院已积累了大量医疗相关数据。

数据挖掘在医学大数据研究中已取得了较多成果,通过文献检索,总结了三方面的应用现状ju111官网ju111官网ju111官网。

疾病早期预警医疗领域往往需要更精确的实时预警工具ju111官网,而基于数据挖掘的疾病早期预警模型的建立,有助于提高疾病的早期诊断ju111官网ju111官网ju111官网、预警和监护ju111官网ju111官网,同时,也有利于医疗机构采取预防和控制措施,减少疾病恶化及并发症的发生。

疾病早期预警ju111官网ju111官网,首先要收集与疾病相关的指标数据或危险因素ju111官网ju111官网,然后建立模型,从而发现隐含在数据之中的发病机制和病情之间的联系ju111官网ju111官网。Forkan等采集日常监测的心率、舒张压ju111官网ju111官网、收缩压、平均血压ju111官网、呼吸率、血氧饱和度等生命体征数据,以J48决策树、随机森林树及序列最小优化算法等建立疾病预警模型ju111官网,用于远程家庭监测ju111官网,识别未曾诊断过的疾病发生,并将监测结果发送到医疗急救机构ju111官网,实现生命体征大数据、病人及医疗机构的完整衔接,以降低突发疾病及死亡的发生率。Easton等利用贝叶斯分类算法建立了中风后遗症死亡预测模型ju111官网ju111官网,认为中风后遗症死亡概率与中风发生后的时间长短成函数关系ju111官网,有助于中风后遗症患者的后续监护ju111官网。Tayefi等基于决策树算法建立了冠心病预测模型ju111官网,该模型发现hs-CRP作为新的冠心病预测标志物,比传统的标志物(如FBG、LDL)更具特异性ju111官网ju111官网。

慢性病研究糖尿病ju111官网ju111官网、高血压ju111官网ju111官网ju111官网、心血管疾病等慢性病正在影响着人们的健康ju111官网,识别慢性病危险因素并建立预警模型有助于降低慢性疾病并发症的发生。Alagugowr等建立的心脏病预警系统,从心脏病大数据库中提取特征指标ju111官网,通过K-means聚类算法识别出心脏病危险因素ju111官网,又以Apriori算法挖掘高频危险因素与心脏病危险等级之间的关联规则ju111官网。Ilayaraja等则以高频项集寻找心脏病危险因素并识别病人风险程度,该方法能够回避无意义项集的产生ju111官网,从而解决了以往研究中项集数量多ju111官网ju111官网、所需存储空间大等问题ju111官网ju111官网。CH Jen等对慢性疾病并发症风险识别的研究分三个步骤ju111官网ju111官网,首先,选择健康人群体检数据和慢性病患者相关疾病数据ju111官网ju111官网ju111官网ju111官网,以带有序列前项选择的线性判别分析来寻找相关疾病的特征变量;然后ju111官网ju111官网,以K-NN对特征变量进行分类处理;最后ju111官网ju111官网,将K-NN算法的分类结果应用于慢性疾病预警模型的建立ju111官网。Aljumah等先后以回归分析和SVM用于预测和判断糖尿病不同治疗方式与不同年龄组之间的最佳匹配,为患者选择最佳治疗方式提供依据ju111官网ju111官网。Perveen等对糖尿病的预测研究,采用患者人口学数据和临床指标数据ju111官网ju111官网,并分别用Adaboost集成算法ju111官网、Bagging算法及决策树三种算法来建立预测模型ju111官网,认为Adaboost集成算法的精确性更高ju111官网。

辅助医学诊断医学数据不仅体量大,而且错综复杂ju111官网ju111官网、相互关联ju111官网。对大量医学数据的分析ju111官网,挖掘出有价值的诊断规则ju111官网ju111官网ju111官网,将对疾病诊断提供参考。Yang等基于决策树算法和Apriori算法ju111官网,对肺癌病理报告与临床信息之间的关联性进行了研究,为肺癌病理分期诊断提供依据,从而可回避诊断中需要手术方法获取病理组织ju111官网。Becerra-Garcia等应用SVMju111官网ju111官网、K-NN和CART三种算法对眼球电图进行信号预处理、脉冲检测和脉冲分类ju111官网,为研究临床眼球电图检查中非自发扫视眼球运动的识别提供依据ju111官网ju111官网。彭玉兰等对某医院5年的乳腺超声数据进行了关联规则挖掘,建立乳腺病理诊断与超声诊断之间的关联规则ju111官网ju111官网,并开发了乳腺超声数据库数据检索系统ju111官网,便于医生快速获得超声诊断和病理诊断的各种诊断信息和病例信息ju111官网。

医学大数据挖掘已呈现广阔的发展前景和巨大的应用价值ju111官网,将为疾病研究、临床及管理决策ju111官网ju111官网、医疗服务个性化及图像识别等众多领域带来更多支持ju111官网。麦肯锡在其报告中指出ju111官网ju111官网,大数据分析可以帮助美国医疗服务业一年创造3000亿美元的附加价值,而美国医疗协会也称,改善医疗卫生事业的关键在于大数据。

目前ju111官网,医院大数据中心、区域性卫生信息平台、国家医疗大数据中心的建立以及卫生信息互联互通标准和共享规范的制定ju111官网,为数据存储和共享、推动医学大数据的应用提供了更多支撑ju111官网。未来ju111官网,医学大数据挖掘将不断更新,探索新的研究领域ju111官网ju111官网ju111官网ju111官网,推动研究成果转化。

朗锐慧康(www.z0441.com)认为,医学大数据与数据挖掘的结合ju111官网ju111官网,能够帮助人们从存储的大体量ju111官网ju111官网、高复杂的医学数据中提取有价值信息ju111官网ju111官网,加速医学成果转化ju111官网,为医疗行业开拓一个新的时代。

ju111官网