第29卷第1期 201】 年01月 佳木斯大学学报(自然科学版) Journal of Jiamusi University(Natural Science Edition) Vo1.29 No.1 Jan. 2011 文章编号:1008—1402(2011)O1—0044—03 基于数据挖掘的健康计划管理系统设计① 富春岩,葛茂松, 富野 (佳木斯大学公共计算机教研部,黑龙江佳木斯154007) 摘要: 针对个人基本信息和体检结果,开发一套疾病预防与监测,提供个人健康计划,发现医 学健康知识的管理系统.该系统可将体检的信息以数据的形式存储到数据仓库中,在需要时将用 户的历史数据传榆、汇总,方便地得到个人健康状况的信息及饮食=、起居、医疗等情况的建议.通 过数据挖掘模块可对存储在数据仓库中的海量数据进行挖掘,得到相关于生活习惯和健康状况 与疾病发生发展的趋势等重要知识. 关键词: 健康管理;健康计划;数据挖掘 中图分类号:TP393 文献标识码:A 健康管理作为一门学科及行业是最近二三十 年兴起的,如同其他行业的兴起一样,健康管理行 业的兴起也是顺应市场的需求,特别是由于人的寿 命延长和慢性疾病发生的增加,造成的医疗费用大 理、健康信息审核和数据挖掘分析利用等. 2)个人用户:负责个人信息的注册、个人信息 管理、个人体检信息管理、个人健康计划管理和个 人信息的统计分析等. 3)单位用户:负责团体用户的注册、团体信息 幅度持续上升,寻求控制医疗费用并保证个人健康 利益的需求推动了健康管理行业的发展. 基于数据挖掘的健康计划管理系统,通过采集 和管理个人或群体的健康信息,评估个人或群体的 健康和疾病危险性,制定个人或群体的健康促进计 划,挖掘医学和健康领域有用的知识. 管理、团体体检信息管理、团体健康计划管理以及 团体数据的统计分析等. 2系统总体设计 健康计划管理系统包括从个人基本信息、健康 1 UML系统用例图 UML是一个通用的标准建模语言,可以对任 信息到健康计划的所有信息,涵盖了生成健康计划 和健康数据分析挖掘的一系列操作过程,具体功能 可分为:基本信息管理、个人健康信息管理、体检信 息管理、健康计划管理、统计分析和数据挖掘几个 模块,如图2所示. 2.1基本信息管理 何具有静态结构和动态行为的系统进行建模.UML 适用于系统开发过程中从需求规格描述到系统完 成后测试的不同阶段.在需求分析阶段,以用例来 捕获用户需求.通过用例建模,描述对系统感兴趣 的外部角色及其对系统(用例)的功能要求…. 本系统通过的客户需求分析,描述了健康计划 管理系统的角色及角色分类,绘制了详细的系统用 包括系统所涉及到的疾病,饮食,运动相关信 息,医院,地区信息等.其中疾病信息是按国际标准 分类ICD10进行分类,规范了诊断和分析的一致 例图,给代码的编写提供了清晰的对象和关系. 系统用例图如图1所示: 从图中可以得知,健康计划管理系统的角色主 要有3类: 1)管理员:负责系统用户管理、基本信息管 ①性,提供了与I艋床全面吻合的接口标准 . 2.2个人健康信息管理 主要包括个人的基本资料,包括卡号、病历号、 公费医疗编号、身份证号码、姓名、性别、出生日期、 收稿日期:2010—11—03 基金项目:佳木斯大学2009科学技术研究项目(I2009—130). 作者简介:富春岩(1974一),女,黑龙江佳木斯人,佳木斯大学公共计算机教研部副教授 第l期 富春岩,等:基于数据挖掘的健康计划管理系统设计 45 族病史、霎 生活习惯等与健康相关的生活方式等基本 2.3体检信息管理一………一 健康信息 . 图1健康计划管理系统用例图 体检信息管理包括个人的体检信息和就医记 录.体检信息主要包括体检日期、身高体重、血压、 心率、脉搏、既往病史、家族病史等内科体检项目, 还包括吸烟、饮酒、运动、饮食等个人生活习惯,还 有血糖、血脂、肌酐、胆红素、尿酸、尿素等血生化项 目,并对各检查项目的检查结果进行分析,提供数 值变化曲线,直观地反映用户的病情发展情况u4 J. 过各种疾病、健康和亚健康模型,分析判断评估个 人现在的健康状况,根据个人的不同饮食、运动等 生活习惯,制定出权威、切实可行的健康计划,从遗 传、生活习惯、饮食、生活环境、职业行为等方面出 发,对身体状况进行预测跟踪、对疾病早期预警,并 进行全方位地健康干预,使人们通过健康计划可以 全面了解自身健康状态,按照健康计划改善生活方 式,提高健康生活水平. 健康计划的生成过程又是健康计划管理模块 的重中之重,健康计划生成的依据都是国际通用的 健康或疾病分析模型,如中国高血压管理标准,糖 尿病国际分型模型,肥胖、冠心病、中风、肿瘤等评 估标准. 健康评估是健康管理服务中重要的一环,即通 过收集与跟踪反映个人身体健康状况的各种信息, 利用预测模型来确定参加者目前的健康状况及发 展趋势,使参加者能了解自身是否有发生某种慢性 病的危险性,以及和其他人相比,危险性的大 小 J。并根据疾病评估结果,针对健康危险因素为 个人提供保持和改善健康的方法.包括帮助降低个 图2健康管理系统模块图 人患慢性病的危险性,维持与个体年龄一致的良好 状态,使其能健康幸福地生活. 2.5统计分析模块 2.4健康计划管理 健康计划管理模块是整个系统的核心,也是功 能实现的重点之一.此模块的功能是把用户通过体 检信息管理录人或导人的信息,进行加工整理,通 可针对个人、单位和行业,提供不同类型的统 计分析功能.个人用户可以通过统计分析了解个人 46 佳木斯大学学报(自然科学版) 务数 J. 根据该公式,可产生关联规则如下: 2011年 既往健康状况,对比以往健康信息,给出个人健康 发展图文说明,有助于个人对自己健康状况的进一 步了解. 2.6数据挖掘模块 1)对于每个频繁项集I,产生I的所有非空子 集. 2)对于I的每个非空子集S,如果≥min— conf,则输出规则“S(I—S)”.其中,min—conf是 健康计划管理系统提供的大量个人健康信息, 形成一个数据仓库,通过数据挖掘模块对存储在数 据仓库中的海量数据进行挖掘,得到相关于生活习 惯和健康状况与疾病发生发展的趋势等重要知识. 最小置信度阈值. 在本系统中通过数据挖掘,发现高盐饮食和肥 3 数据挖掘 本系统主要以关联分析为主,对疾病、健康和 胖导致高血压的置信度达到84.31%,这个强规则 说明高盐饮食及肥胖是高血压病的重要因素之一. 另外,还发现高盐饮食的高血压患者导致肥胖的置 信度也很高. 生活习惯信息进行关联分析,通过关联分析发现描 述数据中强关联特征的模式,挖掘出疾病或健康与 某种生活方式的关联特征.采用了基于Apriori的关 联规则算法,即通过对事务数据库频繁项集的产生, 以得到满足最小支持度和最小置信度的关联规则. 关联规则挖掘过程主要包含2个阶段: 4结论 使用本系统,可以根据多次体检结果,测量及 观察号幔性病的发生、发展有密切关系的生物医学 指标的变化情况,评价个体的健康状况,调动群体 和个人的主观积极性,以低廉的预防费用投入获得 第一阶段必须先从数据集合中找出所有的高 频项目组(Frequent hemsets).例如,通过对数据库 超值的健康回报和个人的健康改善.避免或降低个 人慢性疾病发生的危险性,从而降低个人医疗费用 的发生.提高生活质量,减轻社会负担. 参考文献: [1]郭宁.UML及建模[M].北京:北方交通大学出版社,2007. [2]章向宏,何彩升.浅谈医院信息系统的规划与建设[J].中山 大学学报。2002:175—179. 中健康信息和体检信息的数据挖掘,我们找到高血 压与高盐饮食和肥胖的频繁项集,既高血压频繁项 集l={高血压,高盐饮食,肥胖}. 第二阶段再由高频项目组中产生关联规则 (Association Rules).由数据库找出频繁项集,可直 接由频繁项集产生强关联规则(强关联规则满足 [3]庞永峰,安志勇.电子病历及其发展方向[J].科技情报开发 与经济,2003:169—170. [4]程巧燕.电子病案在应用管理中有关问题的探讨[J].中国 医药信息学研究,2000:13—15. [5] Ranjit Bose,Knowledge Mmanagement—enabled Health Care Management Systems 2003 59-7 1. 最小支持度和最小置信度).对于置信度,可以用 式(1)来计算. confidence(A )=P(BIA)= (1) 式中,support—count(AuB)是包含项集AuB的 [6]范明,孟小峰.数据挖掘概念与技术[M].北京:机械工业出 版社.2008. 事务数,而support—count(A)是包含项集A的事 Design of Management System of Health Plan Based on Data Mining FU Chun—yan, GE Mao—song, F ye (Public Computer Ofice,Jiammif University,Jiamusi 154007,China) Abstract: For basic personal information and health examination report,a management system is devel— oped,which is used for disease surveillance and prevention,providing personal health plan and medical health knowledge.In the management system,health examination reports are stored into the data warehouse in the form of data.The health data will be applied to get personal healh itnformation,diet,living conditions and medical recommendations.Through data mining module,massive history data in the data warehouse are mined,and im— portant knowledge about life style,health status,and trends of diseases can be obtained. Key words:healh management;healtth plan;data mining