数据挖掘论文精选5篇论文数据挖掘一:
题目:数据挖掘技术在神经根型颈椎病方剂研究中的优势及应用进展关键词:数据挖掘技术;神经根型颈椎病;方剂;综述;1数据挖掘技术简介
数据挖掘技术[1](KnowledgeDiscoveryinDatebase,KKD,是一种新兴的信息处理技术,它融汇了人工智能、模式别、模糊数学、数据库、数理统计等多种技术方法,专门用于海量数据的处理,从大量的、不完全的、有噪声的、模糊的、随机的数据集中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识,其目的是发现规律而不是验证假设。数据挖掘技术主要适用于庞大的数据库的研究,其特点在于:基于数据分析方法角度的分类,其本质属于观察性研究,数据来源于日常诊疗工作资料,应用的技术较传统研究更先进,分析工具、理论模型与传统研究区别较大。其操作步骤包括[2]:选择数据,数据处理,挖掘分析,结果解释,其中结果解释是数据挖掘技术研究的关键。其方法包括分类、聚类、关联、序列、决策树、贝斯网络、因子、辨别等分析[3],其结果通常表示为概念、规则、规律、模式、约束、可视化等形式图[4]。当今数据挖掘技术的方向主要在于:特定数据挖掘,高效挖掘算法,提高结果的有效性、确定性和表达性,结果的可视化,多抽象层上的交互式数据挖掘,多元数据挖掘及数据的安全性和保密性。因其优势和独特性被运用于多个领域中,且结果运用后取得显着成效,因此越来越多的中医方剂研究者将其运用于方剂中药物的研究。
2数据挖掘术在神经根型颈椎病治方研究中的优势
中医对于神经根型颈椎病的治疗准则为辨证论治,从古至今神经根型颈椎病的中医证型有很多,其治方是集中医之理、法、方、药为一体的数据集合,具有以“方-药-证”为核心的多维结构。方剂配伍本质上表现为方与方、方与药、药与药、药与剂量,以及方药与证、病、症交叉错综的关联与对应[5],而中医方剂讲究君臣佐使的配伍,药物有升降沉浮,四气五味及归经之别,对于神经根型颈椎病的治疗,治方中药物的种类、炮制方法、用量、用法等都是千变万化的,而这些海量、模糊、看似随机的药物背后隐藏着对临床有用的信息和规律,但这些大数据是无法在可承受的时间范围内可用常规软件工具进行捕捉、管理和处理的,是需要一个新处理模式才能具有更强的决策力、洞察力和流程优化能力,而数据挖掘技术有可能从这些海量的的数据中发现新知识,揭示背后隐藏的关系和规则,并且对未知的情况进行预测[6]。再者,中医辨治充满非线性思维,“方-药-证”间的多层关联、序列组合、集群对应,形成了整体论的思维方式和原则,而数据挖掘技术数据挖掘在技术线路上与传统数据处理方法不同在于其能对数据库内的数据以线性和非线性方式解析,尤善处理模糊的、非量化的数据。例如赵睿曦等[7]在研究张氏骨伤治疗腰椎间盘突出症的用药规律时,选取了100张治方,因该病病因病机复杂,证候不一,骨伤名师
张玉柱先生对该病的治则治法、药物使用是不同的。因此他们利用Excel建立方证数据库,采用SPPSClementine12.0软件对这些数据的用药频次、药物关联规则及药物聚类进行分析,最后总结出张氏骨伤治疗腰椎间盘突出症遵循病从肝治、病从血治、标本兼治的原则,也归纳出治疗三种不同证型的腰突症的三类自拟方。由此看出数据挖掘技术在方剂研究中的应用对数据背后信息、规律等的挖掘及名家经验的推广具有重大意义,因此数据挖掘技术在神经根型颈椎病的治方研究中也同样发挥着巨大的作用。
3数据挖掘技术在神经根型颈椎治方中的应用进展
神经根型颈椎病在所有颈椎病中最常见,约占50%~60%[8],医家对其治方的研究也是不计其数。近年来数据挖掘技术也被运用于其治方研究中,笔者通过万方、中国知网等总共检索出以下几篇文献,虽数量不多但其优势明显。刘向前等[9]在挖掘古方治疗神经根型颈椎病的用药规律时,通过检索《中华医典》并从中筛选以治疗颈项肩臂痛为主的古方219首并建立数据库,对不同证治古方的用药类别、总味数、单味药使用频数及药对(组出现频数进行统计,总结出风寒湿痹证、痰湿阻痹证、寒湿阻滞证、正虚不足证的用药特点,得出解表药、祛风湿药、活血化瘀药、补虚药是治疗颈项肩臂痛古方组成的主要药物。古为今用,该研究对于现代医家在治疗该病中有很好的借鉴和参考意义。齐兵献等[10]检索CNKI(1980-2009年相关文献中治疗神经根型颈椎病的方剂建立数据库