序列模式发现算法的研究与改进

序列模式发现算法的研究与改进

一、时序模式发现算法研究与改进(论文文献综述)

钟睿[1](2021)在《面向电信数据的智能反欺诈决策平台的设计与实现》文中研究表明信息的飞速增长引爆了大数据时代的到来,其中随着通信行业的不断发展,也使得越来越多的电信欺诈出现在用户的日常生活中。电信诈骗已经成为影响人们日常生活的主要诈骗形式,且当下的反欺诈手段较为被动与笨重,无法满足高效反诈的需求,针对电信诈骗的研究迫在眉睫。因此,本文基于电信反欺诈场景下的信令数据与通话文本数据,分别提出反欺诈综合决策识别算法,诈骗模式发现及趋势分析算法,能够高效的进行相应的电信反欺诈识别与决策。进一步地,为了给上述算法提供一个支撑平台,同时为了适应日益变化的欺诈手段,本文设计并实现了一个面向电信数据的智能反欺诈决策平台。通过本平台,用户将相应的电信数据上传后,通过平台提供的多源异构特征工程对数据进行统一的封装与建模,并通过平台提供的诈骗电话识别算法、诈骗模式发现算法和诈骗趋势分析算法,针对不同场景和目标,进行快速的反欺诈决策与分析,帮助与指导相关人员的工作。本文的关键算法在于反欺诈综合决策和诈骗模式发现及趋势分析。本课题立足于电信反诈场景,通过反欺诈综合决策高效的解决诈骗电话的识别问题,提出了“基于编码宽度学习网络的诈骗识别算法”和“基于宽度学习的模型并行化训练方法”,前者结合降噪自编码与宽度学习系统,创新性的提出了一种算法,与其他经典算法对比下,进一步提高了准确率的同时,大大缩减了训练时间;后者在前者算法的基础上,针对的提出了相应的并行化算法,进一步缩减训练预测时间,解决了内存爆炸的问题,更好的满足反欺诈的时效需求。同时,通过诈骗模式发现及趋势分析,分别提出了“基于半监督网络的诈骗模式发现算法”和“基于时序的欺诈趋势发现及分析方法”,前者利用半监督图网络,借鉴图结构进一步的挖掘诈骗模式,发现更多的欺诈电话;后者基于时序结果,综合利用聚类与数理统计等方式对诈骗趋势进行分析。实验结果表明,上述算法能够高效的识别诈骗电话,好于现有传统方法,并对诈骗模式与趋势进行进一步的挖掘与分析,为相关人员提供分析与帮助。本文首先阐述了整体的研究背景和实际意义,分析了该研究在国内外的研究现状。接着对本平台进行需求分析,分析了反欺诈综合决策算法和诈骗模式发现及趋势分析算法的研究意义,按照目的不同,分为多源异构电信数据特征工程、反欺诈智能综合决策、诈骗模式及趋势挖掘三个主要功能。随后对系统需要解决的关键问题,进行了研究与实现。接下来,设计与实现了平台的整体架构和相关的功能模块,详细介绍了内部的类与接口,描述了平台处理请求的过程以及如何通过交互配合最终得到响应结果。最后对平台的部署、环境与测试进行了说明,并对该工作进行了相关的总结与展望。

郑佳碧[2](2021)在《基于因果机制的用户行为研究及应用》文中研究表明随着在线社交网络、在线视频、在线游戏等应用的普及,在线网络活动已经成为人们生活的重要组成部分,促使在线营销逐渐成为市场营销的主要形式之一。如何从海量的在线用户行为中挖掘出有价值的信息,指导营销策略设计,减少营销成本,提升营销转化率,是在线营销研究的关键问题之一。虽然目前基于关联分析的方法已经取得一系列理论及应用成果,但是现有基于关联分析的方法在指导广告投放等干预营销方面仍存在较大的不足,是在线营销领域亟需突破的瓶颈问题。与关联分析不同,因果分析严格区分因-果不对称性,在发现事物产生机制的原因、指导干预决策等各方面优势较为突出,是解决上述关联分析不足的有效工具。因此,本课题将从在线营销的实际需求出发,基于因果关系理论及方法对在线用户行为开展系统研究。在线用户行为的非结构化、高维、高噪声等特点给基于因果机制的市场营销研究带来极大挑战,具体包括以下三个方面:在因果表征方面,现有用户行为主要以用户点击、行为轨迹等低语义的原始数据形式体现,如何从这些低语义的原始数据中提取因果变量是后续因果推断的基础,是有待解决的第一个挑战;在因果结构方面,用户行为的因果变量呈现出高维稀疏特性,如何从高维稀疏的用户行为中发现隐藏的因果网络以指导后续营销设计,是有待解决的第二个挑战;在营销效果评估方面,营销过程往往不是随机分组,如何在这些观察数据上对混杂因子进行建模,实现营销效果的精准量化评估是有待解决的第三个挑战。围绕上述三方面的挑战,具体工作介绍如下:1、在因果表征方面,分别从非结构文本数据和用户轨迹数据两个方面开展了研究。(1)在文本数据方面,为实现从高噪声非结构化文本数据中发现用户特征,提出基于关键短语发现的因果表征学习方法。首先,针对文本数据的高噪声特性,提出了基于改进频繁模式挖掘方法的候选关键短语发现算法。然后,针对标签系统对于“关键短语-标签”层次结构的业务需求,提出了结合隶属准则和代表关键词筛选准则的标签系统更新方法。(2)在轨迹数据方面,为解决用户轨迹等底层特征和用户标签高层语义之间的语义鸿沟问题,提出基于用户轨迹的因果表征学习方法。首先,针对用户轨迹的底层特征特性,通过引入用户状态和兴趣点等信息,提出状态序列模型,建立底层特征和用户标签之间的语义桥梁。然后,针对用户状态序列的高噪声以及数据缺失特性,提出基于长短记忆神经网络的表征学习方法。最后,为了充分利用多个标签预测任务之间的相关性,提出一种轻量级微调多任务学习算法,进一步提升用户标签预测的准确率。上述两方面方法的有效性在广告投放真实应用场景中得到验证。本部分工作为后续因果结构学习提供更完整的数据基础。2、在因果结构学习方面,为了实现高维、稀疏用户标签间的因果结构发现,提出一种混合型因果结构学习算法。首先,针对用户标签的高维特性,提出一种迭代式框架,通过交替使用因果关系检测和因果方向推断,有效提升因果网络构建的可靠性。然后,针对因果结构的稀疏性,提出结合V-结构和加性噪声模型的因果方向推断方法以解决马尔可夫等价类难题。最后,我们对算法的正确性进行理论证明。上述方法的有效性在多个模拟数据和真实应用场景得到验证。本部分工作率先对用户标签的因果结构进行探索,为广告投放等营销行为决策提供重要依据。3、在因果效应评估方面,为了消除混杂因子的影响实现营销效果量化评估,提出混杂平衡营销效果评估方法。首先,针对营销场景具有海量对照组样本和包含丰富特征描述的数据特性,将基于深度学习的用户建模方法与因果推断思想相结合,提出以用户为单位的细粒度混杂平衡目标;然后,引入K近邻准则为每个营销组用户筛选最为合适的对照组用户,避免大样本引入的干扰误差;最后通过有效综合时序非时序特征进行高效的样本权重学习,实现稳定可靠的因果效应评估。本成果在合作企业的会员营销场景中获得应用验证。综上所述,本文从因果机制的角度出发,结合在线用户行为的特性,针对在线营销中的若干关键环节开展系统研究,解决传统关联分析方法在指导干预方面的不足,取得若干理论和应用成果。

刘睿霖[3](2020)在《基于需求-服务匹配的服务解决方案构造优化方法》文中研究指明随着新一代信息技术与互联网的飞速发展与推广普及,各应用领域的服务业务不断跨网跨域跨界交叉融合,进而形成了复杂的服务生态系统。如何在复杂服务环境下,针对顾客的特定需求来优化服务业务,并通过服务融合与资源复用等手段构造最佳的服务解决方案成为目前需要解决的难题。针对这一问题,本文重点研究领域服务优化问题(服务推荐、服务选择和服务组合问题),在复杂多变的服务生态环境下,提出一套基于需求-服务匹配的服务解决方案构造和优化方法,采用领域相关的模式来构造跨领域的服务解决方案,实现跨多个领域的服务资源聚合。该方法基于历史经验分析顾客的需求模式,还挖掘各领域长期形成的服务模式。进而,建立需求模式与服务模式的偶对匹配机制,完成顾客需求与服务解决方案间的映射,支持服务解决方案的高效构建。本文主要内容如下:(1)在“需求-工程”两段式服务开发范型(“Requirement Engineering”TwoPhase of Service Engineering Paradigm,RE2SEP)的基础上,本文分析了服务系统中三种不同需求类型的显着特征以及识别出需要解决的主要问题,介绍如何在RE2SEP范型的指导下有针对性的进行系统优化。具体地,针对不同的问题特性给出相应的解决方法和思路,将服务系统中面临的问题分为基于模式匹配和时间间隔预测的服务推荐、基于需求-服务概率矩阵的服务选择和基于模式偶对矩阵的服务组合。(2)提出基于模式匹配和时间间隔预测的服务推荐方法。鉴于服务系统中的服务数量急剧增加,本文通过挖掘历史记录中的知识有效地发现用户的潜在需求,做到在正确的时间将合适的服务推荐给目标用户。具体地,提出基于模式匹配的候选服务识别方法,通过用户聚类和评分偏好找到目标用户的潜在需求模式,进而找到相似的用户群,挖掘相似用户群的服务使用序列中出现频率较高的面向时序的服务模式,利用模式匹配发现目标用户潜在候选服务。其次,提出基于候选服务和时间间隔预测的服务推荐,通过生成概率模型有效估计不同服务之间的时间间隔,并且使用贝叶斯个性化排序优化服务之间的偏序关系,从而,做到在正确的时间推荐合适的服务,提高推荐质量和用户体验。(3)提出基于需求-服务概率矩阵的服务选择方法。由于巨大的搜索空间,现有方法很难在有限的时间内从海量的候选服务中选择高质量服务,构造可行的、满足用户质量需求的全局最优服务解决方案。为了解决该问题,本文以历史数据中获得的先验知识指导概率匹配矩阵的构建,有效地缩减服务选择问题的搜索空间,以达到提高效率的目的。其次,质量感知服务选择问题作为NP难问题,研究人员应用各种进化算法,通过寻找近似最优解决方案来降低时间复杂度。为了解决进化算法参数设定问题,研究了服务选择问题的特征、进化算法的参数值和优化结果之间存在的依赖关系。从而,在避免多次繁琐尝试而寻求最优参数设定的前提下,为基于需求-服务概率矩阵的服务选择进行参数优化设定。(4)提出基于模式偶对矩阵的服务组合方法。为满足用户所提出的复杂性更高的个性化功能性服务需求,而不是局限于系统提供的标准化流程,服务组合技术被广泛用于构建复杂的、增值的组合服务。为提高服务组合效率,本文主要研究了包括为解决语义对齐而提出的本体构建和融合方法、发现功能需求模式的形式概念分析方法、提高相关服务发现效率的面向功能的服务模式挖掘方法、描述功能需求模式和面向功能的服务模式之间偶对关系的矩阵构建方法,以及基于模式偶对矩阵的服务组合方法。与从零开始构造服务解决方案的方法相比,该方法由于考虑面向功能的服务模式有效地缩减了相关服务的搜索空间,并使用模式偶对矩阵为面向功能的服务模式建立了快速索引机制,进一步提高了搜索效率,取得了很好的实验效果。

李国昌[4](2020)在《流程对象在线实时知识发现系统的设计与实现》文中研究表明在流程工业中,生产管理过程普遍采用DCS分布式的控制管理系统,它可以实时地监测流程工业的生产状态,形成状态数据。流程工业的生产过程强调实时性和高效性,而通过对实时采集到的工业数据流进行在线数据挖掘,可以更有效的挖掘出对实际生产活动有价值的技术知识,并可以对工业数据快速的做出响应,更好的辅助决策于生产。本文以完整的燃煤锅炉生产过程作为研究对象,针对工业数据流规模不断增长、对象实时更新、价值随时间衰减等特点,提出了一种增量式模型更新的实时知识发现算法。算法包含数据预处理、基于滑动窗口的数据流聚类、概念迁移判断、关联链挖掘、模型预测更新。并在算法的各个阶段采用Spark框架进行并行加速,以此实现知识发现效率的提升。最终设计了流程对象在线实时知识发现系统,并在某热电公司进行部署与应用。在锅炉生产中,工业数据流是通过所有生产环节的数据集成汇聚得到的。采集过程难免会存在噪声,所以首先要对数据进行清洗。而后要挖掘所有环节正确的时序。本文采用基于差分极值的算法进行时序计算。得到的序列次序,为后续关联规则筛选作铺垫。对于数据流来说,需要考虑数据价值衰减的问题。而生产人员比较关心的是近期时间内的锅炉状态,本文采用了基于滑动窗口的数据流聚类算法来保留近期的工况变化,并降低数据的离散程度。并对比数据流到来前后的聚类结果,如果发生明显变化,可以判定发生了概念迁移,此时锅炉的工况可能发生巨大的改变,迫切需要发现新的知识,所以继续进行后续知识发现算法;如果没有发生明显变化,就继续等待下一个采样窗口。在关联链挖掘阶段中,针对流程对象多环节性的特点,本文采用了基于FP-Growth的维间关联规则算法,并加入兴趣度与关联度的计算。通过计算规则频数占比计算环节间的关系(关联度),形成各环节间关联度表;最后通过时间序列以及关联度表串联生成最终的关联链。关联链是一种链式的关联规则,能够形象的体现出环节间状态的关联。各环节的关联链,以及前一阶段滑动窗口中的近期锅炉工况状态数据,都为模型预测打下良好的数据基础。本文采用了柔性神经树算法,获得关键参数的趋势预测表达式。最终实现了模型的增量式更新,让模型更加适合不断变化的锅炉状态。最终该模型应用于流程对象在线实时知识发现系统。该系统实现了对实时采集到工业数据流进行在线的知识发现,还实现了对关键参数的实时状态监测,数值预测,可视化的趋势预测对比图像,以及更有效的故障检测。并为生产人员的锅炉参数调节提供了辅助决策。

陈加伟[5](2020)在《基于时序挖掘的信息系统诊断平台设计与实现》文中研究指明近年来,随着社会生产方式和信息化水平的不断发展,信息系统运维开始逐渐受到人们的关注。在人工智能广泛应用的背景下,考虑如何采用大数据技术提升运维领域的智能化水平、减轻运维压力,已经成为当下需要突破的首要难题。本文设计并实现了一种基于时序挖掘的信息系统诊断平台,首先通过对复杂业务指标数据进行时序分析和异常挖掘,主动发现信息系统潜在故障;其次构建信息系统运行状态评估体系,实现对信息系统“健康状态”的实时监测;最后结合改进的预测算法完成对系统整体态势的预测,及早发现信息系统异常运行的征兆和规律。综合该过程提出的“诊断-评估-预测”三阶段运维方案,本文的主要研究内容如下:1.研究基于统一时序分析框架的异常检测算法。在传统时序监控的基础上,本文构建了离线大规模时序数据批量处理、建模与在线实时流数据计算、异常检测相融合的统一时序分析框架,大幅提升了实际业务系统中异常检测的命中率,为后续信息系统状态评估和趋势预测提供了有效的数据支撑。2.研究基于时序分析优化的系统健康状态评估模型。综合比较不同系统层次结构下传统评估方法的应用区别,本文基于模糊矩阵细化指标影响权重,并通过时序挖掘技术对核心判断矩阵构建过程中各指标的横纵向关系进行加权,之后结合遗传算法进行一致性优化,保证了模型的合理性和有效性,实现了更为精准的信息系统运行状态评估效果。3.研究基于混合神经网络的系统态势预测模型。考虑到系统态势的预测是一个长、短期分析相结合的问题,本文在传统短期时序预测的基础上,结合TreNet混合神经网络进行长期趋势分析,提出了一种改进的态势预测模型,突破了传统时序预测在实际业务场景中难以应用且准确率低的瓶颈。4.设计实现基于时序挖掘的信息系统诊断平台。基于实际信息系统的运维需求,分析并设计了诊断平台的整体功能架构,采用Html5设计实现图形用户界面,核心算法基于Python实现,同时使用MySql作为数据库存储时序信息。本文通过对系统功能和算法进行测试,验证了信息系统诊断平台的有效性和可用性,对大数据背景下智能运维的发展具有积极意义。

张驰[6](2020)在《基于不确定理论的时序关联规则挖掘算法的研究》文中进行了进一步梳理随着大数据时代的来临,海量的信息带来了数据的爆炸式增长,人们往往难以获取自己想得到的数据,所以从大量的信息提取有用的数据就显得尤为重要。数据挖掘是从大量的数据中通过算法提取隐藏的、有潜在价值的信息的过程,它的主要分析方法包括聚类分析、关联规则分析、分类分析、预测演变分析、序列分析和异常检测分析等分析方法。关联规则挖掘算法作为数据挖掘的重要算法之一,可以从事务数据集中获取隐藏的、有意义的联系,为人们提供更好的选择。传统的关联规则挖掘算法仅仅是从简单的数据集中获取数据之间的联系,但在现实中,数据是会随着时间的变化而产生不一样的重要性,而时序关联规则挖掘算法可以根据数据的时序性在周期时间内挖掘出高效的规则,因此时序关联规则挖掘算法在现实生活中得到了更为广泛的应用。本文运用了两种改进的时序关联算法分别应用在股票预测和商品上架方面。本文在时序关联算法的基础上运用了两种改进的算法,主要工作如下:(1)传统的数据挖掘算法只考虑数据库中模式的频率,这不足以找到有意义或重要的模式。对此,本文通过事务的时序关系进行周期性分段,并结合不确定理论中的专家系统进行分析给予每个事件权重值,先计算出候选项,然后从后选项中计算并找到频繁项,从中发现其关联规则,最后将该算法应用在股票预测中。实验结果表明,该算法应用于时序性质的数据集具有较高的实际意义。(2)针对传统的数据挖掘算法只考虑商品之间的联系,没有考虑到利润问题和上架时间问题。因此,本文根据交易中每条事务交易的商品的个体利润、数量和商品的上架时间,运用了一种两阶段的挖掘算法,在周期时间内找到商品之间的关联规则。实验结果表明,该算法可以帮助商家在更合理的时间周期内上架商品,以获取更多的利润。

王兆刚[7](2020)在《基于时序数据挖掘的煤矿安全趋势性知识发现研究》文中进行了进一步梳理煤炭作为我国经济社会发展的基础能源,安全生产是保证能源稳定供应的前提条件。虽然近年来我国煤矿安全水平有所提高,但与欧美发达国家相比,还存在一定差距,煤矿安全形势依然较为严峻。经过多年的煤矿信息化建设,企业信息系统中积累了大量的安全数据。发挥数据的价值,辅助安全管理工作,进一步改善煤矿安全状况,不仅是煤炭企业的现实需求,也是煤矿安全管理的重要研究内容。但是,当前在宏观和微观煤矿安全时间序列数据挖掘研究,以及煤矿安全信息系统的数据挖掘模型研究方面,对煤矿安全时间序列数据中蕴涵的趋势性规律,尚未有系统性的研究。相关研究的缺乏导致难以切实发挥煤矿安全时间序列数据的作用,包括分析煤矿安全系统的复杂系统结构、识别危险源间的趋势变化关系、促进智能化风险识别与预防的实现。对于有效辅助煤矿安全管理,不断完善煤矿安全信息系统的数据挖掘功能,不能提供有价值的指导和参考。因此,基于上述实践背景与研究不足,本文提出基于时序数据挖掘的煤矿安全趋势性知识发现研究选题,以煤矿安全时间序列数据为挖掘对象,以趋势性知识发现为目标,在对数据挖掘与知识发现一般理论、事故致因与危险源类别划分、煤炭企业数据构成、时间序列趋势分析与描述、时间序列分段线性表示、趋势相似性度量等相关领域研究进行评述的基础上,提出了研究中拟解决的关键科学问题,包括煤矿安全时间序列数据的构成、煤矿安全趋势性知识的内涵及其发现的科学过程、趋势性知识发现有效方法的选取和构建等,其中趋势性知识发现方法包括用于时间序列降维趋势变换的趋势描述基元体系和分段线性表示方法,以及用于数据挖掘的趋势相似性度量方法。具体研究内容如下:1)煤矿安全时间序列数据构成研究。针对煤矿安全时间序列数据的构成问题,以事故致因因素和危险源类别划分为理论依据,以煤炭企业现有数据为现实基础,构建了包括人员、设备设施、环境、组织及内部管理、相关外部等类别的煤矿安全时间序列数据体系,并分析了其主要特点,从而为煤矿安全趋势性知识发现奠定良好的数据基础。2)时间序列趋势描述基元体系研究。针对用于描述煤矿安全趋势性知识的趋势基元体系问题,提出了趋势基元与分段子序列的变化方向和均值水平的对应关系,在此基础上定义了九元型趋势描述基元体系,从而为准确描述煤矿安全时间序列的局部趋势和整体趋势提供了有效方法。3)煤矿安全趋势性知识内涵与发现过程研究。首先,针对煤矿安全趋势性知识的内涵问题,基于现有的时间序列趋势性分析与描述的相关研究,结合煤矿安全领域知识,提出了煤矿安全趋势性知识的内涵,即煤矿安全时间序列数据中蕴涵的,对煤矿安全管理具有使用价值的,由若干个趋势基元有序连接构成的趋势序列模式和序列间趋势相似性关系,包括单序列的频繁序列模式和多序列的趋势相似性关系及其共有模式两类,并从复杂多样性、依存性、动态扩展性、直观可理解性、稀疏性等方面分析了其主要特征,从煤矿安全时序数据的有效运用、分析危险源的复杂系统结构、趋势相似序列间的预测参考和指示、危险源的智能化风险识别与预防等方面分析了其主要作用。然后,针对煤矿安全趋势性知识发现的科学流程问题,提出了以分段线性表示和九元型趋势描述基元体系进行降维趋势变换预处理,以序列模式发现方法和趋势相似性度量方法进行数据挖掘,以真实可靠性和对煤矿安全管理的有用价值性对数据挖掘结果进行评估的煤矿安全趋势性知识发现过程模型,从而为煤矿安全趋势性知识发现提供流程框架的参考和指导。4)煤矿安全时间序列数据预处理方法研究。首先,针对预处理过程中的分段线性表示方法(PLR)问题,将遗传算法(geneticalgorithm,GA)与PLR相结合,构建了一种具有自适应特性的PLR方法,即基于GA的时间序列分段线性表示方法PLRGA,并选取实验数据,验证了该方法的可行性与有效性,以为煤矿安全时序数据的降维趋势变换预处理提供具有灵活适用性的有效方法。然后,以PLRGA为基础,结合九元型趋势描述基元体系,提出了对煤矿安全时序数据进行降维趋势变换预处理的过程模型,以为煤矿安全趋势性知识发现提供预处理过程模型。5)煤矿安全单时序趋势性知识发现研究。为了验证煤矿安全趋势性知识发现过程模型对发现煤矿安全单时序趋势性知识的有效性,选取真实的煤矿安全单时序数据,运用降维趋势变换预处理过程模型进行预处理,以等价类序列模式挖掘算法(Sequential Pattern Discovery using Equivalence classes,SPADE),识别预处理后趋势序列数据中的频繁模式。然后,融合煤矿安全领域知识,分析和识别满足煤矿安全管理需求,具备使用价值的频繁模式;同时,调整预处理参数压缩率,分析不同压缩率条件下是否存在相同频繁模式,以验证该频繁模式的真实可靠性。研究表明:煤矿安全时间序列数据降维趋势变换预处理过程模型,可以有效保留原始煤矿安全时间序列数据的趋势信息;运用煤矿安全趋势性知识发现过程模型,能够有效发现煤矿安全单时序数据中的趋势性知识。6)趋势相似性度量方法研究。为了提供有效的趋势相似性度量方法,以用于煤矿安全多时序趋势性知识发现,在九元型趋势描述基元体系的基础上,以趋势基元间的异同性比较定义匹配距离,借鉴动态时间弯曲方法(dynamic time warping,DTW)的动态规划原理,构建了一种动态模式匹配方法(dynamicpattern matching,DPM),并运用实验数据验证了该方法的优越性,从而为煤矿安全多时序趋势性知识发现提供了有效的趋势相似性度量方法。7)煤矿安全多时序趋势性知识发现研究。为了验证煤矿安全趋势性知识发现过程模型对发现多时序趋势性知识的有效性,选取真实的煤矿安全时间序列数据,运用基于PLRGA的预处理过程模型进行降维趋势变换预处理,以DPM方法度量变换后趋势序列的相似性,采用层次聚类法识别和划分趋势类别,运用SPADE算法识别不同趋势类别的共有序列模式,通过不同趋势类别的共有模式的差异性,验证数据间趋势相似关系的真实可靠性。研究表明:煤矿安全趋势性知识发现过程模型,可以发现煤矿安全多时序数据中的趋势性知识。研究中取得的创新点总结如下:1)针对煤矿安全时间序列数据的构成问题,构建了包括人员数据、设备设施数据、环境数据、组织及内部管理数据、组织外部相关数据的煤矿安全时间序列数据体系,从而为煤矿安全趋势性知识发现提供了可靠的数据选择基础。2)针对描述煤矿安全趋势性知识的趋势基元体系问题,建立了趋势基元与分段子序列的变化方向和均值水平对应关系,以有效反映原始序列的长期趋势,在此基础上构建了九元型时间序列数据趋势描述基元体系。3)针对数据预处理过程中的分段线性表示方法问题,提出了一种基于GA的时间序列分段线性表示方法(PLRGA),结合九元型趋势描述基元体系,进一步提出了煤矿安全时间序列数据转换为趋势时间序列数据方法。4)针对趋势相似性度量方法问题,以趋势基元间的异同性比较,建立了趋势基元间的匹配距离,然后借鉴DTW方法的动态规划原理,构建了一种动态模式匹配方法(DPM)。5)针对煤矿安全趋势性知识发现的科学流程问题,提出了以PLRGA方法和九元型趋势描述基元体系进行降维趋势变换预处理,以SPADE方法和DPM方法进行数据挖掘,以真实可靠性和对煤矿安全管理的有用价值性对数据挖掘结果进行评估的煤矿安全趋势性知识发现过程模型,以用于煤矿安全趋势性知识发现。

陈静锋[8](2019)在《基于电子病历的典型诊疗模式挖掘方法研究》文中研究说明随着医疗信息系统中数据量的急剧增长,医疗数据密集型科学与精准医学研究的不断深入,利用数据挖掘技术从电子病历数据库中发现潜在的有价值的诊疗信息和知识越来越受到关注。然而,在电子病历数据挖掘的背景下,患者表示、相似性度量、聚类算法与聚类结果的抽取是疾病诊断模式与治疗模式挖掘任务中最为基础和关键的工作,其质量的好坏直接影响到挖掘结果的评估与推荐。患者表示的目的是针对临床数据的多样性、时序性与动态性特点,从电子病历数据中提取有效的特征,提高数据挖掘任务的效率。相似性度量是针对患者表示,定量化分析特征间的距离,快速有效地度量患者的相似性,提高聚类效果的准确性。聚类与聚类结果的抽取是在相似性度量的基础上,将患者自动划分为不同的簇,并定义簇的核心区域,抽取最具代表性的诊断与治疗结果,称为典型模式,与传统采用簇的代表点或聚类中心相比,典型模式更能体现临床数据的复杂性特点,增强挖掘结果的可解释性。因此,本文从电子病历数据本身出发,一方面针对患者入院信息,研究典型诊断模式挖掘方法,另一方面针对患者医嘱信息,研究典型用药序列、典型用药时间与融合多视角信息的典型治疗模式挖掘方法,促进临床诊疗业务流程的标准化。本文的主要研究工作如下:(1)基于患者入院信息的典型诊断模式挖掘方法。为了解决现有疾病诊断模式挖掘研究中未考虑疾病编码间语义关系、患者症状信息表达能力不足等问题,提出了一种结合相似性度量、无监督聚类与有监督分类思想的典型诊断模式挖掘方法。该方法通过考虑疾病编码间语义关系,构建疾病编码本体结构,采用编码信息量度量、编码间相似性度量与编码集间相似性度量方法三个层次度量患者诊断信息相似性,并运用聚类算法抽取典型疾病共现模式,讨论了疾病间的主次关系及在本体结构中的位置。以患者人口统计学、症状与实验室检查等多类型入院信息为属性集,典型疾病共现模式为类别集,运用两种决策树分类算法,多角度挖掘典型诊断模式。基于真实患者电子病历数据的实验结果表明,本文提出的方法能够抽取高稳定性的疾病共现关系与高准确度的疾病诊断规则,为临床诊断方案库的构建提供了一种数据驱动的研究思路。(2)基于患者医嘱信息的典型用药序列挖掘方法。为了解决当前医嘱时序模式挖掘研究中挖掘结果频繁复杂与可解释性差等问题,考虑医嘱时序性问题中药物的重复性、时间不一致性与联合性等特征,提出了典型用药序列挖掘方法。该方法利用过程挖掘思想与马尔科夫链理论将患者治疗记录表示为药物集合序列,设计了一种新的相似性度量方法,理论证明该方法满足距离度量的非负性、对称性与三角不等式性。采用聚类算法抽取稳定数量的典型用药序列,并从治疗效果与治疗效率两个视角评估抽取的结果。基于真实患者电子病历数据的实验结果表明,本文设计的相似性度量方法在聚类效果上优于现有的研究方法,从药物名称与药物功效视角抽取的多层次典型用药序列既能为新入院患者根据其入院病情推荐有效的时序性治疗方案,也为辅助构建与完善现有的临床路径提供参考。(3)基于医嘱信息的典型用药时间挖掘方法。为了从大量患者治疗记录中发现潜在的核心药物及其使用时间规律,考虑医嘱持续性问题中药物的开始用药时间、用药间隔与结束用药时间特征,提出了典型用药时间挖掘方法。该方法借鉴描述样本数据分布形状特征的统计量思想定义药物使用时间分布特征与患者治疗记录,并设计相似性度量方法。采用聚类算法抽取典型药物及其有效使用时间,并使用患者入院信息与治疗结局信息对抽取的结果进行评估与疾病编码标注。基于真实患者电子病历数据的实验结果表明,本文方法能够抽取最具代表性的典型用药时间模式,经评估证明治疗结果有效的典型用药时间模式有助于患者治疗过程中用药时间的预测与推荐。(4)基于医嘱多视角信息融合的典型治疗模式挖掘方法。为了得到可解释性强、涵盖信息量全并且满足合理用药要求的治疗方案,在当前医嘱单视角研究基础上,提出了多视角信息融合的典型治疗模式挖掘方法。该方法针对医嘱的药物名称、药物功效、给药途径、每次剂量、每日频次、起始-终止时间六类属性,分析了医嘱信息的内容性、时序性与持续性差异,分别设计患者治疗记录表示方法与相似性度量方法。多视角相似度网络融合方法能够在尽可能减少信息损失的情况下集成三个视角的相似度,形成一个统一的患者相似度网络,并采用谱聚类算法抽取典型治疗模式。基于真实患者电子病历数据的实验结果表明,本文提出的多视角相似性度量方法在聚类效果上优于单视角、线性组合与现有的研究方法,从医嘱的三个视角抽取的核心药物、给药途径、每日剂量、用药次数与用药时间等信息,有助于促进合理用药“五个正确”目标的实现,即正确的药物、正确的剂量、正确的给药时间、正确的给药途径、给予正确的患者。本研究在理论方面,针对电子病历数据的多样性、时序性、动态性等诸多特性,提出了涉及电子病历数据预处理、患者表示、相似性度量,聚类算法,聚类结果的抽取与评估的典型诊疗模式挖掘方法。在应用方面,将提出的方法应用于电子病历数据中,可以挖掘最具代表性的疾病诊疗方案,辅助制定标准化的临床诊疗业务流程。

孙明瑞[9](2019)在《基于特征关联的特征识别与推荐算法研究》文中提出随着物联网的发展和大数据时代的到来,数据爆炸式增长导致信息过载等问题,使传统的推荐系统逐渐转型为个性化推荐系统。个性化推荐算法通过构建用户画像和预测用户行为来提供信息过滤和推荐服务。在以大数据为背景下的推荐系统中,领域推荐技术的数据构成日趋复杂,呈现出海量异构数据、数据特征缺失、数据特征异常和数据特征关联等新特征。这些特征从问题规模、特征缺失程度、异常特征状态和关联关系等方面对推荐算法提出了新的需求和挑战。为此,本文开展基于特征关联的特征识别、预测与推荐算法研究。主要包含以下几个方面:(1)特征关系的分类关联规则启发式挖掘算法与特征匹配算法。基于海量数据隐藏的关联关系,重点研究面向推荐算法的数据本身隐式的分类关联规则。引入分类及连续的数据特征属性并离散化,扩展数据特征的二元表示,确保数据特征属性的多样性。为了挖掘数据中某些关联特征,研究基于最小支持度的启发式特征挖掘方法,发现关联特征的频繁性及构建最优特征子集。基于数据特征频繁项,研究基于最小置信度的启发式分类关联规则挖掘算法,为不同情景模式下,进行基于分类关联规则的特征匹配。利用机器学习库中健康医疗情景实验数据进行实验验证与分析,验证了提出算法的有效性。(2)隐式反馈特征识别与预测算法。针对应用领域数据特征稀疏性和缺失性问题,系统地研究领域中数据缺失特征的识别与预测分类问题。在系统地分析领域数据特征缺失基础上,研究基于加权用户的协同过滤特征识别方法。通过有监督学习向无监督学习的转变,研究推荐系统特征属性间隐式关联关系的特征识别方法。研究基于隐式特征提取的隐式反馈协同过滤特征识别与预测算法,通过随机创建的数据特征缺失程度模拟真实环境数据特征缺失情况,实验验证算法的有效性。利用机器学习库中健康医疗情景实验数据进行实验验证与分析,验证了提出算法的有效性和预测准确率。(3)数据异常特征识别与预测算法。针对只关注于离散数据特征的局限性,研究基于连续属性时间序列数据相互依赖关联的特征识别算法,以此进行异常特征识别与预测。研究基于深度学习网络模型的连续时间序列数据的特征识别方法,通过复杂的图模式进行数据降维,以及时频序列数据分析,形成深层次的数据时序关联关系与异常特征识别模型,以此改善预测结果的有效性。利用脑电图健康医疗情景实验数据进行实验验证与分析,验证了提出算法的有效性和预测准确率。(4)面向领域的级联加权混合个性化推荐方法。针对特定领域推荐需求,研究不同情境模式下的混合推荐方法,面向领域的研究问题抽象成为本体推荐项目的个性化推荐过程。构建用户特征信息模型画像,采用分类树和内容相似度的相似用户发现算法发现相似用户,并基于关联规则的特征匹配算法加权计算得到推荐方案。针对推荐算法冷启动问题,研究基于领域知识分类树的相似用户发现算法,采用离线计算方法提高效率。基于多用户的层次分析决策推荐形式化方法进行决策推荐,改善用户的满意度和推荐效果。中风患者实际健康医疗实验数据进行实验验证与算法比较,验证了本文混合推荐算法的有效性。

王晓密[10](2017)在《顾及尺度驱动的聚类知识挖掘方法及应用》文中进行了进一步梳理聚类知识挖掘技术作为数据挖掘的一个重要研究方向,重点揭示事物和现象的集聚分布模式,其不仅可以作为一个独立的数据挖掘工具,还可以结合其他数据挖掘方法开展更深入的知识挖掘,目前己成为数据挖掘研究中的热点课题之一。目前,已有不少学者开展了聚类知识挖掘方面的研究,然而现有研究通常存在如下几点不足。首先,现有方法只是判断目标集是否为一类,但并未对类别合理性和显着性进行判别;其次,现有方法通常需依赖先验知识对预设参数值进行设置,然而聚类知识挖掘算法做为一个普适性的空间分析工具,用户在聚类知识挖掘过程中通常没有足够的先验知识;另外,现有复杂的地学数据集聚分布知识通常存在噪声干扰,空间异质分布、形状和密度各异等特征,现有算法通常难以同时顾及上述特征开展聚类知识挖掘。基于上述问题,本文进一步结合聚类知识对尺度的强依赖性问题,开展顾及尺度驱动的聚类知识挖掘方法和应用研究,具体研究内容如下:首先提出一套聚类知识挖掘模式,为顾及尺度驱动的聚类知识挖掘提供理论基础与分析框架;其次,开展一系列顾及尺度驱动的聚类知识挖掘算法的研究,并以改进的顾及尺度驱动的聚类知识挖掘算法为技术手段,在聚类知识挖掘模式的指导下,开展一系列聚类知识挖掘应用。其中顾及尺度驱动的聚类知识挖掘算法根据数据类别的不同可分为顾及尺度驱动的双重聚类知识挖掘算法、顾及尺度驱动的时序聚类知识挖掘算法以及顾及尺度驱动的多元关联关系聚类知识挖掘算法。对聚类知识挖掘过程进行概括与构想,构建聚类知识挖掘模式。该模式涉及聚类知识挖掘的全过程,综合考虑了聚类知识挖掘变量的设计、挖掘单元的划分、挖掘数据的转换与存储、挖掘过程以及挖掘结果的可视化。本文构建的聚类知识挖掘模式具有较强的普适性,能够完整的描述从基础数据到聚类知识可视化表达的全过程。开展顾及尺度驱动的双重聚类知识挖掘算法研究。该算法综合考虑了聚类知识对尺度的依赖性,聚类知识挖掘过程中先验知识缺乏,类别受噪声和障碍等约束的影响等问题,实现显着的空间邻近,非空间属性相近的类别的探测。另外,本文提出的改进的顾及尺度驱动的双重聚类知识挖掘算法能够探测任意形状和密度的类别,且适用于在不均匀分布的数据中挖掘潜在的空间邻近,非空间属性分布相似的类别。最后,以模拟数据和实例数据对算法进行验证。在实例应用中,以分析武汉市小区房价的空间分异规律为挖掘目标,结果表明武汉市小区房价分布呈现明显的双核辐射分布特征,以长江和东湖为核心,小区房价向四周呈现辐射递减的趋势。开展顾及尺度驱动的时序聚类知识挖掘算法研究。已有时序聚类知识挖掘算法通常未能在顾及地理要素的空间异质性特征且现有时序聚类知识挖掘算法对先验知识具有很强的依赖性,因此本文在同时顾及空间属性、非空间属性值和非空间属性趋势的基础上,提出改进的顾及尺度驱动的时序聚类知识挖掘算法,开展自适应的时序聚类知识挖掘。根据数据结构的不同,分别对栅格数据和矢量数据开展顾及尺度驱动的时序聚类知识挖掘算法的研究。顾及尺度驱动的时序聚类知识挖掘算法从多尺度层次开展聚类知识挖掘,采用聚类知识评价方法,获取显着尺度的聚类知识,上述策略使得本文提出的改进的时序聚类知识挖掘算法能够自适应的获取空间邻近、非空间属性值和属性趋势相似的类别。最后以本文提出的顾及尺度驱动的聚类知识挖掘算法为挖掘技术手段,以全国降雨时序数据为例开展模式挖掘,结果表明全国降雨呈现显着的区域特征,且西北部地区降雨量少,且年间降雨总量波动小,而东部和南部地区,降雨量大,且年间降雨总量波动大,并且从类别间提取出的显着分异线与全国的半干旱半湿润分割线保持一致;以宁波市地表变形为例,挖掘的聚类知识表明宁波市主城区呈现地表缓慢上升的趋势,而重点开发建设区域以及围填海区域呈现显着的不均匀形变的特征,大面积开发区域在建成后的20年内基本处于稳步下沉的状态,上述模式的挖掘为地表变形机理分析奠定了良好的基础。开展顾及尺度驱动的多元关联关系聚类知识挖掘算法研究。顾及尺度驱动的多元关联关系聚类知识挖掘算法通过采用层次策略分别对空间属性和非空间属性关联关系进行聚类,首先采用PSO优化算法和Delaunay三角网,获取最优空间尺度的目标之间的邻接关系,然后融合Apriori算法和改进的基于密度的聚类算法,获取显着的多元关联关系集聚性分布区域。采用模拟数据进行算法验证,结果表明本文提出的改进的多元关联关系聚类知识挖掘算法能够自适应的获取多元关联关系在空间的显着分布区域。采用顾及尺度驱动的多元关联关系聚类知识挖掘算法开展土壤元素受环境因素影响的空间集聚性分布区域的挖掘,结果表明研究区内土壤元素分布受环境因素影响显着,基于该结论,进一步改进预测模型构建时校正集样本选择方法,选取具有多元代表性(包括环境代表性)的样本,构建预测模型,结果表明改进的方法能够更高精度的实现预测分析。总之,本文旨在自适应的获取显着尺度的集聚性分布知识。首先提出具有普适性的聚类知识挖掘模式,以挖掘模式为指导,开展顾及尺度驱动的聚类知识挖掘算法及应用的研究。其中聚类知识挖掘算法根据数据类别的不同分为顾及尺度驱动的双重聚类知识挖掘模型、顾及尺度驱动的时序聚类知识挖掘模型以及顾及多元关联关系聚类知识挖掘模型。

二、时序模式发现算法研究与改进(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、时序模式发现算法研究与改进(论文提纲范文)

(1)面向电信数据的智能反欺诈决策平台的设计与实现(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
    1.3 论文主要工作
    1.4 论文组织和结构
第二章 相关技术简介
    2.1 电信反欺诈相关技术
        2.1.1 传统反欺诈方法
        2.1.2 基于机器学习的反欺诈算法
    2.2 宽度学习系统
        2.2.1 宽度学习网络
        2.2.2 宽度学习的增量更新算法
    2.3 图网络算法
第三章 需求分析
    3.1 系统概述
    3.2 典型业务场景分析
    3.3 功能性需求分析
        3.3.1 面向多源异构电信数据的特征工程
        3.3.2 反欺诈智能综合决策
        3.3.3 诈骗挖掘
    3.4 本章小结
第四章 基于改进宽度学习的反欺诈综合决策
    4.1 总体流程
    4.2 基于编码宽度学习网络的诈骗识别算法
        4.2.1 问题描述
        4.2.2 编码宽度学习特征建模
        4.2.3 编码宽度学习网络建模
    4.3 基于宽度学习的模型并行化训练算法
        4.3.1 问题描述
        4.3.2 宽度学习网络数据并行化结构设计
        4.3.3 基于集成学习的宽度学习网络并行化算法
    4.4 实验结果与分析
        4.4.1 实验环境
        4.4.2 基于编码宽度学习网络的诈骗识别算法实验结果分析
        4.4.3 基于宽度学习的并行化算法实验结果分析
    4.5 本章小结
第五章 面向电信数据的诈骗模式发现及趋势分析算法
    5.1 总体流程
    5.2 基于半监督图网络的诈骗模式发现算法
        5.2.1 问题描述
        5.2.2 基于半监督的图网络建模
        5.2.3 基于semi-GCN的诈骗发现算法
    5.3 基于时序的欺诈趋势发现及分析方法
        5.3.1 问题描述
        5.3.2 基于聚类的趋势发现方法
        5.3.3 基于时序统计的趋势分析及评估
    5.4 实验结果与分析
        5.4.1 实验环境
        5.4.2 基于半监督图网络的诈骗模式发现算法实验结果分析
        5.4.3 基于时序的欺诈趋势发现及分析方法实验结果分析
    5.5 本章小结
第六章 总体设计
    6.1 系统总体架构
    6.2 平台关键功能模块介绍
        6.2.1 反欺诈综合决策模块
        6.2.2 模式发现及趋势分析模块
        6.2.3 多源异构特征工程模块
        6.2.4 多源异构数据集成模块
        6.2.5 多源异构数据存储模块
    6.3 基本工作流程
        6.3.1 智能反欺诈综合决策流程
        6.3.2 诈骗模式发现流程
        6.3.3 诈骗趋势分析流程
    6.4 本章小结
第七章 详细设计
    7.1 反欺诈综合决策详细设计
        7.1.1 类图及接口说明
        7.1.2 典型场景说明
    7.2 诈骗模式发现及趋势分析详细设计
        7.2.1 类图及接口说明
        7.2.2 典型场景说明说明
    7.3 多源异构特征工程详细设计
        7.3.1 类图及接口说明
        7.3.2 典型场景说明说明
    7.4 本章小结
第八章 系统部署与测试
    8.1 测试环境部署
    8.2 系统测试
        8.2.1 系统前端界面
        8.2.2 系统功能测试
        8.2.3 算法性能测试
        8.2.4 测试结果分析
    8.3 本章小结
第九章 总结与展望
    9.1 论文工作总结
    9.2 研究展望
参考文献
致谢
攻读学位期间发表的学术论文目录

(2)基于因果机制的用户行为研究及应用(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 用户行为分析
        1.2.2 因果关系发现
        1.2.3 因果效应评估
    1.3 课题的研究内容
    1.4 论文的结构
第二章 相关知识
    2.1 基本概念
    2.2 因果关系发现
        2.2.1 基于约束的方法
        2.2.2 基于因果函数的方法
    2.3 因果效应评估
    2.4 长短记忆神经网络
    2.5 需求方平台(DSP)
    2.6 数据管理平台(DMP)
第三章 基于关键短语发现的因果表征学习
    3.1 引言
    3.2 相关工作
    3.3 基于频繁模式挖掘的关键短语发现
        3.3.1 问题定义
        3.3.2 基于时序模式挖掘的关键短语发现
        3.3.3 面向新增关键短语的标签系统更新
    3.4 在DSP系统中的应用
        3.4.1 应用场景
        3.4.2 应用效果
    3.5 小结
第四章 面向用户轨迹的因果表征学习
    4.1 引言
    4.2 相关工作
        4.2.1 轨迹挖掘
        4.2.2 轨迹语义挖掘
    4.3 基于多任务LSTM预测方法
        4.3.1 问题定义
        4.3.2 用户轨迹的状态序列模型
        4.3.3 基于LSTM的状态序列表征学习
        4.3.4 基于多任务依赖的轻量级调优
    4.4 算法实验结果
        4.4.1 数据说明
        4.4.2 实验结果
    4.5 在DSP系统中的应用
        4.5.1 应用场景
        4.5.2 应用效果
    4.6 小结
第五章 用户标签间的因果关系发现
    5.1 引言
    5.2 相关工作
    5.3 迭代因果关系搜索算法
        5.3.1 问题定义
        5.3.2 算法框架
        5.3.3 基于条件集搜索的因果关系检测
        5.3.4 基于联合策略的因果方向推断
    5.4 算法仿真实验
        5.4.1 数据说明
        5.4.2 实验结果
    5.5 在DSP系统中的应用
        5.5.1 应用场景
        5.5.2 应用效果
    5.6 小结
第六章 基于混杂平衡的营销因果效应评估
    6.1 引言
    6.2 相关工作
    6.3 细粒度营销效果评估算法
        6.3.1 问题定义
        6.3.2 细粒度混杂平衡目标设计
        6.3.3 混杂权重函数学习
        6.3.4 模型总结
    6.4 算法实验
        6.4.1 实验设置
        6.4.2 实验结果
    6.5 小结
总结与展望
    本文总结
    研究展望
参考文献
攻读学位期间发表的论文
攻读学位期间承担和主要参与的项目
致谢

(3)基于需求-服务匹配的服务解决方案构造优化方法(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 相关问题的研究现状
        1.2.1 软件服务开发方法论
        1.2.2 服务推荐方法
        1.2.3 服务选择与组合方法
        1.2.4 基于先验知识的服务复用方法
        1.2.5 有待深入研究的问题
    1.3 课题来源及主要研究内容
    1.4 论文章节安排
第2章 “需求-工程”两段式服务开发范型
    2.1 RE2SEP范型概述
    2.2 RE2SEP相关定义
        2.2.1 面向服务的需求工程
        2.2.2 面向领域的服务工程
    2.3 RE2SEP范型的元模型
        2.3.1 形式化描述
        2.3.2 不同需求类型下的优化方法
    2.4 面向服务方法论的对比和分析
        2.4.1 评判标准
        2.4.2 通用特性的比较和分析
        2.4.3 服务相关特性的比较
    2.5 本章小结
第3章 基于模式匹配和时间间隔预测的服务推荐
    3.1 问题背景与求解策略
    3.2 服务推荐相关定义
    3.3 基于相似用户的潜在需求模式发现
    3.4 面向时序的服务模式挖掘
    3.5 基于候选服务和时间间隔预测的服务推荐
        3.5.1 基于模式匹配的候选服务识别
        3.5.2 基于时间间隔张量的时序偏好建模
        3.5.3 基于候选服务和时间间隔预测的服务推荐
    3.6 实验与分析
        3.6.1 基于模式匹配的候选服务识别
        3.6.2 基于候选服务和时间间隔预测的服务推荐
    3.7 本章小结
第4章 基于需求-服务概率矩阵的服务选择
    4.1 问题背景与求解策略
    4.2 服务选择相关定义
    4.3 基于模糊聚类和天际线的质量需求模式发现
    4.4 面向质量的服务模式挖掘
    4.5 基于需求-服务概率矩阵的服务选择
        4.5.1 需求-服务概率矩阵的构建方法
        4.5.2 基于需求-服务概率矩阵的人工蜂群算法
        4.5.3 服务选择算法的参数优化
    4.6 实验与分析
        4.6.1 基于需求-服务概率矩阵的服务选择
        4.6.2 服务选择方法的参数优化
    4.7 本章小结
第5章 基于模式偶对矩阵的服务组合
    5.1 问题背景与求解策略
    5.2 服务组合相关定义
    5.3 基于语义相似性和关联性的功能需求模式发现
        5.3.1 基于领域本体的服务功能语义对齐
        5.3.2 基于形式概念分析的功能需求模式发现
    5.4 面向功能的服务模式挖掘
    5.5 基于模式偶对矩阵的服务组合
        5.5.1 模式偶对矩阵的构建
        5.5.2 基于模式偶对矩阵的服务解决方案生成
        5.5.3 基于启发式反向搜索的服务解决方案优化
    5.6 实验与分析
        5.6.1 数据集简介
        5.6.2 实验结果对比和分析
        5.6.3 模式选择策略的影响及分析
    5.7 整体案例验证
    5.8 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其他成果
致谢
个人简历

(4)流程对象在线实时知识发现系统的设计与实现(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 论文的主要内容与创新点
        1.3.1 论文的主要内容
        1.3.2 论文的创新点
    1.4 论文组织结构
第二章 燃煤锅炉流程对象及其算法流程
    2.1 燃煤锅炉的流程对象
        2.1.1 流程对象
        2.1.2 流程对象的特点
        2.1.3 关于燃煤锅炉流程对象的参数调节
    2.2 相关的算法流程
    2.3 对系统进行并行化设计
        2.3.1 相关并行计算的理论
        2.3.2 Spark集群计算框架
    2.4 本章小结
第三章 锅炉数据预处理以及数据流聚类
    3.1 锅炉数据预处理
        3.1.1 原始数据
        3.1.2 时序调整
    3.2 基于滑动窗口的数据流聚类算法
        3.2.1 滑动窗口
        3.2.2 概念迁移
        3.2.3 K-means聚类算法并行化
    3.3 本章小节
第四章 关联链的挖掘
    4.1 引言
    4.2 簇类间关联规则
    4.3 环节间关联规则
    4.4 关联链
    4.5 FP-Growth关联规则算法
    4.6 本章小结
第五章 模型预测更新
    5.1 引言
    5.2 柔性神经树算法及流程
    5.3 实验分析
    5.4 本章小结
第六章 流程对象在线实时知识发现系统的实现
    6.1 系统概述
    6.2 系统环境
    6.3 数据库设计
    6.4 系统功能模块图
    6.5 系统流程图
    6.6 系统功能分析
        6.6.1 实时知识发现模块
        6.6.2 查询模块
        6.6.3 预测模块
        6.6.4 实时监测模块
    6.7 本章小结
第七章 结论与展望
    7.1 论文总结
    7.2 工作展望
参考文献
致谢
附录

(5)基于时序挖掘的信息系统诊断平台设计与实现(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 时间序列分析
        1.2.2 异常检测
        1.2.3 信息系统运维
    1.3 研究内容
    1.4 结构安排
第二章 相关技术和基础理论
    2.1 系统状态评估方法
    2.2 时序分析基础理论
        2.2.1 时序数据预处理
        2.2.2 异常模式挖掘
        2.2.3 时序指标预测
    2.3 本章小结
第三章 系统运维诊断与态势预测关键算法研究与实现
    3.1 总体算法框架
    3.2 基于统一时序挖掘框架的异常检测算法
        3.2.1 传统时序异常检测模型及存在的问题
        3.2.2 异常检测算法设计
        3.2.3 异常检测算法实现与测试
    3.3 基于时序分析优化的系统健康状态评估模型
        3.3.1 传统AHP应用介绍及主要问题
        3.3.2 系统健康状态评估模型设计
        3.3.3 系统健康状态评估模型实现与测试
    3.4 基于混合神经网络的系统态势预测模型
        3.4.1 传统ARIMA时序预测介绍
        3.4.2 Tre Net混合神经网络架构
        3.4.3 系统态势预测模型设计
        3.4.4 系统态势预测模型实现与测试
    3.5 本章小结
第四章 基于时序挖掘的信息系统诊断平台设计与实现
    4.1 需求分析
    4.2 系统设计与实现
        4.2.1 总体设计
        4.2.2 数据库设计与实现
        4.2.3 功能模块设计与实现
    4.3 本章小结
第五章 系统测试与结果分析
    5.1 测试环境
    5.2 系统功能测试
    5.3 本章小结
第六章 总结与展望
    6.1 论文总结
    6.2 未来工作展望
致谢
参考文献
攻读硕士学位期间取得的成果

(6)基于不确定理论的时序关联规则挖掘算法的研究(论文提纲范文)

中文摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 论文的研究思想和内容安排
        1.3.1 本文研究内容
        1.3.2 本文的组织和安排
2 数据挖掘和关联规则算法研究以及不确定理论的概述
    2.1 数据挖掘概述
    2.2 关联规则算法概述
    2.3 不确定理论概述
3 时序关联规则算法研究
    3.1 时序关联规则
    3.2 时序关联规则算法
    3.3 结语
4 基于加权部分周期模式算法研究
    4.1 相关术语
    4.2 挖掘加权部分周期模式算法
    4.3 实例分析
    4.4 实验分析
        4.4.1 模拟数据
        4.4.2 实际数据
    4.5 结语
5 基于高利润的上架项集关联规则研究
    5.1 相关属性概念
    5.2 挖掘高利润上架项集
    5.3 实例分析
    5.4 实验评估
    5.5 结语
6 结论与展望
参考文献
致谢

(7)基于时序数据挖掘的煤矿安全趋势性知识发现研究(论文提纲范文)

摘要
Abstract
1 引言
    1.1 研究背景
    1.2 煤矿安全时间序列研究分析
        1.2.1 宏观煤矿安全时序数据挖掘研究
        1.2.2 微观煤矿安全时序数据挖掘研究
        1.2.3 煤矿安全数据挖掘系统研究
    1.3 研究目标与研究意义
        1.3.1 研究目标
        1.3.2 研究意义
    1.4 研究内容与研究方法
        1.4.1 研究内容
        1.4.2 研究方法
2 文献综述
    2.1 数据挖掘与知识发现
        2.1.1 基本内涵
        2.1.2 一般过程
        2.1.3 研究范式及特征
        2.1.4 类别划分及其主要功能作用
    2.2 事故致因因素与危险源
    2.3 煤炭企业数据构成
    2.4 时间序列趋势分析与描述
        2.4.1 时间序列趋势性分析与预测
        2.4.2 时间序列趋势性描述
    2.5 时间序列分段线性表示研究
    2.6 时间序列趋势相似性度量研究
    2.7 关键科学问题
    2.8 本章小结
3 煤矿安全趋势性知识
    3.1 煤矿安全时间序列数据体系
        3.1.1 煤矿安全时间序列数据
        3.1.2 基于二维属性的煤矿安全时间序列数据体系
    3.2 时间序列趋势描述基元体系
    3.3 煤矿安全趋势性知识内涵
        3.3.1 煤矿安全趋势性知识的构成
        3.3.2 煤矿安全趋势性知识特征
    3.4 煤矿安全趋势性知识的价值与作用
    3.5 煤矿安全趋势性知识发现过程
    3.6 本章小结
4 基于PLR_GA的煤矿安全时间序列数据预处理方法
    4.1 基于GA的时间序列分段线性表示
        4.1.1 算法实现步骤
        4.1.2 算法特点分析
    4.2 实验及结果分析
        4.2.1 实验环境及数据
        4.2.2 实验方法
        4.2.3 实验结果
    4.3 煤矿安全趋势性知识发现预处理过程模型
    4.4 本章小结
5 煤矿安全单时序趋势性知识发现
    5.1 CO数据趋势性知识发现
        5.1.1 数据理解
        5.1.2 基于PLR_GA的降维趋势变换
        5.1.3 基于SPADE算法的CO趋势序列频繁模式发现
        5.1.4. 不同压缩率条件下的CO频繁序列模式评估
    5.2 瓦斯浓度序列数据趋势性知识发现
        5.2.1 数据理解
        5.2.2 基于PLR_GA的降维趋势变换
        5.2.3 不同压缩率条件下的瓦斯趋势序列频繁模式评估
    5.3 负压数据的趋势性知识发现
        5.3.1 数据理解
        5.3.2 基于PLR_GA的降维趋势变换
        5.3.3 不同压缩率条件下的负压趋势序列频繁模式评估
    5.4 本章小结
6 煤矿安全多时序趋势性知识发现
    6.1 动态模式匹配
        6.1.1 动态模式匹配距离
        6.1.2 实验分析
    6.2 基于DPM的序列趋势相似性关系识别
        6.2.1 数据选择与预处理
        6.2.2 煤矿安全趋势序列数据类型识别
        6.2.3 聚类结果
    6.3 基于SPADE的序列趋势相似性关系分析与评估
    6.4 本章小结
7 结论与展望
    7.1 主要结论
    7.2 创新点
    7.3 展望
参考文献
附录
致谢
作者简介

(8)基于电子病历的典型诊疗模式挖掘方法研究(论文提纲范文)

摘要
ABSTRACT
主要符号表
1 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究问题
        1.1.3 研究意义
    1.2 国内外研究进展
        1.2.1 电子病历数据挖掘研究现状
        1.2.2 疾病诊断模式挖掘方法研究现状
        1.2.3 疾病治疗模式挖掘方法研究现状
        1.2.4 患者表示方法、相似性度量方法与聚类方法研究现状
        1.2.5 已有研究工作中的不足
    1.3 研究内容和结构
        1.3.1 研究内容
        1.3.2 论文结构
        1.3.3 研究思路
2 基于患者入院信息的典型诊断模式挖掘方法
    2.1 疾病编码标注问题描述及研究框架
    2.2 典型诊断模式挖掘方法
        2.2.1 患者入院信息表示方法
        2.2.2 患者疾病编码本体结构构建方法
        2.2.3 患者疾病诊断信息相似性度量方法
        2.2.4 患者疾病诊断信息聚类算法
        2.2.5 典型疾病共现模式抽取方法
        2.2.6 典型诊断模式抽取方法
    2.3 实验及结果分析
        2.3.1 实验数据集预处理与参数设置
        2.3.2 AP聚类最优簇的数量选择
        2.3.3 典型疾病共现模式抽取
        2.3.4 典型诊断模式抽取
        2.3.5 典型疾病共现模式稳定性分析
    2.4 本章小结
3 基于患者医嘱信息的典型用药序列挖掘方法
    3.1 医嘱的时序模式挖掘问题描述
    3.2 典型用药序列挖掘方法
        3.2.1 药物集合序列表示方法
        3.2.2 药物集合序列相似性度量方法
        3.2.3 药物集合序列聚类算法
        3.2.4 典型用药序列抽取方法
        3.2.5 典型用药序列评估方法
    3.3 实验及结果分析
        3.3.1 实验数据集描述与参数设置
        3.3.2 相似性度量方法比较
        3.3.3 AP聚类最优簇的数量选择
        3.3.4 典型用药序列抽取
        3.3.5 典型用药序列评估
        3.3.6 实验结果讨论
    3.4 本章小结
4 基于患者医嘱信息的典型用药时间挖掘方法
    4.1 医嘱的持续模式挖掘问题描述
    4.2 典型用药时间挖掘方法
        4.2.1 用药时间分布特征表示方法
        4.2.2 患者治疗记录相似性度量方法
        4.2.3 患者治疗记录聚类算法
        4.2.4 典型用药时间抽取方法
        4.2.5 典型用药时间评估与疾病编码标注方法
        4.2.6 算法总结
    4.3 实验及结果分析
        4.3.1 实验数据集预处理与参数设置
        4.3.2 AP聚类最优簇的数量选择
        4.3.3 典型用药时间抽取
        4.3.4 典型用药时间评估
        4.3.5 典型用药时间疾病编码标注
        4.3.6 典型用药时间推荐
    4.4 本章小结
5 基于医嘱多视角信息融合的典型治疗模式挖掘方法
    5.1 医嘱的多视角信息融合挖掘问题描述及研究框架
    5.2 典型治疗模式挖掘方法
        5.2.1 医嘱形式化表示方法
        5.2.2 医嘱单视角相似性度量方法
        5.2.3 医嘱多视角相似度网络融合方法
        5.2.4 患者治疗记录聚类算法
        5.2.5 典型治疗模式抽取与评估方法
    5.3 实验及结果分析
        5.3.1 实验数据集描述与参数设置
        5.3.2 相似性度量方法比较
        5.3.3 谱聚类最优簇的数量选择
        5.3.4 典型治疗模式抽取
        5.3.5 典型治疗模式评估
    5.4 讨论
    5.5 本章小结
6 结论与展望
    6.1 结论
    6.2 创新点
    6.3 展望
参考文献
攻读博士学位期间科研项目及科研成果
致谢
作者简介

(9)基于特征关联的特征识别与推荐算法研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 相关问题研究现状
        1.2.1 关联规则挖掘算法
        1.2.2 特征识别与推荐算法
        1.2.3 推荐算法的评价指标
        1.2.4 有待深入研究的问题
    1.3 课题来源及主要研究内容
    1.4 论文章节安排
第2章 基于特征关系的关联规则挖掘与特征匹配算法
    2.1 引言
        2.1.1 现有研究存在的问题
        2.1.2 本文的解决思路
    2.2 问题与定义
    2.3 贝叶斯网络特征关系马尔科夫独立性推理分析
    2.4 基于改进蚁群算法的分类关联规则挖掘算法
        2.4.1 基于改进蚁群算法的频繁特征项集挖掘
        2.4.2 基于改进蚁群算法的分类关联规则挖掘算法
    2.5 基于分类关联规则的特征匹配算法
    2.6 实验验证与分析
        2.6.1 实验数据的预处理
        2.6.2 频繁特征项集及分类关联规则挖掘
        2.6.3 分类关联规则挖掘算法有效性验证
        2.6.4 特征匹配算法比较分析
    2.7 本章小结
第3章 基于隐式反馈的特征识别与预测算法
    3.1 引言
        3.1.1 现有研究存在的问题
        3.1.2 本文的解决思路
    3.2 问题与定义
    3.3 面向预测的特征关联识别理论分析
        3.3.1 面向预测的显式特征关联分析
        3.3.2 面向预测的隐式特征关联分析
        3.3.3 无向概率图特征关系马尔科夫独立性推理分析
        3.3.4 面向预测的特征属性模型可表征理论
    3.4 基于隐式反馈的特征识别与预测算法
        3.4.1 DB-PRBM隐式反馈特征识别方法
        3.4.2 DB-PDRBM隐式反馈特征识别方法
        3.4.3 基于隐式反馈的协同过滤预测算法
    3.5 实验验证与分析
        3.5.1 实验数据预处理
        3.5.2 加权用户协同过滤特征识别方法与分析
        3.5.3 DB-PRBM特征识别结果与分析
        3.5.4 DB-PDRBM特征识别结果与分析
        3.5.5 相关特征识别与预测算法比较分析
    3.6 本章小结
第4章 基于卷积神经网络的异常特征识别与预测算法
    4.1 引言
        4.1.1 现有研究存在的问题
        4.1.2 本文的解决思路
    4.2 问题与定义
    4.3 基于深度学习的异常特征识别模型
        4.3.1 基于递归神经网络的异常特征识别模型
        4.3.2 基于卷积神经网络的异常特征识别模型
    4.4 基于异常特征识别模型的预测算法
    4.5 实验验证与分析
        4.5.1 实验数据预处理
        4.5.2 基于线性基准模型的异常特征识别结果分析
        4.5.3 基于递归神经网络的异常特征识别结果分析
        4.5.4 基于卷积神经网络的异常特征识别结果分析
        4.5.5 相关特征识别算法预测结果比较分析
    4.6 本章小结
第5章 基于级联加权的混合个性化推荐算法
    5.1 引言
        5.1.1 现有研究存在的问题
        5.1.2 本文的解决思路
    5.2 问题与定义
    5.3 相似用户发现算法
        5.3.1 基于知识分类树的相似用户发现算法
        5.3.2 基于内容相似度的相似用户发现算法
        5.3.3 基于关联规则的特征匹配算法
    5.4 面向领域的个性化特征建模方法
        5.4.1 用户画像个性化特征建模方法
        5.4.2 基于分类树的领域知识建模方法
    5.5 基于级联加权的混合个性化推荐算法
    5.6 基于多用户的层次分析推荐形式化方法
    5.7 实验验证与分析
        5.7.1 决策推荐与协同服务评价体系
        5.7.2 相似用户发现与决策方案推荐结果
        5.7.3 相关推荐算法比较分析
    5.8 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其它成果
致谢
个人简历

(10)顾及尺度驱动的聚类知识挖掘方法及应用(论文提纲范文)

本论文创新点
摘要
ABSTRACT
1 绪论
    1.1 研究背景与意义
    1.2 研究现状
        1.2.1 顾及尺度驱动的聚类知识挖掘问题
        1.2.2 聚类知识挖掘模式
        1.2.3 双重聚类知识挖掘算法
        1.2.4 时序聚类知识挖掘算法
        1.2.5 多元关联关系聚类知识挖掘算法
    1.3 研究目标及研究内容
    1.4 研究的技术路线
    1.5 论文结构
2 顾及尺度驱动的聚类知识挖掘的尺度驱动分析与模式构建
    2.1 顾及尺度驱动的聚类知识挖掘的尺度驱动分析
    2.2 聚类知识挖掘模式
        2.2.1 聚类知识挖掘变量
        2.2.2 聚类知识挖掘单元
        2.2.3 聚类知识挖掘特征库构建
        2.2.4 聚类知识挖掘信息库构建
        2.2.5 顾及尺度驱动的聚类知识挖掘模型与算法
        2.2.6 聚类知识的评价分析与可视化
    2.3 本章小结
3 顾及尺度驱动的双重聚类知识挖掘
    3.1 引言
    3.2 双重聚类知识挖掘的尺度驱动分析
    3.3 顾及尺度驱动的双重聚类知识挖掘算法
    3.4 实验分析与验证
        3.4.1 基于模拟数据的算法分析与比较
        3.4.2 实际应用分析与比较
    3.5 本章小结
4 顾及尺度驱动的时序聚类知识挖掘
    4.1 基于矢量数据的尺度驱动的时序聚类知识挖掘
        4.1.1 引言
        4.1.2 基于矢量数据的时序聚类知识挖掘的尺度驱动分析
        4.1.3 基于矢量数据的顾及尺度驱动的时序聚类知识挖掘过程
        4.1.4 实验分析与验证
        4.1.5 讨论与分析
    4.2 基于栅格数据的尺度驱动的时序聚类知识挖掘
        4.2.1 引言
        4.2.2 基于栅格数据的时序聚类知识挖掘的尺度驱动分析
        4.2.3 基于栅格数据的顾及尺度驱动的时序聚类知识挖掘过程
        4.2.4 实验分析与验证
    4.3 本章小结
5 尺度驱动的多元关联关系聚类知识挖掘
    5.1 引言
    5.2 多元关联关系聚类知识挖掘的尺度驱动分析
    5.3 顾及尺度驱动的多元关联关系聚类知识挖掘过程
    5.4 实验分析与验证
        5.4.1 模拟数据分析与比较
        5.4.2 实际应用分析与比较
        5.4.3 多元关联关系聚类知识在土壤有机质预测中的应用
        5.4.4 实验结果与讨论
    5.5 本章小结
6 总结与展望
    6.1 本文主要工作与总结
    6.2 研究展望
参考文献
攻博期间发表的与学位论文相关的科研成果目录
致谢

四、时序模式发现算法研究与改进(论文参考文献)

  • [1]面向电信数据的智能反欺诈决策平台的设计与实现[D]. 钟睿. 北京邮电大学, 2021(01)
  • [2]基于因果机制的用户行为研究及应用[D]. 郑佳碧. 广东工业大学, 2021(08)
  • [3]基于需求-服务匹配的服务解决方案构造优化方法[D]. 刘睿霖. 哈尔滨工业大学, 2020
  • [4]流程对象在线实时知识发现系统的设计与实现[D]. 李国昌. 济南大学, 2020(04)
  • [5]基于时序挖掘的信息系统诊断平台设计与实现[D]. 陈加伟. 电子科技大学, 2020(07)
  • [6]基于不确定理论的时序关联规则挖掘算法的研究[D]. 张驰. 山西师范大学, 2020(07)
  • [7]基于时序数据挖掘的煤矿安全趋势性知识发现研究[D]. 王兆刚. 中国矿业大学(北京), 2020(04)
  • [8]基于电子病历的典型诊疗模式挖掘方法研究[D]. 陈静锋. 大连理工大学, 2019(06)
  • [9]基于特征关联的特征识别与推荐算法研究[D]. 孙明瑞. 哈尔滨工业大学, 2019
  • [10]顾及尺度驱动的聚类知识挖掘方法及应用[D]. 王晓密. 武汉大学, 2017(07)

标签:;  ;  ;  ;  ;  

序列模式发现算法的研究与改进
下载Doc文档

猜你喜欢