数据挖掘论文
数据挖掘论文(精选10篇) 由大文斗范文网会员“dongdong634”投稿精心推荐,小编希望对你的学习工作能带来参考借鉴作用。
篇1:数据挖掘论文
题目:档案信息管理系统中的计算机数据挖掘技术探讨
摘要:伴随着计算机技术的不断进步和发展,数据挖掘技术成为数据处理工作中的重点技术,能借助相关算法搜索相关信息,在节省人力资本的同时,提高数据检索的实际效率,基于此,被广泛应用在数据密集型行业中。笔者简要分析了计算机数据挖掘技术,并集中阐释了档案信息管理系统计算机数据仓库的建立和技术实现过程,以供参考。
关键词:档案信息管理系统;计算机;数据挖掘技术;
1数据挖掘技术概述
数据挖掘技术就是指在超多随机数据中提取隐含信息,并且将其整合后应用在知识处理体系的技术过程。若是从技术层面判定数据挖掘技术,则需要将其划分在商业数据处理技术中,整合商业数据提取和转化机制,并且建构更加系统化的分析模型和处理机制,从根本上优化商业决策。借助数据挖掘技术能建构完整的数据仓库,满足集成性、时变性以及非易失性等需求,整和数据处理和冗余参数,确保技术框架结构的完整性。
目前,数据挖掘技术常用的工具,如SAS企业的EnterpriseMiner、IBM企业的IntellientMiner以及SPSS企业的Clementine等应用都十分广泛。企业在实际工作过程中,往往会利用数据源和数据预处理工具进行数据定型和更新管理,并且应用聚类分析模块、决策树分析模块以及关联分析算法等,借助数据挖掘技术对相关数据进行处理。
2档案信息管理系统计算机数据仓库的建立
2.1客户需求单元
为了充分发挥档案信息管理系统的优势,要结合客户的实际需求建立完整的处理框架体系。在数据库体系建立中,要适应迭代式处理特征,并且从用户需求出发整合数据模型,保证其建立过程能按照整体规划有序进行,且能按照目标和分析框架参数完成操作。首先,要确立基础性的数据仓库对象,由于是档案信息管理,因此,要集中划分档案数据分析的主题,并且有效录入档案信息,确保满足档案的数据分析需求。其次,要对日常工作中的用户数据进行集中的挖掘处理,从根本上提高数据仓库分析的完整性。
(1)确定数据仓库的基础性用户,其中,主要包括档案工作人员和使用人员,结合不同人员的工作需求建立相应的数据仓库。
(2)档案工作要利用数据分析和档案用户特征分析进行分类描述。
(3)确定档案的基础性分类主题,一般而言,要将文书档案归档状况、卷数等基础性信息作为分类依据。
2.2数据库设计单元
在设计过程中,要针对不同维度建立相应的参数体系和组成结构,并且有效整合组成事实表的主键项目,建立框架结构。
第一,建立事实表。事实表是数据模型的核心单元,主要是记录相关业务和统计数据的表,能整合数据仓库中的信息单元,并且提升多维空间处理效果,确保数据储存过程切实有效。(1)档案管理中文书档案目录卷数事实表:事实表主键,字段类型Int,字段为Id;文书归档年份,字段类型Int,字段为Gdyear_key;文书归档类型,字段类型Int,字段为Ajtm_key;文书归档单位,字段类型Int,字段为Gddw_key;文书档案生成年份,字段类型Int,字段为Ajscsj_key,以及文书档案包括的文件数目。(2)档案管理中文书档案卷数事实表:事实表主键,字段类型Int,字段为Id;文书归档利用日期,字段类型Int,字段为Date_key;文书归档利用单位,字段类型Int,字段为Dw_key;文书归档利用类别,字段类型Int,字段为Dalb_key;文书归档利用年份,字段类型Int,字段为Dayear_key等[1]。
第二,建立维度表,在实际数据仓库建立和运维工作中,提高数据管理效果和水平,确保建立循环和反馈的系统框架体系,并且处理增长过程和完善过程,有效实现数据库模型设计以及相关维护操作。首先,要对模式的基础性维度进行分析并且制作相应的表,主要包括档案年度维表、利用方式维表等。其次,要建构数据库星型模型体系。最后,要集中判定数据库工具,保证数据库平台在客户管理工作方面具备必须的优势,集中制订商务智能解决方案,保证集成环境的稳定性和数据仓库建模的效果,真正提高数据抽取以及转换工作的实际水平。需要注意的是,在全面整合和分析处理数据的过程中,要分离文书档案中的数据,相关操作如下:
deletefromdaggdtemp//删除临时表中的数据
Chcount=dag1.importfile(dbo.uwswj)//将文书目录中数据导出到数据窗口
Dag1.update()//将数据窗口中的数据保存到临时表
相关技术人员要对数据进行有效处理,以保证相关数据合并操作、连接操作以及条件性拆分操作等都能按照数据预处理管理要求合理化进行,从根本上维护数据处理效果。
2.3多维数据模型建立单元
在档案多维数据模型建立的过程中,相关技术人员要判定联机分析处理项目和数据挖掘方案,整合信息系统中的数据源、数据视图、维度参数以及属性参数等,保证具体单元能发挥其实际作用,并且真正发挥档案维表的稳定性、安全性优势。
第一,档案事实表中的数据稳定,事实表是加载和处理档案数据的基本模块,按照档案目录数据表和档案利用状况表分析和判定其类别和归档时间,从而提高数据独立分析水平。一方面,能追加有效的数据,保证数据仓库信息的基本质量,也能追加时间判定标准,能在实际操作中减少扫描整个表浪费的时间,从根本上提高实际效率。另一方面,能删除数据,实现数据更新,检索相关关键词即可。并且也能同时修改数据,维护档案撤出和档案追加的动态化处理效果。
第二,档案维表的安全性。在维表管理工作中,档案参数和数据的安全稳定性十分关键,由于其不会随着时间的推移出现变化,因此,要对其进行合理的处理和协调。维表本身的存储空间较小,尽管结构发生变化的概率不大,但仍会对代表的对象产生影响,这就会使得数据出现动态的变化。对于这种改变,需要借助新维生成的方式进行处理,从而保证不同维表能有效连接,整合正确数据的同时,也能对事实表外键进行分析[2]。
3档案信息管理系统计算机数据仓库的实现
3.1描述需求
随着互联网技术和数据库技术不断进步,要提高档案数字化水平以及完善信息化整合机制,加快数据库管控体系的更新,确保设备存储以及网络环境一体化水平能满足需求,尤其是在档案资源重组和预测项目中,只有从根本上落实数据挖掘体系,才能为后续信息档案管理项目升级奠定坚实基础。另外,在数据表和文书等基础性数据结构模型建立的基础上,要按照规律制定具有个性化的主动性服务机制。
3.2关联计算[由www.xiexiebang.comKI(1980-2009年)相关文献中治疗神经根型颈椎病的方剂建立数据库,采用SPSS11.5统计软件这些治方常用药物使用频次频率、性味频率、归经频率分析比较,治疗神经根型颈椎病的中药共计99味,使用频次479味次;所用药物种类依次以补益药、活血化瘀药、祛风湿药运用最多,其中药味以辛、苦为主,药性以温、寒为主,归经以肝、脾、心为主,而本病以肝肾亏虚,气血瘀滞为主,临床以补益药、活血化瘀药、祛风湿药等中药运用最多。这对于医家
治疗该病选用药物的性味、归经等具有指导好处。陈元川等[11]检索2004年1月至2013年3月发表的以单纯口服中药治疗神经根型颈椎病的有关文献,对其中的方剂和药物进行统计、归类、分析,最终纳入32首方剂,涉及111味中药,补气药、发散风寒药、活血止痛药、补血药等使用频次较高;葛根、白芍、黄芪、当归、桂枝等药物使用频次较高,证实与古方桂枝加葛根汤主药相同,且该方扶阳解表的治法与该研究得出的扶正祛邪的结果相吻合,同时也证实石氏伤科强调治伤科病当“以气为主,以血为先”等正确性。所以大数据背后的规律和关系在很多方面古今是一致的,同时数据依据的支持也为现代神经根型颈椎病治疗带给有力的保障。谢辉等[12]收集2009至2014年10月3日的166张治疗神经根型颈椎病的治方建立数据库,采用关联规则算法、复杂系统熵聚类等无监督数据挖掘方法,利用中医传承辅助平台(TCMISS)软件分析处方中各种药物的使用频次、药物之间的关联规则、核心药物组合和新处方,从中挖掘出治疗该病中医中的常用药物、药对,阐明了治疗该病以解肌散寒药、补气活血药、祛风胜湿药和温经通络药为主,治法主要包括解肌舒筋、益气活血和补益肝肾,这一方面很清晰明了地展示了药物使用频率、药物之间的联系,证实其与很多古代
经典中治疗神经根型颈椎病的治则、治法及用药规律是吻合的,是临床用药的积累和升华,可有效地指导临床并提高疗效;另一方面也为中药新药的创制带给处方来源,指导新药研发[13]。
4小结
数据挖掘技术作为一种新型的研究技术,在神经根型颈椎病的治方研究中的运用相对于其他领域是偏少的,并且基本上是研究文献资料上出现的治方,在对名老中医个人治疗经验及用药规律的总结是缺乏的,因此研究范围广而缺乏针对性,同时使用该技术的相关软件种类往往是单一的。此刻研究者在研究中医方剂时往往采用传统的研究方法,这就导致在大数据的研究中耗时、耗力甚则无能为力,同样也难以精准地提取大数据背后的隐藏的潜在关系和规则及缺乏对未知状况的预测。产生这样的现状,一方面是很多研究者尚未清楚该技术在方剂研究中的优势所在,思维模式尚未更新;另一方面是很多研究者尚未清楚该技术的操作技能及软件种类及其应用范围。故以后应向更多研究者普及该技术的软件种类、其中的优势及操作技能,让该技术在临床中使用更广,产生更大的效益。
参考文献
[1]舒正渝.浅谈数据挖掘技术及应用[J].中国西部科技,2010,9(5):38-39.[2]曹毅,季聪华.临床科研设计与分析[M].杭州:浙江科学技术出版社,2015:189.[3]王静,崔蒙.数据挖掘技术在中医方剂学研究中的应用[J].中国中医药信息杂志,2008,15(3):103-104.[4]陈丈伟.数据仓库与数据挖掘[M].北京:清华大学出版社,2006:5.[5]杨玉珠.数据挖掘技术综述与应用[J].河南科技,2014,10(19):21.[6]余侃侃.数据挖掘技术在方剂配伍中的研究现状及研究方法[J].中国医药指南,2008,6(24):310-312.[7]赵睿曦.方证数据挖掘分析张氏骨伤对腰椎间盘突出症的辨证用药规律[J].陕西中医药大学学报,2016,39(6):44-46.[8]李曙明,尹战海,王莹.神经根型颈椎病的影像学特点和分型[J].中国矫形外科杂志,2013,21(1):7-11.[9]刘向前,陈民,黄广平等.颈项肩臂痛内治古方常用药物的统计分析[J].中华中医药学刊,2012,30(9):42-44.[10]齐兵献,樊成虎,李兆和.神经根型颈椎病中医用药规律的文献研究[J].河南中医,2012,32(4):518-519.[11]陈元川,王翔,庞坚,等.单纯口服中药治疗神经根型颈椎病用药分析[J].上海中医药杂志,2014,48(6):78-80.[12]谢辉,刘军,潘建科,等.基于数据挖掘方法的神经根型颈椎病用药规律研究[J].世界中西医结合杂志,2015,10(6):849-852.[13]唐仕欢,杨洪军.中医组方用药规律研究进展述评[J].中国实验方剂学杂志,2013(5):359-363.篇8:数据挖掘论文
关于计算机Web数据及其在电子商务中的应用探析
论文摘要:目前计算机Web数据挖掘技术被广泛应用于电子商务活动,它是随着网络技术和数据库技术的快速发展而出现的一种新技术,已成为现代电子商务企业获取市场信息极为重要的工具。介绍了Web数据挖掘的含义、特征及类别,重点探究了计算机Web数据挖掘技术在电子商务中的几种典型应用。
论文关键词:数据挖掘;电子商务;Web数据挖掘
1引言
当前,随着网络技术的发展和数据库技术的迅猛发展,有效推动了商务活动由传统活动向电子商务变革。电子商务就是利用计算机和网络技术以及远程通信技术,实现整个商务活动的电子化、数字化和网络化。基于Internet的电子商务快速发展,使现代企业积累了超多的数据,这些数据不仅仅能给企业带来更多有用信息,同时还使其他现代企业管理者能够及时准确的搜集到超多的数据。访问客户带给更多更优质的服务,成为电子商务成败的关键因素,因而受到现代电子商务经营者的高度关注,这也对计算机web数据技术提出了新的要求,Web数据挖掘技术应运而生。它是一种能够从网上获取超多数据,并能有效地提取有用信息供企业决策者分析参考,以便科学合理制定和调整营销策略,为客户带给动态、个性化、高效率服务的全新技术。目前,它已成为电子商务活动中不可或缺的重要载体。
2计算机web数据挖掘概述
2.1计算机web数据挖掘的由来
计算机Web数据挖掘是一个在Web资源上将对自己有用的数据信息进行筛选的过程。Web数据挖掘是把传统的数据挖掘思想和方法移植到Web应用中,即从现有的Web文档和活动中挑选自己感兴趣且有用的模式或者隐藏的数据信息。计算机Web数据挖掘能够在多领域中展示其作用,目前已被广泛应用于数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等多个方面,其中对商务活动的变革起到重大的推动作用方面最为明显。
2.2计算机Web数据挖掘含义及特征
(1)Web数据挖掘的含义。
Web数据挖掘是指数据挖掘技术在Web环境下的应用,是一项数据挖掘技术与WWW技术相结合产生的新技术,综合运用到了计算机语言、Internet、人工智能、统计学、信息学等多个领域的技术。具体说,就是透过充分利用网络(Internet),挖掘用户访问日志文件、商品信息、搜索信息、购销信息以及网络用户登记信息等资料,从中找出隐性的、潜在有用的和有价值的信息,最后再用于企业管理和商业决策。
(2)Web数据挖掘的特点。
计算机Web数据挖掘技术具有以下特点:一是用户不用带给主观的评价信息;二是用户“访问模式动态获取”不会过时;三是能够处理大规模的数据量,并且使用方便;四是与传统数据库和数据仓库相比,Web是一个巨大、分布广泛、全球性的信息服务中心。
(3)计算机web数据挖掘技术的类别。
web数据挖掘技术共有三类:第一类是Web使用记录挖掘。就是透过网络对Web日志记录进行挖掘,查找用户访问Web页面的模式及潜在客户等信息,以此提高其站点所有服务的竞争力。第二类是Web资料挖掘。既是指从Web文档中抽取知识的过程。第三类是Web结构挖掘。就是透过对Web上超多文档集合的资料进行小结、聚类、关联分析的方式,从Web文档的组织结构和链接关系中预测相关信息和知识。
3计算机web数据挖掘技术与电子商务的关系
借助计算机技术和网络技术的日臻成熟,电子商务正以其快速、便捷的特点受到越来越多的企业和个人的关注。随着电子商务企业业务规模的不断扩大,电子商务企业的商品和客户数量也随之迅速增加,电子商务企业以此获得了超多的数据,这些数据正成为了电子商务企业客户管理和销售管理的重要信息。为了更好地开发和利用这些数据资源,以便给企业和客户带来更多的便利和实惠,各种数据挖掘技术也逐渐被应用到电子商务网站中。目前,基于数据挖掘(个性是web数据挖掘)技术构建的电子商务推荐系统正成为电子商务推荐系统发展的一种趋势。
4计算机web数据挖掘在电子商务中的具体应用
(1)电子商务中的web数据挖掘的过程。
在电子商务中,web数据挖掘的过程主要有以下三个阶段:既是数据准备阶段、数据挖掘操作阶段、结果表达和解释阶段。如果在结果表达阶段中,分析结果不能让电子商务企业的决策者满意,就需要重复上述过程,直到满意为止。
(2)Web数据挖掘技术在电子商务中的应用。
目前,电子商务在企业中得到广泛应用,极大地促进了电子商务网站的兴起,经过分析必须时期内站点上的用户的访问信息,便可发现该商务站点上潜在的客户群体、相关页面、聚类客户等数据信息,企业信息系统因此会获得超多的数据,如此多的数据使Web数据挖掘有了丰富的数据基础,使它在各种商业领域有着更加重要的实用价值。因而,电子商务必将是未来Web数据挖掘的主攻方向。Web数据挖掘技术在电子商务中的应用主要包含以下几方面:
一是寻找潜在客户。电子商务活动中,企业的销售商能够利用分类技术在Internet上找到潜在客户,透过挖掘Web日志记录等信息资源,对访问者进行分类,寻找访问客户共同的特征和规律,然后从已经存在的分类中找到潜在的客户。
二是留住访问客户。电子商务企业透过商务网站能够充分挖掘客户浏览访问时留下的信息,了解客户的浏览行为,然后根据客户不同的爱好和要求,及时做出让访问客户满意的页面推荐和专属性产品,以此来不断提高网站访问的满意度,最大限度延长客户驻留的时间,实现留住老客户发掘新客户的目的。
三是带给营销策略参考。透过Web数据挖掘,电子商务企业销售商能够透过挖掘商品访问状况和销售状况,同时结合市场的变化状况,透过聚类分析的方法,推导出客户访问的规律,不同的消费需求以及消费产品的生命周期等状况,为决策带给及时而准确的信息参考,以便决策者能够适时做出商品销售策略调整,优化商品营销。
四是完善商务网站设计。电子商务网站站点设计者能够利用关联规则,来了解客户的行为记录和反馈状况,并以此作为改善网站的依据,不断对网站的组织结构进行优化来方便客户访问,不断提高网站的点击率。
5结语
本文对Web挖掘技术进行了综述,讲述了其在电子商务中广泛应用。能够看出,随着计算机技术和数据库技术快速发展,计算机Web数据技术的应用将更加广泛,Web数据挖掘也将成为十分重要的研究领域,研究前景巨大、好处深远。目前,我国的Web数据应用还处于探索和起步阶段,还有许多问题值得深入研究。
篇9:数据挖掘论文
题目:软件工程数据挖掘研究进展
摘要:数据挖掘是指在大数据中开发出有价值信息数据的过程。计算机技术的不断进步,透过人工的方式进行软件的开发与维护难度较大。而数据挖掘能够有效的提升软件开发的效率,并能够在超多的数据中获得有效的数据。文章主要探究软件工程中数据挖掘技术的任务和存在的问题,并重点论述软件开发过程中出现的问题和相关的解决措施。
关键词:软件工程;数据挖掘;解决措施;
在软件开发过程中,为了能够获得更加准确的数据资源,软件的研发人员就需要搜集和整理数据。但是在大数据时代,人工获取数据信息的难度极大。当前,软件工程中运用最多的就是数据挖掘技术。软件挖掘技术是传统数据挖掘技术在软件工程方向的其中一部分。但是它具有自身的特征,体此刻以下三个方面:
(1)在软件工程中,对有效数据的挖掘和处理;
(2)挖掘数据算法的选取问题;
(3)软件的开发者该如何选取数据。
1在软件工程中数据挖掘的主要任务
在数据挖掘技术中,软件工程数据挖掘是其中之一,其挖掘的过程与传统数据的挖掘无异。通常包括三个阶段:第一阶段,数据的预处理;第二阶段,数据的挖掘;第三阶段,对结果的评估。第一阶段的主要任务有对数据的分类、对异常数据的检测以及整理和提取复杂信息等。虽然软件工程的数据挖掘和传统的数据挖掘存在相似性,但是也存在必须的差异,其主要体此刻以下三个方面:
1.1软件工程的数据更加复杂
软件工程数据主要包括两种,一种是软件报告,另外一种是软件的版本信息。当然还包括一些软件代码和注释在内的非结构化数据信息。这两种软件工程数据的算法是不同的,但是两者之间又有必须的联系,这也是软件工程数据挖掘复杂性的重要原因。
1.2数据分析结果的表现更加特殊
传统的数据挖掘结果能够透过很多种结果展示出来,最常见的有报表和文字的方式。但是对于软件工程的数据挖掘来讲,它最主要的职能是给软件的研发人员带给更加精准的案例,软件漏洞的实际定位以及设计构造方面的信息,同时也包括数据挖掘的统计结果。所以这就要求软件工程的数据挖掘需要更加先进的结果提交方式和途径。
1.3对数据挖掘结果难以达成一致的评价
我国传统的数据挖掘已经初步构成统一的评价标准,而且评价体系相对成熟。但是软件工程的数据挖掘过程中,研发人员需要更多复杂而又具体的数据信息,所以数据的表示方法也相对多样化,数据之间难以进行比较,所以也就难以达成一致的评价标准和结果。不难看出,软件工程数据挖掘的关键在于对挖掘数据的预处理和对数据结果的表示方法。
2软件工程研发阶段出现的问题和解决措施
软件在研发阶段主要的任务是对软件运行程序的编写。以下是软件在编码和结果的提交过程中出现的问题和相应的解决措施。
2.1对软件代码的编写过程
该过程需要软件的研发人员能够对自己需要编写的代码结构与功能有充分的了解和认识。并能够依据自身掌握的信息,在数据库中搜集到能够使用的数据信息。通常状况下,编程需要的数据信息能够分为三个方面:
(1)软件的研发人员能够在已经存在的代码中搜集能够重新使用的代码;
(2)软件的研发人员能够搜寻能够重用的静态规则,比如继承关系等。
(3)软件的开发人员搜寻能够重用的动态规则。
包括软件的接口调用顺序等。在寻找以上信息的过程中,通常是利用软件的帮忙文档、寻求外界帮忙和搜集代码的方式实现,但是以上方式在搜集信息过程中往往会遇到较多的问题,比如:帮忙文档的准确性较低,同时不够完整,可利用的重用信息不多等。
2.2对软件代码的重用
在对软件代码重用过程中,最关键的问题是软件的研发人员务必掌握需要的类或方法,并能够透过与之有联系的代码实现代码的重用。但是这种方式哦足迹信息将会耗费工作人员超多的精力。而透过关键词在代码库中搜集可重用的软件代码,同时按照代码的相关度对搜集到的代码进行排序,该过程使用的原理就是可重用的代码必然模式基本类似,最终所展现出来的搜索结果是以上下文结构的方式展现的。比如:类与类之间的联系。其实现的具体流程如下:
(1)软件的开发人员建立同时具备例程和上下文架构的代码库;
(2)软件的研发人员能够向代码库带给类的相关信息,然后对反馈的结果进行评估,建立新型的代码库。
(3)未来的研发人员在搜集过程中能够按照评估结果的高低排序,便于查询,极大地缩减工作人员的任务量,提升其工作效率。
2.3对动态规则的重用
软件工程领域内对动态规则重用的研究已经相对成熟,透过在编译器内安装特定插件的方式检验代码是否为动态规则最适用的,并能够将不适合的规则反馈给软件的研发人员。其操作流程为:
(1)软件的研发人员能够规定动态规则的顺序,主要表此刻:使用某一函数是不能够调用其他的函数。
(2)实现对相关数据的保存,能够透过队列等简单的数据结构完成。在利用编译拓展中检测其中的顺序。
(3)能够将错误的信息反馈给软件的研发人员。
3结束语
在软件工程的数据挖掘过程中,数据挖掘的概念才逐步被定义,但是所需要挖掘的数据是已经存在的。数据挖掘技术在软件工程中的运用能够降低研发人员的工作量,同时软件工程与数据挖掘的结合是计算机技术必然的发展方向。从数据挖掘的过程来讲,在其整个实施过程和周期中都包括软件工程。而对数据挖掘的技术手段来讲,它在软件工程中的运用更加普遍。在对数据挖掘技术的研究过程中能够发现,该技术虽然已经获得必须的效果,但是还有更多未被挖掘的空间,还需要进一步的研究和发现。
参考文献
[1]王艺蓉.试析面向软件工程数据挖掘的开发测试技术[J].电子技术与软件工程,2017(18):64.[2]吴彦博.软件工程中数据挖掘技术的运用探索[J].数字通信世界,2017(09):187.[3]周雨辰.数据挖掘技术在软件工程中的应用研究[J].电脑迷,2017(08):27-28.[4]刘桂林.分析软件工程中数据挖掘技术的应用方式[J].中国新通信,2017,19(13):119.篇10:数据挖掘论文
数据挖掘在电力调度自动化系统的应用
摘要:电力调度自动化系统主要是被应用在线调度生产运行中,能够对数据信息进行分析、控制、传输。数据挖掘技术作为一种人工智能和数据库技术结合的新型技术形式,将其应用到电力调度自动化系统中能够有效解决电力调动自动化系统数据信息应用不合理的问题。文章在阐述数据挖掘和电力调度自动化系统内涵的基础上,结合蚁群算法改善原有周期性数据挖掘方法,旨在进一步提升电力调度自动化系统运行速度,为相关人员的报表制定、事故预警带给帮忙。
关键词:数据挖掘;电力调度自动化系统;应用
在大数据技术的不断发展下,人们对数据信息的需求增加,但是现阶段社会发展中缺乏对数据信息进行有效分析、处理的工具。数据库系统也仅仅是对数据信息的简单处理,无法充分挖掘数据信息背后的隐藏信息,因而无法发挥出数据信息在人类社会发展中的重要作用。电力调度自动化系统中包含超多电力数据信息,但是在实际应用中这些信息是很难被完全挖掘出来的。数据挖掘的出现有效解决了信息无法充分挖掘的问题,能够实现对噪声数据、不完全数据的有效处理。在数据挖掘中,关联规则数据是数据挖掘的重要课题,透过关联规则能够发现不同数据库数据信息之间的关联,为数据挖掘带给有力支持。为此,文章重点分析基于关联规则的数据挖掘在电力调度自动化系统中的应用。
1数据挖掘概述
1.1内涵和分类
在信息技术的发展下,我国数据库库存容量急剧扩张,在庞大的数据信息中怎样获取有效的数据信息成为相关人员重点思考的问题。数据挖掘能够从技术层面来分析、处理这些数据信息,透过各种分析工具的利用来找到数据信息和模型构建之间的关联,为相关领域的发展带给重要决策支持。在信息挖掘技术的发展下,出现了不同类型的数据挖掘技术和方法。
1.2关联规则挖掘
关联规则挖掘是数据挖掘的重要分支,是常见的数据挖掘方法,主要是对超多数据之间关联问题的发现和分析,在找到数据联系之后决定哪些事件能够一齐发生。数据库中的关联规则描述如下所示:假设I={i1、i2......im}是由m个不同项目组合构成的集合,项的集合是项集,包括k个项集,给定事务D(交易数据库),事务(交易)T从属于数据项(I),T是唯一的标示符。在X属于T的时候,交易T则是包含项集X,关联规则X=Y在交易数据库中成立。
2电力调度自动化系统概述
2.1内涵
电力调度自动化系统能够为电网系统安全、稳定运行带给重要支持,并为相关电力人员工作、决策带给有力信息的支持。电力调度自动化系统的组成如下所示:第一,前置机。前置机能够从RTU从完成数据信息的收集整理工作,并能够结合实际对系统的指令进行接收、解释。第二,主备用服务器。主备泳服务器包括数据库和实时库服务器,是电力调度系统的重要组成部件,能够对系统各个工作站的运行进行监督。第三,网络服务器。网络服务器主要是对数据信息分布和数据表整理工作的监督。第四,卫星钟。卫星钟系统将全球定位时间作为系统时间。第五,物理隔离开关。物理隔离开关能够解决数据的隔离应用问题。
2.2电力调度自动化系统对数据挖掘技术的需求
电力导调度自动化系统对数据挖掘技术的需求具体表此刻以下几个方面:第一,透过数据挖掘技术减少电力调度自动化系统的工作时间,提高工作效率。第二,数据挖掘能够提高数据挖掘技术的管理应用水平,减少外界因素对电力调度自动化的干扰。第三,能够从不同角度对数据信息进行定量、定性分析。第四,为电网报告的分析和制定带给辅助支持。第五,实现了对数据信息的及时查询,为电力调度自动化工作带给了支持。
3基于蚁群算法的周期性关联规则数据挖掘
3.1周期关联规则
周期性关联规则挖掘是时态约束关联规则的一种,适用于对周期性关联的发现层面,比如每年夏季城市居民用电量的均值比其他季节高,城市居民周末用电量平均值比其他周末时间高等。
3.2蚁群算法
蚂蚁的群体行为表现出一种信息正反馈现象,蚁群算法由转移规则和信息素更新规则组成,具体能够描述成:假设平面上有n个城市,n个城市的TSP问题来找到n个城市的最短路径。假设蚁群系统中蚂蚁的数量是m、d(i,j=1,2,…,n),代表的是城市i到城市j之间的距离,b(t)表示t时刻位于城市i的蚂蚁个数。在初始阶段,各个线路上的信息量是对等的,假设τij(0)=c,蚂蚁k在运动的过程中根据信息量来选取下一步所走的方向,t时刻蚂蚁k由城市i转移到城市j的概率表示如(1)所示。
3.3基于蚁群算法的周期性关联规则
假设T1、T2,Tmin为系统时间定义单位组成的时间表达式,都比零大,假设T1<T2,差的绝对值比极小时间值的小,称作T1在T2之前发生。如果T1=T2,差的绝对值和极小时间值相等,则是说明T1和T2同时发生。假设T1,T2是系统时间定义单位组成的时间表达式,都比零大,int=[T1、T2]是T1到T2的时间隔。基于蚁群算法的周期性关联规则操作首先需要对数据集进行分类整理,在时间差表满足数据库要求的状况下将数据集按照时间分成多个分块,并按照时态属性进行升序排列,结合每个类别进行周期性关联规则挖掘,构成多个数据集。其次,对各个分类数据集进行周期性数据挖掘分析、改善。最后,对周期性数据集挖掘的改善。对数据信息进行排列整理,如果两个周期性序列相交,以周期小的为主,在数据的时间跨度内对数据的子集进行截取。
4数据挖掘在电力调度自动化系统中的应用
4.1基于周期性关联规则挖掘的数据分析系统平台
在社会经济的发展下,电力调度自动化系统从原先的实时性监控报表查询系统转变为智能调度自动化系统,高级应用软件的应用促进了电力调度系统朝着智能化的方向发展。基于周期性关联规则挖掘的数据分析系统平台选取微软的平台,在该平台的支持下为电力调度系统运行带给了丰富数据资源的支持,且具备强大的数据库访问潜力。
4.2基于数据桥的数据集成模块设计
在电力调度自动化系统的应用中存在多个标准,这些标准对分布式电力系统发展起到了重要作用,但是在各个数据集成规约不同的影响下,电力企业发展容易出现信息混乱的现象。为了避免这种现象的发生,在数据集成模块中需要进行数据清洗操作。
4.3数据分析功能模块设计
第一,同期数据分析模块。同期数据分析模块一般被人们用在调度自动化数据系统的横纵向比较,透过对同期数据的比对分析能够为电力调度系统数据评估带给更多便利。同期比较分析模块应用了动态生成查询语句,能够对数据信息进行动态化的查询和分析整理。第二,周期性数据分析。周期性数据分析主要是在数据库系统中挖掘具有周期性特点的数据集,从而对数据波动状况进行清晰的反应。在周期性数据分析模块挖掘算法中存在一个最小时间的误差参数,这参数是周期数据集的基础数据,影响周期性数据分析的精确度。第三,数据预警分析。数据预警主要是结合现有的调度自动化系统报警信息和数据挖掘周期数据集来对关联数据进行分析,数据分析系统采取了有限权值分配的方法,预警列表按照预警信息的大小进行有序排列,具体包含报警周期性数据集、预警信息周期性数据集大小、预警模式等资料。
5结束语
综上所述,文章在阐述数据挖掘内涵和电力调度自动化系统内涵的基础上研究了周期性关联规则的数据挖掘算法知识,并将其应用到电力调度自动化系统中,取得了良好的效果。周期性关联规则算法是数据挖掘技术的主流发展方向,在从历史数据中寻找规律的同时能够为电力调度自动化系统运行带给支持,需要引起相关人员的重视。
参考文献:
[1]肖福明.浅析数据挖掘在电力调度自动化系统中的应用[J].通讯世界,2014(17):58-59.[2]李阳.数据挖掘在电力调度自动化系统中的应用[D].华北电力大学(河北),2009.[3]朱维佳,曹坚.电力调度自动化系统中数据挖掘技术的应用[J].电气时代,2015(07):108-111.[4]于存水.基于智能电网调度系统的调度监控平台的设计与实现[D].吉林大学,2013.[5]李艳.关于数据挖掘中关联规则算法的相关问题研究[J].科技创新与应用,2017(33):161+163.数据挖掘论文(精选10篇)如果还不能满足你的要求,请在大文斗范文网搜索更多其他数据挖掘论文范文。
