文档介绍:基于优化粒子群算法的云环境大数据聚类算法
摘 要: 对于传统云环境大数据聚类中的量子进化方法的聚类精准度比较低的问题,为了降低存储开销,提高数据管理能力与调度能力,提出将优化粒子群算法作为基础的云环境大数据聚类算法,对云环境用户只需要和网络连接,就能够利用云计算强大的计算和存储能力实现功能。基于云计算背景,大数据信息处理能够实现数据聚类,利用大数据的特征参量可以对数据进行分析。基于数据聚类可实现大数据的创建,并且利用模式识别与诊断实现服务分析。
1 云环境大数据存储的设计
云计算是指通过现代互联网对结构模型与存储空间进行动态扩展。要想以云计算作为背景,进行分类挖掘与大数据存储,首先就要实现大数据存储机制架构的创建。在云环境中,大数据存储通过虚拟化存储在计算机集群开展云计算部署,通过USB磁盘层、结构层、计算机等构成,企业利用终端就能够使用,通过分布式计算机就能进行计算。
云环境大数据存储结构如图1所示。
利用图1所示结构,将屋内分配应用到云计算虚拟机中。通过式(1)、式(2)实现优化聚类算法,利用最优解实现云计算背景中大数据特点聚类物理分配,公式为: 然后收集样本且分析、判断,之后给予此样本,假如设置大数据库数据信息为S=X1,X2,…,Xk,则在时间段T1,T2,…,Tk中对样本数据进行分析。划分云计算环境大数据集合X为c类,c,n大于1,实现数据的空间分割,以此得到大数据存储结构中心的矢量。由于客户端具有相同的模块大小,从而可开展云聚类。利用以上云计算背景大数据存储机制分析,从而实现数据聚类精准分析[1]。
假如基于云计算背景下时间序列表示为:
X与Y指的是数形结合,以此得出云计算背景数据聚类空间分析:
式中:x(t)为云环境大数据聚类的信息流时间序列;J为云环境数据重构时间窗函数;t为数据手术时间。对角向量指的是数据中心粒子距离与目标解,利用误差反转降低训练梯度,使大数据优化特点充分展现出来,将其输入到数据聚类中识别计算模式。
2 基本粒子群算法
基本粒子群算法的位置与速度更新公式为:
式中:k为迭代次数;[Xid]为粒子位置;[Vid]为粒子速度;C1为学习因子;C2为加速常量;Plid为个体极值;Pgd为全局极值。
基本粒子群算法参数
基本粒子群算法中参数主要包括学习因子C1和C2、最大速度vmax、惯性权重系数[ω]和种群规模m。
惯性权重系数
惯性权重是指基本粒子群算法主要参数,其能够对算法开发与探索的能力进行控制。惯性权重大小和粒子目前速度继承相关,惯性权重比较大就会提高粒子速度,提高探索能力。
在选择惯性权重的过程中,主要有时变与常量,算法执行效果和惯性权重有密切关系。~,此方法能够使基本粒子群开始时对大区域探索,然后对最优解大致位置进行探索,在惯性权重减小过程中,降低了粒子速度,开始精准局部搜索[2]。
学习因子
C1指的是粒子对历史最优值权重系数的跟踪,其指的是粒子对自身认知。C2指的是粒子跟踪群体的最优质权重系数,其指的是粒子对整体认知。其能够对粒子全局最优粒子与个体最优粒子方向飞行最大步长进