文档介绍:篡法研究 学术探讨
基于 云计算 的贝叶斯 分类算法
在过滤垃圾 邮件 中的研 究
周 霞 王 华 军
成都 理工大学,四 成都
摘 要 为 了抵 制垃圾 邮件对互联 网及 其用户造成的严重不 良影 响 ,本 文采用高效的 贝叶斯分类算 法,基 于平
台实现垃圾邮件的过滤 系统 ,克服 了传统并行 系统在编程 实现和 系统扩展上 的不足 ,充分利 用云计 算环境优 势 ,使 系统 实现 简
单,扩展容 易,性能提 高;并做 了相关的试验 ,验证 了设计理论 。
关键宇 垃圾邮件 ;云计算 ;贝叶斯分类 ;;
是一种编程模 型,适用 于大规模数据集 的并
. 引言
行 运算 。任 务过程被 分成两个 处理阶段 :阶
垃圾邮件存在 于互联劂 中占用 大量的传输 、存储和运算 段 和 阶段 ,每个 阶段都 以键/值对作 为输入和输 出 ,可
资源 ,造成 巨大 的资源浪 费;对 信息 安全系 统也构成 了一 定 选 择他们 的类 型 。但 阶段 的输入 类型 必须与 阶
程度 的威胁 :浪费用户 的时间、精 力和 金钱 ,损害 了用户 的利 段 的输 出类 型 相匹配 。控 制作 业执 行过 程 的是两 类节 点 :
益 。 因此 正确 识别垃圾 邮件显 得尤其 重要 常见 的垃圾 邮 和 。运行 自己的任务 ,并
件过 滤技术 :邮件发送认证技 术仅仅保证 了合法 用户发送 邮 且将运 行的进度报告给 。负责调度 ,记
件 ;黑 白名单 技术 ,邮件 特