1 / 6
文档名称:

一种钓鱼网站识别系统及方法.docx

格式:docx   大小:19KB   页数:6页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种钓鱼网站识别系统及方法.docx

上传人:421989820 2022/6/28 文件大小:19 KB

下载得到文件列表

一种钓鱼网站识别系统及方法.docx

相关文档

文档介绍

文档介绍:一种钓鱼网站识别系统及方法
专利名称:一种钓鱼网站识别系统及方法
技术领域:
本发明涉及网络安全技术领域,特别涉及一种钓鱼网站识别系统及方法。
背景技术:
随着互联网的发展,网民数量逐年增加。在上网时,除了传统的木马、病毒的威胁,鱼网站识别方法,其包括步骤收集待识别网站中出现的所有链接,得到所述链接对应的域名;
统计所述域名在所述待识别网站中出现的次数,找到出现次数最多的域名,记作目标域名;根据所述目标域名与所述待识别网站的自身域名判断所述待识别网站是否是钓鱼网站。其中,所述根据所述目标域名与所述待识别网站的自身
域名判断所述待识别网站是否是钓鱼网站,进一步包括步骤判断所述目标域名与所述自身域名是否相同,如果是,判定所述待识别网站不是钓鱼网站,结束流程;否则,执行下一步; 计算所述目标域名的出现次数与所述自身域名的出现次数之间的比例,以及所述目标域名与所述自身域名之间的相似度,根据所述比例和所述相似度判断所述待识别网站是否是钓鱼网站。 其中,所述计算所述目标域名的出现次数与所述自身域名的出现次数之间的比例,以及所述目标域名与所述自身域名之间的相似度,根据所述比例和所述相似度判断所述待识别网站是否是钓鱼网站,进一步包括步骤计算所述目标域名的出现次数与所述自身域名的出现次数之间的比例;计算所述目标域名与所述自身域名之间的相似度;判断是否满足以下条件所述比例大于预定比例,并且所述相似度大于预定阈值;如果是,判定所述待识别网站是钓鱼网站;否则,判定所述待识别网站不是钓鱼网站。其中,所述计算所述目标域名与所述自身域名之间的相似度,进一步包括步骤构建所述目标域名的字符串与所述自身域名的字符串的对比阵列,将所述目标域名的字符串设置在所述对比阵列的第一行并保持位置固定,将所述自身域名的字符串设置在所述对比阵列的第二行并自左向右移动,对两行字符串中重叠的字符进行对比;当所述目标域名的首字符与所述自身域名的尾字符对齐时,计算所述目标域名与所述自身域名之间的第一相似度计算值Q1 ;当所述目标域名的第二字符与所述自身域名的尾字符对齐时,计算所述目标域名与所述自身域名之间的第二相似度计算值Q2;依次类推,当所述目标域名的尾字符与所述自身域名的首字符对齐时,计算所述目标域名与所述自身域名之间的第m相似度计算值Qm ;其中,m=ni+n2-l, H1表示所述目标域名的字符串长度,n2表示所述自身域名的字符串长度;根据下述公式计算得到所述目标域名与所述自身域名之间的相似度Qmax Q^maxtQp Q2, Q3, ......Qj。其中,所述当所述目标域名的首字符与所述自身域名的尾字符对齐时,计算所述目标域名与所述自身域名之间的第一相似度计算值Q1;当所述目标域名的第二字符与所述自身域名的尾字符对齐时,计算所述目标域名与所述自身域名之间的第二相似度计算值Q2 ;依次类推,当所述目标域名的尾字符与所述自身域名的首字符对齐时,计算所述目标域名与所述自身域名之间的第m相似度计算值Q111中,第i相似度计算值Qi的计算公式如下Qi=Mi2 X Li ;其中,i为自然数,并且,l^i^m ;并且,Mi=SiAiniax ;Li=IVnniax ;
其中,ri表示在第i次对比时,所述自身域名的字符串与所述目标域名的字符串中,重叠的字符个数;n_表示所述自身域名的字符串与所述目标