1 / 10
文档名称:

基于深度学习的验证码识别Web应用平台.doc

格式:doc   大小:18KB   页数:10页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于深度学习的验证码识别Web应用平台.doc

上传人:学习好资料 2022/6/25 文件大小:18 KB

下载得到文件列表

基于深度学习的验证码识别Web应用平台.doc

相关文档

文档介绍

文档介绍:基于深度学****的验证码识别Web应用平台
王昊 康晓凤 卢志科 施润杰 黄成鑫 摘 要:目前许多网站使用验证码阻止黑客进行***登录口令,但是随着技术的发展验证码识别的难度及成本日益提升,传统的OCR(Optical Char输入层到隐藏层,以及隐藏层到输出层之间的神经元都是全连接的,使得参数量巨大,神经网络训练耗时过长,很难进行训练,而CNN则通过局部连接和权值共享等方式解决了这个难点[3]。
CNN的神经层主要有三种:卷积层(Convolutional Layer)、池化层(Pooling Layer)、全连接层(Fully-Connected Layer),识别过程由三种神经层协调发展。本平台的识别功能,在创建识别模型的时候,使用卷积神经网络构建。传统的Lenet的模型结构是:输入层—卷积层—池化层—卷积层—池化层—全连接层—全连接层—输出层。而本平台识别模型如图1所示,采用输入层—卷积层—池化层—卷积层—池化层—卷积层—池化层—局部連接层—全连接层—全连接层—输出层的结构。相比较传统模型进行了改进,多添加了一次卷积层—池化层的过程,并对每层dropout防止过拟合的问题,这主要是针对验证码类型进行的修改,提高了模型识别率[4]。
TensorFlow TensorFlow是基于谷歌的神经网络算法库DistBelief研发的人工智能学****系统,2017年2月,正式发布了TensorFlow 。作为最受欢迎的深度学****框架之一,拥有丰富的算法库,高度的灵活性,真正的可移植性,多语言支持,完善的文档等特点。TensorFlow使用数据流图来表示计算任务,使用张量的形式表示数据,对图的节点可以进行数学运算,通过读写变量维护状态。本平台验证码识别功能使用Tensorflow框架来构建卷积神经网络模型。
Redis
Redis(Remote Dictionary Server)是一个开源的,且具有高性能的key-value存储系统。Redis具有轻量级,低延迟,高并发的优点。本平台使用Redis充当消息队列,通过Redis服务器使得web平台和验证码识别应用进行交互,具有较高性能,满足使用需求。
3 Vcode Identify平台实现(Build the platform of Vcode Identify)
本平台使用python语言编写,用CNN实现模型的建立、训练、识别,搭建web平台服务,使用Redis作消息队列,连接web服务和验证码识别应用,即可以分成三个层次架构:应用层、传输层和平台层。平台软件主要功能模块如图2所示,分为用户注册、用户登录、模型选择、识别检测还有生产接口。
验证码识别应用层
该层主要负责将验证码图片识别成对应验证码结果。传统的验证码识别通常需要将图片切割成几部分,使得每一张图片中只包含一个字符,然后训练单个字符模型,识别每个字符,再将每个识别出来的结果按原先顺序拼接成完整字符串,作为识别结果。而现在的字符型验证码很多字符都粘在一起,字符分布不均匀,很难做到将各个字符进行切割。操作流程如下:首先对彩色的验证码图片进行灰度化处理,接着将灰度化后的图像进行二值化,去除背景图的干扰,保留其中的字符。如果