验证码识别:如何识别高级的验证码

来源:安全中国

、验证码基本知识

  1. 验证码主要目是强制人机交互来抵御机器自动化攻击

  2. 大部分验证码设计者并不得要领不了解图像处理机器视觉模式识别人工智能基本概念

  3. 利用验证码可以发财当然要犯罪:比如招商银行密码只有6位验证码形同虚设计算机很快就能破解个有钱账户很多帐户是可以网上交易

  4. 也有设计比较好比如Yahoo,Google,Microsoft等而国内Tencent中文验证码虽然难但算不上好

   2、人工智能模式识别机器视觉图像处理基本知识

  1)主要流程:

  比如我们要从副图片中识别出验证码;比如我们要从副图片中检测并识别出张人脸 大概有哪些步骤呢?

  1.图像采集:验证码呢就直接通过HTTP抓HTML然后分析出图片url然后下载保存就可以了 如果是人脸检测识别般要通过视屏采集设备采集回来通过A/D转操作存为数字图片或者视频频

  2.预处理:检测是正确图像格式转换到合适格式压缩剪切出ROI去除噪音灰度化转换色彩空间这些

  3.检测:车牌检测识别系统要先找到车牌大概位置人脸检测系统要找出图片中所有人脸(包括疑似人脸);验证码识别呢主要是找出文字所在主要区域

  4.前处理:人脸检测和识别会对人脸在识别前作些校正比如面内面外旋转扭曲等我这里验证码识别般”要做文字切割

  5.训练:通过各种模式识别机器学习算法来挑选和训练合适数量训练集不是训练样本越多越好过学习泛化能力差问题可能在这里出现步不是必须有些识别算法是不需要训练

  6.识别:输入待识别处理后图片转换成分类器需要输入格式然后通过输出类和置信度来判断大概可能是哪个字母识别本质上就是分类

  2)关键概念:

  图像处理:般指针对数字图像某种数学处理比如投影钝化锐化细化边缘检测 2值化压缩各种数据变换等等

  1. 2值化:般图片都是彩色按照逼真程度可能很多级别为了降低计算复杂度方便后续处理如果在不损失关键信息情况下能将图片处理成黑白两种颜色那就最好不过了

  2.细化:找出图像骨架图像线条可能是很宽通过细化将宽度将为1某些地方可能大于1区别细化算法可能有区别差异比如是否更靠近线条中间比如是否保持联通行等

  3.边缘检测:主要是理解边缘概念边缘实际上是图像中图像像素属性变化剧烈地方可能通过个固定门限值来判断也可能是自适应门限可能是图像全局也可能是局部不能说那个就定好不过大部分时候自适应局部门限可能要好点被分析可能是颜色也可能是灰度图像灰度

  机器视觉:利用计算机来模式实现人视觉 比如物体检测定位识别按照对图像理解层次差别分高阶和低阶理解

  模式识别:对事物或者现象某种表示方式(数值文字我们这里主要想说是数值)通过些处理和分析来描述归类理解解释这些事物现象及其某种抽象

  人工智能:这种概念比较宽上面这些都属于人工智能这个大方向简单点不要过分学院派理解就是把人类很“智能”东西给模拟出来协助生物人来处理问题特别是在计算机里面





  • 篇文章: Delphi利用HOOK拦截封包原理

  • 篇文章: 3389SHIFT后门自动扫描
  • Tags:  qq验证码识别 验证码识别引擎 验证码识别软件 验证码识别

    延伸阅读

    最新评论

    发表评论