专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅
常用的验证码识别方案对一些复杂的,粘连的字符串基本上是实现不了,最近CrazyCoder在研究腾讯的验证码识别,有一些心得体会,不敢独享,分享出来共大家参考,qq变态的验证码对应于切图和分割相当麻烦,并且干扰线去除也是一些纷繁芜杂,目前也仅仅实现了48%左右的识别率,进行分享下,看如下图片所示 我们这里用传统的方法分割识别貌似不可实现 首先做一些基本分析,字符串粘连,干扰线扯淡,我们第一步要想办法把干扰线给去掉 这里采用一种斜线扫描的方案,也就是以对角线为基点,进行逐斜线扫描记录扫描的有色值的点,然后计算等平记录直线附件跳跃的指定阈值的点,可以很轻松的... [阅读全文] [PDF]
对于比较复杂的验证码,比如DZ论坛最新的验证码,处理起来相对麻烦一些,但是原理还是和普通的识别一样的,无非多了个背景处理的方案,看如下对DZ论坛的验证码的识别的思路 //power by www.crazycoder.cn 首先我们要去除它的背景,对于这样稍微复杂的背景,用过去的方法很难做到,上图的例子还不是很明显,我发现很多图片背景色和字母色近似,而且字母颜色是不断变化的,背景也是不断变化的 那我初始的想法是找到图片中使用颜色最多的方法,于是我们用HSL表示各点颜色,接着进行统计,得到最大的几个峰值,这里便是图片中几个最丰富的颜色的L值得累加值 ... [阅读全文] [PDF]
需验证码识别,对常用论坛的验证码识别的时候大家用来做群发是最合适不过了。一个非常有意义的参考 注:非crazycoder原装,文章是转载的,原文出处不祥了,很多地方都有,找不到原出处了 验证码(captcha)是伴随自动提交程序(spam)的出现而出现的。现在各种论坛、博客、投票等程序都带有验证码功能。大部分验证码都比较容 易识别,只需要简单对照一下特征码就可以得到百分之百准确的结果。也有稍微复杂一点的,比如phpwind和discuz的验证码。 前段时间做了phpwind和discuz的验证码识别,phpwind6.0以前的验证码和discuz最新的验证码如果在不改变后台验... [阅读全文] [PDF]
以前帮朋友写的代码,现在公布出来,道理很简单的,切割,提取验证码,因为验证码字体并未重合,所以切割起来相当的简单,如果您要做分类信息的网站,采集还是可取的,识别率100% 疯狂代码原创发布,转载请注明出处 C#代码如下: using System; using System.Collections.Generic; using System.Text; using System.Drawing; namespace CrazyCoder.Common.Decode { public class GanjiImageDecode : Cra... [阅读全文] [PDF]
老早的一个QQ验证码识别代码了,现在已经不可用,但是里面的方法值得大家学习和参考 目前并不可用,但是可用作为参考 using System; namespace QQ { /// <summary> /// yzm 的摘要说明。 /// </summary> public class yzm { public yzm(public System.Drawing.Bitmap pic) { this.bp = pic; } /// <summary> /// 将一个... [阅读全文] [PDF]
验证码识别最重要的就是对BMP文件进行分析,发布一个常用的BMP图形分析类 using System; 2using CrazyCoder.Commom.IO; 3namespace CrazyCoder.Common.Image 4{ 5 /**//// <summary> 6 /// BMP 的摘要说明。 7 /// </summary> 8 public class BMP 9 { 10 11 public BMP() ... [阅读全文] [PDF]
中文验证码识别的难度稍微大一些,很多朋友都在实践中文验证码,发一个原理出来供大家参考 首先要了解编码原理和。net处理编码原理和字符集定义 1、汉字编码原理   到底怎么办到随机生成汉字的呢?汉字从哪里来的呢?是不是有个后台数据表,其中存放了所需要的所有汉字,使用程序随机取出几个汉字组合就行了 呢?使用后台数据库先将所有汉字存起来使用时随机取出,这也是一种办法,但是中文汉字有这么多,怎么来制作呢?其实可以不使用任何后台数据库,使用程序就 能做到这一切。要知道如何生成汉字,就得先了解中文汉字的编码原理。   1980年,为了使每一个汉字有一个全国统一的代码,我国颁布了第一... [阅读全文] [PDF]
PR: wait... I: wait... L: wait... LD: wait... I: wait... ... [阅读全文] [PDF]
PR: wait... I: wait... L: wait... LD: wait... I: wait... ... [阅读全文] [PDF]
PR: wait... I: wait... L: wait... LD: wait... I: wait... ... [阅读全文] [PDF]
2008年7月30日数字验证码的识别
PR: wait... I: wait... L: wait... LD: wait... I: wait... ... [阅读全文] [PDF]
验证码识别大致是三步曲,分割,去背景,提取特征码,但是对于一些高级的验证码识别,是需要一些特殊的手段的,了解一下验证码识别的技术同样对我们设计验证码还是很有帮助的 下面谈一下高级的验证码识别技术 ... [阅读全文] [PDF]
1 共12条 分1页