2008年12月1日原创,使用轮廓以及扇形扫描实现qq的验证码识别
常用的验证码识别方案对一些复杂的,粘连的字符串基本上是实现不了,最近CrazyCoder在研究腾讯的验证码识别,有一些心得体会,不敢独享,分享出来共大家参考,qq变态的验证码对应于切图和分割相当麻烦,并且干扰线去除也是一些纷繁芜杂,目前也仅仅实现了48%左右的识别率,进行分享下,看如下图片所示
我们这里用传统的方法分割识别貌似不可实现
首先做一些基本分析,字符串粘连,干扰线扯淡,我们第一步要想办法把干扰线给去掉
这里采用一种斜线扫描的方案,也就是以对角线为基点,进行逐斜线扫描记录扫描的有色值的点,然后计算等平记录直线附件跳跃的指定阈值的点,可以很轻松的...
[阅读全文] [PDF]
2008年8月21日复杂背景的验证码识别破解,以Discuz的动画验证码为例
对于比较复杂的验证码,比如DZ论坛最新的验证码,处理起来相对麻烦一些,但是原理还是和普通的识别一样的,无非多了个背景处理的方案,看如下对DZ论坛的验证码的识别的思路
//power by www.crazycoder.cn
首先我们要去除它的背景,对于这样稍微复杂的背景,用过去的方法很难做到,上图的例子还不是很明显,我发现很多图片背景色和字母色近似,而且字母颜色是不断变化的,背景也是不断变化的
那我初始的想法是找到图片中使用颜色最多的方法,于是我们用HSL表示各点颜色,接着进行统计,得到最大的几个峰值,这里便是图片中几个最丰富的颜色的L值得累加值
...
[阅读全文] [PDF]
2008年8月21日验证码识别,最新Discuz验证码和PhpWind验证码的识别
需验证码识别,对常用论坛的验证码识别的时候大家用来做群发是最合适不过了。一个非常有意义的参考
注:非crazycoder原装,文章是转载的,原文出处不祥了,很多地方都有,找不到原出处了
验证码(captcha)是伴随自动提交程序(spam)的出现而出现的。现在各种论坛、博客、投票等程序都带有验证码功能。大部分验证码都比较容 易识别,只需要简单对照一下特征码就可以得到百分之百准确的结果。也有稍微复杂一点的,比如phpwind和discuz的验证码。
前段时间做了phpwind和discuz的验证码识别,phpwind6.0以前的验证码和discuz最新的验证码如果在不改变后台验...
[阅读全文] [PDF]
2008年8月4日原创,c#简单验证码识别,发布一个赶集网的图片电话号码识别的代码
以前帮朋友写的代码,现在公布出来,道理很简单的,切割,提取验证码,因为验证码字体并未重合,所以切割起来相当的简单,如果您要做分类信息的网站,采集还是可取的,识别率100%
疯狂代码原创发布,转载请注明出处
C#代码如下:
using System;
using System.Collections.Generic;
using System.Text;
using System.Drawing;
namespace CrazyCoder.Common.Decode
{
public class GanjiImageDecode : Cra...
[阅读全文] [PDF]
老早的一个QQ验证码识别代码了,现在已经不可用,但是里面的方法值得大家学习和参考
目前并不可用,但是可用作为参考
using System;
namespace QQ
{
/// <summary>
/// yzm 的摘要说明。
/// </summary>
public class yzm
{
public yzm(public System.Drawing.Bitmap pic)
{
this.bp = pic;
}
/// <summary>
/// 将一个...
[阅读全文] [PDF]
2008年8月2日验证码识别必备,c#分析bmp图形文件,一个有用的BMP图形分析类
验证码识别最重要的就是对BMP文件进行分析,发布一个常用的BMP图形分析类
using System;
2using CrazyCoder.Commom.IO;
3namespace CrazyCoder.Common.Image
4{
5 /**//// <summary>
6 /// BMP 的摘要说明。
7 /// </summary>
8 public class BMP
9 {
10
11 public BMP()
...
[阅读全文] [PDF]
2008年8月1日中文验证码,用C#生成随机中文汉字验证码的基本原理
中文验证码识别的难度稍微大一些,很多朋友都在实践中文验证码,发一个原理出来供大家参考
首先要了解编码原理和。net处理编码原理和字符集定义
1、汉字编码原理
到底怎么办到随机生成汉字的呢?汉字从哪里来的呢?是不是有个后台数据表,其中存放了所需要的所有汉字,使用程序随机取出几个汉字组合就行了 呢?使用后台数据库先将所有汉字存起来使用时随机取出,这也是一种办法,但是中文汉字有这么多,怎么来制作呢?其实可以不使用任何后台数据库,使用程序就 能做到这一切。要知道如何生成汉字,就得先了解中文汉字的编码原理。
1980年,为了使每一个汉字有一个全国统一的代码,我国颁布了第一...
[阅读全文] [PDF]
2008年7月31日验证码识别 验证码识别技术
2008年7月31日实例程序实现对CSDN验证码的识别
2008年7月31日区域对比验证码识别,超级简单的Region对比识别验证码
2008年7月30日数字验证码的识别
2008年7月29日高级验证码识别,如何识别高级的验证码
验证码识别大致是三步曲,分割,去背景,提取特征码,但是对于一些高级的验证码识别,是需要一些特殊的手段的,了解一下验证码识别的技术同样对我们设计验证码还是很有帮助的
下面谈一下高级的验证码识别技术
...
[阅读全文] [PDF]
1 共12条 分1页

