js中字符串比较,js和C#中的字符串编码解码

最近朋友问我关于编码和加密问题,下午有点时间就查了一些资料,总结一下与大家分享:
在用javascript对URL字符串进行编码中,虽然escape()、encodeURI()、encodeURIComponent()三种方法都能对一些影响URL完整性的特殊字符进行过滤。但后两者是将字符串转换为UTF-8的方式来传输,解决了页面编码不一至导致的乱码问题。例如:发送页与接受页的编码格式(Charset)不一致(假设发送页面是GB2312而接收页面编码是UTF-8),使用escape()转换传输中文字串就会出现乱码问题。 以下是JS下对URL进行编/解码的各种方法: 1、escape 方法:返回一个可在所有计算机上读取的编码 String 对象。 function escape(charString : String) : String 不会被此方法编码的字符: @ * / + 说明:escape 方法返回一个包含 charstring 内容的字符串值(Unicode 格式)。所有空格、标点、 重音符号以及任何其他非 ASCII 字符都用 %xx 编码替换,其中 xx 等于表示该字符的十六进制数。 例如,空格返回为“%20”。(字符值大于 255 的字符以 %uxxxx 格式存储。) 注意:escape 方法不能用来对“统一资源标识符”(URI) 进行编码。对其编码应使用 encodeURI 和encodeURIComponent 方法。 2、encodeURI 方法:返回编码为有效的统一资源标识符 (URI) 的字符串。 function encodeURI(URIString : String) : String 不会被此方法编码的字符:! @ # $ & * ( ) = : / ; ? + ' 说明:encodeURI 方法返回一个已编码的 URI。如果将编码结果传递给 decodeURI,则将返回初始的字符串。encodeURI 不对下列字符进行编码:“:”、“/”、“;”和“?”。请使用 encodeURIComponent 对这些字符进行编码。 3、encodeURIComponent 方法:返回编码为统一资源标识符 (URI) 的有效组件的字符串。 function encodeURIComponent(encodedURIString : String) : String 不会被此方法编码的字符:! * ( ) ' 说明:encodeURIComponent 方法返回一个已编码的 URI。如果将编码结果传递给decodeURIComponent,则将返回初始的字符串。因为 encodeURIComponent 方法将对所有字符编码, 请注意,如果该字符串代表一个路径,例如 /folder1/folder2/default.html,则其中的斜杠也将被编码,这样,当该字符串作为请求发送到 Web 服务器时它将是无效的。如果字符串中包含多个 URI 组件,请使用 encodeURI 方法进行编码。 4、unescape 方法:从用 escape 方法编码的 String 对象中返回已解码的字符串。 function unescape(charString : String) : String 说明:unescape 方法返回一个包含 charstring 内容的字符串值。所有以 %xx 十六进制形式编码的 字符都用 ASCII 字符集当中等效的字符代替。(以 %uxxxx 格式(Unicode 字符)编码的字符用十六 进制编码 xxxx 的 Unicode 字符代替。) 注意:unescape 方法不应用于解码“统一资源标识符”(URI)。请改用 decodeURI 和 decodeURIComponent 方法。 5、decodeURI 方法:返回一个已编码的统一资源标识符 (URI) 的非编码形式。 function decodeURI(URIstring : String) : String decodeURIComponent 方法:返回统一资源标识符 (URI) 的一个已编码组件的非编码形式。 function decodeURIComponent(encodedURIString : String) : String BTW:C#中对URL编码的方法。。。 编码:Server.UrlEncode(string) 解码:Server.UrlDecode(string) 前面三种客户端编码都可以用这个方法在后台解码。
关于HttpUtility.UrlEncodeHttpUtility.UrlDecodeServer.UrlEncodeServer.UrlDecode
HttpUtility.UrlEncode 方法:
对 URL 字符串进行编码,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。
重载列表 将字节数组转换为已编码的 URL 字符串,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。 [C#] public static string UrlEncode(byte[]);
对 URL 字符串进行编码,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。 [C#] public static string UrlEncode(string);
使用指定的编码对象对 URL 字符串进行编码,以便实现从 Web 服务器到客户端的可靠 HTTP 传输。 [C#] public static string UrlEncode(string, Encoding);
从数组中的指定位置开始一直到指定的字节数为止,将字节数组转换为 URL 编码的字符串,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。 [C#] public static string UrlEncode(byte[], int, int);
HttpUtility.UrlDecode 方法:
将已经为在 URL 中传输而编码的字符串转换为解码的字符串。
重载列表 将已经为在 URL 中传输而编码的字符串转换为解码的字符串。 [C#] public static string UrlDecode(string);
使用指定的解码对象将 URL 编码的字节数组转换为已解码的字符串。 [C#] public static string UrlDecode(byte[], Encoding);
使用指定的编码对象将 URL 编码的字符串转换为已解码的字符串。 [C#] public static string UrlDecode(string, Encoding);
使用指定的编码对象,从数组中的指定位置开始到指定的字节数为止,将 URL 编码的字节数组转换为已解码的字符串。 [C#] public static string UrlDecode(byte[], int, int, Encoding);
Server是HttpServerUtility类的实例,是System.Web.UI.Page的属性。 HttpServerUtility.UrlEncode 方法: 编码字符串,以便通过 URL 从 Web 服务器到客户端进行可靠的 HTTP 传输。
重载列表 对字符串进行 URL 编码,并返回已编码的字符串。 [C#] public string UrlEncode(string);
URL 对字符串进行编码,并将结果输出发送到 TextWriter 输出流。 [C#] public void UrlEncode(string, TextWriter); 例: String TestString = "This is a ."; StringWriter writer = new StringWriter(); Server.UrlEncode(TestString, writer); String EncodedString = writer.ToString();
HttpServerUtility.UrlDecode 方法: 对字符串进行解码,该字符串为了进行 HTTP 传输而进行编码并在 URL 中发送到服务器。
重载列表 对字符串进行 URL 解码并返回已解码的字符串。 [C#] public string UrlDecode(string);
对在 URL 中接收的 HTML 字符串进行解码,并将结果输出发送到 TextWriter 输出流。 [C#] public void UrlDecode(string, TextWriter);
需要注意的几点: 1、HttpUtility.UrlEncode,HttpUtility.UrlDecode是静态方法,而Server.UrlEncode,Server.UrlDecode是实例方法。 2、Server是HttpServerUtility类的实例,是System.Web.UI.Page的属性。 3、用HttpUtility.UrlEncode编码后的字符串和用Server.UrlEncode进行编码后的字符串对象不一样: 例如: string url="http://search.99read.com/index.aspx?book_search=all&main_str=奥迷尔"; Response.Write(HttpUtility.UrlEncode(url)); Response.Write("
"); Response.Write(Server.UrlEncode(url));
输出结果是: http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%e5%a5%a5%e8%bf%b7%e5%b0%94 http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb
原因:Server.UrlEncode的编码方式是按照本地程序设置的编码方式进行编码的,而HttpUtility.UrlEncode是默认的按照.net的utf-8格式进行编码的。
如果改一下程序: string url1="http://search.99read.com/index.aspx?book_search=all&main_str=奥迷尔"; Response.Write(HttpUtility.UrlEncode(url1,System.Text.Encoding.GetEncoding("GB2312"))); Response.Write("
"); Response.Write(Server.UrlEncode(url1));
输出的结果是: http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb
4、有时候可能别的系统传递过来的url是用别的编码方式编码的。 介绍自己编写的一个方法,可以获取指定编码格式的QueryString。
public string GetNonNullQueryString(string key,Encoding encoding) { //引用System.Collections.Specialized和System.Text命名空间 string stringValue; System.Collections.Specialized.NameValueCollection encodingQueryString; //该方法是在2.0中新增的 encodingQueryString = HttpUtility.ParseQueryString(Request.Url.Query,encoding); //'里面的key就是你提交的参数的Key return encodingQueryString[key] != null ? encodingQueryString[key].Trim() : ""; }
调用: string url = GetNonNullQueryString("url",Encoding.UTF8).Trim();
在对URL进行编码时,该用哪一个?这两都使用上有什么区别吗? 测试: string file="文件上(传)篇.doc"; string Server_UrlEncode=Server.UrlEncode(file); string Server_UrlDecode=Server.UrlDecode(Server_UrlEncode); string HttpUtility_UrlEncode=System.Web.HttpUtility.UrlEncode(file); string HttpUtility_UrlDecode=System.Web.HttpUtility.UrlDecode(HttpUtility_UrlEncode); Response.Write("原数据:"+file); SFun.WriteLine("Server.UrlEncode:"+Server_UrlEncode); SFun.WriteLine("Server.UrlDecode:"+Server_UrlDecode); SFun.WriteLine("HttpUtility.UrlEncode:"+HttpUtility_UrlEncode); SFun.WriteLine("HttpUtility.UrlDecode:"+HttpUtility_UrlDecode); 输出: 原数据:文件上(传)篇.doc Server.UrlEncode:%ce%c4%bc%fe%c9%cf%a3%a8%b4%ab%a3%a9%c6%aa.doc Server.UrlDecode:文件上(传)篇.doc HttpUtility.UrlEncode:%e6%96%87%e4%bb%b6%e4%b8%8a%ef%bc%88%e4%bc%a0%ef%bc%89%e7%af%87.doc HttpUtility.UrlDecode:文件上(传)篇.doc 区别在于:HttpUtility.UrlEncode()默认是以UTF8对URL进行编码,而Server.UrlEncode()则以默认的编码对URL进行编码。 在用 ASP.Net 开发页面的时候, 我们常常通过 System.Web.HttpUtility.UrlEncode 和 UrlDecode 在页面间通过 URL 传递参数. 成对的使用 Encode 和 Decode 是没有问题的. 但是, 我们在编写文件下载的页面的时候, 常常用如下方法来指定下载的文件的名称: Response.AddHeader("Content-Disposition","attachment; filename=" + HttpUtility.UrlEncode(fileName, Encoding.UTF8)); 之所以转换成 UTF8 是为了支持中文文件名. 这 时候问题就来了, 因为 HttpUtility.UrlEncode 在 Encode 的时候, 将空格转换成加号('+'), 在 Decode 的时候将加号转为空格, 但是浏览器是不能理解加号为空格的, 所以如果文件名包含了空格, 在浏览器下载得到的文件, 空格就变成了加号. 一个解决办法是, 在 HttpUtility 的 UrlEncode 之后, 将 "+" 替换成 "%20"( 如果原来是 "+" 则被转换成 "%2b" ) , 如: fileName = HttpUtility.UrlEncode(fileName, Encoding.UTF8); fileName = fileName.Replace("+", "%20"); 不明白微软为什么要把空格转换成加号而不是"%20". 记得 JDK 的 UrlEncoder 是将空格转换成 "%20"的. 经检查, 在 .Net 2.0 也是这样. 有时候默认aspx是以utf-8为编码的,你的程序默认编码(),问题出现了,以前没有问题的HttpUtility.UrlDecode在Page.Request回的值是乱码这就是上面说的HttpUtility.UrlDecode默认以UTF8对URL进行编码,这种情况下面只需将HttpUtility.UrlDecode改成Server.UrlEncode即可。
二.js加密解密
在做网页时(其实是网页木马呵呵),最让人烦恼的是自己辛辛苦苦写出来的客户端IE运行的javascript代码常常被别人轻易的拷贝,实在让自己的心里有点不是滋味,要知道自己写点东西也挺累的......^*^ 以加密下面的javascript代码为例: 一:最简单的加密解密 大家对于javascript函数escape()和unescape()想必是比较了解啦(很多网页加密在用它们),分别是编码和解码字符串,比如例子代码用escape()函数加密后变为如下格式: alert%28%22%u9ED1%u5BA2%u9632%u7EBF%22%29%3B 如何?还看的懂吗?当然其中的ASCII字符"alert"并没有被加密,如果愿意我们可以写点javascript代码重新把它加密如下: %61%6C%65%72%74%28%22%u9ED1%u5BA2%u9632%u7EBF%22%29%3B 呵呵!如何?这次是完全都加密了! 当然,这样加密后的代码是不能直接运行的,幸好还有eval(codeString)可用,这个函数的作用就是检查javascript代码并执行,必选项 codeString 参数是包含有效 javascript 代码的字符串值,加上上面的解码unescape(),加密后的结果如下:
是不是很简单?不要高兴,解密也就同样的简单,解密代码都摆给别人啦(unescape())!呵呵 二:转义字符""的妙用 大家可能对转义字符""不太熟悉,但对于javascript提供了一些特殊字符如:n (换行)、 r (回车)、' (单引号)等应该是有所了解的吧?其实""后面还可以跟八进制或十六进制的数字,如字符"a"则可以表示为:"141"或"x61"(注意是小写字符"x"),至于双字节字符如汉字"黑"则仅能用十六进制表示为"u9ED1"(注意是小写字符"u"),其中字符"u"表示是双字节字符,根据这个原理例子代码则可以表示为:
八进制转义字符串如下:
十六进制转义字符串如下:
这次没有了解码函数,因为javascript执行时会自行转换,同样解码也是很简单如下:
就会弹出对话框告诉你解密后的结果! 三:使用Microsoft出品的脚本编码器Script Encoder来进行编码 工具的使用就不多介绍啦!我是直接使用javascript调用控件Scripting.Encoder完成的编码!代码如下:
'; var Encode=Senc.EncodeScriptFile(".htm",code,0,""); alert(Encode);
编码后的结果如下:
够难看懂得吧?但相应的解密工具早已出来,而且连解密网页都有!因为其解密网页代码过多,我就不多说拉!给大家介绍一下我独创的解密代码,如下:
咋样?够简单吧?它是原理是:编码后的代码运行前IE会先对其进行解码,如果我们先把加密的代码放入一个自定义函数如上面的decode()中,然后对自定义函数decode调用toString()方法,得到的将是解码后的代码!
如果你觉得这样编码得到的代码LANGUAGE属性是JScript.Encode,很容易让人识破,那么还有一个几乎不为人知的window对象的方法execScript(),其原形为:
window.execScript( sExpression, sLanguage )
参数: sExpression: 必选项。字符串(String)。要被执行的代码。 sLanguage : 必选项。字符串(String)。指定执行的代码的语言。默认值为 Microsoft JScript 使用时,前面的"window"可以省略不写!
利用它我们可以很好的运行编码后的javascript代码,如下:
你可以利用方法二对其中的""号内的字符串再进行编码,使得"JScript.Encode"以及编码特征码"#@~^"不出现,效果会更好!
四:任意添加NUL空字符(十六进制00H) 一次偶然的实验,使我发现在HTML网页中任意位置添加任意个数的"空字符",IE照样会正常显示其中的内容,并正常执行其中的javascript 代码,而添加的"空字符"我们在用一般的编辑器查看时,会显示形如空格或黑块,使得原码很难看懂,如用记事本查看则"空字符"会变成"空格",利用这个原理加密结果如下:(其中显示的"空格"代表"空字符")
a l er t (" 我 爱 一 起") ; < / SC R I P T>
如何?是不是显得乱七八糟的?如果不知道方法的人很难想到要去掉里面的"空字符"(00H)的! 五:无用内容混乱以及换行空格TAB大法 在javascript代码中我们可以加入大量的无用字符串或数字,以及无用代码和注释内容等等,使真正的有用代码埋没在其中,并把有用的代码中能加入换行、空格、TAB的地方加入大量换行、空格、TAB,并可以把正常的字符串用""来进行换行,这样就会使得代码难以看懂!如我加密后的形式如下:
至少如果我看到这样的代码是不会有心思去分析它的,你哪? 六:自写解密函数法 这个方法和一、二差不多,只不过是自己写个函数对代码进行解密,很多VBS病毒使用这种方法对自身进行加密,来防止特征码扫描!下面是我写的一个简单的加密解密函数,加密代码如下(详细参照文件"加密.htm"):
运行得到加密结果为:
o%CD%D1%D7%E6%9CJ%u9EF3%uFA73%uF1D4%u14F1%u7EE1Kd
相应的加密后解密的代码如下:
七:错误的利用 利用try{}catch(e){}结构对代码进行测试解密,虽然这个想法很好(呵呵,夸夸自己),因为实用性不大,我仅给个例子
三。实现Server.UrlEncode和Server.UrlDecode的js代码
var EncodeURI = function(unzipStr,isCusEncode){ if(isCusEncode){ var zipArray = new Array(); var zipstr = ""; var lens = new Array(); for(var i=0;i?[]^`{|}~%"; var tt= ""; for(var i=0;i 0x7f){ zipstr+=encodeURI(unzipStr.substr(i,1)); }else{ if(chr==" ") zipstr+="+"; else if(strSpecial.indexOf(chr)!=-1) zipstr+="%"+c.toString(16); else zipstr+=chr; } } return zipstr; } } var DecodeURI = function(zipStr,isCusEncode){ if(isCusEncode){ var zipArray = zipStr.split("N"); var zipSrcStr = zipArray[0]; var zipLens; if(zipArray[1]){ zipLens = zipArray[1].split("O"); }else{ zipLens.length = 0; } var uzipStr = ""; for(var j=0;j0x7f){ uzipStr+=decodeURI("%"+asc.toString()+zipStr.substring(i+3,i+9).toString()); ; i+=8; }else{ uzipStr+=AsciiToString(parseInt("0x"+asc)); i+=2; } }else{ uzipStr+= chr; } } return uzipStr; } } var StringToAscii = function(str){ return str.charCodeAt(0).toString(16); } var AsciiToString = function(asccode){ return String.fromCharCode(asccode); }
Tags:  js字符串长度 js字符串替换 js字符串 js截取字符串 js中字符串比较

延伸阅读

最新评论

发表评论