专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅
  首先要了解对方网页运行机制 这可以用httpwacth或者httplook来看下http发送和接收数据这两个工具应该说是比较简单易懂这里就不再介绍了主要关注内容是header和post内容般会包括cookieReferer页面和其他些乱其 8糟可能看不懂变量还有就是正常交互参数比如需要post或者getquery所包含东西   httplook和httpwacth网上有很多下载这里推荐使用httpwach可以直接嵌入到ie中个人觉得这个比较好用这两个工具可以到我上传在csdn资源中下载地址为   http://download.csdn.net/us [阅读全文] [PDF]
背景  随着Internet普及网络信息正以极高速度增长在这么多数据中找到自己需要信息是件很繁琐事情找到需要信息后如何获取也是件麻烦事这就需要Internet信息抓取来代替人工操作 所谓Internet信息抓取就是会按照用户关键词或关键网站WebSite来收集相应信息并提供给用户想要信息格式  信息量增加会带来信息网站WebSite发布人员工作量剧增为实现信息发布系统实现信息自 动发布、减少工作人员工作量、即时跟踪最新信息就需要自动 [阅读全文] [PDF]
<%@ page contentType="text/html;char=gb2312"%> <% String sCurrentLine; String sTotalString; sCurrentLine=""; sTotalString=""; java.io.InputStream l [阅读全文] [PDF]
<%@ page contentType="text/html;charset=gb2312"%><%String sCurrentLine;String sTotalString;sCurrentLine="";sTotalString="";java.io.InputStream l_urlStream;java.net.URL l_url = new java.net.URL("http://www.163.net/");java.net.HttpURLConnec [阅读全文] [PDF]
1 共4条 分1页