在迅猛增加海量异构Web信息资源中蕴含着巨大潜在价值数据如何从浩如烟海Web资源中发现潜在有价值知识成为迫在眉睫问题人们迫切需要能从Web上快速、有效地发现资源和数据工具以提高在Web上检索信息、利用信息效率 目前Web文本挖掘大部分研究都是建立在词汇袋(bag of words)或称向量表示法(Vector Representation)基础上这种思路方法将单个词汇看成文档集合中属性只从统计角度将词汇孤立地看待而忽略该词汇出现位置和上下文环境词汇袋思路方法个弊端是自由文本中数据丰富词汇量非常大处理起来很困难为解决这个问题人们做了相应研究采取了区别技 [阅读全文] [PDF]
1 共1条 分1页
- 网站安全检测工具:15个在线网站WebSite检测工具
- 有关网站WebSite挂马的处理
- puttyssh:使用putty(ssh)密匙安全登录服务器
- phpmssql函数:用PHP函数解决SQL injection
- ftpservu8.0教程:保护FTP服务器 做好Serv—U的安全防范
- iisweb服务器:加强IIS安全机制 建立高安全Web服务器
- :十大安全窍门技巧 可以让你的网站WebSite远离危险
- 物理路径:防止.NET木马列所有站物理路径 防止.JPG类型木马
- 解决网页被script挂马的办法
- 本地安全策略:设置IP安全策略 将木马阻杀在端口的外
- 如何能有效杜绝木马干扰 防范后门病毒
- 如何防sql注入:网站WebSite如何防SQL注入
- web服务器:教你如何才能打好WEB服务器安全攻坚战
- excel常用技巧:ASP常用窍门技巧
- c语言中常见错误:ASP中的常见错误
- 旁注web检测工具:Web安全工具大汇聚
- windowsserver:封堵Windows Server 2008几个明显漏洞
- 被人遗忘的一些安全问题
- modsecurity:使用mod_security加强Apache的安全性
- ts服务器黑名单:网络安全的 7种思路方法防范网络服务器被黑