专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅
  在迅猛增加海量异构Web信息资源中蕴含着巨大潜在价值数据如何从浩如烟海Web资源中发现潜在有价值知识成为迫在眉睫问题人们迫切需要能从Web上快速、有效地发现资源和数据工具以提高在Web上检索信息、利用信息效率   目前Web文本挖掘大部分研究都是建立在词汇袋(bag of words)或称向量表示法(Vector Representation)基础上这种思路方法将单个词汇看成文档集合中属性只从统计角度将词汇孤立地看待而忽略该词汇出现位置和上下文环境词汇袋思路方法个弊端是自由文本中数据丰富词汇量非常大处理起来很困难为解决这个问题人们做了相应研究采取了区别技 [阅读全文] [PDF]
1 共1条 分1页