文本挖掘疯狂代码

Rss订阅
简洁模式

首页 »标签 » 文本挖掘 » 列表

　　在迅猛增加海量异构Web信息资源中蕴含着巨大潜在价值数据如何从浩如烟海Web资源中发现潜在有价值知识成为迫在眉睫问题人们迫切需要能从Web上快速、有效地发现资源和数据工具以提高在Web上检索信息、利用信息效率　　目前Web文本挖掘大部分研究都是建立在词汇袋(bag of words)或称向量表示法(Vector Representation)基础上这种思路方法将单个词汇看成文档集合中属性只从统计角度将词汇孤立地看待而忽略该词汇出现位置和上下文环境词汇袋思路方法个弊端是自由文本中数据丰富词汇量非常大处理起来很困难为解决这个问题人们做了相应研究采取了区别技 [阅读全文] [PDF]

标签：指纹加密文件夹文件指纹指纹文件控制器文本挖掘

专注于互联网--专注于架构

首页 »标签 » 文本挖掘 » 列表

热门标签

精华推荐

Dig排行

阅读排行

最新文章