今天各种汉字输入法已经很成熟了随便挑出种主要输入法比十几年前最好输入法都要快、要准现在抛开具体输入法从理论上分析下输入汉字到底能有多快
我们假定常用汉字在 2级国标里面共有 6700 个作用汉字如果不考虑汉字频率分布用键盘上 26 个字母对汉字编码两个字母组合只能对 676 个汉字编码对 6700 个汉字编码需要用 3个字母组合即编码长度为 3当然聪明读者马上发现了我们可以对常见字用较短编码对不常见字用较长编码这样平均起来每个汉字编码长度可以缩短我们假定每个汉字频率是
p1, p2, p3, ..., p6700
它们编码长度是
[阅读全文] [PDF]
Google、T-Mobile 和 HTC 宣布了第款基于开源操作系统 Android 3G 手机其中个重要功能是利用全球卫星定位系统实现全球导航这个功能在其它手机中早已使用并且早在 5 6年前就已经有实现这功能车载设备出售其中关键技术只有两个:第是利用卫星定位;第 2根据用户输入起终点在地图上规划最短路线或者最快路线后者关键算法是计算机科学图论中动态规划(Dynamic Programming)算法
在图论(请见拙著图论和网络爬虫)中个抽象图包括些节点和连接他们弧比如说中国公路网就是个很好“图”例子:每个城市是 [阅读全文] [PDF]
在日常生活中包括在设计计算机软件Software时我们经常要判断个元素是否在个集合中比如在字处理软件Software中需要检查个英语单词是否拼写正确(也就是要判断它是否在已知字典中);在 FBI个嫌疑人名字是否已经在嫌疑名单上;在网络爬虫里个网址是否被访问过等等最直接思路方法就是将集合中全部元素存在计算机中遇到个新元素时将它和集合中元素直接比较即可般来讲计算机中集合是用哈希表(hash table)来存储它好处是快速准确缺点是费存储空间当集合比较小时这个问题不显著但是当集合巨大时哈希表存储效率低问题就显现出来了比如说个象 Yahoo,Hotmail [阅读全文] [PDF]
我们在前面系列中介绍和提到了些年轻有为科学家迈克尔·柯林斯艾里克·布莱尔大卫·雅让斯基拉纳帕提等等他们都出自宾夕法尼亚计算机系米奇·马库斯(Mitch Marcus)名下就像许多武侠小说中描写弟子都成了各派掌门师傅定了不得确马库斯虽然作为第作者发表论文并不多但是从很多角度上讲他可以说是自然语言处理领域教父
马库斯教授长期当任宾夕法尼亚大学计算机系主任直到他在几年前从 AT&T 找到皮耶尔替代他为止作为个管理者马库斯显示出在自然处理和计算机科学方面卓识远见在指导博士生时马库斯发现语 [阅读全文] [PDF]
1 共4条 分1页
- server.createobject:本地安装测试IIS出现Server.CreateObject失败解决思路方法
- sql注入:阻止恶意SQL注入
- 瑞星安全助手:瑞星安全专家详细解析DNS攻击真相
- windows服务器安全:Windows服务器安全维护注意 8要点
- iisweb服务器:IIS Web服务器容易忽视的 6大基本安全问题
- 木马的防范:防范ASP木马的十大基本原则
- 中国的应对措施:百度对域名故障的应对措施
- discuz管理员密码:提权技术研究:Discuz!管理员复制
- photoshop文字教程:photoshop教程:木头文字效果的制作
- 微软office最新版本:微软证实Office 2010最新系统需求
- 微软office2007下载:微软Office 2010新形象和界面赏析
- [SharePoint2010]在Ribbon中添加自定义按钮
- 远程控制安全:安全知识 如何预防IT远程控制威胁
- 环境保护数据:安全为王 4建议助力中小企业保护数据
- windows2008防火墙:Windows 2008的高级安全防火墙功能
- windows2008防火墙:Windows 2008的高级安全防火墙功能
- 平衡的艺术:安全的道:一门平衡的艺术
- 硬件防火墙评测:阿尔叙硬件防火墙评测
- linux服务器维护:Linux服务器维护的 4大法宝
- illustrator教程:Illustrator教程:制作漂亮的新货吊牌