python脚本:python实现的翻译脚本疯狂代码！

python脚本:python实现的翻译脚本

　　今天突然有

个想法

就是想自己写

个翻译脚本

可惜Google提供

API是供网络应用

刚好在

dive

o python

里面这本书里面看到如何从HTML文档中提取出来自己想要

内容

那这样

话

可不可以模拟浏览器来发送想翻译

句子

然后再接收返回结果后

HTML源码

最后从中提取出翻译

结果呢？　　其实是行

利用python可以模拟浏览器

行为

向Google翻译

主页发送想要翻译

句子

下面是具体

代码:

　　Python语言:

1　import　urllib,urllib2
2　
3　values={'hl':'zh-CN','ie':'utf8','text':text,'langpair':"en|zh-CN"}
4　url='http://translate.google.cn/translate_t'
5　data　=　urllib.urlencode(values)
6　req　=　urllib2.Request(url,　data)
7　req.add_header('User-Agent',　"Mozilla/5.0+(compatible;+Googlebot/2.1;http://www.google.com/bot.html)")
8　response　=　urllib2.urlopen(req)

　　上面最关键

是text这个变量

值为想翻译

句子

后面

langpair

值是语言对

这里是英文翻译成简体中文

可以自由改动

下面就要实现

个类来取出我们想要

翻译结果

这个类要从SGMLParser派生出来

SGMLParser是在sgmllib.py中包含

　　Python语言:

01　from　sgmllib　import　SGMLParser
02　
03　　URLLister(SGMLParser):
04　　　　　def　re(self):
05　　　　　　　　　SGMLParser.re(self)
06　　　　　　　　　self.result　=　
07　　　　　　　　　self.open　=　False
08　　　　　def　start_div(self,　attrs):
09　　　　　　　　　id　=　[v　for　k,　v　in　attrs　　k'id']
10　　　　　　　　　　'result_box'　in　id:
11　　　　　　　　　　　　　self.open　=　True
12　　　　　def　handle_data(self,　text):
13　　　　　　　　　　self.open:
14　　　　　　　　　　　　　self.result.append(text)
15　　　　　　　　　　　　　self.open　=　False

　　当

feed思路方法时

就会寻找开始标记为div

片段

当找到时

它会

个自身内部

思路方法

其实最终也就是

到start_div跟handle_data这两个思路方法来找出我们想要

翻译结果

具体

就不说了

下面是完整

代码:

　　Python语言:

01　import　urllib,urllib2
02　from　sgmllib　import　SGMLParser
03　
04　　URLLister(SGMLParser):
05　　　　　def　re(self):
06　　　　　　　　　SGMLParser.re(self)
07　　　　　　　　　self.result　=　
08　　　　　　　　　self.open　=　False
09　　　　　def　start_div(self,　attrs):
10　　　　　　　　　id　=　[v　for　k,　v　in　attrs　　k'id']
11　　　　　　　　　　'result_box'　in　id:
12　　　　　　　　　　　　　self.open　=　True
13　　　　　def　handle_data(self,　text):
14　　　　　　　　　　self.open:
15　　　　　　　　　　　　　self.result.append(text)
16　　　　　　　　　　　　　self.open　=　False
17　
18　while　True:
19　　　　　text　=　raw_input("请输入要翻译英文(退出输入q):")
20　　　　　　text'q':
21　　　　　　　　　;
22　　　　　values={'hl':'zh-CN','ie':'utf8','text':text,'langpair':"en|zh-CN"}
23　　　　　url='http://translate.google.cn/translate_t'
24　　　　　data　=　urllib.urlencode(values)
25　　　　　req　=　urllib2.Request(url,　data)
26　　　　　req.add_header('User-Agent',　"Mozilla/5.0+(compatible;+Googlebot/2.1;http://www.google.com/bot.html)")
27　　　　　response　=　urllib2.urlopen(req)
28　　　　　parser　=　URLLister
29　　　　　parser.feed(response.read)
30　　　　　parser.close
31　　　　　pr　"翻译结果:"
32　　　　　for　i　in　parser.result:
33　　　　　　　　　i　=　unicode(i,'utf-8').encode('gbk');
34　　　　　　　　　pr　i

　　查看原图(大图)

Tags: pythonshell脚本如何运行python脚本 python测试脚本 python脚本

python脚本:python实现的翻译脚本

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注