博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python 爬取简单网页
阅读量:5990 次
发布时间:2019-06-20

本文共 442 字,大约阅读时间需要 1 分钟。

1 import urllib.request 2 url = "http://www.baidu.com/s?wd="      #get网址格式:“https://www.baidu.com/s?wd=关键字” 3 key="周杰伦" 4 key_code=urllib.request.quote(key)      # 汉字编码转化 5 url_all=url+key_code 6 req=urllib.request.Request(url_all) 7 data=urllib.request.urlopen(req).read() 8  9 fhandle = open("F:/Python/5.html","wb")     #把爬取到的数据,写入指定文件夹,并生成文件10 fhandle.write(data)11 fhandle.close()

 

转载于:https://www.cnblogs.com/Hunter-541695/p/9534619.html

你可能感兴趣的文章
The connection to adb is down, and a severe error has occured.问题解决
查看>>
Servlet 单例多线程
查看>>
Java-对象多态性
查看>>
Android点击Button实现功能的几种方法
查看>>
uva 592 Island of Logic (收索)
查看>>
【转载】shell中 dd 命令
查看>>
八大排序方法汇总(选择排序,插入排序-简单插入排序、shell排序,交换排序-冒泡排序、快速排序、堆排序,归并排序,计数排序)...
查看>>
骨传导技术(转)
查看>>
Ubuntu 下忘记mysql 密码
查看>>
poj3683(2-SAT 求任意方案)
查看>>
我的wordpress插件总结
查看>>
转 C++常用的类库
查看>>
如何指定rman下的备份路径
查看>>
设置U盘为第一启动顺序
查看>>
分块读取Blob字段数据(Oracle)
查看>>
CentOS6.4 安装Nagios 并监控端口
查看>>
我的架构截图~永久更新中...
查看>>
python异常处理(基础)
查看>>
〖Linux〗apt-get wait for another apt process
查看>>
[CLR via C#]5.2 引用类型和值类型
查看>>