爬虫入门到精通-环境的搭建

爬虫入门到精通-环境的搭建

本文章属于爬虫入门到精通系统教程第三讲

IDE的安装

IDE我用的是VS code,也用过pycharm(但是电脑配置不行,比较卡)

VScode安装教程在这,写的蛮清楚的

然后安装一个python的插件就行 见如下截图

  • 点击数字1的地方
  • 在数字2的地方输入python
  • 点击python 0.5.8 右边的安装按钮

包的安装

配置pip源,不配置的话下载速度很慢

windows:在当前用户根目录下,创建pip和这个文件夹,然后在里面新建一个文件(pip.ini) 里面的内容为

[global]
index-url = http://mirrors.aliyun.com/pypi/simple/
[install]
trusted-host=mirrors.aliyun.com

截图如下(我当前用户名为kimga)

linux:在~/.pip/pip.conf文件中添加或修改(内容同上)

包的安装

直接pip install 包的名字 如 pip install requests

依次安装如下4个包

  1. requests
  2. lxml
  3. ipython
  4. jupyter

如果发现报错的话,

  • ubuntu用apt-get install python-包名
    • 如 apt-get install python-lxml


windows下pip install lxml 很少能安装成功。。。

那我们怎么做呢?

  1. 打开Unofficial Windows Binaries for Python Extension Packages这个网址
  2. ctrl+ F,然后在搜索框内输入lxml
  1. 找到与你系统版本相同的包,下载
  • 我的python版本是2.7,系统是64位的,所以我选择lxml‑3.7.3‑cp27‑cp27m‑win_amd64.whl


  1. 下载完成后在你下载的目录下打开cmd命令行
  • 这边有个小技巧是,找到你下载的目录后,按住shift不放,然后空白处右键,会多出来一个在此处打开命令窗口,不用再慢慢的cd过来


  1. 然后pip install 你刚下载的文件,发现就安装成功了

Google浏览器的安装

百度软件中心下载

记得点普通下载(要不然有可能会收获百度全家桶一份)

下载完正常安装就行

安装可以更换浏览器头的插件

  1. 打开 google插件下载这个网页
  2. 在输入框内输入 extension ID ffhkkpnppgnfaobgihpdblnhmmbodake
  3. 点击下载
  4. 如果无法下载的话,就点击链接加入群【Python爬虫】:二维码页面,群文件里面有。群(628522190)
  1. 下载完成后,打开Google浏览器,在地址栏输入chrome://extensions/
  2. 把刚刚下载的文件拖进去进行

最终效果见下图

总结

看完本篇文章后,你应该要

  • 有一个自己熟悉的python IDE
  • Python配置国内源
  • 能安装python包
  • 有安装Google浏览器
  • 有可以更换浏览器头的插件

最后,因为后续实战我基本上都是用Jupyter notebook来写调试的,所以请阅读以下两篇文章,能大概了解Jupyter notebook

Jupyter Notebook 快速入门(上)codingpy.com图标Jupyter Notebook 快速入门(下)codingpy.com图标


欢迎关注本人的微信公众号获取更多Python爬虫相关的内容

(可以直接搜索「写bug的高师傅」)

编辑于 01-14

文章被以下专栏收录