Python爬取哔哩哔哩实时直播弹幕

Python爬取哔哩哔哩实时直播弹幕

用Python爬取哔哩哔哩直播弹幕,关键在于找到哔哩哔哩网站的一个POST网址,和应该POST的数据。代码不长,十分简单。关键在于浏览器开发者工具的使用。希望对于新入门的萌新有一定的借鉴意义。

1.找到POST的网址

先找到一个直播间,点击进去【感觉是废话】。

打开开发者工具【F12】,差不多是这样。

然后刷新【F5】,并点击方法翻到最上面,或者最下面,在这里可能会弹出两三个POST数据【如下图所示】,不要管有几个POST格式的文件,找到下图中标记的哪一个!!

这个文件就包含了我们需要的弹幕。但是,我们需要向服务器提交一下数据,服务器才会返还给我们数据,也就是弹幕。所以在上图的基础上点击右下角的参数。点击后如下图:

在这里会出现三个我们需要提交的数据【注意,我在写这篇文章之前是只需要提交两个数据的】,不过没关系提交三个应该也可以。但是下面的代码里面写的是两个参数,你可以照着我的参数格式直接再加一个就行。最后就是用requests提交参数就行,返回的网页用json方法解析一下就可以很方便的提取了,不用写正则。代码比较少,而且也有注释,所以就不在这里啰嗦了。

2.Python代码





关于作者:

  • 姓名:麦艳涛
  • 网名:挖掘机小王子
  • 个人网站:挖掘机小王子
  • 微信:Gorgon---Medusa
  • QQ邮箱:WaJueJiPrince@qq.com
  • 个人简介:数据分析爱好者

转载请注明出处:zhuanlan.zhihu.com/p/30

「真诚赞赏,手留余香」
还没有人赞赏,快来当第一个赞赏的人吧!
文章被以下专栏收录
6 条评论
推荐阅读