首发于复杂鱼塘
整理了一下关于知乎的公开数据集(欢迎评论补充)

整理了一下关于知乎的公开数据集(欢迎评论补充)

这学期的Agent-based Model课上开了个小课题,标题非常直(chi)白(luo):How to get followed on Zhihu.

所以这段时间也一直在找关于知乎的数据库,汇总了一下可以公开/半公开获得的:

1. 知乎问题/标签

作者:NLPCC 2018

内容:问题,标签

下载地址:

格式:CSV

2. 「看知乎」数据

作者: @苏莉安

内容:用户基本信息;时序数据:赞/关注/感谢/收藏/发表数

下载地址:zhuanlan.zhihu.com/p/22

格式:MySQL

3. 知乎社交网络数据·一

作者: @路人甲

内容:还没搞清楚怎么打开……= =

地址:需联系作者

格式:Neo4j

4. 用知乎做科研

作者: @江踏歌

内容:Quora关于climate change的回答文本

地址:见评论区,Live:用知乎和 Quora 数据做学术

格式:未知

5. 2011~2016提问数据

未公开

im-Jay:【数据看知乎】知乎问题少男少女,以及关注度最高的300个问题

6. 知乎社交网络数据·二

作者: @赵澈

地址:zhihu.com/question/3613

格式:SQLite



相关回答/文章:

知乎数据集里的一个发现:「赞粉比」也是幂律分布的?

我分析了70万局「吃鸡」数据,找到了其中的3个秘密

编辑于 2018-09-10 10:31