整理了一下关于知乎的公开数据集(欢迎评论补充)
这学期的Agent-based Model课上开了个小课题,标题非常直(chi)白(luo):How to get followed on Zhihu.
所以这段时间也一直在找关于知乎的数据库,汇总了一下可以公开/半公开获得的:
1. 知乎问题/标签
作者:NLPCC 2018
内容:问题,标签
下载地址:
- https://zhuanlan.zhihu.com/p/35007020
- 关于 NLPCC 2018 Shared Tasks 的说明请参见:NLPCC 2018 Call for Participation (Shared Tasks)
- 具体的问题说明和数据说明请参见:http://tcci.ccf.org.cn/conference/2018/dldoc/taskgline06.pdf
格式:CSV
2. 「看知乎」数据
作者: @苏莉安
内容:用户基本信息;时序数据:赞/关注/感谢/收藏/发表数
下载地址:https://zhuanlan.zhihu.com/p/22887287
格式:MySQL
3. 知乎社交网络数据·一
作者: @路人甲
内容:还没搞清楚怎么打开……= =
地址:需联系作者
格式:Neo4j
4. 用知乎做科研
作者: @江踏歌
内容:Quora关于climate change的回答文本
地址:见评论区,Live:用知乎和 Quora 数据做学术
格式:未知
5. 2011~2016提问数据
未公开
im-Jay:【数据看知乎】知乎问题少男少女,以及关注度最高的300个问题
6. 知乎社交网络数据·二
作者: @赵澈
地址:https://www.zhihu.com/question/36132174/answer/88579592
格式:SQLite
相关回答/文章:
编辑于 2018-09-10 10:31