昨日偶然回帖发现吧里还是有挺多人对国内的坂道相关数据很感兴趣,就在昨天的基础上一口气爬了笔组的所有微博,今天结合专业知识做了一点粗浅的分析,将结果呈现出来供大家讨论。
我所爬取的笔组的微博一共5113条,不排除会少几条,因为为了防止被封,我没有登陆我的微博账号,这样爬虫时可能会有少量的微博爬不下来,不过这样的微博不会超过5%,影响不大。
然后必须要声明的是:
1、本帖纯属个人爱好,只为客观呈现数据,所有微博的版权都属于顶笔Ten使字幕组,本人只是非营利性使用。
2、本帖只是初步挖掘与分析,所有内容基于Python和R语言完成,没有什么特别的技术含量,但是也费了一番功夫做data tidy,请各位尊重鄙人的劳动成果,如有转载请注明出处。
我所爬取的笔组的微博一共5113条,不排除会少几条,因为为了防止被封,我没有登陆我的微博账号,这样爬虫时可能会有少量的微博爬不下来,不过这样的微博不会超过5%,影响不大。
然后必须要声明的是:
1、本帖纯属个人爱好,只为客观呈现数据,所有微博的版权都属于顶笔Ten使字幕组,本人只是非营利性使用。
2、本帖只是初步挖掘与分析,所有内容基于Python和R语言完成,没有什么特别的技术含量,但是也费了一番功夫做data tidy,请各位尊重鄙人的劳动成果,如有转载请注明出处。