突破抖音反爬虫机制,字体图标替换实现通过抖音UID获取真实抖音号

最近在研究抖音app的数据爬取,遇到了一个小小的问题。通过分析mitmproxy抓包返回的json数据发现,有的账号会显示UID,但是抖音号是“0”。按道理来说每个人都有唯一的抖音号。这是为什么呢?我首先想到的是查文档,看看API文档是如何定义的。你爬取别人的数...

[简易爬虫]Requests+BeautifulSoup爬取音乐网站所有曲目,多线程实现歌曲本地保存

著名民谣(摇滚😖)歌手李志被官方以行为不端的理由封杀,作品遭到全网下架。虽然事情没有最终的结论,但是最近确实是没办法听到他的歌了。在网易云无聊的刷live视频,被逼哥震撼的现场所打动,从此被他真实的歌声吸引。作为程序员,典型的pushover...

Requests+BeautiSoup实现<<平凡的世界>>爬取和本地保存

项目灵感 最新想重温一下平凡的世界,然后网上虽然搜索到了资源,但是总感觉章节不全,然后我就找到了一个网站,网站很直接就叫平凡的世界,网站的内容很简单,就是平凡的世界的章节内容展示,全是静态页面,为什么不写个爬虫把文章全部保存下来呢?工作量似乎不大,...

Top