吹牛,是不可能的

python之禅

共 794字,需浏览 2分钟

 ·

2021-01-18 08:29

昨天发了一篇用pillow裁剪图片的文章,然后很多人后台留言说这个功能很鸡肋,明明有很多现成的工具,干嘛还要自己造个轮子,麻烦的一逼。



其实这个需求不是我YY出来的,而是确实有这样的场景。今天我就给你们讲个爬虫领域的使用场景。


可能有些人知道,我在爬虫这块比较专业,特别是公众号这块,然后有次一个客户找到我,他们希望有个能实时获取公众号内容更新的需求。


但是微信并没有提供这样的接口可以让你去实时获取更新,你只有不断去轮询询问服务器有没有更新内容,如果一两个号你轮询下还好,几百上千个号你去轮询就不可取了。


想要实时获取最新的推送内容有一种方法就是DDL注入技术,不过这种技术难度大,风险指数高,动不动就会被封号。


那么退而求其次的方法是什么呢?


就是将公众号的订阅列表先截图,然后通过图文识别技术将公众号名字提取出来。接着就可以根据公众号名字去查询最近的文章列表(至于怎么查是另外一个话题了)



那这跟图片裁剪有什么关系呢?因为我要裁剪的固定区域的图片,其它地方的内容都属于干扰信息,所以首先要进行裁剪。


整个流程可以做到完全自动化无需人工参与来实现这个需求。


今天推荐一下我的一个星球,价值365元的免费星球,为什么免费星球却要说价值365呢,因为我会将自己思考、认知的东西记录下来,顺便能给一部分人带来启发,这就是它的价值。所以现在加入相当于白嫖。




上周大伟赠送了他的一本新书给我,关于Echarts可视化方面的,对做数据分析可视化这块的同学会有帮助。这里送5本书给大家,有一本已经在朋友圈提前送出去了。直接用抽奖助手参与抽奖就好。



你还见过哪些爬虫骚操作?

浏览 18
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报