吹牛,是不可能的
共 794字,需浏览 2分钟
·
2021-01-18 08:29
昨天发了一篇用pillow裁剪图片的文章,然后很多人后台留言说这个功能很鸡肋,明明有很多现成的工具,干嘛还要自己造个轮子,麻烦的一逼。
其实这个需求不是我YY出来的,而是确实有这样的场景。今天我就给你们讲个爬虫领域的使用场景。
可能有些人知道,我在爬虫这块比较专业,特别是公众号这块,然后有次一个客户找到我,他们希望有个能实时获取公众号内容更新的需求。
但是微信并没有提供这样的接口可以让你去实时获取更新,你只有不断去轮询询问服务器有没有更新内容,如果一两个号你轮询下还好,几百上千个号你去轮询就不可取了。
想要实时获取最新的推送内容有一种方法就是DDL注入技术,不过这种技术难度大,风险指数高,动不动就会被封号。
那么退而求其次的方法是什么呢?
就是将公众号的订阅列表先截图,然后通过图文识别技术将公众号名字提取出来。接着就可以根据公众号名字去查询最近的文章列表(至于怎么查是另外一个话题了)
那这跟图片裁剪有什么关系呢?因为我要裁剪的固定区域的图片,其它地方的内容都属于干扰信息,所以首先要进行裁剪。
整个流程可以做到完全自动化无需人工参与来实现这个需求。
今天推荐一下我的一个星球,价值365元的免费星球,为什么免费星球却要说价值365呢,因为我会将自己思考、认知的东西记录下来,顺便能给一部分人带来启发,这就是它的价值。所以现在加入相当于白嫖。
上周大伟赠送了他的一本新书给我,关于Echarts可视化方面的,对做数据分析可视化这块的同学会有帮助。这里送5本书给大家,有一本已经在朋友圈提前送出去了。直接用抽奖助手参与抽奖就好。
你还见过哪些爬虫骚操作?