2

程序员找对象聚合平台-xunta.today

 2 years ago
source link: https://igaojin.me/2019/11/30/%E7%A8%8B%E5%BA%8F%E5%91%98%E6%89%BE%E5%AF%B9%E8%B1%A1%E8%81%9A%E5%90%88%E5%B9%B3%E5%8F%B0-xunta-today/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

程序员找对象聚合平台-xunta.today

程序员相亲的公众号最近也挺多的,但是因为微信平台的原因

导致无法搜索,不能更快的寻找需要的信息…

所以做了一个聚合N个相亲公众号信息的网站 https://xunta.today

网站名字叫 XUNTA

目前只汇总以下公众号的文章

  • CQ脱单联萌
  • 程序员脱单实验室
  • 村姑的个人农场
  • 单身青年自救平台

如果还有新的公众号也提供相亲信息的话 欢迎邮件告诉我

上面那几个还是发朋友圈问来的

通过爬虫定期去爬取以上公众号的文章,下载网页源代码就好了

然后把源代码丢到pelican 里面

再放到github上面

源代码在:https://github.com/xunta-today/website

爬虫的没有公开,主要怕公开了微信限制接口,后面增加工作量,有需要可以邮件我.

碰到的问题

  1. 微信图片有防盗链

使用nginx转发一下就可以了,当然需要先把图片域名改成你的

location /mmbiz{
proxy_set_header referer "https://mp.weixin.qq.com";
proxy_set_header origin "https://mp.weixin.qq.com";
proxy_set_header user-agent "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36";

rewrite /(.+)$ /$1 break;
proxy_pass http://mmbiz.qpic.cn;
}

location /mp{
proxy_set_header referer "https://mp.weixin.qq.com";
proxy_set_header origin "https://mp.weixin.qq.com";
proxy_set_header user-agent "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36";
rewrite /(.+)$ /$1 break;
proxy_pass https://mp.weixin.qq.com;
}

用的是 tipue_search

显示结果有点辣眼睛

因为源代码里面太多乱七八糟的东西了,所以我直接在创建搜索的时候,只保留了文章中的中文内容,其他全部去掉了…

用Google搜索

直接用 site:xunta.today 加上你要搜索的内容 搜索

爬虫会每天更新一次

公众号也会每周汇总一次,有人有兴趣一起参与的话欢迎邮件我,(不限于讨论,排版,等等…)

投诉与建议

如果你觉得某篇文章有冒犯你,请直接邮件我 并且带上链接!

有好的建议也欢迎邮件!

[email protected]

删除一些不相关文章的时候发现的。。。

本文作者:高金
本文地址https://igaojin.me/2019/11/30/程序员找对象聚合平台-xunta-today/
版权声明:转载请注明出处!

0 comments

Be the first person to leave a comment!

分享

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK