Why Nostr? What is Njump?
2023-05-22 17:19:48

时间的玫瑰 on Nostr: 为了训练模型,要大规模从county网站爬数据。 ...

为了训练模型,要大规模从county网站爬数据。
一个观察是我们要过滤掉的条目里居然有🦣了,与一大堆社交网站平起平坐,可喜可贺。不过县政府网站要什么毛象啊喂!
还有一个观察是,我爬的时候还有点紧张的,因为我老想着我以前看的一个新闻,一个工程师爬上海的政府网站,结果政府网站能力不够被爬崩掉了,然后工程师就坐牢了……
我作为一个中国人在加拿大爬美国政府的网站,我这心啊。
Author Public Key
npub1ltwlvhufh3t5l27wz3we0ddtkpj4ffeplywemj3wu4q24m36qlcsp75mkd