阅读视图

发现新文章,点击刷新页面。

谷歌你是有多烂,能把别人的网站名错误的扣到我的网站上

现在的谷歌Google真是操蛋。

语言无法形容我有多讨厌印度人。


把别人网站的标题扣我网站上

中午的时候网站崩了,检查一下发现是供应商机房的电源爆了,折腾了2小时才恢复。无聊期间用谷歌搜了下自己的网站,想检查下之前那个镜像我网站的结果滚蛋没有。

然后TMD神奇的结果就出现了。

screenshot_on_b85m_by_flameshot_at_2024-10-23_19-14-41

screenshot_on_b85m_by_flameshot_at_2024-10-23_19-27-40

谷歌怎么把 【秋风于渭水 https://www.tjsky.net/】 的网站名扣到我的网站上了?


也不是最近才开始讨厌谷歌的

上学那会可是把谷歌当宝贝了,那时候中文搜索引擎,靠谱的就他一个。后来参加工作后,由于工作需要,要大量搜索英文资料,所以谷歌更是必不可少。

谷歌发臭大概就是2016年后,也就是谷歌搞完 AlphaGo 之后,声称其会把其人工智能算法要应用到多个领域,其中一个就是谷歌翻译。那几天谷歌翻译的准确率的确上升了一点点……然后就像腹泻患者蹲上茅坑,把粪涂得满墙一般,翻译质量直接就崩了。同一时间段,YouTuBe也更新了其推送算法,出现了很严重的重复推送用户已观看视频的问题,推送质量跟美国飓风摧毁过一样,一片狼藉。

仔细想想,2016年也刚好是谷歌更换CEO后,对自己公司捅刀子该捅出效果的时候了。

印度人


奇葩的印度人

去年的时候 【挨踢路 – 老狼个人博客】 就遇到过一次谷歌抽风,搜索结果带奇怪后缀的问题。在那之前其实我就遇到过很多次谷歌干出来的奇葩设定,比如

  • 谷歌搜索结果出来的不是你的网页标题,而是谷歌自己猜想出来的玩意
  • site: 或 URL 搜出来的结果完全不能表示最终搜索结果
  • 用不同关键字搜出来的相同内容,标题是不同的

这些应该都在谷歌的 Google Search Central Community 有记录过。所有人都在骂,但是印度人的脑逻辑是很神奇的。

现在倒好,我也中招了,而且更奇葩。

screenshot_on_b85m_by_flameshot_at_2024-10-23_20-57-57

10年啊,10年的老站,谷歌你他妈的连个网站标题都搞不明白。

这是搞得有多砸才能完成的壮举啊?谷歌?


互联网正在死去

以前总有人说,中文已死,中文正在死去。

全球都没好到哪里去嘛。

 

摆烂吧。

人类亡了。

The post 谷歌你是有多烂,能把别人的网站名错误的扣到我的网站上 first appeared on 石樱灯笼博客.

网站镜像攻击2024第一版

又是网络攻击的一年,又是新花样掺老花样,无聊得想拉屎。

我发现每次我遇到无聊得想拉屎的事情的时候,股票啊基金啊虚拟货币啥的都暴跌。


又是网站镜像攻击

我大概2007年开始写博客,2010年正式建立这个网站。

那几年里,垃圾站、抄袭站、镜像站 堪称行业定义。你去买个域名买个空间,如果卖家发现你不是做这些粪坑玩意的,都会鄙视你。

以至于我到现在,电脑里还保留着某个流氓软件……的快捷方式。

b85m-win540-snap

清晰记得那时候校学生会和院学生会都偷偷在学校官网里塞私链给自己的垃圾站引流,然后颐指气使地对我这种无官无位的普通学生鄙夷不屑。

然后突然有一天谷歌更新了收录算法,一下子就把所有垃圾站砍光了。百度倒是一直那个德行,除了垃圾其他什么都不搜,不过就算收录了也没啥用,你在上面也搜不到你想要的内容。


国内博客网站被大批镜像

这最近一个月,突然好多博客在写如何避免自己网站被镜像。招数还是10多年前时候的那些招数,只不过 javascript 的语法比以前干净了,

就有点奇怪了,这十多年从来没人担心过这种问题,怎么突然全在提这个问题。

然后随手搜了一下,果不其然本站也被镜像了。

screenshot_on_b85m_by_flameshot_at_2024-10-09_19-27-47

screenshot_on_b85m_by_flameshot_at_2024-10-09_17-57-07

镜像就镜像呗,反正谷歌收录又不是识别不出来。

screenshot_on_b85m_by_flameshot_at_2024-10-09_19-46-03

b85m-win541-snap

唉草,谷歌现在这么垃圾了吗?原创不收录,反而优先收录镜像站。

我这十多年老域名的含金量还不如一个一年的镜像站了?


分析

随便看了一眼 access.log

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-48-31

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-47-47

IP 是 103.233.9.190 ,一个香港的主机。

原本会以为会是什么云服务商的 Worker 啥的,结果就是个普通的主机。顿时觉得没意思了。

之前这货用的IP是 154.39.149.128 。上个季度我网站流量排第二的就是这个IP。

前端是套的 cloudflare 。但是后面这个 103.233.9.190 基本没藏,所有有趣的设置都在 103.233.9.190 上而不在 cloudflare 上。我估计是工作量太大了根本设置不过来。

直接访问会报 404 错误。

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-58-15

必须用美国(此处存疑)的IP访问才能正常访问,如果用欧洲或者其他国家的IP还是404,感觉就是为了搞谷歌收录。

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-57-51

刚才也说了,后面的真是主机基本没藏。

直接用静态解析就能访问到。

screenshot_on_b85m_by_flameshot_at_2024-10-10_20-04-20

screenshot_on_b85m_by_flameshot_at_2024-10-10_20-05-48

没啥意思。

用 Internet Archive 搜了下,这个域名去年也是在做某些网站的镜像。看来是老杂种了。

PS:写文的时候 Internet Archive 挂了,疑似是被攻击,还被拖库,这是有够惨。反正网站是打不开了,没得截图。


共情

随便在网上搜了下这两个IP,看来受害者还挺多。

Cloudflare 和 Google 的 DCMA 投诉啥的虽然略有效果,但是收效甚微,最多就是恢复下当前的收录。

很明显这坏人不像是处于经济动机做这些恶心事。而且国庆假期期间还搞事也说明了就是个社会闲散人员。

除了几个提供警示和反制手段的博客之外,也有不少精神胜利法的。上来先猜一波方法是什么动机是什么目的是什么,最后猜了一圈就给出个大结论,连access.log都不会看;然后在搞什么收录搞什么投诉再搞什么举报,最后就精神大胜利了,非常阿Q。


处理

随便写了 rewrite 策略糊弄了事。

是的这一块我不太关心。这玩意就是猫捉老鼠,跟实际上看猫和老鼠完全不一样,很无聊。

想一下如果我是坏人,那我有什么办法?我办法多了去了,网上多数人的防御和反制手段基本都拦不住我。问题是缺德的事情我不做,更别说这事情本身就没有经济价值。


结论

写完这篇文章后搞不好又得遭一波 DDOS CC 攻击。

参考资料和引用资料我就不放了,别再被爬去被用作攻击列表。毕竟有些博主的反制能力不是很强。

请不要尝试去访问攻击者的镜像。

The post 网站镜像攻击2024第一版 first appeared on 石樱灯笼博客.

百度大规模删站:坚守世界上最后一个由人类撰写的独立博客

本文发布后,经博友大魏指点,百度收录量截至2023.10.15增加到44条,详细折腾过程见评论区置顶。

最近SEO站长圈哀嚎一片,起因百度大规模封杀采集站。对于百度此举,我是举双手双脚赞成的,因为对采集站从生理上就感觉不适。一个站点如果一味迎合搜索引擎喜好,大批量生成文不对题、东拼西凑、不知所云的内容,是对互联网搜索资源的浪费,挤占了更多拥有优质内容的站点被搜索发现的机会,造成劣币驱逐良币的恶果。

然而,我终究也是想多了。即便如东评西就这样纯人肉敲出来的独立博客,共计336篇文章,时间跨度从我的高中时代、大学、工作、结婚生子,直至现在22年的时光,目前百度收录页面也仅有3条,而且还在以肉眼可见的速度减少,鬼知道哪天会从百度彻底消失。

这不得不提搭建这个独立博客踩过的坑。

大约在去年3、4月份,天涯博客停止维护,内容被系统设置为仅博主,我嗅出来天涯博客要黄的味道(但我没想到的是,一年后天涯社区整站关闭了),连夜用爬虫工具备份了300+篇文章和近万条评论,开始寻找合适的平台复刻这些文字。

天涯社区无法访问,但目前百度仍保留着天涯的800万+条收录页面

人人博客的时代已经过去,很多博客如博客中国、博客巴士等平台早已关闭,在我的认知里,也只有自主搭建独立博客这一条路子。

从WordPress、Hexo、Hugo、Typecho等博客程序里对比了一番,最后选择了Docker自主搭建Farbox博客,原因是开源,却没想到Farbox的开源其实作者弃坑而去,留下一个烂摊子。

选择Farbox的原因很简单,看中了一款「菩提树下」的极简主题,又能简单粗暴地导入天涯博客的评论信息,WordPress都没它方便。

正好赶上阿里云针对新手的空前优惠,没几天就把所有文章和评论复刻到了Farbox博客,几乎没做SEO优化百度很快就收录了大量页面。看似顺风顺水,却是噩梦的开始。

由于Farbox作者开源后也停止了更新了,其实程序有很多bug,再加上对技术也不熟悉,没几天博客就让我给搞崩了,一直404状态。

于是寻摸着更换新的博客程序,多方权衡最终选择了Hexo程序。其实在Hexo和Hugo之间也纠结了很久,我也知道在某些方面Hugo要比Hexo优秀许多,但理想很丰满,显示很骨感,最终确定Hexo只是因为首先测试成功了Hexo。

我就是这么一个急性子,典型白羊座风格,没有长远规划,先让博客跑起来再说。

文章发布、图床搭建轻车熟路。最难的部分也是一个博客称之为博客的灵魂之处——评论,耗费了我好几个月的时间,询问Twikoo开发者+ChatGPT,总算写出一个评论迁移脚本。看着曾经青涩文字下面熟悉的ID又在另外一个空间重新浮现,耽于回忆的我一度陷入深深的恍惚之中,仿佛那些文字里发生的事情就在昨天。

自从搭建了Hexo博客后,博客主题一直没有更换过,各种独立博客的标配如朋友圈、说说广场,也在各路大佬如杜老师koobai木木老师张时贰等博友的帮助下一一实现。

一番折腾后,我总结出一条经验,一个博客主题的好坏,最终还是要看博客的内容的丰富与否。偶尔有人在评论区称赞这个博客魔改的主题美观,我觉得,更多的是对博客内容的认同。尤其是历史文章下面的评论,都是岁月的痕迹。

导致百度收录页面骤减的原因,很重要的一条是来自于今年年初的域名更换。

dongjunke.cn这个域名其实在2007年我就持有过,后来因为微信公众号的诞生,就放弃了这个域名。直到疫情期间偶然联系到了这个域名的现在持有人,当然也是个域名贩子。起初对方要价1000元,称域名是人名域名,比较稀缺。我告诉他,我曾经持有过这个域名,这么多年过去了,也没人来买这个域名,也只有我稀罕它,我的心理价是200块钱,如果成交不了,那你就继续烂在手里吧。或许是疫情期间大家生计普遍比较窘迫的原因,对方很爽快成交了。

更换域名后,我就把之前的域名停止解析了,也没有在百度站长平台做网站改版之类的设置。旧域名很快收录消失,新域名很长时间停留在15条左右,直到最近降到了3条。

反观必应、谷歌的收录数量,比较接近实际文章数量。尤其是必应,几乎可以在当天收录。


百度的收录逻辑令我百思不得其解。曾经邮件向站方反馈过,对方给我的回应也是语焉不详、模棱两可。

百度反馈

我依然每次后向百度搜索提交API,也不再纠结收录具体有多少。如我这样用爱发电的独立博客,或许原本并不是百度搜索的目标用户,毫无任何商业价值。

从今天起,做个纯粹的独立博主,不关心流量,只关心内容有没有人评论,守护AI时代有可能是世界上最后一个由人类撰写的独立博客。

This message is used to verify that this feed (feedId:41446022334079030) belongs to me (userId:55601570809479168). Join me in enjoying the next generation information browser https://follow.is.

鸟叔博客流量再创新高已破千

之前鸟叔博客流量一直徘徊在200-300ip,从大前天开始博客流量从260ip直接涨到了960ip,再到之后的1538ip,完成了一个质的飞跃,足足翻了6倍,不知道是昙花一现还是稳定开涨的开始。

百度作为国内最大的搜索引擎最近一直在折腾中小站点,鸟叔博客也无一例外的被当作低质量站点,收录和 [Read More…]

The post 鸟叔博客流量再创新高已破千 first appeared on 鸟叔の窝.

❌