普通视图

发现新文章,点击刷新页面。
昨天以前首页

谷歌你是有多烂,能把别人的网站名错误的扣到我的网站上

作者 石樱灯笼
2024年10月23日 23:08

现在的谷歌Google真是操蛋。

语言无法形容我有多讨厌印度人。


把别人网站的标题扣我网站上

中午的时候网站崩了,检查一下发现是供应商机房的电源爆了,折腾了2小时才恢复。无聊期间用谷歌搜了下自己的网站,想检查下之前那个镜像我网站的结果滚蛋没有。

然后TMD神奇的结果就出现了。

screenshot_on_b85m_by_flameshot_at_2024-10-23_19-14-41

screenshot_on_b85m_by_flameshot_at_2024-10-23_19-27-40

谷歌怎么把 【秋风于渭水 https://www.tjsky.net/】 的网站名扣到我的网站上了?


也不是最近才开始讨厌谷歌的

上学那会可是把谷歌当宝贝了,那时候中文搜索引擎,靠谱的就他一个。后来参加工作后,由于工作需要,要大量搜索英文资料,所以谷歌更是必不可少。

谷歌发臭大概就是2016年后,也就是谷歌搞完 AlphaGo 之后,声称其会把其人工智能算法要应用到多个领域,其中一个就是谷歌翻译。那几天谷歌翻译的准确率的确上升了一点点……然后就像腹泻患者蹲上茅坑,把粪涂得满墙一般,翻译质量直接就崩了。同一时间段,YouTuBe也更新了其推送算法,出现了很严重的重复推送用户已观看视频的问题,推送质量跟美国飓风摧毁过一样,一片狼藉。

仔细想想,2016年也刚好是谷歌更换CEO后,对自己公司捅刀子该捅出效果的时候了。

印度人


奇葩的印度人

去年的时候 【挨踢路 – 老狼个人博客】 就遇到过一次谷歌抽风,搜索结果带奇怪后缀的问题。在那之前其实我就遇到过很多次谷歌干出来的奇葩设定,比如

  • 谷歌搜索结果出来的不是你的网页标题,而是谷歌自己猜想出来的玩意
  • site: 或 URL 搜出来的结果完全不能表示最终搜索结果
  • 用不同关键字搜出来的相同内容,标题是不同的

这些应该都在谷歌的 Google Search Central Community 有记录过。所有人都在骂,但是印度人的脑逻辑是很神奇的。

现在倒好,我也中招了,而且更奇葩。

screenshot_on_b85m_by_flameshot_at_2024-10-23_20-57-57

10年啊,10年的老站,谷歌你他妈的连个网站标题都搞不明白。

这是搞得有多砸才能完成的壮举啊?谷歌?


互联网正在死去

以前总有人说,中文已死,中文正在死去。

全球都没好到哪里去嘛。

 

摆烂吧。

人类亡了。

The post 谷歌你是有多烂,能把别人的网站名错误的扣到我的网站上 first appeared on 石樱灯笼博客.

网站镜像攻击2024第一版

作者 石樱灯笼
2024年10月10日 22:14

又是网络攻击的一年,又是新花样掺老花样,无聊得想拉屎。

我发现每次我遇到无聊得想拉屎的事情的时候,股票啊基金啊虚拟货币啥的都暴跌。


又是网站镜像攻击

我大概2007年开始写博客,2010年正式建立这个网站。

那几年里,垃圾站、抄袭站、镜像站 堪称行业定义。你去买个域名买个空间,如果卖家发现你不是做这些粪坑玩意的,都会鄙视你。

以至于我到现在,电脑里还保留着某个流氓软件……的快捷方式。

b85m-win540-snap

清晰记得那时候校学生会和院学生会都偷偷在学校官网里塞私链给自己的垃圾站引流,然后颐指气使地对我这种无官无位的普通学生鄙夷不屑。

然后突然有一天谷歌更新了收录算法,一下子就把所有垃圾站砍光了。百度倒是一直那个德行,除了垃圾其他什么都不搜,不过就算收录了也没啥用,你在上面也搜不到你想要的内容。


国内博客网站被大批镜像

这最近一个月,突然好多博客在写如何避免自己网站被镜像。招数还是10多年前时候的那些招数,只不过 javascript 的语法比以前干净了,

就有点奇怪了,这十多年从来没人担心过这种问题,怎么突然全在提这个问题。

然后随手搜了一下,果不其然本站也被镜像了。

screenshot_on_b85m_by_flameshot_at_2024-10-09_19-27-47

screenshot_on_b85m_by_flameshot_at_2024-10-09_17-57-07

镜像就镜像呗,反正谷歌收录又不是识别不出来。

screenshot_on_b85m_by_flameshot_at_2024-10-09_19-46-03

b85m-win541-snap

唉草,谷歌现在这么垃圾了吗?原创不收录,反而优先收录镜像站。

我这十多年老域名的含金量还不如一个一年的镜像站了?


分析

随便看了一眼 access.log

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-48-31

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-47-47

IP 是 103.233.9.190 ,一个香港的主机。

原本会以为会是什么云服务商的 Worker 啥的,结果就是个普通的主机。顿时觉得没意思了。

之前这货用的IP是 154.39.149.128 。上个季度我网站流量排第二的就是这个IP。

前端是套的 cloudflare 。但是后面这个 103.233.9.190 基本没藏,所有有趣的设置都在 103.233.9.190 上而不在 cloudflare 上。我估计是工作量太大了根本设置不过来。

直接访问会报 404 错误。

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-58-15

必须用美国(此处存疑)的IP访问才能正常访问,如果用欧洲或者其他国家的IP还是404,感觉就是为了搞谷歌收录。

screenshot_on_b85m_by_flameshot_at_2024-10-10_19-57-51

刚才也说了,后面的真是主机基本没藏。

直接用静态解析就能访问到。

screenshot_on_b85m_by_flameshot_at_2024-10-10_20-04-20

screenshot_on_b85m_by_flameshot_at_2024-10-10_20-05-48

没啥意思。

用 Internet Archive 搜了下,这个域名去年也是在做某些网站的镜像。看来是老杂种了。

PS:写文的时候 Internet Archive 挂了,疑似是被攻击,还被拖库,这是有够惨。反正网站是打不开了,没得截图。


共情

随便在网上搜了下这两个IP,看来受害者还挺多。

Cloudflare 和 Google 的 DCMA 投诉啥的虽然略有效果,但是收效甚微,最多就是恢复下当前的收录。

很明显这坏人不像是处于经济动机做这些恶心事。而且国庆假期期间还搞事也说明了就是个社会闲散人员。

除了几个提供警示和反制手段的博客之外,也有不少精神胜利法的。上来先猜一波方法是什么动机是什么目的是什么,最后猜了一圈就给出个大结论,连access.log都不会看;然后在搞什么收录搞什么投诉再搞什么举报,最后就精神大胜利了,非常阿Q。


处理

随便写了 rewrite 策略糊弄了事。

是的这一块我不太关心。这玩意就是猫捉老鼠,跟实际上看猫和老鼠完全不一样,很无聊。

想一下如果我是坏人,那我有什么办法?我办法多了去了,网上多数人的防御和反制手段基本都拦不住我。问题是缺德的事情我不做,更别说这事情本身就没有经济价值。


结论

写完这篇文章后搞不好又得遭一波 DDOS CC 攻击。

参考资料和引用资料我就不放了,别再被爬去被用作攻击列表。毕竟有些博主的反制能力不是很强。

请不要尝试去访问攻击者的镜像。

The post 网站镜像攻击2024第一版 first appeared on 石樱灯笼博客.
❌
❌