阅读视图

发现新文章,点击刷新页面。

连串糟糕

当年今日

五一之后的第一个工作日,简直就是糟糕的战斗机。上午的所有事情都比较正常,一切都按部就班,而且顺利得有点让我吃惊。比如平时得花好几天才能凑齐的东西,居然一个早上就完成了。那个东西之所以凑不齐,原因肯定不在我,是因为其他同事没有把数据交过来。

五一假期5天,每天都有100多台车,所以我拿单的时候实际上是比较崩溃的。5天加起来就超过了600个单。点单花掉了半个小时以上,把单拿回到办公室,又花了接近一个小时才全部用计算器过了一遍。后来我算了一下,这其实也挺神奇的。为什么我要花掉50分钟才点完那600多个单呢?我敲计算器的速度很快。600多个单里就只有最后那50个单出头那一份需要重打,其它都是一次性就完成。那么多单都可以一次性完成,我觉得运气比较好,而且很多单都是每份30个以上,好些都是50个左右,所以那么多单都可以一次性不出差错,就平时来说,这也是比较罕见的。为什么我依然要花那么长的时间呢?后来想了一下,因为实际上用计算器把那些单都打一遍核一个总数之前我还要点一下那些单的数量。接下来就是在打单的过程之中又有别人找我核对某些数据,所以实际上600个单我花了大概40分钟。直接粗暴地用时间除以数量去算,好像效率不怎么高,但实际上平时一天的量大概100多个单,需要个10~15分钟是很正常的。

糟糕的事情大概从下午开始,首先是下午一上班我就发现,办公室的电脑win10右下角的坚果云出现灰色状态,这意味着那东西连不上服务器,但是QQ跟微信都是正常的。我马上去打开了一下百度,发现打不开。接着我打开命令行去ping百度,直接没反应,然后我又去ping单位内网的智能化系统,可以打开。当我再去上集团公司的OA,发现同样是打不开的,这到底是怎么回事呢?简单一句就是我用Firefox打开任何的外网都不行。不仅仅是Firefox打不开,用ping的方式也完全没有反应。这到底是什么情况?然后我就去隔壁办公室,让别人也测试一下,发现他们的百度是能打开的,但是集团公司的OA打不开。遇到这种事情,我也就只能找网管,第一个反应是是不是那个杀毒软件又禁止了某些东西,比如封了某些端口?

Firefox是我的默认浏览器,但是当我用360极速打开百度的时候,居然打开了,虽然打开速度很慢,但是当我用Edge浏览器再去打开的时候,发现百度是打不开的,到底是什么情况呢?然后我赶紧求助网友,求助网管,在他们给我回复之前,我突然想到:这些有些能开,有些不能开,聊天软件没问题,是不是DNS被污染了呢?接着我就手机搜了个DNS,换了上去,没过几秒,所有的不正常都消失了。让我觉得很无语的是,在我的电脑打不开网站的时候,实际上我是用电脑共享出WiFi让手机上网,手机在微信上搜索DNS的。所以结论就是,并不是网络有问题,而纯粹只是DNS出状况了。网友说这个问题也不完全是我,他觉得是中午有人动过服务器,断网了一段时间,然后又恢复了,但是我的电脑手动设置了一个不太靠谱的DNS,所以就卡住。

网络恢复了,焦虑减轻了一大半,接下来用固体浆糊做了一些事,想去洗手,发现洗手间没水了。先是没网,然后没水,如果再加上没电,那么就算是全家桶了,但幸好这个为没水只是暂时性的,过了几分钟我再去,发现又有水了。问单位的负责人,告诉我他正在查单位哪里在漏水,所以刚才把水闸关了,但是还没找到漏水点。关了一下水闸,导致没水,居然都被我碰上了。

晚饭过后,我又仔细看了一下宿舍楼南面的那堵墙,发现又有几个非洲大蜗牛在爬升过程中。然后我就回宿舍拿了高浓度盐水对着我可以喷的那个来了几下,没过几秒钟的玩意就掉到地上了。有一个很高,我够不着,但是那个玩意已经爬到了我楼下那个房间阳台窗户的最高处,再往上爬就是我的房间了。所以我就回宿舍,先试图从高处往下喷,结果那个角度太刁钻,盐水根本喷不到,接下来我就拿了个水,拿了个盆,不断地往那个地方泼水,结果还是够不着。没有办法之下,我只能回到1楼,想拿个梯子爬上去再喷,然后就遇到了两个男同事,他们直接用梯子把那个东西给搞下来了。事实证明,用盐水喷正在爬行的蜗牛,的确可以让它缩回壳里,但是盐水不能杀死蜗牛。这是我想搞第2个蜗牛,回到1楼的时候,查看第1个被我喷在地上蜗牛时的结论。那个时候我不确定蜗牛死了没,所以我在宿舍出来的时候就带了一包洗鼻盐,直接就倒在地支蜗牛那里。最后我整了三只蜗牛,首先都是被喷到地上,然后我在上面撒盐。理论上那个玩意应该出水严重,但我觉得它们缩回到了壳里面,只是最外层的地方接触了盐,我不确定这样它们会不会杀死。微信公众号上科普的那些非洲大蜗牛文章说盐是可以杀死蜗牛的,因为蜗牛80%是水分,盐下去以后会让它们脱水。但我觉得这个东西得分情况讨论,如果你直接把它丢在盐堆里,只要出来它就必死无疑,它死定了,但是你如果只是在那身边撒一点盐,或者在它的软体上撒一点盐,那个东西完全缩在了壳里,可能受影响的部分不多。我撒完盐不久,下了一场大雨,当雨水把盐冲走了以后,我感觉大概率它们又会活过来。回到宿舍,拖完地坐在那里,拿起手机,我觉得那个蜗牛不会死,所以我又在淘宝上买了软体动物的专杀农药四聚乙醛。如果那个东西真的可以让蜗牛死一片在那里的话,我就直接让办公室多买一些,在宿舍楼、办公楼的草丛里都撒。如果不是那些杂草乱七八糟生长完全没有人管理,我们根本不至于会出现这种非洲蜗牛大泛滥。

单位大,单位废弃乱七八糟的地方也很多。

繁杂

当年今日

22点44,同事把4月最后一天单位的作业数据发出来。理论上在22点30,单位的作业就算结束了,再往前推,实际上大概在21点30的时候,最后一车已经完成过磅,也就是说21点30-22点30大家只是在等待约定的结束时间而已。之前我也试过提前行动,结果是居然在22点28的时候,又来了几台车,他们是压着点过来的,于是我只能把之前已经做好的东西推翻重来。这一次,我不想推翻了,所以我真的是等到了22点30以后才开始行动,在同事把作业数据发出来之前,其实我已经整理好我的那部分了。一直以来我都是这么干的,这需要有非常好的预判,同时也意味着我不是在等待他们发号司令才开始做我的事情。

确认最终数据之后,我又花了一个小时,把接下来的事情做完。那包括核对库存,做各种各样的表,以及之前把已经做好,但没有提交的完成最后的步骤。为什么我会有月末焦虑呢?因为虽然这些事情都很琐碎,但是累积起来得用几十去形容,它们之间有很强的关联性。当你需要报送的东西越来越多以后,除了把那个数据做出来以外,你也得保证它们互相是不打架的,虽然它们都来自于同一个数据源,但是因为某些特殊情况,会有一些意外的发生。比如说一些非典型业务的出现,就很容易导致没有把数据反映上去,又或者没有把某些数据剔除掉。因为类似的东西要报很多,所以很重要的一点就是,我有没有漏掉?有时候我会做着做着,突然间不知道自己下一步要做什么了,尤其是当我做完一件事,然后被打断的时候。我也说不准这到底是我记忆力不好了还是真的太繁杂了。近几年那些加码的事情得用离谱去形容,以前我只需要管好纸质的东西。现在纸质的东西得管,系统也得管,因为系统的东西实际上是人工录入的,而且系统还一个又一个添上去。纸质的东西也就那样了,但系统的东西,还有一些你预测不到的,比如明明该到你报送的时候了,系统却打不开,又或者没办法转到你需要报的那个表上面,简直让人无语。

到该报报表的时候,报送报表的那个网站打不开是让人很抓狂的。第一次遇到的时候,我的第一反应是可能网站出状况了,我等一等,但是等了半天,还是那样。我差点就要找我的上级反映我报不了数据了,但是在反映这个事情之前,我把那个网站在另外一个浏览器里打开,结果居然就开了。谁知道你是什么情况呢?一直我都是用Firefox做那个报表,为什么Firefox现在就是打不开呢?那个系统是浪潮做的,浪潮干的事,什么状况都有可能发生。根据我的经验,这种有些浏览器能打开,有些浏览器打不开,尤其是我经常用的浏览器打不开的状况,通常清除一下这个网站的cookie就好了。结果真如我所料,我清除了那个网站的cookie,网页就打开了。当我跟网友吐槽起我这个差点给上级上报很囧的事情以后,他的回复是实际上清除缓存不应该由我这个使用者完成,而是应该在做网页设计的时候就写好清除缓存的脚本。使用者无论任何时候,只要不是服务器那边挂了,都可以正常访问使用。这证明了,不是我的问题,不是Firefox的问题,又是浪潮不知道哪位干的好事。

又一个月末挺过去了,但这个月末我居然有种其实我也不确定我是不是都干完了,还是说有些事情我漏掉还没做的迷糊。

豆包“偷偷”“更新”文生图功能

大概是4月21日的晚上,豆包偷偷更新了。不能说是升级,因为出图效果明显劣化了。

倒是没有劣化成之前2.0那个版本。模型的确是更新了,但是精度大幅度下降了,乱七八糟的东西变多了。当然了,豆包的产品动态里屁内容都没有。

本文讲一下已知的变更。

(文章内容随时间推移而失效)


变更

屁话

首先是出图时增加了一堆屁话。

screenshot_on_b85m_by_flameshot_at_2025-04-24_00-39-46

看着像是把你的文本重新理解后重输出,这样好利于你接下来更改你的错误输入。

实际上放了个屁。

这段重排的文字和文生图的最终关系,从结果来看根本没关联。文字上好像是理解了你的文字输入,但实际上最终图片结果大部分场景下跟这段重排文字没啥关系,该错还是错的,这反而更加显蠢。


不知为何把 Debug Log 打到输出了

screenshot_on_b85m_by_flameshot_at_2025-04-21_23-54-12

周一大半夜更新线上业务本来就很恶心,然后这Bug一直活到现在。

看来其实他们根本不在乎这个业务的死活,就是做着玩的。


敏感词提示

这个算是一个有用的更新。

screenshot_on_b85m_by_flameshot_at_2025-04-22_17-06-20

比上来就生成失败然后把输入都给删了强多了。

等有机会把「领导」这个黑名单词汇出个图。


出图精度大幅下降

这是水下吗?这是游泳吗?这游泳馆为啥有海豚?

screenshot_on_b85m_by_flameshot_at_2025-04-23_23-12-58


画蛇添足问题明显

这狗熊脸哪里来的?

screenshot_on_b85m_by_flameshot_at_2025-04-24_00-14-20

这还不是最麻烦的,最麻烦的是,整体场景多余内容变得特别多。这导致整体输出变得非常的不可控,如果想要做内容的话,很有可能因为不必要输出乱跑导致完全跑题。

比如,这是更改前的输出:

screenshot_on_b85m_by_flameshot_at_2025-04-27_16-12-04

这是更改后的输出:

screenshot_on_b85m_by_flameshot_at_2025-04-27_16-11-53

很明显更改前,输出的内容很干净很稳定,但更改后,就非常过分的自作多情了。

准确度也变得更差了,带着雨帽还能露出双马尾这种错误,在更新之前是没有的。

这玩意就是明显的「画蛇添足」


单个会话出图数量有上限

限流。

每次对话能输出的图片数量被限制到了20。

screenshot_on_b85m_by_flameshot_at_2025-04-23_22-27-29

玩不起了呗。

screenshot_on_b85m_by_flameshot_at_2025-04-24_21-15-39

但并不是精确的20个,触发条件不详。


某些场景下会只生成一张图,而不是之前的四张

screenshot_on_b85m_by_flameshot_at_2025-04-24_20-13-33

虽说是因为带输入中指定了「一个」。

screenshot_on_b85m_by_flameshot_at_2025-04-24_21-17-37

但是输入里如果带数字的话,有可能会被识别成一个。

screenshot_on_b85m_by_flameshot_at_2025-04-26_13-21-01

触发条件的细节不确定。

screenshot_on_b85m_by_flameshot_at_2025-04-24_21-44-17

好歹还是做了个最多一次20个的限制。


结论

线上工具用着就是这么难受。

这反而让我想起了10年前的某个工作内容,项目是在微信上做公众号,比起竞争对手的核心优势就在于不需要在手机上另装APP就可以做推送(说实话当年很难绕过安卓手机上的各种流氓应用互相杀进程,所以自己做APP死路一条),结果做了几年之后,微信大幅度砍了公众号的推送功能,导致整个项目都报废了。或许这辈子能有个机会写一个生涯回忆录写一些相关内容,但估计没有那个机会了。

The post 豆包“偷偷”“更新”文生图功能 first appeared on 石樱灯笼博客.

win10更新卡死

当年今日

周三的上午跟往常一样,我操作完一些必须要完成的事情以后,看到win10右下角出现了更新的符号,点开后那里说我已经完成了一个框架更新,同时也有一个累计更新,问我需不需要下载安装,我点击了下载安装,下载是正常的,但是安装到最后就告诉我更新失败。拿着那条代码去搜索,发现原因大概是这个更新在我这个系统的更新目录里,但是里面缺少了二进制的代码,所以更新失败。如果没记错的话,上个周末在家里,我的笔记本电脑也出现过这种情况,但是那个时候我根本没想,更新失败就等下一次再更新吧,反正也无所谓。单位电脑的框架更新已经安装完成,电脑就必须重启才能完成最后的步骤。反正那个时候我也没什么工作,更新完毕,重启一下电脑,理论上也耗不了多少时间。我又是那种强迫症患者,没办法接受右下角一直都有那个更新的符号。我在点击重启之前,我的手机正在使用着电脑共享出来的WiFi。以前是一直没什么问题,反正关掉电脑以后WiFi就断了,那么手机就会自动连上其它的WiFi。之所以我要用自己的电脑和无线网卡共享一个WiFi出来,是因为隔壁那个路由器可能连接的人多了,经常会出现莫名其妙的缓慢卡顿甚至上不了网。

Windows进入更新的蓝屏,进度条什么的一切正常,但是到了“正在准备windows,请勿关闭计算机”那个界面的时候。我就觉得不对劲了。电脑一边在更新,我手机一边在做任务,正常情况下我任务没做完,电脑就应该已经更新完毕了,但实际上我的任务全部都做完了,居然还卡在那个界面。卡了15分钟以后,我就不淡定了,开始找网友,开始在微信上搜索。卡了半个小时后,我更加不淡定了。在那个蓝屏的界面,除了等待,就只有硬重启。硬重启非常有可能会导致系统的损坏或丢失,结果就是进不了系统,或者即便能进系统,系统也不正常,所以最终的后果就是可能得重装。我知道强行关机的后果,但是等待实在让人非常煎熬,于是你控制不住自己用手机查找各种信息。网友建议我观察一下硬盘灯的状态,说如果硬盘灯处在熄灭状态,那么我重启估计也可以,但硬盘灯一直闪烁,只是有时闪得慢一点,有时闪得快一点,闪得快的时候,你甚至可以觉得那是常亮的。有段时候,硬盘灯闪得非常快,我觉得这是不是意味着这个卡的界面要结束了,但实际上并没有。闪得非常快之后又开始慢闪。我知道硬重启不太行,所有人都在劝我要耐心等待。幸好这段时间单位没什么事情。在纠结了一个半小时以后,突然蓝屏消失,电脑进入黑屏。之前也发生过一次,但当我动了一下鼠标后发现实际上是那个蓝屏的状态持续时间已经超过了半小时,所以我的电脑自动进入了休眠。一个半小时之后的那个黑屏跟之前不一样,因为几乎同时我就听到了电脑开机的声音,也就是说总算结束了那个蓝屏进入重启。我给好几台电脑都安装过win10系统,安装之后那些电脑都要进行很多的更新,但是我从来没有试过任何一台机会卡在我遇到的那个蓝屏界面超过一个半小时,别说一个半小时,超过15分钟都是比较离奇的事情,但总算我的电脑没有卡死,成功重启也成功进入系统。进入系统以后,我做的第一件事就是去更新那里不断的按了好多下暂停更新。直接把那个更新的日期推迟到5月中旬。

我实在接受不了月末的时候,再给我发生这么让人崩溃的事情。

Office的安装与激活

当年今日

决定了我的备用电脑要安装Office 2021 proplus之后,接下来我就要决定这个玩意要怎么安装以及怎么激活。我是2017年转的岗位,大概是2018年我觉得是时候给office做一个升级了,在那之前我用的都是Office 2003。 Office 2003贯穿了我整个大学生涯以及开始工作的前十年。为什么我想到要升级office呢?因为岗位不一样了,我需要处理的数据更多更复杂。为了提升自己的技能,所以我买了Excelhome的三件套,那个时候标配的Office是2013,但谁也没告诉我2013的数据透视表就是一个巨大的悲剧。在这台电脑建立了数据透视表,到另外一台电脑就会失效,因为不知道为什么数据透视表的引用居然是一个绝对引用。你把你建立的文件发给别人,别人就会遇到,当他修改明细表的数据的时候发现汇总的数据透视表没有变化,接着,如果他足够理解数据透视表,一看源数据就会发现,原来是那样。你或许会觉得修改一次就完了,但实际上不是这样的。我有很多数据表格,我需要用同步软件在我不同的电脑上同步。同步完成的文件是上一次修改过这个文件电脑的绝对地址。结论就是这根本没法玩。所以我不得不又退回了Office 2003。2018年的双11我入手了荣耀笔记本电脑,自带的是Office 2016家庭版。那个家庭版让我的确感受到2016数据透视表已经治好了2013的那个作死的问题。我也尝试在台式机上安装2016,但那个时候我没有找到靠谱的激活方法,所里2018年的双十二,我在微软商城入手了Office 365个人版。当时那个玩意还附带了一年的视频会员,我选的是爱奇艺,但即便这样,价格也不低。不过这保证了我所有的电脑都可以用同一个office的版本,而且是最新版。

虽然我的电脑没有问题了,但是我还要解决我同事的电脑,因为我的岗位不仅仅是一个人,我还得和他们共享数据、共同编辑,所以那个时候我就研究了一番Office 2016 proplus的安装以及激活。

Office 2021跟Office 2016最大的区别在于,如果是批量版,从2019开始,再也没有官方的离线安装文件,你只能通过部署的方式下载。只是批量版没有了这种方式,零售版依然有离线下载安装程序。这貌似把一部分人挡在了门外,但实际上会一些人会把这些必须要靠命令行才能完成的事情可视化。现在无论你要想安装什么型号的office,总有部署工具,能满足你的需求,他们不仅仅能安装官方版的office软件,还可以一条龙替你激活,但是那种激活方式是不是你想要的,又是另外一个问题。但起码就安装这个步骤来说,你不需要去找微软官方的下载地址了,因为实际上那些部署软件用的就是微软的通道。

不同版本的office,安装设置会有一点点的不一样,比如更新通道的选择,比如选择零售版还是批量版。这两种东西的选择,关系到后续激活到底要用什么样的方式。即便同样是零售版或者批量版,但是不同型号的office以及同型号office的不同细分,又会有不一样的注意事项。

所以我感觉,既然我决定了要装某个版本的Office 2021,对我来说最大的抉择就是我要以什么形式激活,然后才能决定我应该安装什么版本的2021。

讲讲目前使用线上AI文字生成图片工具的局限性

我这是捅到人家的天花板了。

本文多图多视频。我研究了一下,bilibili的嵌入代码,在后面接autoplay=0这个参数时也能像youtube嵌入代码一样禁止自动播放……(破站怎么自己就懒得写上参数呢。我估计写前端播放界面的人都不在了吧)

(为了省事,下文中 关于 文字生成图片图片生成AI生成图片 等一系列同义词,均使用 文生图 这个词)


前言

是的这一阵子仍然很无聊的在折腾AI,主要是在瞎搞豆包的文字生成图片功能。

画画一直是我可望而不可及的能力,天生没有拿笔画画的能力,我最高也只能做到画几个简单的几何体素描,这还是小学一年级寒假的时候送到画画班学了一个月才会的东西。

再往上就感觉脑子里有个瘤一样。人类做不到自己想象不到的事情,而我很明确的想象不出来自己拿着笔画画的样子,最多也只是在3DS上玩一下 《Colors! 3D》 或者 《绘心教室》。

jpg-IMG_20150119_123255

jpg-HNI_0088

所以当有一个能出图的工具摆在眼前的时候,肯定是得当作工具好好尝试一下的。

上一篇文章中也说过了,线下AI文生图工具用不起,线上AI文生图工具不可靠。

只不过这次玩得有点多,我算是把 豆包的AI文生图天花板给捅


尝试用豆包文生图功能做漫画

现在我用AI文生图功能基本上只是想做叙事漫画,而之前文章《[原创漫画] 《生命,科技,灵魂,死亡》,以及制作感想》中也讲了,因为这玩意不是人,所以连续出图的连贯性完全没有保证。

第一个思路就是尽量让内容足够简单,这样在内容变化上能尽量保证主体变化不大,不会崩溃。

于是做了这么个玩意。

《[原创漫画] 工作》

只不过叙事结构实在是太过简单了。甚至都抽象不起来。


尝试用豆包 智能编辑 和 区域重绘 功能出图后插帧做动画

我之前想到过,使用智能编辑和区域重绘,一点一点做一个渐变的效果,然后在用 rife 插帧补成动画。

为此还专门撞到了 rife 的 插帧数量 bug 上了。只不过 rife 的原项目早就沉寂了。社区目前或是没人维护,或是一堆不会说人话的莫名其妙脚本小鬼。

这是两个在动画风格下的尝试结果:

《尝试使用「AI智能编辑」+「AI 补帧」制作一个少女变身效果》

《继续 尝试使用「AI智能编辑」+「AI 补帧」制作一个少女变身效果》

只能说效果非常的不好。rife只能根据两帧之间的差别出图,而动画是一个流畅的东西,在 智能编辑 和 区域重绘 这两个功能下根本没有流畅度可言。

我也尝试了用 NLE 的播放速度曲线,结果没啥效果。尤其是速度曲线需要做积分来确定播放时长,而我现在的脑子算个一元一次方程式都卡壳。


捅到豆包文生图2.0模型的天花板

(我猜这玩意叫2.0,因为我不知道这玩意到底叫啥)

我在思考过后,想了个不如干脆不用动漫风格,而是用写实风格,找个特定的明星脸去保证任务的连贯性。

然后就发现了个很有趣的现象: 当关键词足够多的时候,出图风格会回落 ,像是内存被站满了然后把整体模型下降一个级别以减少内存使用的现象。

具体回落顺序是:「人像摄影」>「电影写真」>「3D渲染」>「动漫」

screenshot_on_b85m_by_flameshot_at_2025-03-31_19-36-09

可以看出在一定关键字下,人脸输出还是比较稳定的,图像也比较像真人。

但是当继续增加关键词的时候,出图风格就会往下落。「人像摄影」和「电影写真」都是出真人照片,「3D渲染」就开始出类似建模一样的风格,甚至直接降级到「动漫」这个风格里。

screenshot_on_b85m_by_flameshot_at_2025-03-31_19-36-15

继续增加关键词的话,即使手动设定「3D渲染」也会落到「动漫」风格。

screenshot_on_b85m_by_flameshot_at_2025-03-31_21-35-27

这算是捅到豆包的文生图功能的天花板了。

于是只能继续简化关键词,这也就意味着要简化场景的复杂度。

在这个限制条件下,我做了这个视频

《[原创] Dump》

怎么说呢,场景实在是太过于简洁了。

只能说,在线上工具有如此限制的情况下,创作上限真的是极其有限。

这也是为什么我一直讨厌依赖线上工具的原因之一。


豆包文生图模型升级到3.0

这玩意还能升级我是没想到的,因为我一直不太明确,目前这些大厂搞这些产品的目的是什么。豆包的这个产品,明显在外部宣传上没跑过同类选手,在商业宣传上亏一大截。事实上我个人认为线上这些工具全部都在迷茫期,或许瞎搞才是正常状态。

screenshot_on_b85m_by_flameshot_at_2025-04-12_22-24-27

模型升级后,的确画质提升了非常多,前文中讲的 风格回落 问题基本就不会出现了(或许是服务器升级了内存上限?)。但就像我说的 我一直讨厌依赖线上工具 ,线上工具的变化在用户端是不可控的。

模型升级后网站把不少样例都更新了。说实话旧版模型我觉得有些样例图根本就生成不出来,所以新版出来的时候很多样例肉眼可见的是画质变差了。但由于新模型的确有提升,所以整体上还算是升级。尤其是那个文案超级长的只放在「精选」分类里的例子,看着的确搏人眼球。

screenshot_on_b85m_by_flameshot_at_2025-04-13_16-36-01

screenshot_on_b85m_by_flameshot_at_2025-04-04_19-11-32

模型升级后的优点

(注:内容具有时效性,随时间变化部分内容会失效)

首先是文字内容的命中率高了非常多。

同等文案旧模型与新模型的对比:

生成特定风格图片_realesrgan2x

生成特定风格图片-2555473994924546-20250413162847

旧模型不会画单元楼门,不会画角色与背景的比例,不会画角色与背景的相对角度。新模型虽然在比例上还是歪的,但是至少把意思表达出来了。

输出的最大变长也从 1024 升级到了 2048,绝大多数情况下不用再手动用 realesrgan 放大一遍了后再缩小到 1920×1080 了。

模型升级后的带来的新缺点

原本作为「属性入口」的关键词,现在被当作真实的文字关键词使用。

比如原本用来控制角色身高的关键词,现在成了猎奇玩意。

screenshot_on_b85m_by_flameshot_at_2025-04-07_23-45-58

screenshot_on_b85m_by_flameshot_at_2025-04-07_23-49-34

screenshot_on_b85m_by_flameshot_at_2025-04-07_23-52-43

总之目前模型下已经没法控制输出角色的身高了。

screenshot_on_b85m_by_flameshot_at_2025-04-11_22-06-26

然后是输出的角色现在都不能闭嘴不露齿笑,全部都只能张嘴傻笑了。

screenshot_on_b85m_by_flameshot_at_2025-04-07_00-10-03

悲伤必然流眼泪,伤心难过不哭不行。

screenshot_on_b85m_by_flameshot_at_2025-04-14_00-55-16

screenshot_on_b85m_by_flameshot_at_2025-04-14_00-57-24

然后不知道为什么,发箍 这个字段总被当作 光环

screenshot_on_b85m_by_flameshot_at_2025-04-13_19-41-01

screenshot_on_b85m_by_flameshot_at_2025-04-13_19-51-43

(莫不是模型是用 蔚蓝档案 跑出来的?)

模型升级前后依旧存在的缺点

和前一篇文章提到的问题一样,只要元素个体超过两个,相互关系就会崩。

  • 车是依旧不会开的。

screenshot_on_b85m_by_flameshot_at_2025-04-07_20-32-35

  • 马是不会骑的。

screenshot_on_b85m_by_flameshot_at_2025-04-12_15-31-16

  • 部分关键词的理解还是错的。

screenshot_on_b85m_by_flameshot_at_2025-04-07_13-57-29

  • 疑问表情的时候问号是画出来的。

生成动漫风格厨房图片-2994986069843458-20250414012836

  • 关键字屏蔽还是在的

screenshot_on_b85m_by_flameshot_at_2025-04-06_16-07-05

  • 多个对象场景下比例还是很容易崩的。

生成动漫风格图片-2988978288407810-20250413231900

  • 多个对象场景下,对象间关系很容易出错。

比如,我想让这个紫色少女站在橙色少女前面,站着的时候就没问题。

screenshot_on_b85m_by_flameshot_at_2025-04-11_20-38-23

但只要橙色少女坐下,就没戏。

screenshot_on_b85m_by_flameshot_at_2025-04-11_20-38-29

screenshot_on_b85m_by_flameshot_at_2025-04-11_20-39-30

更别说总能渲染出离奇玩意出来。

生成动漫风格图片-2860612677803010-20250411191734

地上那个大屁股是谁掉的?


参考图、智能编辑、区域重绘、擦除

讲了出图,也得讲一下改图。

擦除

擦除应该是最有用的功能,只不过豆包的这个擦除,抹啥糊啥。

原图:

生成动漫风格图片-2996429080838914-20250413233527

豆包擦除:

生成动漫风格图片-2996429080838914-20250413233211

百度擦除:

jpg-e1d68564eccf784c743295bb2fbbd76c

(百度出的结果是jpg的而且分辨率会被缩,基本上是一坨屎)

GIMP 克隆工具:

生成动漫风格图片-2996429080838914-20250413233209

而且很诡异的是,豆包的擦除会破坏原图非目标区域。

screenshot_on_b85m_by_flameshot_at_2025-04-13_23-41-49

百度就不用讨论了,输出的是JPG肯定毁得一塌糊涂。

screenshot_on_b85m_by_flameshot_at_2025-04-13_23-42-06

所以有擦除需要的时候能用传统工具还是用传统工具最好。

screenshot_on_b85m_by_flameshot_at_2025-04-13_23-43-23

参考图、智能编辑、区域重绘

参考图、智能编辑、区域重绘,这三个我就一起说了。

原本2.0模型的时候,这仨功能就不怎么好使。最大的感觉就像是,这三个玩意用的是一个比2.0劣质一点的模型,但还没有到达不可接受的差距。

尤其是2.0的时候,文生图的输出最大边长是1024,而 智能编辑 的最大边长却是 1312,对应16:9比例的话输出结果是 1312×736 这么个分辨率,直接放大到 1920×1080 的话是 1920×1077 或 1925×1080 。也太奇葩了。

用了智能编辑后不仅分辨率坏掉了,图像的精细度也会降一大截。

生成特定风格图片-1961225555338754-20250316194924

生成特定风格图片-1961225555338754-20250316195003

如果运气好的话,新图的角色可能会比旧图角色小一点,那样的花就用rembg把旧图角色抠出来,然后自己编辑,再贴到新图上。

动画模型还好一点,真实场景模型几乎烂到恐怖。尤其是现在模型是3.0的情况下,精细度差别能大到吓人。

这是3.0的文生图:

生成特定风格图片-2715236277751298-20250407223427

这是区域重绘,尝试在椅子上放一瓶可乐:

生成特定风格图片-2715236277751298-20250413154949

这是 参考图/智能编辑 想在空椅子上加个人:

生成特定风格图片-2715236277751298-20250413155332

纯正 伪人-模拟恐怖

事实上即使是抛开画质不谈,智能编辑本身就会严重丢失原图的信息量。

换杯饮料立刻不哭:

生成动漫风格图片-3001337865737730-20250414010459-1

换个地毯立刻开心:

生成动漫风格图片-2991379788847618-20250414010930-1

白天黑夜表情就变了:

图片风格设定-3043733434981378-20250414231405-1

甚至连东西都不会拿了。

图片风格与内容描述-3006221925573122-20250414013744-1

我文章开头说过想用智能编辑区域重绘做动画,如果用真实场景的话大概就是这么个效果:

尝试使用「AI智能编辑」+「AI 补帧」制作一个少女变身效果(三)

这里还有一个动漫效果的,所有元素的变形都太严重,根本没法看。

尝试使用「AI智能编辑」+「AI 补帧」制作一个少女变身效果(四)

文中最开头也说了,本身这玩意流畅度就够呛,再加上 智能编辑和区域重绘 的模型,就烂得非常的变型了。真实场景的伪人问题特别严重。

可以说在文生图是3.0的场景下, 智能编辑区域重绘 基本是没法用的。

扩图

这功能本来也没啥太大用,就是在部分不在意内容的场景下填补空白,比如视频封面图啥的。

只不过由于出图分辨率是固定的,所以 扩图 的同时还在 缩图

我曾想着或许可以靠反复扩图的方法,做一个绝命毒师结局的 Baby Blue 场景,结果,豆包的扩图一直往竖屏海报这个方向跑。

screenshot_on_b85m_by_flameshot_at_2025-04-08_22-00-03

想了多种办法调整之后

jpg-screenshot_a4ab1c79e10c4b187093e6fe35a8629c

重点目标被糊成一堆气泡,想要用来重复的边缘图形也糊成了抽象油彩。或许自己拿 GIMP 克隆工具自己图都更靠谱。


豆包应用

说完模型,说下豆包这玩意。

声明:我个人本身是很讨厌头条系的(现在可能叫做字节系?)。但相对于厌恶程度,头条系在我眼中最多只能排第三。

这玩意应该是有一个网页版,一个 Chrome/Edge/Safari 插件,一个 Windows/MacOS 浏览器,一个手机客户端。Chrome插件 和 Windows客户端我都试过了,正经人谁会用这玩意?退一步讲,哪个产品经理想出来专门做一个浏览器只为了跑一个网页?脑残的阿里吗?

手机APP我没有试过。

网页端则只有短音验证码登录、APP扫码登录 和 第三方登录。

但是没有强制登出所有其他已登录对话的功能。

screenshot_on_b85m_by_flameshot_at_2025-04-15_00-42-44

这就意味着假如哪天手机短信验证码泄露了,其他人就可以一直在他的界面上一直监视你的所有操作。

仅是安全性这一块就可以打0分了。


豆包模型背后的火山方舟

这玩意背靠的是头条系字节跳动旗下的 火山引擎

火山引擎这玩意想要登录进去可以说特别困难,页面的稳定性烂得出奇,大部分情况下都是后端API超时,跨域请求出错,前端条件判定出错,然后报错一大堆。可以说这玩意至少在商业场景下就是一坨屎。

screenshot_on_b85m_by_flameshot_at_2025-04-12_22-39-34

进去之后看到的就是一个山寨 阿里云/腾讯云 一样的界面。云服务供应商虽然都长得差不多,但是至少阿里腾讯的业务至少控制台每次都能正常登录。

说实话我一直以为豆包这娱乐性的APP大概是为了向公众展示技术实力的一个窗口,而其背后应该有更多的能提供更强更稳定的商业服务。

至少 稳定 这一块是没了。

而作为 更强 这一块呢?

文生图的付费接口仍然是旧版的2.0模型。

screenshot_on_b85m_by_flameshot_at_2025-04-12_22-38-10

付费服务比免费服务还烂,是超出我的想象的。

screenshot_on_b85m_by_flameshot_at_2025-04-11_22-06-44

这个输入接口甚至比百度AI的公开服务还烂,而出图质量甚至都没有上一个版本的豆包高,只有百度AI的水平。

而且和豆包以及其他国内平台一样,文生图功能都只有一个文字输入接口,非常的落后。(现在的文生图平台基本是以「正面」和「负面」两个文字输入接口存在的,「负面」输入可以保证输出结果中不存在你完全不想要的内容)

(有一种不愧是头条系的感觉,除了搞出致瘾性算法之外什么都搞得稀烂的样子)

至于其他产品,图文生视频这玩意目前就是搞笑的,屁用没有。你可以看我在B站做的这个视频合集:合集·用AI生成的视频也太离谱了,这玩意最多只能用来做搞笑段子。

screenshot_Shotcut_00_02_29_833

语音模型,开放业务只有声音复刻和同声传译。

文本模型,这玩意真的有人想要花钱 这玩意吗?用途会是啥啊?自己搞个假的 DeepSeek 搞分销?


结尾

反正目前这个AI水平,放在个人手中,仍然只是个玩具。线上服务基本上都是不靠谱不稳定随时跑偏做得稀烂还想捞钱;线下个人用户很难将业务稳定的部署,硬件软件都是坎。

尤其是我目前的确有几个AI编程的需求,就是根据已有的html文本,直接生成带锚链接的目录。这个需求我在 豆包 百度 copilot 下同时试了 bash node php python 三个语言,基本全部都是语法错误,基本都是瞎写的,正则语法都是错误的。狗屎一堆。

上一篇文章《是时候在我这里聊一下人工智能了》,除了一条有效评论之外,全是来刷AI的评论。

screenshot_on_b85m_by_flameshot_at_2025-04-08_13-21-07

诚然我已知现在人的确没几个能读得下去文字,更别说是我写的这种枯燥无味的长篇大论。但是人机刷评论这操作属实是有些人放弃做人了,毕竟独立博客不需要刷活跃度来提升展示率,这些人机刷的这些玩意属实是真把脑子丢了塞了个热度算法塞自己头骨里了。

只能说互联网真的退潮了。「潮水褪去,才知道谁在裸泳。」结果发现在水里泡着的全都没穿裤子,大家都在那甩小屌,那就无所谓了。

前几年我的某个亲戚嚷嚷着要培养自己家还在上小学的孙子搞黑客,现在又要做直播,我就等他家啥时候搞AI了。

The post 讲讲目前使用线上AI文字生成图片工具的局限性 first appeared on 石樱灯笼博客.

确定买断Office的版本

当年今日

经过了Microsoft 365惊魂一夜之后,我意识到我不能把自己吊死在一棵树上,所以即便我要继续用 Microsoft Office软件,我也不能把所有电脑都用上365版本,主力机我可以继续用365,因为显然那个是最顺手的,如果他们能一直把服务提供下去,我也愿意一直每年都给他们一些费用。万一某一天365故障了,不让我们用了,我也得有对策,所以我的计划是所有的备用电脑全部装上proplus的版本,至于要装2019、2021还是2024,得考虑一下。2019跟2021比起来,我肯定会选2021,因为经过那么多年,其实2021也已经成熟了。之前不知道听谁说2016跟2019会在同一时间停止支持。

在我还不确定是要用2021还是2024的时候,突然间有人在ExcelHome上面问除了Microsoft 365以外,还有哪个版本的office是支持溢出函数。溢出函数是什么?ExcelHome的大神没有马上反应过来,但是我反应过来了,因为我用过那些函数,当我的设置不当的时候,在理论上应该显示正确答案的地方就会出现“溢出”两个字。溢出函数说白了就是动态数组函数。以前的数组函数,你必须要用三键结束,而且你还要把函数扩充到你想要的范围,但不知道是从2019还是2021开始就有了溢出函数这个东西,又或者准确的来说应该是动态数组函数,这些动态数组函数你只需要在一个单元格里设定,它的结果会扩充到其它的单元格,会向右向下扩充。至于扩充多少,就看你所设定的那个函数能获取到什么样的结果。正如上面我所说,如果你的函数设定是不对的,那么你就会得到溢出这两个字。如果你把单元格定位在动态数组函数非公式设定的那个单元格,会发现里面是主单元格灰色的公式,但实际上你看上去那个单元格又是有数据的。这是很方便的东西,也很奇妙,但如果你直接想把那个结果进一步使用,又很有难度。哪怕你想把那些东西建立一个超级表实际上也是做不到的,你想把那些数据作为数据透视表的元素去引用,也是不行的。所以这个动态数组函数到底用在什么地方呢?我觉得只能是最后的一步,就是你想做的那个事情的最后一步,因为那之后你已经没办法再继续操作下去了,情况就像在VBA的SQL里,把数据透视化展示就是语句的最后一步,透视处理之后的东西,你再也没办法进一步操作了。

我用过动态数组函数,但用得不多。因为我知道很多人的office还是挺低端的,可能不支持这个玩意,我看到他们看不到,文件发过去等于没用。动态数组函数我用得不多,但xlookup函数我用得挺多,基本可以这么说,在考虑怎么得出索引数据的时候,基本上我都会首先想到那个,而不是经典的那些组合,虽然实际上在某些情况下,他们得到能得到一样的结果,经典函数加上超级表的结构语言依然能得出很简便的索引公式。 Microsoft 365故障的那一天,因为电脑自动被退回到了Office 2016家庭版,然后我就见识到了自己的xlookup函数全部崩溃的那个画面。于是第二天我就把那些Excel表格公式全部改成了lookup函数,实际上也没有多大的改动,因为那不就是个多条件索引而已。 lookup函数Office 2016肯定是支持的,但是xlookup函数好像要到Office 2021才算是全体支持,至于升级到后期版本的2019是否支持,这个我还得进一步找一下资料。

为什么要高级版本的office呢?因为高级版本的office支持的Excel函数更多了,但是是否最高级的版本就最好呢?未必,因为据说Office 2024有不少bug。

综上所述,所以我把目标买断office版本初定为Office 2021proplus。以防万一,我也要把自己经常使用的那些Excel表格里面太高端的公式全部低端化,也不一定要低端到Office 2016也能支持,但如果真的能做到那样的话就更好了。

Microsoft 365家庭版全球一起宕机

当年今日

回宿舍开始动感单车课程,一开始我觉得自己还没有回过神来,但随着运动时间的延长,我渐渐把那个很烦人的东西放一边了。运动对我来说是一个很好的减压方式,到了一定程度以后我会忘却一切。我不知道这是因为我专注其中,还是运动分泌的某些东西会让我好过一些。

运动结束一看手机,发现有人给我发微信说他回到了办公室,他电脑的office软件正常没问题。打开他的截图,原来是Office2021家庭版,那肯定没有问题。不是痴迷分子,看到office软件可以用,根本不会意识到自己是不是跟我一样的问题,但可以肯定的是,这一次抽风的是Microsoft 365,而且可能是只是家庭版家长以外的用户,但也可能个人版跟家庭版的主账号也会有一些毛病。其它机子附带的那些各种家庭版,又或者是用其它方式激活的各种批量版没有问题。给我发微信的那个同事,也是在我们那个Microsoft 365的家庭版里的其中一个小孩,他虽然知道自己是365的订阅用户,但是他却没有意识到自己办公室那台电脑用的原来是Office2021家庭版。

当他说没问题的时候,我没有电脑,所以我打开了Microsoft 365的app,发现之前说我的账号是免费用户的地方现在显示我是订阅用户,所以这是不是意味着电脑好了呢?于是我赶紧开机,发现电脑还是不好,但不知道为什么之前我的office是无论如何只读状态,这一次打开的时候就直接给了我一个Office2016家庭版的界面,不仅仅是界面,帐户那里也显示我是2016家庭版,所以微软到底什么脑洞呢?365用不了,但是这个帐号下还有一个office,那么就给他切换到那个可用的许可证。但实际上他们真的能做到吗?除了office的界面很不一样以外,功能也很不一样,我不知道这样纯粹只是换了个Office版本许可证,这个阉割版的office到底有什么bug。一个普通的升级降级都会很容易导致office那些功能无端端就不能用,更何况是这种降级了几个级别的?Office 2016、2019、2021,现在最新版本是2024,Microsoft 365对标的是2024,又或者你可以说是2024 plus,因为2024版不具备的功能,可能365也是有的。虽然我不知道这次带了多少bug,但起码office可以打开编辑了,只操作一些低级的功能完全没有问题。

接着我马上打开网页版的微软账号,发现那里依然不显示我是Microsoft 365家庭版的订阅用户,当我再次打开手机app的时候,发现我的账号又变成了免费账号。接下来我又去搜索微信,出来的结果是微软发出了官方的声明,说Microsoft 365家庭版的服务器出了一些故障。除了官方账号以外,其它公众号也说这个故障是全球性的,国内好像是从周四下午开始就陆续有人发现这个问题。可能我的运气比较好,我是晚上19点多才发现的。也不是说我下午一直没有使用。我一直都用着,但一直都没有问题。大概就是那个点,突然我的账号我的软件要跟微软交换某些数据,于是就卡住了,然后就傻掉了。理论上Microsoft 365的账号是不需要一直联网的,但要过一段段时间就服务器认证激活。可能我就是那么好彩,校验的那个时点刚好遇上了他们服务器瘫痪。服务器瘫痪是肯定,从微信公众号上的某条信息看来这是全球性的,我就没那么慌了,这就意味着这不是因为贸易战争,针对中国而出现的毛病。全球性的毛病不需要焦虑,过上一段时间就会好。

大概在周四晚上11点左右,我发现office好像终于正常了,手机app显示我是订阅用户,在网页上微软账号也显示出我是家庭版的订阅用户,电脑上的 office也可以在帐户那里重新切换回Microsoft 365。

折腾了我整整一个晚上的365风波终于告一段落。

Microsoft 365家庭版崩掉

当年今日

周三下午发现Excel SQL查询的问题,周四下午算是写完一个调查报告,周四晚上跟往常一样等待的单位的作业结束,结果在某次使用Microsoft 365的时候就出了问题。突然弹出一个窗口,说我的账号上有Office2016家庭版。这意味着什么呢?一开始我并没有马上反应过来,但接下来的事情让我傻眼了。实际上这个并不是一开Office就出的状况,是我正在使用过程中,突然就弹窗。看一下右上角,我的账号是处在一个登录状态。再看我的帐号的那个地方,果然,如我所料,Microsoft 365显示出一个未授权的状态。怎么就未授权呢?无论我怎么点击,出来都是没有结果.于是我就尝试在网页上登录微软账号,第一次进去的时候显示错误代码,403禁止访问,过了一段时间之后我再去,网页上微软账号算是登进去了,但是那里显示了我只有 Office 2016家庭版以及已经过期的Microsoft 365个人版。那个人版肯定过期的啊,因为之后我加入了Microsoft 365家庭版。无论是在微软账号的首页,还是订阅页面,都没有看到Microsoft 365家庭版的订阅信息。我不确定这到底是不是正常,但从直觉看来这很不正常。与此同时,在账号首页,我还能看到我的家庭成员。家庭版的家长是我的同事,不可能把我踢出去,而且家庭的成员也都在,如果要踢就一并踢了,我就看不到那些成员了,所以这到底是什么情况呢?

遇到这种事情,我是很慌的,因为就在较早时候,准确来说大概是半个小时之前。不知道为什么,我就看到了传闻说微软要退出中国。华大基因使用的系统以及office软件也被禁止使用了,所以微软真的对普通个人用户也干这种事情吗?

首先我去微博搜索,发现还没有消息。在这期间我一直在联系家庭版的家长,但是他没有回复,结论只有一个,他去踢球了。一个小时后,当我再去搜索的时候发现微信上有人说Microsoft 365账号的订阅出现了问题。有人显示的订阅被取消,有人显示未授权。通常发生在Microsoft365 家庭版的账号订阅上。这个时候我依然是慌的,难道他们就这么迅速地要针对中国用户?在微信上搜索到这条信息之前,我有的同事已经跟我说,他的office没有问题,原来他用的是Office2021家庭版。

周四下班之前,上面有个任务让我要报某个数据,但现在我的office软件处在一个只能阅读的状态。数据出来了,但我用什么编辑呢?没办法,这下我只能把表格发给自己,然后保存下来,用手机上的Microsoft 365打开编辑保存,然后再发回给自己,电脑上,用只读方式打开核对数据无误后,再把表格发出去。丁大一点的手机,要处理这个,虽然只是填写两个数据,也足以让我觉得很崩溃。

手机上的Microsoft 365显示我是一个免费用户,实际上我应该是一个订阅用户,因为我是Microsoft 365家庭版用户,几乎可以肯定,这种订阅关系不知道为什么被取消了,或者准确来说失去了关联。手机可以打开表格,编辑表格,保存表格,为什么电脑上的版本就只能阅读呢,同样都是免费用户。

那个时候我的脑子里有无数个念头。我的所有电脑全部用的都是我微软账号登录的Microsoft 365,一旦那个玩意失效,我该怎么办?直接换到WPS是不行的,因为单位作业数据的获取是通过数据库查询获取的。开发那个查询的也就是我家庭版的家长,还没有把WPS的查询开发出来,直接把office的查询放在WPS里面,是没有任何效果的。这该怎么办呢?

在办公室里等待下去也没有用,因为这不是一时半刻就能解决的问题,而且问题不在我,所以我也就只能先回宿舍开始动感单车课程。

使用内部数据就会卡?

当年今日

昨天说到一个很简单的SQL语句引用的数据库就只有一个字段两行记录,居然需要24秒才能得出结果。这让我觉得非常不可思议。首先可以肯定的是数据量非常少,为什么会出现这种问题呢?那只能是连接方面是不是出了什么故障,也不能说,那是失效的,因为的确还能查询得到想要查询的东西。在我测试的那个宏里面。我引用了两个文件,一个是外部文件,一个是内部文件。外部文件是含有比较多的数据,而内部文件,也就是我一开始说的那个只有两条数据。我感觉如果我的SQL再厉害一些,我对VBA再熟悉一些的话,那个内部文件可能我就不需要引用了,我直接就在VBA里创建一个数据库,然后把两条数据给写进去,用完以后就删掉,但显然现在我还没有很大的把握,一定能完美地做这件事情。把我某个文件里面的数据转化为数据库的数据我又烂熟,所以我采取了现在使用的这种方式。

ADO+SQL的这种方式,因为我们是跨表引用,所以意味着数据肯定来源于多个文件。他们有可能是同一个工作簿的不同工作表,也有可能是在不同的工作簿里。对我来说,只要是在一个工作簿里,那么起码一开始设定指向的时候就得有一个数据源。最经典的方式引用的那个数据源在使用数据的时候,在from后面不需要进行进一步的引用,其它的就得麻烦一些。我的第一个反应是,是不是引用数据的那个语句出现了变动呢?比如说现在我用的是Excel12。在数据源引用方面,我又折腾了一番,发现好像还是那样,没什么进展。会拖慢查询的那个数据源,我甚至把它放到了主数据源里,结果发现还是很慢,于是这就排除了是数据源引用语句变动导致缓慢。

所以这到底是什么原因造成的呢?因为我有很多个跨表引用的查询。有些查询是内部数据外部数据都有,有些只有外部数据,经过测试后我发现好像只有引用了内部数据的查询才会变慢。

为了证明我这个想法,星期三的晚上我编造了一些数据做测试。主要原理就是研究是不是数据源的关系导致这种变慢。一开始我的设计就是一个排列组合的方式,因为我默认的数据引用是要跨表的,所以我把数据源根据内内、内外、外外和外内这4种方式测试,实际上内内和外外是一回事,也就不需要进行两个引用了,所以我又把那两个东西拿了出来,同样进行测试。结果让人有点吃惊,凡是有内部数据参与的查询都会变慢。我测试的数据就只有一个字段几条记录,内内和内外需要12秒,外外需要0.1秒,外内需要24秒。这就能解释为什么我的那些变慢的查询起码都要24秒才能出结果。因为我永远把内部数据放在后面。究其原因是因为我设计那些查询的时候,我后来才想到要在那个查询文件里面搭一个加脚手架,把一些基础的东西加上去,在这种情况下我加得最多的是日期表。

关于这个测试的来龙去脉以及最终的结果,我在ExcelHome里面做了一个详细的帖子,在这里就不再具体阐述了。

折腾了这么一番以后,我发现这个锅还真不是我整出来的。造锅的是微软,不知道更新出了什么状况导致了。

Excel用多了,不知不觉我也居然能挑出微软的毛病。

查询突然变慢

当年今日

周三的下午跟往常一样,我点一下自己写的ADO+SQL+VBA的跨表查询文件,结果发现之前一秒就能出结果的东西等了好久,鼠标在那里转圈,我都甚至怀疑是Excel不知道因为什么原因卡死了,但我又有理由相信这不是卡死,因为当VBA要运行很长时间的时候,就会出现那种假死的状态。以前我遇到过这种情况,当我要查询一整年的平均库存的时候,就会这样,如果只是查询一个月的,没有问题。之所以一整年会出状况,是因为需要处理的数据的确有点多,如果我用的不是Excel的VBA的SQL,如果我要做的那个平均库存是在数据库里,用正儿八经规范标准的SQL做,我感觉不需要那么长时间。要长时间运行,无可避免会出现假死状态。周三下午,我就经历了一次,但我觉得那个查询不应该会假死。那个查询文件我用了接近两年,一直以来都没什么问题,因为数据不多,很简单,所以正常情况下,一秒之内出结果。其它查询可能需要的时间长一点,因为涉及的数据量比较大,但是这一次让我卡死的那个,一直以来,当我测试成功通过以后,就没有卡死过。

为什么会这样呢?我把自己写的所有查询文件全部都点了一遍。我觉得既然最简单的那个都要卡24秒,那些之前需要更长运行时间,会让人疯掉。测试结果让我有点意外。我猜想会更疯狂的那些居然没事,跟以前一样,运行时间没什么区别,但有些我感觉没有难度的东西,反倒卡住了。最卡的那个卡了97秒,实际上那个查询平时只需要0.5秒。

遇到这种情况,首先我不觉得是因为我的查询文件出了状况,因为这几天它没改动过,除非有人动了我的电脑,但这个几率太低。我觉得出状况最大的可能性是那个源文件的结构发生了某些变化,因为我引用的是Excel文件。用的那个范围是一个超级表,而如果在那个超级表以外的某个地方出现了一些奇怪的数据,比如说在纯日期的列里面出现了文本,那么就会导致在SQL转化数据的过程之中出现一些意想不到的事情。为了避免这种事情,我把源数据的那些空白行和列全部都删除处理。这就保证了我的原始数据是符合规定的,和以前的格式是一致的。接下来我觉得这会不会是更新的问题,所以我对windows系统以及Microsoft 365都进行了手动的更新。这两个东西的确都是需要安装更新的。更新完成了以后,问题依旧。

接下来我有两个选择,一个是就这样等死,反正现在的情况也不是出不了查询结果,只是用时很长而已。万一这真的是微软升级的bug,说不定哪一天他们就会解决掉,但也说不准他们永远都不解决这个我认为是bug的问题。第二个选择是我主动出击,逐个测试VBA查询里的语句。找出那条让我运行时间很长的语句,然后判定到底是什么原因。

那个理论上一秒就应该结束的查询,实际上是Excel工作表里面汇集了多个汇总查询。我只是把结果都在一个页面展示而已,所以首先,我要找出导致最终结果很慢的是哪个查询。这是一个反推的过程。让我有点意外的是,那些涉及很多数据的查询居然都没有问题,一个我觉得根本不会出问题的问东西里居然出问题了。出问题的那个查询实际上只涉及了一个字段两条数据。这简直让我震惊了,怎么居然这样呢?

这个问题是我之前没有遇到过的,但从发现这个奇葩之后,我觉得自己有点跟那杠上了。

是时候在我这里聊一下人工智能了

疯狂的热度也该过了吧。

也是时候冷静的看待这个问题了。

screenshot-downloaded-image

这篇文章写得特别长。懒了,没有拆成多篇文章。


目录


一、个人初接触AI技术

1. waifu2x

我第一次开始接触并使用 AI 技术,应该是 waifu2x 这个图像缩放工具。

确切的说 waifu2x 并不是人工智能技术,只是使用了和目前人工智能技术相同的 「卷积神经网络」

这东西其实不用多介绍了。

这东西实用性能满足日常需求,而且本地部署也只需要不到50MB的空间,方便又整洁。

screenshot_on_b85m_by_flameshot_at_2025-03-18_22-57-18

论清晰度其实 waifu2x 已经很不错了,尤其是平时出的原图的时候不符合各种破视频网站分辨率最低要求的时候,用 waifu2x 糊弄一个高分辨率图,然后再被这些破网站压缩成 320×180 的小图。

唯一想说的就是当时这个技术可是被小鬼滥用到极致,最火爆的期间各种互联网古董图片都被这些小鬼用waifu2x放大之后发到网上,然后大叫“我找到XXX的高清原图了!”。不明真相的人要是跟他讲这是“放大的”,他还会继续跟你解释“这是高清原图!”

你永远叫不醒一个装醒的人。

2. style2paints

接触到的第二个 AI 工具应该是 style2paints 。这是一个线稿上色工具。

最初接触这个软件的时候还是V3版本。

screenshot_EHDsLiyVAAAhjDF

网上的AI线稿上色功能基本已经烂了,但是完成度也是稀烂,可以说根本没法用。

Screenshot_2025-03-18_at_23-06-03

最早那一阵子还因为随便上色了一个线稿,画师直接就把我拉黑了。

screenshot_snap2888-starbreaker

screenshot_snap2930

style2paints 出 V4 的时候我写过这么一篇文章:https://blog.catscarlet.com/202002203604.html

202002203604_play_s2pv4/1046.png

screenshot__ERL3IRbUwAADPz-

后来 style2paints 出完 V4.5 之后,说要出 V5,而且放出了不少预览图,效果很棒,但是再也没有过下文。开发者在 GitHub 上还是活跃状态的,只不过全部都是私有提交了。

网上也再没出现过独立的开源上色工具。各个大厂虽然有各种所谓的线上AI图像处理工具,却基本上没有免费的线稿上色功能。收费的倒是一大堆,但是AI出图的效果本身就稀烂,谁知道输出一次期望中的结果之前得花多少冤枉钱。

3. rife

这算是第三个我使用的AI工具。功能是:补帧

最开始的时候这个项目还是叫做 arXiv2020-RIFE ,后来才改成 ECCV2022-RIFE 的。

但是实际上这玩意放在个人手里意义不是很大。最多就是把互联网早期的GIF表情包改得流畅一点,但是很多情况下 AI 对于补帧和人脑还是两回事。

bilibili:整了个支持Alpha图层GIF动画的放大加补帧转VP9的脚本

在有遮挡性的图像变动的时候,补帧出来的图像就会出错。4.22版本。

screenshot_00000054

(我本地是有更新的模型版本的,但是执行的时候就会出现主机断电的状况。能确定不是电源供电不足,但具体是什么愿意无从得知)

现在这个技术也被滥用了。

  • 网上有一堆原生30fps被补到60fps的动画资源,看着特别的果冻。也有电影,甚至 YouTuBe 上有 60fps 版本的 复仇者联盟1 看着就像游戏过场动画一样。
  • 很多电视台的代理(IPTV)和电视盒上游,会把 30fps 的视频补到 60fps,看着十分的诡异。
  • 最烂的当然还是显卡厂家,直接搞出 DLSS 这种帧生成的恶心玩意。

我自己看这种全局的恶意补帧视频时觉得就挺恶心的,头晕得很快。但是后来发现大多数人都是瞎子,别说补帧了,帧错误亮度错误对比度错误在他们眼珠子里都没有区别的,盯着一个坏掉的显示器看上几个小时愣没察觉到自己显示器是坏的旁边显示器是好的,瞎。

4. 其他

其他的基本上就没有接触过了。最多就是个 rembg 去背景工具,我也用不上。

再往前还有 AlphaGo,谷歌在打完围棋之后跑去打星际争霸,然后难产了好一阵子。最后不了了之,在网上搜谷歌AI打星际的视频,只能搜到一个播放列表,是 ArtosisTV 解说的 AlphaStar vs Serral,但是解说内容是基于非星际争霸玩家的,AI的每个行为以及星际争霸的每个兵种和技能都要解说一遍,中间夹杂着各种暂停和战术解释,节奏超级慢,12分钟的游戏解说了半个多小时,根本看不下去。这其间谷歌的AI就彻底凉了。

那几年 AI 爆火的时候 Python 从个只是底层干活的脚本语言一跃成为 不学 python 你就落伍了 这种骗术主流。我是懒得去学,这玩意个人学了也是屁用没有。AI 这种技术注定要被大厂捏得死死的。


二、爆火的 DeepSeek 把国际 AI 大厂的股票打废了

国产的 DeepSeek 把以 Nvidia 为首的国际AI大厂打废了,这是事实。但理由并不像国内鬣狗自媒体和阿Q人一样,因为鬣狗阿Q的思路就是成功啦崛起啦疯狂嗷嗷叫,谁叫得声音大谁有理。

Nvidia和其他大厂之所以市值蒸发,是因为他们一直声称的 需要更多硬件更多算力扯蛋

确切的说, Nvidia 摆烂也不是有 AI 才开始的。先是在挖矿潮期间摆烂,后又开搞各种与游戏算力不相关的各种糊弄人的技术。其他各厂基本上也是一样,微软在那搞的 onnx 的也是稀烂(之前我参与修复的 rembg 不能正确使用硬件加速的 bug 就是 微软 onnxruntime 和 Nvidia-CUDA 联手造成的,可见其代码是有多烂)。

而一个名不见经传的 DeepSeek 却用了很普通的过时硬件做出来一个捅了行业技术天花板的产品,这直接戳破了 英伟、微软、英特尔 这么多年来一直给市值吹肥皂的核心理念。 算力不是最重要的 不需要什么大厂技术也能做 一直吹牛逼的玩意其实屁都不是 ,这乐子直接打得 Nvidia 的50系显卡一点都不香,微软的 Win12 不知道该怎么塞烂功能,英特尔的 Ultra 系列定位完全翻车。 活该!

至于 DeepSeek 究竟怎么样?看着那个推理过程好似挺有趣的,但其实推理流程过于营销号,复杂一点的问题就开始胡说,网上难搜到的东西就开始瞎编,就和其他 AI 一样。

screenshot_on_b85m_by_flameshot_at_2025-03-19_00-42-48

screenshot_on_b85m_by_flameshot_at_2025-03-19_00-43-22

screenshot_on_b85m_by_flameshot_at_2025-03-19_00-43-43

screenshot_on_b85m_by_flameshot_at_2025-03-19_00-43-48

screenshot_on_b85m_by_flameshot_at_2025-03-19_01-06-00

screenshot_on_b85m_by_flameshot_at_2025-03-19_01-06-10

screenshot_on_b85m_by_flameshot_at_2025-03-19_01-06-17

screenshot_on_b85m_by_flameshot_at_2025-03-19_01-06-28

(部分错误引用和内容均用红框标注)

这表现实在是太像一个初中没毕业结了婚有了娃,娃娃问你一些客观存在但你完全不知道的知识时,就在那瞎引用瞎推理瞎解释,着实一个爹味浓厚的鬣狗阿Q,着实让本来就生活在这种恶劣环境的人反胃。


三、目前的 AI 到底能做些什么?

首先这个得分场景考虑,也就是,AI 这项技术在谁的手里时才有什么用。

1. 大型IT企业

首先一个前提得讲清楚:

目前的 AI 技术就是 给一个算法喂数据养模型,当相应的数据是 由人类创作的 情况下就十分有争议,说难听点就是 抄袭 。编程AI抄代码,绘图AI抄绘画,医疗AI抄病例,这也是目前相当多一部分人反AI的核心理由。

我的个人观点是:

  • 以一定的目的使用特定的数据训练AI并以此谋私利,那就是 抄袭
  • 将整个互联网数据全部用来训练AI,并公开数据模型,供所有人无偿使用,那不叫抄袭,那叫 人类的知识库

很可惜 人类的知识库 在目前的商业环境下实现不了。想使用 将整个互联网数据 的就只有大型IT企业,而目前的这些企业都是清一色的自私自利行业毒瘤,他们的存在多数都是对行业弊大于利,唯一的那点利也知识为了保住他们的自身地位罢了。(举例的话就是微软英特尔之流目前在开源界贡献的代码排在首位,但是他们贡献的全他妈的是他们自家用的驱动代码和调用代码,对整体行业有个屁用啊)

2. 中小型IT行业企业

首先中小型企业很少能有能力自己研究算法,在有限的资金和精力之下无法对行业技术作出突破性的贡献。你也不能怪罪他们,很多公司本身为了能正常运营就已经很努力了。

这才是行业真实现状。他们的产出才是老百姓真正能接触到和获益的。

目前据我能看到的,超市电子秤 可以说是一个不错的例子:传统的大型商超的果蔬摊位基本上都是要有个 负责称重的功能,有些是有专人上秤打标签,有些则是自主称重。现在很多超市都是AI电子秤,把果蔬放上去之后,能直接识别到品名(可能会识别到多种,再人工选择),这个工作量要比纯手选低多了(一个果蔬商超一般都有几十种甚至上百种标签)。当然,具体是如何实现的,我不知道,可能是电子秤公司自己训练模型,也可能傻屌公司每次都得调用一次大厂的云服务进行图像识别。

当然了!

也可能反过来,因为这些企业的领导人可能就不是IT行业出身的,很可能就是个投机人。

那么,答案只有一个了:《Employment for computer programmers in the U.S. has plummeted to its lowest level since 1980—years before the internet existed》

你甚至可以尝试阅读这篇文章的中文AI总结:《财富》:程序员就业降 – 豆包

20250415更新:豆包应该是玩不起了,AI阅读功能被大幅度阉割了,原链接虽然貌似还能用,但是没办法看新链接了。也可以看翻译

事实上国内中小型IT行业企业的产品质量也已经进一步滑坡了,你可以看一下这个 用户端验证时间 的神奇逻辑:《海航888元的随心飞偷跑了!》,基本就是什么人要写个需要验证时间的代码结果直接丢给AI就复制粘贴了,人脑里连产品设计的逻辑基础都没有。

screenshot_on_b85m_by_flameshot_at_2025-03-19_19-59-14

3. 非 IT 行业的企业

首先摆烂的一定不会是普通老百姓。

screenshot_on_b85m_by_flameshot_at_2025-03-12_14-22

https://weibo.com/2645861077/Pi3jJBv1w

普通老百姓摆烂都抢不到热乎的。

更别说还有人人喊打的 AI 客服了。


四、目前的 AI 在个人手中到底能做些什么?

1. 作为问答式搜索引擎

因为目前的AI就是一个特速算法的搜索引擎,所以当搜索引擎用是最基本的功能。尤其是在如今搜索引擎(不论中外)的搜索结果质量都暴跌,很多人都期望能在AI上得到好一些的结果。

只不过AI也是从搜索引擎拿结果的……

screenshot_on_b85m_by_flameshot_at_2025-03-16_20-38-25

啊不是,我要是自己愿意自己逐像素框选的话那我还问你干球?

screenshot_on_b85m_by_flameshot_at_2025-03-17_21-49-05

这是怎么把一个街机游戏识别成 999 和 11eyes 的?还把俩游戏标题合并到一起了?

screenshot_on_b85m_by_flameshot_at_2025-03-21_23-29-24

Jay Smith 的 Bad Romance 与 Lady Gaga 的 Bad Romance 是什么关系?你这 DeepSeek 这是要往哪里推啊?

screenshot_on_b85m_by_flameshot_at_2025-02-25_20-44_1

我已经无语了。

不得不说很多问题有时候答案是烂得不行。

2. 写垃圾文案

简直是官僚主义形式主义的辉煌!废话文学的巅峰!狗屁不通高考满分作文上树!

screenshot_on_b85m_by_flameshot_at_2025-03-22_00-03-52

当然我也找到了点正经有点用的功能,那就是语法检测。

screenshot_on_b85m_by_flameshot_at_2025-03-22_00-20-26

这玩意对于非母语用户还行,就是也很喜欢在有得没得的地方反复胡扯。没有中文版是个遗憾。国内的产品会拿你的文档做训练,所以千万别用。

3. 编程

・项目

作为一个差不多快被社会淘汰的程序员,说实话,我到现在 IDE 还是在用 Pulsar (原 GitHub 被微软收购后被抛弃的 Atom 的社区派生版本)。什么AI插件我都没安装。

我对于 AI 编程不是很了解,我也不知道这玩意现在到底能干啥。反正大家都吹得天花乱坠的。于是找了某之名 AI 编程 IDE ,cursor,在本地试了一下。

我这手里有一些对我来说解决起来很麻烦的问题,就是不是我自己写的旧代码不兼容新环境的问题,工程量太大,业务逻辑完全不知道,我也不想去研究这些项目的具体实现。

我就想着,AI工具既然可以导入项目,那可不可以直接让AI把代码过一遍,然后针对新环境的版本把旧代码中不兼容的地方全找出来改掉。

想得美!现在的AI编程工具和搜索引擎一样,还是问答式的。

试着导入了一个项目,然后 cursor 一直不停的有得没得一直在废话一些毫不相关的东西,对于因新环境和新框架不兼容的问题一个都没发现。

screenshot_on_b85m_by_flameshot_at_2025-03-05_20-14

不得不说,很多人活得非常的 人机

・功能片段

那既然,AI编程这玩意仍然是问答式的,那就干脆继续当搜索引擎用就罢了,根本不需要什么编程插件或IDE编辑器,更不需要什么按量付费编程接口。

事实上,AI在问答式编程输出的结果还挺不错,尤其是在很多 理论上可行且应该有人实现过,但周围所有认识的人都没接触过对应技术 的场景下极为有效,而作为一个腐朽的程序员,我没事就会遇到这种 技术上应该能实现但是我不知道对应技术的入口在哪,而身边完全更是没一个比我更了解响应技术领域的人 ,这时要是在像文中 《我是救兵请来的猴子》 提到过的环境下,至少身边人都会想办法帮你找对应的资源,但是事实上现在国内大部分公司,同事人人自危根本顾不上你,甚至有人巴不得你翻车然后下次被优化的就是你,领导更是觉得「员工遇上瓶颈」乃是天大的 职场PUA 机会,绝对不会放过。

比如 《从豆包下载无水印图片》 这个用户脚本的核心理念是 跨域下载并重命名图片 。本身下载并重命名图片是 HTML5 协议中<a>的的一部分,但是掺合上跨域后就报废了。理论上这是个安全无风险的功能,但是实际上就是做不到,封死了。绕路办法,如果在网上搜,大部分资源都是告诉你使用 <canvas> 对图片进行跨域下载,但实际上却有更好更干净的办法。这个的确在AI中可以搜到,而在传统搜索引擎搜索的时候,搜索结果却会被 <canvas> 的结果淹没。

・繁琐复杂又没技术含量的代码

在编程开发这一块中,有很大一块工作内容都是 繁琐复杂又没技术含量的代码,尤其是前端开发,经常要计算渲染后图像的位置,或者单个元素的样式。这一块基本没人愿意写,但是很多时候不写不行。

这种工作交给 AI 却是非常的巴适。

screenshot_on_b85m_by_flameshot_at_2025-03-22_00-41-37

screenshot_on_b85m_by_flameshot_at_2025-03-15_20-49-15

有些时候国内AI编程的确会给出点惊艳的地方,比如需要临时文件或文件夹的时候知道 mktemp 。微软这种背靠 GitHub 的 Copilot 甚至都只会原地拉屎。

screenshot_on_b85m_by_flameshot_at_2025-03-06_14-18

但是却并不 100% 可靠。

screenshot_on_b85m_by_flameshot_at_2025-03-26_01-36-48

screenshot_on_b85m_by_flameshot_at_2025-03-26_01-38-28

・复杂逻辑的编程

上一点复杂逻辑,AI编程就很容易挖坑。

比如AI会犯最经典 初级程序员错误 ,第二次循环时忘记把标志位重置。

screenshot_on_b85m_by_flameshot_at_2025-03-06_14-23

(原链接找不到了只剩下文件了)

以及基础命令经常想当然,上下文对应不上。

screenshot_on_b85m_by_flameshot_at_2025-03-17_06-36-16

红框位置的 type -f 对应的是 文件 ,但是上下文里写得清清楚楚的是在处理 软链接,应该改使用的是 type -l 才对。

只要上一点逻辑,那出错的情况就特别多。而且由于这代码不是你亲自写的,所以你要重新读一遍所有代码才能理清其逻辑,之后才能找到 Bug 所在。

经典的 编程即是10%的时间写代码,90%的时间找bug,那 10% 才是编程的真正乐趣。而大范围引入AI进行编程后,编程是1%的时间写代码,99%的时间找bug

把编程唯一的快乐送给AI,把屎留给自己吃。

4. 绘画

这一块既是最有争议的一块,亦是我用到的最多的一块。

说来也挺可乐的,程序员在AI领域用到最多的功能不是AI编程……但话又说回来,我自己会编程我为什么还要找一个不靠谱的AI给我添麻烦?没上过班没被同事坑过还是怎么回事?

其实2022年那阵我就接触过 dalle-mini ,然而当时AI绘图基本上只能到这个程度:

screenshot_on_b85m_by_flameshot_at_2022-06-08_15-24-18

screenshot_on_b85m_by_flameshot_at_2022-06-08_14-22-06

screenshot_on_b85m_by_flameshot_at_2022-06-08_14-08-33

screenshot_on_b85m_by_flameshot_at_2022-06-08_14-04-19

怎么说呢,有些输出的确是带着灵魂的,但是整体上一塌糊涂。你可以看到每个输出中都或多或少带着核心细节。

现在AI出图已经今非昔比了。

screenshot-生成特定风格图片-2136008435344130-20250322221645

screenshot-生成特定风格图片-2134056610409986-20250322215006

・尝试本地化

首先当然是尝试在本地部署这玩意。在网上搜了下,基本都在说 comfyui 。这玩意我看了一下,支持 Docker ,那就毫不犹豫部署了。

screenshot_on_b85m_by_flameshot_at_2025-02-19_17-50-18

然而实际使用效果不太乐观。

comfyui 的默认模型出图基本是这样的:

screenshot_on_b85m_by_flameshot_at_2025-02-19_19-56-15

离实际能使用差太多了。

而目前可以在线上无限次数使用的AI生成图像工具,我找到了两个:豆包和百度,他们的出图效果是这样的。

豆包:

screenshot_on_b85m_by_flameshot_at_2025-02-19_20-07-18

百度:

screenshot_on_b85m_by_flameshot_at_2025-02-19_20-06-59

百度英文解析:

screenshot_on_b85m_by_flameshot_at_2025-02-19_20-07-33

(豆包不支持纯英文解析)

百度的出图效果要比豆包差一些,但是在关键字很少的情况下精度比豆包要高,但但是关键字超过一个限度之后百度的精度就急转直下彻底崩了。

我检查了一下,comfyui 应该是需要手动添加模型。但是我尝试了几个例子看起来很不错的模型,在执行到 VAE Decode 时,主机就会直接断电重启。

screenshot_on_b85m_by_flameshot_at_2025-03-12_01-14

我个人认为应该不是电源供电不足的问题,因为在 KSampler 阶段,显卡就已经跑满 200w 了。同样的问题也在 rife 上出现过(前文也提到了),使用 4.22 模型就正常,使用 4.25 模型就会断电重启。虽然我也怀疑是显存不够的问题,但是 comfyui 比较小的模型只有 2G 多就会导致我断电重启,而 rife 4.25 模型与 4.22 模型都只有不足 20M ,这就不太像是显存不够的情况。而且我的显卡是 GTX1080 8G 版本的,实测最多也只用掉 6G 多一点。

只能怀疑是驱动问题了,毕竟 GTX1080 这个老显卡是诞生得比挖矿潮还早。但没有办法了,我之前把系统升级后(从 Linux Mint 20.3升级到 Linux Mint 22.1,基于Ubuntu20.04到Ubuntu24.04),驱动版本还是550,CUDA也只是从12.2升级到了12.4而已,而最新版本貌似是12.8。我也不清楚到底是 GTX1080 只能装这么高,还是有什么其他限制。Nvidia 官网倒是有一个 575版本,Linux Mint官方没说正式支持,我也不想试。毕竟即使跑 comfyui 的默认模型,显卡的噪音都超大,温度直达 70 度以上(风扇57%转速,再提高那噪音就真的难以忍受了),而仍然要等很久才能出一张图。

本地化部署这事只能暂时放弃,等有新电脑新显卡再说吧。

・放大图片工具

出图只能用线上工具,那顺带看看线上工具都有哪些功能,结果发现百度放大图片的功能效果竟比我本地的 waifu2x 要好。

screenshot_on_b85m_by_flameshot_at_2025-02-22_20-26-52

(左图:百度放大。右图:本地 waifu2x 放大)

这我可接受不了。立刻把本地的图片放大工具换成 Real-ESRGAN ,测试一下。

把图片缩小,然后再用 Real-ESRGAN 放大,然后离谱的就来了。

screenshot_on_b85m_by_flameshot_at_2025-02-23_00-11-47

(左图:Real-ESRGAN animevideov3 模型。右图:原图)

animevideov3 不知道为何图片变得有点鲜艳了?

screenshot_on_b85m_by_flameshot_at_2025-02-23_00-12-01

(左图:Real-ESRGAN x4plus 模型。右图:原图)

x4plus 放大后竟然比原图还清晰!太离谱了。

这让我想起了网上传闻的「断崖上未融化的雪块被相机AI补全成坠崖的白色尸体」的乐子了。

・去背景工具

本地化了 rembg ,因为命令行真的太好用了,比起线上工具实在太方便。然而 rembg 的代码质量稀烂,依赖的环境(onnxruntime,cuda-cudnn)更是烂到彻底。为此做了不少工作。我根本就不是个写 Python 的。

反正最后调通了,而且把模型更新到了 birefnet ,效果比默认的 u2net 好非常多。

screenshot_on_b85m_by_flameshot_at_2025-02-20_15-32-10

(左图:u2net 模型。右图:birefnet 模型)

screenshot_on_b85m_by_flameshot_at_2025-02-20_15-32-20

(左图:u2net 模型。右图:birefnet 模型)

・线上出图工具

前文也讲了,我找到的可以在线上无限次数使用的AI生成图像工具有两个:豆包和百度。豆包出图效果比百度强一点。

只不过除了模型比较强大以外,豆包仍然有着所有AI图像生成工具都有的毛病:不听话

screenshot_on_b85m_by_flameshot_at_2025-03-03_11-27

screenshot_on_b85m_by_flameshot_at_2025-03-03_11-28

这完全不日系赛璐璐芳文社好吧,这都给干到韩国去了。

screenshot_on_b85m_by_flameshot_at_2025-03-10_17-12

特别喜欢给妹子穿过膝袜。裤袜搞错就已经很烦了,裤子都给你忽略了。

screenshot-生成动漫风格图片-1804857296308738-20250310150611_realesrgan2x-1

我之前想搞一个倒霉OL妹子的插画想做个有连续剧情的系列,比如妹子加班后下班下大雨,顶着雨去地铁站,结果豆包不会画折叠雨伞,我总不能让妹子淋雨吧?这个就算是情节也实在太不礼貌了,结果发现豆包也不会画「湿衣服」,可乐。

百度却非常的会画「湿衣服」,不仅如此,貌似百度画出来的衣服全都是湿的。

screenshot_on_b85m_by_flameshot_at_2025-03-10_19-00

screenshot_on_b85m_by_flameshot_at_2025-03-12_01-15

发觉百度的输出都特别的色情……

然后是如果遇到AI完全不能理解的内容,出图就特别的诡异。

screenshot_on_b85m_by_flameshot_at_2025-03-09_22-43

screenshot_on_b85m_by_flameshot_at_2025-03-09_20-50

screenshot_on_b85m_by_flameshot_at_2025-03-09_20-50_1

(开车很困难)

有时候干脆就是精神污染……

screenshot_on_b85m_by_flameshot_at_2025-03-12_23-52

不仅如此,线上工具还有敏感词屏蔽词和谐词汇,而且理由也过于欧亨利了。

screenshot_on_b85m_by_flameshot_at_2025-03-12_22-06

screenshot_on_b85m_by_flameshot_at_2025-03-23_23-29-39

这是有多怕有人用AI生成「铁链女」的照片啊?

你就只能靠中国人的聪明才智绕过屏蔽词。

screenshot_on_b85m_by_flameshot_at_2025-03-12_22-08

另一大问题就是让图像上拥有超过1个的关键性事物。

screenshot_on_b85m_by_flameshot_at_2025-03-13_01-39

screenshot_on_b85m_by_flameshot_at_2025-03-13_11-35

一个人拿着一个有特性的事物,或者两个人,就会出错。

貌似这个问题是AI的通病,AI不听话乃是日常,因为人类一句话能讲讲明白一件事情哪个关键词轻哪个关键词重是主观的,两个人能顺利交流那是电波对上了,不能顺利交流那至少一个人看另一个人是傻逼。AI 不一样,AI 没得交流,现在的 AI 只是「训练」出来的。

网上传闻 FLUX 就要靠谱很多,但是本地部署的要求则高得更加离谱。本来在研究这玩意期间发现需要研究的内容就不仅仅是 ComfyUI,还有 LoRA、ControlNet、IP-Adapter 这一堆看着就乱七八糟的玩意就烦了,我又不是专门画图的画师,专门画图的画师也不会用这种完全是另一个领域的工具坑自己。烦了烦了,不研究了。

・线上改图工具

这算是出图工具的子集。

screenshot-赛璐璐风格少女绘制-1843589592669954-20250312154607

screenshot_on_b85m_by_flameshot_at_2025-03-12_15-32

百度的出图效果就巨烂,改图效果更是差劲。事实上百度的那个AI图像编辑废柴得不行。

而豆包则超可笑的只要看到特朗普就生成失败。

最后单独生成了个图片然后用 rembg 去掉背景后再用 GIMP P上去。

screenshot-生成动漫风格图片-1845130723445762-20250312162334

screenshot_-Part-GTY-2202534763-1-1-1_realesrgan2x-1


五、目前我的态度

1. 对个人

我目前个人认为,AI 在个人手里最多只是个大玩具。

讲了这么多工具类的产品,没有多少是能在生产生活中切实获益的。或许像抠背景这种工具在艺术照或者COS照方面能有点用途,或者黑白老照片上色(但是能本地化的上色工具我又没找到)。

可能做创作时可以用 AI 做一些单页插画。但是做漫画就很困难,因为内容的连续性基本无法维持,很容易崩坏。

编程方面,虽然有牛逼吹说有人完全靠AI开发了APP,我觉得那是真吹牛逼。仅是编程环境搭建这一块在任何人面前都是令人生畏的第一座大山,大部分人根本走不到 Hello World 这一步就早早崩溃了。

剩下的就只能用来做坏事了。

2. 对各个企业

・国际

英伟达微软英特尔,仨破玩意早崩早开心。就是不清楚先被 DeepSeek 揭开丑陋真面目后又被川普背后捅刀子的股票崩溃后,到底能对这仨死玩意有多大伤害。

其实我觉得 英伟达 内心是害怕的。当年挖矿潮,捅他刀子的并不是显卡商,而是 ASIC 。我觉得再过一段时间他就得挨真刀子,所以他得把 CUDA 这一块跟 微软 绑得死死的。

screenshot_on_b85m_by_flameshot_at_2025-03-25_23-05-41

screenshot_on_b85m_by_flameshot_at_2025-03-15_20-16-44

screenshot_on_b85m_by_flameshot_at_2025-03-15_20-17-04

screenshot_on_b85m_by_flameshot_at_2025-03-15_20-18-12

(至今我们仍然不知道 ASIC 将如何跨过 AI运行环境 这个门槛)

就是不知道其他大厂到底和英伟达是不是一条心。

screenshot-生成特定风格图片-1932475492982018-20250315210448

而微软的 onnx 烂得曾让我想干脆把看到的 AI 小项目都改写成 腾讯 ncnn 的。这玩意如果要做对比的话:

  • onnxruntime 和 cuda 组合起来的运行环境一般需要 2GB 到 几十GB 的硬盘空间(不包含模型文件),启动速度超级慢,安装各种依赖包很可能搞崩溃你的系统。跨平台安装有完全不同的安装依赖。在日常主机上安装高风险高困难,只有使用 Docker 这种容器才能安全的保证主机不被污染。
  • 腾讯的 ncnn 则完全不需要用户安装任何依赖包,只要操作系统的驱动正确就可以了,整套环境是基于 Vulkan API 实现的,。整个运行环境大概在 几十MB 左右(不包含模型文件),非常的轻量。跨平台只要预编译对应的二进制文件即可。纯绿色。

然而一个巨大的门槛挡住了我,ncnn需要的编程语言基础是C系,对我来说完全是另一个领域,搞不定。

・国内

百度风投 和 DeepSeek 一栋楼。

腾讯有着最好的 ncnn 但是学习门槛略高,而且很明显国际老流氓们都提防着这个山寨王。

阿里?谁他妈的为了个问答系统还要专门安装一个浏览器,甚至产品主页都没适配PC端的桌面浏览器。烧钱疯狂投广告搞得各个平台都跟得了癣病似的。能滚多远滚多远。

screenshot_on_b85m_by_flameshot_at_2025-03-24_00-35-27

国家超算互联网中心?我跟你讲要不是因为秋风于渭水写的这一篇DeepSeek R1 可免费/白嫖网页版一览,我都不知道这玩意存在。这玩意是来搞笑的吧,自己建了一个 DeepSeek 服务但是这鸡巴什么玩意?

screenshot_on_b85m_by_flameshot_at_2025-03-24_00-56-25

screenshot_on_b85m_by_flameshot_at_2025-03-24_00-57-46

互联网的里程碑在这破玩意嘴里被贬成了 在国际上的影响力相对较小


六、结论

个人观点,仅供参考。

这篇文章写到中途的时候发觉内容太多太长。想过从中间拆开,分成多篇文章发布,但想了半天,去他妈的。

The post 是时候在我这里聊一下人工智能了 first appeared on 石樱灯笼博客.

[userscript] 从豆包下载无水印图片

心血来潮,做了个 从豆包下载无水印图片 的 userscript 。

没啥技术含量。

截图

snap-1

snap2-1

 

安装及使用

具体的安装和使用方式见Greasyfork脚本安装地址或Github源码仓库。

 

脚本安装地址

Greasyfork :<https://greasyfork.org/scripts/527890>,点击页面上的  安装此脚本  即可。

 

源码

Github:<https://github.com/catscarlet/Download-Origin-Image-from-Doubao-without-Watermark>

 

废话

这个算是今年第一篇文章。

其实一直没闲着,搞了一堆屁事,或者说被一堆屁事搞。

文章又积压了,压了一堆,没精力写。

 

The post [userscript] 从豆包下载无水印图片 first appeared on 石樱灯笼博客.

大家一起黑屏

当年今日

我觉得小米Civi 1S的黑屏问题很困扰我,于是我就不断搜索到底这个是一个什么情况,希望有人跟我一样,也有类似的问题,而他们又有了现成的解决办法。

用了超过10年的小米,为什么之前就没有这种问题呢?

但我去搜索黑屏的小米手机之后,发现很多小米13Ultra出来的人有这个烦恼。当他们晚上插着充电器直到第2天,会发现黑屏开不了机,只能重启。他们这个问题的复发率非常高,很多人都遇到了,大概是在2月10日以后出现的。他们都更新到了同一个版本,HyperOS 2.0,刚好是100的那个版本。不知道那个是不是小米13Ultra从1.0升到2.0的第1个版本。看到小米13Ultra的人在小米社区哀嚎一片,却没有官方的人站出来说些什么。唯一一个帖子里面我看到了有人说把充电从智能充变成普通就没有问题了。智能跟普通有什么区别呢?我感觉是如果检测到你长期充电,智能充电充到某个程度就可能不冲了,或者使用小电流充电。但为什么这个理论上这么智能的功能反而会导致问题呢?发帖的那个人说他是把充电改成普通的方法让自己的手机不会黑屏,但是他没有说这个不会黑屏能持续多长时间,是一直都不会,还是说只是一段时间可以。可以肯定的是,小米13Ultra的人经历过黑屏,而且他们经历的黑屏感受跟我有点类似,虽然我不会把充电器插一整个晚上。有时候睡午觉可能连续插了好几个小时,但这是极少数的,通常充到100%再加个15到30分钟我就拔掉了。在我有意识的情况之下,我的充电时间不会超过一个小时,而且周一我发生黑屏的时候,前一天晚上,我没有通宵充电。我从来没有把手机放在枕头边充电的习惯。周日我从家回到单位,理论上我应该是下午充电的,这样才能保证我回单位的路上不会有电量焦虑,但万一下午我没有充电,那么有可能周日晚上睡觉之前我用18W的慢充充电了一段时间。但到底周日晚上我有没有充电呢?我已经不记得了。

小米13Ultra出来的这个问题很明确,但小米14和小米15的黑屏问题就很无厘头,他们任何时候都有可能黑屏关机,尤其是小米15。长按电源键还开不了机,你必须插上充电头或者充电宝,插上以后它又自动开机了,这个很诡异。理论如果你的机子是处于关机状态的,插上电源,屏幕点亮很正常,但屏幕点亮跟开机是两回事。小米15是非常新的机子,为什么会出现这种问题呢?小米14上线的时候,曾经出过一个更新之后屏幕会被锁定,什么都用不了,只能看到,但是却用不到的问题。为什么小米头牌的数字系列在新机推出的时候会有这种让人哭笑不得的问题呢?让我觉得很搞不懂的是,为什么小米15黑屏了以后,不插上充电头,还开不了机呢?出现这种问题以后官方好像至今都没有个说法。突然黑屏要重启,我感觉硬件软件的问题都可能有,但是新机买回来,才用了几天,电池应该不会那么快就有问题吧,如果不是电池的问题,那就有可能是CPU虚焊。这个虚焊问题,造成了一部分的机子出现同样的毛病,这个回收起来就不是一笔小数目了。一般的小米之家,一般的检测方法,怎么可能检测得到是某个元件虚焊呢?所以可能他们宁愿不承认这个问题,因为你的黑屏,没办法随时再现。

看到了那么多人跟我一起黑屏的时候,我觉得黑屏这个问题我又可以接受了,这仿佛是一个小米手机的印记,我买到的是正版。

惠普1020出状况

当年今日

不知道为什么,糟糕的事情总是接连不断。

周二的晚上跟往常一样,我要打印记账凭证,结果发现,一直用得好好的惠普LaserJet 1020 plus突然罢工,发生错误无法打印。看明细好像是因为USB无法识别。USB无法识别,下午的时候我就曾经看过弹窗,但我没理会,因为当时我正在把MP3插在电脑上充电,非常有可能突然间那个USB拓展口傻掉了,然后又不知道为什么识别不出那个MP3。反正能充电就行,能不能识别那个装置不用没关系。在电脑出现那个弹窗的时候,我就没有理会因为当时我的键盘鼠标都是正常的。MP3充电的显示也是正常的,无论如何我都不会想到,那是因为打印机。

打印机折腾的一番,没发现到底是什么问题,反正不时显示出来的状况就是某一个USB设备无法识别。折腾来折腾去都不行,我甚至换了一根USB线,也依然是那个效果,所以我把1020卸载了,然后重新安装。我是想着重新安装的,但关键是,当我插上USB线以后,还是那个问题无法识别。为什么一直非常稳定的1020突然出了这个问题呢?换了一个USB线也一样就意味着不是线材的问题,不是插口的问题,因为电脑主机的插口我已经换了好几个了。电脑已经重启过,但是打印机我没有把电关掉重启。所以那个时候我把打印机电关掉,然后重启,之后1020自动安装上去了。那个时候我也已经在惠普的官网下载了1020的全套安装包,我不知道那个全套里有什么玩意。反正在我印象之中,1020不需要安装包,win10是可以自动识别安装的。

打印机装上去了,接下来就是直接打印。我没有考虑那么多,像平常那样我就开动了,结果发现打印出来的东西不对劲,打印出来的那张纸是A4大小,但实际上我打印的那个记账凭证应该是增值税发票大小的纸,那个纸,我之前已经在系统的打印机属性设置里面设置过,为什么1020就识别不出来呢?

按照往常的方法,我又把那个自定义的纸张大小设置了一圈,结果无论如何在Excel界面看到的1020可选纸张大小依然没有。为什么居然会这样呢?之前从来没有遇到过这个问题。为什么我说从来没有遇到过,因为我也帮其他人设置过好多遍,每一次都是打印机装上去了,然后系统的那个打印设置设置好了,打印机就自动能选择系统已经设置好的自定义纸张,这一次不行。于是我又把电脑重启了,通常重启就能解决90%的问题,但这一次这个问题依然存在。为什么Epson针式打印机就能自动识别出我系统里自定义添加的两个纸张大小,但是惠普的这个1020却不行呢?在我印象之中以前是没有问题的。最终无可奈何之下,我只能在1020的打印机首选项里手动添加我自定义的纸张大小。经过一番折腾以后,我终于在我期待的纸张上打印出我想要的内容。平时这就只是一个秒杀的操作,闭眼就能完成,这一次耗费了我接近一个小时,而且遇到的事情都是很奇葩的,颠覆我之前认知的,为什么会这样呢?

唯一能解释的就是,下午我擦桌子的时候,我把打印机抱起来了。然后不知道为什么触碰到了一些东西,所以打印机就有点失常了。但是擦桌子的时候把打印机抱起来,这个操作经常发生,为什么平时就没有这个问题呢?打印机打印不了,通常我觉得是不是windows进行了某个更新,驱动不太合适的原因。经过一番USB线拔插以后,问题依旧。为什么我就没想到那个时候要重启一下打印机呢?大概因为我太信任这个1020了,可以这么说,除了不能自动双面打印以外,1020是一款非常经典非常耐用非常抗折腾的打印机,万万没想到居然会出这个乱子。

人的运气衰起来的时候,什么事情都会发生。

博客略微升级到 WordPress 5.3.18

如题。

主要是因为最近想写点和代码相关的内容,但是目前在用的代码高亮插件已经嗝屁太久,而且这破插件有乱改代码的大毛病。我也是嫌弃这插件好久了。

奈何看了下目前的插件,或者是要更新到很新的版本,或者要对 <pre><code>example code</code></pre> 这种标准 HTML 写法进行大改。这互联网怎么还越发展越刁钻越发展越死板越发展越玩寡头垄断呢。

没办法检查了几个博友的实现,结果发现有些高端用法过于高端,至少我也得在本地调试一下才敢在线上部署。

但是5.2版本我拉到本地开调试模式就狂报错,的确这破版本是不支持PHP7.4的。而我目前也没精力把 WordPress 往 6 版本上升级,以及 PHP8 同理。

目前就先往上拉一个等级再说。

 

各位朋友如果发现博客有 Bug 可以直接评论。

The post 博客略微升级到 WordPress 5.3.18 first appeared on 石樱灯笼博客.

Do not play 100% Orange Juice on Linux or Steam Deck

TL;DR: The Developers in charge of Steam Cloud Save File Sync for 100% Orange Juice don’t know how to handle it. They may mess up your save files, and you may be unaware of it until the loss is done.

Notice: This advice may become obsolete in the future.

Notice 2: English isn’t my native tongue.

Developers are stubborn.


I will use 100oj as 100% Orange Juice for short.

100oj is a beloved game. I declare it as the best online board game ever, with no hesitation.

The Beginning of Playing 100oj on Linux

The very original 100oj is surely made for Windows.

The earliest Steam page capture from web.archive.original

screenshot_on_b85m_by_flameshot_at_2024-12-13_17-40-21

Meanwhile, Valve is making Steam OS, and then, Steam Deck. Proton made Playing Windows Games on Linux become a real thing. (Nah, I don’t want to talk about wine. No one would really want to use those for real generic gaming).

So basically, Proton is a fork of Wine, and this software can run Windows games on Linux, and players don’t need to worry about most of the How to run Windows games on Linux things.

It is also very convenient for most game Developers. Proton just works. No need to change anything, unless you use some very unrecommended/unofficial/deprecated/obsoleted Windows API, which may happen in very old days.

100oj v3.3 on Linux Mint.

screenshot_by_flameshot_at_20210119135409

Sora on Linux Mint.

screenshot_by_flameshot_at_20210117104610

Funny thing is, the OP animation is in WMV format (Windows Media Video), which was made by Microsoft and was not kind of an open/free format. So if you play Sora on Linux with Proton, the game will crash if you stay at the start screen long enough, and try to wait for the OP animation to play.

screenshot_on_b85m_by_flameshot_at_2024-12-14_17-57-13

Funnier thing is, the OP animation WMV file is actually

  • Container: WebM
  • Video Coding: VP9
  • Audio Coding: Opus

All of them are open and royalty-free.

screenshot_on_b85m_by_flameshot_at_2024-12-13_18-24-57

Well, let’s not talk about Sora right now.


The Official announcement: Support for 100oj on Linux?

I don’t remember when it was exactly.

The wiki says it was Sep 20th, 2024, v3.23 Versioned Hotfix 1, but the official Discord announcement is Oct 6th, 2024.

screenshot_on_b85m_by_flameshot_at_2024-12-13_18-42-57

screenshot_on_b85m_by_flameshot_at_2024-12-13_18-39-08

screenshot_on_b85m_by_flameshot_at_2024-12-13_18-37-55

100oj now officially has a Linux native build.

This is where/when/how a nightmare begins.


The first time when an inexperienced programmer gives a name without knowing case-sensitive

Here it is. You can read the paragraph heading, and if you know Linux, you already know what I am talking about.

On Oct 7th, 2024, while I was checking on the Linux side, I found my save file on the Linux side is kinda outdated compared to the save on the Windows side, despite Steam already saying Cloud Status is Up to date. Also, the Free Weekly Character is different from the Windows side.

Turned out there were two directories.

screenshot_on_b85m_by_flameshot_at_2024-10-07_15-55-32

I posted this on the official Discord Support Channel.

screenshot_on_b85m_by_flameshot_at_2024-12-13_22-29-34

After that, a developer from 100oj Official replied:

screenshot_on_b85m_by_flameshot_at_2024-12-13_22-21-26

So basically, the old Steam-Play, aka the Proton one worked fine, but when the Linux native build came out, they messed up the path because of case-sensitive.

That’s kinda acceptable for a developer who doesn’t have much experience on Linux.

Well, the easiest way to fix my problem is, because I play 100oj on Windows most, I just wanted to keep the Windows savefile, so just delete both Save and save on my Linux side, and let Steam re-sync from the steam-cloud. That worked well.

I thought this case-sensitive crisis was over.


Major update 3.24

Well the most recent major update of 100oj is 3.24, released on Nov 24th, 2024.

Talking from my point of view, it was a terribly stupid idea to accomplish all these at one time.

  • Adding new play mode
  • Graphics engine changing
  • New Platform MacOS support
  • Dropping support for 32bit

I mean, what are they? Fresh inexperienced just-graduated noob programmers? What are they thinking?

100oj game crashed, a lot, after that release. The Discord support channel became a total mess.

Look at the Version 3.24 release note on orangejuice.wiki. There are one versioned hotfix and 4 unversioned hotfixes, lasting for 16 days. You should know it was a mess.


Linux Steam Overlay Issue

I mean, look at this one:

screenshot_on_b85m_by_flameshot_at_2024-12-13_22-58-08

This was reported by me, and what’s the first reply I received?

screenshot_on_b85m_by_flameshot_at_2024-12-13_23-01-01

“You are not doing that right that’s your fault lmao bronze you noob gamer trash.”

Well funny thing: the 100oj start-entry is a shell script. It looked like this:

screenshot_on_b85m_by_flameshot_at_2024-11-27_20-59-32-2

To no programmers, I will explain it: The script wants to load a file, and it should be at ‘/home/rapha/.steam/debian-installation/ubuntu12_64/gameoverlayrenderer.so’. The path is formed with:

  • Prefix ‘/home/’
  • User name ‘rapha’
  • Steam installation directory ‘/.steam’
  • Steam file ‘/debian-installation/ubuntu12_64/gameoverlayrenderer.so’

There are two problems.

The first one: Who is rapha? It’s not me, obviously.

The second one: in the Steam installation directory ‘/.steam’, the file ‘ameoverlayrenderer.so’ is actually located at ‘/ubuntu12_64/gameoverlayrenderer.so’, thus there is no such a prefix ‘/debian-installation/’.

After some tests, I figured out there were some useful variables when starting something from steam client.

 

https://www.bilibili.com/video/BV1R6BRYmEoD/

Both STEAM_BASE_FOLDER and STEAM_COMPAT_CLIENT_INSTALL_PATH are reliable. I also searched on Google but didn’t find any official valve/steam document about how to locate where the steam client is installed.

I recommended “$HOME/.local/share/Steam/ubuntu12_64/gameoverlayrenderer.so” and “${STEAM_COMPAT_CLIENT_INSTALL_PATH}/ubuntu12_64/gameoverlayrenderer.so”, but got refused.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-01-24

Well of course he didn’t know what a symbolic link is.

During the discussion, a new unversioned hotfix was released:

  • Fixed Steam Overlay not working on Linux.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-04-30

Fixing by this:

screenshot_on_b85m_by_flameshot_at_2024-11-27_20-59-32-1

So they removed the ‘/home/rapha/’ part but still kept the ‘/debian-installation/’ there. I don’t know why.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-03-37

I asked. No response.

Thankfully, some Linux users are aware of that and they know how to search and read.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-04-04

Turns out there is no need to  load the steam overly library manually when start from Steam.

Well, at least I helped someone.

Note: Right now they have fixed it stealthily, with no release notes. The entry script is just like this:

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-27-59

 

Well. No credit to me.


The save path issue continues

Now they supported MacOS.

New platform, new steam cloud sync issues.

They even made a post on How to deal with save problems.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-15-16

But there isn’t any of the cross-platform savefile case-sensitivity issue information. I had to ask for adding that part.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-17-31


Mess up steam cloud sync again

I think it’s about Unversioned Hotfix 4 when they tried to fix the macOS saves sync issue.

After that update, my Linux 100oj couldn’t sync saves anymore.

screenshot_on_b85m_by_flameshot_at_2024-12-10_01-13-03

I tried the old way, removing all save files on Linux, expecting that steam client could just download the saves from steam cloud.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-29-54

Nope, that was not happening.

After a lot of trying and testing, I figured out what is happening.

screenshot_on_b85m_by_flameshot_at_2024-12-11_23-29-04

On Linux, 100oj is using both Save and save at the same time. When there are no save files:

  1. Try to convert old format saves user.dat into the new format at save/{userid}/, which the file should be very old before steam family sharing
  2. Uploading save files at Save/{userid}/
  3. If anything is missing when uploading, steam will call Unable to sync / Cloud Conflict
  4. Stuck.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-53-13

And here is the official response.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-48-47

See, that’s why I didn’t even bother explaining it.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-50-43

And you thought at least they managed to make macOS work? Too bad. Look at this screenshot of a macOS user’s Steam Cloud Storage, and see what a mess they had made.

screenshot_on_b85m_by_flameshot_at_2024-12-14_00-53-24

screenshot_1316429008703062187


Conclusion?

Well for now, they could still change anything stealthily with no release note. May become better, or become worse. I don’t know.

I even talked about this to the guy who was taking charge of 100oj Chinese localization.

screenshot_on_b85m_by_flameshot_at_2024-12-13_22-32-42

Developers are stubborn.

Well I don’t want to care about it anymore. I get no paid nor credit.

 


Update in 2024-12-23

100oj Official admitted they messed up the steam cloud setting for savefile sync.

They also said they fixed it.

 

I’m not buying it. Anyway, there is no credit to me.

The post Do not play 100% Orange Juice on Linux or Steam Deck first appeared on 石樱灯笼博客.

如何强制pnpm通过git HTTP安装npm包

某个版本之前都是通过HTTP安装托管在git源上的npm包的,然而似乎某个版本开始就有可能采取SSH连接的方式。然而,SSH需要SSH Key才可以连接到git源(仅以Github为例),这样的策略会导致在一些CI上无法安装依赖(例如Vercel),得到这样的错误: 这个问题碰到很久了。观察发现在安装时,会随机地从HTTP或Git拉取包,所以每一次安装依赖以后,Git包的来源都可能发生变化。所以之前都是反复安装然后最终得到从加载的结果时再上传。是的,很粗暴。 今天终于想彻底地修一下这个问题。机缘巧合找到了这么一篇GIST,引用如下: 试了一下果然管用,爽到。 当然也可能是正好随机到codeload了?有待观察。 所以我之前又翻文档又翻文档试图找到一个config或者cli option来解决问题实在走错路了,

来源

❌