豆包“偷偷”“更新”文生图功能
大概是4月21日的晚上,豆包偷偷更新了。不能说是升级,因为出图效果明显劣化了。
倒是没有劣化成之前2.0那个版本。模型的确是更新了,但是精度大幅度下降了,乱七八糟的东西变多了。当然了,豆包的产品动态里屁内容都没有。
本文讲一下已知的变更。
(文章内容随时间推移而失效)
变更
屁话
首先是出图时增加了一堆屁话。
看着像是把你的文本重新理解后重输出,这样好利于你接下来更改你的错误输入。
实际上放了个屁。
这段重排的文字和文生图的最终关系,从结果来看根本没关联。文字上好像是理解了你的文字输入,但实际上最终图片结果大部分场景下跟这段重排文字没啥关系,该错还是错的,这反而更加显蠢。
不知为何把 Debug Log 打到输出了
周一大半夜更新线上业务本来就很恶心,然后这Bug一直活到现在。
看来其实他们根本不在乎这个业务的死活,就是做着玩的。
敏感词提示
这个算是一个有用的更新。
比上来就生成失败然后把输入都给删了强多了。
等有机会把「领导」这个黑名单词汇出个图。
出图精度大幅下降
这是水下吗?这是游泳吗?这游泳馆为啥有海豚?
画蛇添足问题明显
这狗熊脸哪里来的?
这还不是最麻烦的,最麻烦的是,整体场景多余内容变得特别多。这导致整体输出变得非常的不可控,如果想要做内容的话,很有可能因为不必要输出乱跑导致完全跑题。
比如,这是更改前的输出:
这是更改后的输出:
很明显更改前,输出的内容很干净很稳定,但更改后,就非常过分的自作多情了。
准确度也变得更差了,带着雨帽还能露出双马尾这种错误,在更新之前是没有的。
这玩意就是明显的「画蛇添足」
单个会话出图数量有上限
限流。
每次对话能输出的图片数量被限制到了20。
玩不起了呗。
但并不是精确的20个,触发条件不详。
某些场景下会只生成一张图,而不是之前的四张
虽说是因为带输入中指定了「一个」。
但是输入里如果带数字的话,有可能会被识别成一个。
触发条件的细节不确定。
好歹还是做了个最多一次20个的限制。
结论
线上工具用着就是这么难受。
这反而让我想起了10年前的某个工作内容,项目是在微信上做公众号,比起竞争对手的核心优势就在于不需要在手机上另装APP就可以做推送(说实话当年很难绕过安卓手机上的各种流氓应用互相杀进程,所以自己做APP死路一条),结果做了几年之后,微信大幅度砍了公众号的推送功能,导致整个项目都报废了。或许这辈子能有个机会写一个生涯回忆录写一些相关内容,但估计没有那个机会了。
The post 豆包“偷偷”“更新”文生图功能 first appeared on 石樱灯笼博客.