豆包“偷偷”“更新”文生图功能

石樱灯笼博客

石樱灯笼

2025年4月27日 01:06

大概是4月21日的晚上，豆包偷偷更新了。不能说是升级，因为出图效果明显劣化了。

倒是没有劣化成之前2.0那个版本。模型的确是更新了，但是精度大幅度下降了，乱七八糟的东西变多了。当然了，豆包的产品动态里屁内容都没有。

本文讲一下已知的变更。

（文章内容随时间推移而失效）

变更

屁话

首先是出图时增加了一堆屁话。

screenshot_on_b85m_by_flameshot_at_2025-04-24_00-39-46

看着像是把你的文本重新理解后重输出，这样好利于你接下来更改你的错误输入。

实际上放了个屁。

这段重排的文字和文生图的最终关系，从结果来看根本没关联。文字上好像是理解了你的文字输入，但实际上最终图片结果大部分场景下跟这段重排文字没啥关系，该错还是错的，这反而更加显蠢。

不知为何把 Debug Log 打到输出了

screenshot_on_b85m_by_flameshot_at_2025-04-21_23-54-12

周一大半夜更新线上业务本来就很恶心，然后这Bug一直活到现在。

看来其实他们根本不在乎这个业务的死活，就是做着玩的。

敏感词提示

这个算是一个有用的更新。

screenshot_on_b85m_by_flameshot_at_2025-04-22_17-06-20

比上来就生成失败然后把输入都给删了强多了。

等有机会把「领导」这个黑名单词汇出个图。

出图精度大幅下降

这是水下吗？这是游泳吗？这游泳馆为啥有海豚？

screenshot_on_b85m_by_flameshot_at_2025-04-23_23-12-58

画蛇添足问题明显

这狗熊脸哪里来的？

screenshot_on_b85m_by_flameshot_at_2025-04-24_00-14-20

这还不是最麻烦的，最麻烦的是，整体场景多余内容变得特别多。这导致整体输出变得非常的不可控，如果想要做内容的话，很有可能因为不必要输出乱跑导致完全跑题。

比如，这是更改前的输出：

screenshot_on_b85m_by_flameshot_at_2025-04-27_16-12-04

这是更改后的输出：

screenshot_on_b85m_by_flameshot_at_2025-04-27_16-11-53

很明显更改前，输出的内容很干净很稳定，但更改后，就非常过分的自作多情了。

准确度也变得更差了，带着雨帽还能露出双马尾这种错误，在更新之前是没有的。

这玩意就是明显的「画蛇添足」

单个会话出图数量有上限

限流。

每次对话能输出的图片数量被限制到了20。

screenshot_on_b85m_by_flameshot_at_2025-04-23_22-27-29

玩不起了呗。

screenshot_on_b85m_by_flameshot_at_2025-04-24_21-15-39

但并不是精确的20个，触发条件不详。

某些场景下会只生成一张图，而不是之前的四张

screenshot_on_b85m_by_flameshot_at_2025-04-24_20-13-33

虽说是因为带输入中指定了「一个」。

screenshot_on_b85m_by_flameshot_at_2025-04-24_21-17-37

但是输入里如果带数字的话，有可能会被识别成一个。

screenshot_on_b85m_by_flameshot_at_2025-04-26_13-21-01

触发条件的细节不确定。

screenshot_on_b85m_by_flameshot_at_2025-04-24_21-44-17

好歹还是做了个最多一次20个的限制。

结论

线上工具用着就是这么难受。

这反而让我想起了10年前的某个工作内容，项目是在微信上做公众号，比起竞争对手的核心优势就在于不需要在手机上另装APP就可以做推送（说实话当年很难绕过安卓手机上的各种流氓应用互相杀进程，所以自己做APP死路一条），结果做了几年之后，微信大幅度砍了公众号的推送功能，导致整个项目都报废了。或许这辈子能有个机会写一个生涯回忆录写一些相关内容，但估计没有那个机会了。

The post 豆包“偷偷”“更新”文生图功能 first appeared on 石樱灯笼博客.

阅读视图

变更

屁话