ChatGPT Can Finally Generate Images With Legible Text How-To Geek 作者 Andrew Heinzman 2025年3月26日 05:00 GPT-4o image generation is now available in ChatGPT. The new image generation model, which replaces DALL-E 3, is most notable for its accurate text rendering, improved "binding" capabilities, and ease of use.
小试自定义GPT 落园 作者 Liyun 2024年1月12日 09:09 最近不是在折腾LLM嘛,于是就试了两条路子:用openai的api,以及直接在openai的界面里面创建GPT。 前者没啥特别的,chatgpt的api做的很成熟了,from openai import OpenAI 之后直接在python里面调用几个现成的函数就好了。可选的参数其实也不多,主要就是prompt写的好一点就行。我的要求也不高,试了试基本满足。此外我还用到了微软 azure api,也很方便,两者一结合基本一个app就搓出来了,只是暂时还只能在命令行运行,没写前端ui罢了。 后者就麻烦了。我想着自己写前端ui还挺麻烦的,就想偷个懒直接在GPT里面弄弄看看行不。结果呢,现在这个版本实在是太挫了,只支持最最基本的action,虽然可以调用其他api,但还没研究出来怎么实现用户上传的文件扔到action api call里面。搜了搜他们的论坛也没啥结果,然后心累就到此为止了。 最后贴一下如何在openai 的GPT里面调用azure api。主要是api key那里实在是反用户直觉,我找了好久……一定要选 custom 然后把自定义的名字设为 Ocp-Apim-Subscription-Key 才可以。贴个图。 自定义 action -> authentication -> custom header name 当然azure api的文档做的也很差就是了,经常搜出来的是过时的文档,试一试都是404错误。哎,时间都花在这些琐碎的调试bug上了。 最后的结论是,在现在这个阶段,openai GPT的多模态做的还是太封闭,只适用于比较基础的交互需求,得等到后面允许自定义编程更丰富一些才可以。想做的稍稍复杂一点,写ui是逃不掉的了。web版还可以写个python+js凑和一下(flask这么轻量级的web开发框架真的是效率提升利器),app版xcode看了半天发现也是一等一的复杂……说好的ai改变程序开发呢?叹口气……
排队76天获得微软Azure OpenAI GPT-4的服务 尚磊的博客 作者 尚磊 2023年9月5日 13:10 一、如愿以偿 总算收到微软Azure 的OpenAI GPT-4 的服务邀请了。做了一番研究之后,在Azure 上部署了GPT-4 的服务,先在playground 里玩一玩,这是在国内通过相对正规渠道获得GPT-4 服务的唯一方法,其他的渠道和途经,都有被OpenAI 官方封禁的可能,我已经被折磨好几次了。 这次,我先部署的是8K令牌的GPT-4,32K令牌的价格要高不少,目前我的使用场景中并不需要。 二、热度和使用频次都降下来了 经过长达67天的等待,现在对GPT的使用,也已经进入了冷静期,使用热度和频次都已经降下来了,进入了“正轨”。简单做一些总结概括、翻译、改写的工作,就交给GPT-3.5就行,一些需要较高质量回答的内容才交给GPT-4。毕竟,在Azure 上使用OpenAI 的服务都是需要根据使用量来进行计费的。 如果想在国内比较稳定的使用OpenAI 的GPT 服务,我还是建议你留意下微软Azure 所提供的OpenAI 服务,虽然相比官方的API 和ChatGPT 还是有一定的局限性,但在稳定性和合规性方面都有比较不错的支持,对开发也更加有好一些,将OpenAI 服务嵌入到你在微软Azure 云服务中也有更好的支持。 三、时间线 6月14日,审核通过后,我开通了微软Azure 的OpenAI 服务 6月16日,请求加入微软Azure OpenAI 服务GPT-4预览版的等待名单 6月17日,被添加到Azure OpenAI 服务GPT-4预览的等待列表中 9月1日,获得Azure OpenAI 服务GPT-4