阅读视图

发现新文章,点击刷新页面。

充分发挥 ChatGPT 在日常生活中的作用

技术人员利用 ChatGPT 开发软件、赚钱,非技术人员可以充分发挥 ChatGPT 在日常生活中的作用。

充分发挥 ChatGPT 在日常生活中的作用 - 第1张图片

2022年12月初,我就注册了 OpenAI 账号并开始使用 ChatGPT,被它生成速度所惊艳,被它生成的内容感到震撼,抛开它一股子 AI 味儿不说,其他方面还是足以让人接受,而且随着不断更新迭代,从最初的 GPT-3.5,到现在的 GPT-4-turbo,速度、准确度都有大幅提升。这一年使用下来,帮助我解决了很多事情,比如学校里老师布置的各种小论文,给它一个提示词,生成所需的内容,再比如咨询一些关于 WordPress 的问题,帮助我修改主题、增加功能等等。

令我印象深刻的是,一开始由于技术限制,ChatGPT 一次性生成的内容字数有限,到达限制之后会停止生成,你得回复“继续”或者“continue”,它才会继续给你生成剩下的内容,有网友说这叫人工智能界的“捧哏”。

今天分享我的经验。

沉浸式翻译

充分发挥 ChatGPT 在日常生活中的作用 - 第2张图片

本来想专门写一篇文章介绍并分享这一款浏览器扩展,也是我在2023年用过的最棒的工具之一,今天碰上 ChatGPT,便一并聊聊吧。

沉浸式翻译最早应该是在2022年12月出来的,当时还不支持使用 ChatGPT 的翻译服务,我便使用默认的必应翻译或者腾讯交互翻译,后来发现可以自己申请彩云小译的 API,便换成了彩云小译,翻译质量和水平也有所提升。

它最大的特点我觉得是智能。和一般的网页翻译不同,沉浸式翻译可以在显示原文的情况下同时显示译文,以前浏览到英文网页,顺手使用浏览器自带的网页翻译,结果返回一片一片的中文,翻译效果也差,来回切换十分麻烦,沉浸式翻译正好解决了这一痛点。

后面更新了一个“剧透”效果,将鼠标放到译文上时,译文内容才会显示,似乎这便是它的“沉浸式”吧。

充分发挥 ChatGPT 在日常生活中的作用 - 第3张图片

直到支持使用 ChatGPT 的翻译服务,两者一起使用,翻译水平和质量有大幅提升。只需要在扩展设置中添加自己的 OpenAI API Key,就可以在扩展中使用 ChatGPT 的翻译服务。

充分发挥 ChatGPT 在日常生活中的作用 - 第4张图片

文生图

ChatGPT 后期支持的 DALL-E-3 模型,让使用它的人体会到了一些乐趣。输入几句 prompts,AI 便会根据你的指令输出图片,如果对此不满意,还可以继续修改 prompts,增加细节。

将其用于文章配图,相当不错。虽然我文章中的图片不多,大部分来自截图,但偶尔实在没有图片搭配的情况下,可以让 AI 根据文章内容及其主题,生成相符的图片作为配图使用,多多少少也能增加文章的可读性。

另外,最近在 GitHub 上 Fork 了 XiaowenZ 修改过的项目——daily,主要是利用 GitHub Actions,搭配各类 API,定时生成对应的信息,并发送到 Telegram 频道或群组。我在这个项目里添加了 Bing Create 的 cookie,以及每日诗词的 API,让 Bing Create 以每日诗词的内容为提示词,生成对应的图片,于是便有了下面的效果。

充分发挥 ChatGPT 在日常生活中的作用 - 第5张图片 充分发挥 ChatGPT 在日常生活中的作用 - 第6张图片

ChatGPT-Next-Web

充分发挥 ChatGPT 在日常生活中的作用 - 第7张图片这是我最早、最常用的方式,即把 ChatGPT 当成一个百科全书,我负责提问、提需求,ChatGPT 负责解答。

但这一环节最重要的就是 prompt,prompt 的精确度决定了 ChatGPT 生成内容的准确度和质量,我记得 ChatGPT 刚问世那会,就出现了各种调教 ChatGPT 的方法和教程,正经的和不正经的都有一大堆。

正好有 ChatGPT-Next-Web 项目,免费部署,填入自己的 OpenAI API Key,即可与之对话,而且还内置了海量的 prompts,将其打造成各种身份,用于各种方面,比如学术论文、创意写作、数据分析等,再或者是让它模仿小红书笔记的风格,以特定产品为描述对象,生成小红书风格的内容……

估计这也是大多数普通人的 ChatGPT 用法,一个百科全书、私人管家。


AIGC API

但上述内容的使用前提是得需要有 OpenAI API Key,如果只注册了 OpenAI 账号,那就只能登录 ChatGPT 官网,使用最基础的 GPT-3.5 对话服务。不过,我由于没有信用卡,而且每个月订阅 ChatGPT Plus 的20美元对我来说太贵,便一直没有开通,一直使用基础的 GPT-3.5。

但是最近我不开通 ChatGPT Plus,也用上了 GPT-4 等相关功能,也能生成 OpenAI API Key。

朋友最近在做一个代理服务——AIGC API(aigcapi.io),低于 OpenAI 官方价格,却可以使用 GPT-4、DALL-E-3、Claude 2等模型的 API Key,虽然我不知道这是如何做到的,但觉得非常神奇,1美元额度的 API Key,在他那里只需要2元人民币,官方价格居然是他的3.6倍。

充分发挥 ChatGPT 在日常生活中的作用 - 第8张图片 充分发挥 ChatGPT 在日常生活中的作用 - 第9张图片

这模型名称让我搞不太明白,turbo 后面还加个数字,不过目前最好用的模型应该是 GPT-4-1106-preview 和 DALL-E-3。

借着朋友送我的额度,“嚣张”地使用着,我一个人也用不完,便部署了 ChatGPT-Next-Web 服务,将方法分享给了班上的同学,最近正好是写论文的时候,方便他们用 ChatGPT 修改自己的文章。

然后偶尔使用 DALL-E-3 文生图模型,让 AI 画出一些古诗词中的景色和场景,用了大半个月,我的感受是:太耐用,用不完,根本用不完。20美元不到,按照朋友提供的价格,折合人民币20元不到,相当于相当于购买20美元,就是20元人民币,但如果按照 OpenAI 官方的定价,就得上百块钱。

充分发挥 ChatGPT 在日常生活中的作用 - 第10张图片

虽然是第三方代理,但能享受官方的体验,除了价格比官方便宜,速度还比官方要快,准确度和官方保持一致,可以说体验升级。调用速度和 OpenAI 直连速度没区别,稳定性和 OpenAI 一致(OpenAI 崩他们也崩),每一笔调用都能在后台清晰可见。

仅需将官方接口地址(https://api.openai.com) 更改为AIGC API的接口地址:https://api.aigcapi.io 即可快速使用。专为企业和程序开发测试人员打造,更适合企业和站长等高并发大用量的用户,均是高速 API 渠道。

目前新用户注册默认赠送1美元额度,感兴趣的可以先尝试一下,如果觉得好用,需求大的话,我可以找朋友弄点折扣和优惠码。


另外说几句题外话,自从 ChatGPT 问世,各种 AI 工具层出不穷,有真正使用 AI 技术、并且有真本事的工具,也有不少挂羊头卖狗肉的套壳服务,工具多到我用不过来,眼花缭乱,都快对“AI”这个词产生应激反应。

最后我的选择还是跟随自己的需求,不要一拥而上,ChatGPT、Perplexity、Bing Create 足够我使用很久很久,除非我产生了新的需求。

使用 Vercel 免费部署 LobeChat

我在之前的文章《充分发挥 ChatGPT 在日常生活中的作用》中介绍过一款开源项目——ChatNextWeb,搭配 Vercel 即可部署自己的网页对话机器人,但它仅支持对话,如果想使用 DELL·E 3 模型进行文生图,似乎无法实现。最近看到另一个类似的项目——LobeChat,功能更加齐全、丰富,UI 也更加好看,便记录一下部署过程。

使用 Vercel 免费部署 LobeChat - 第1张图片

LobeChat 介绍

该项目在 GitHub 上已有 17.7k stars,这几个特性比较吸引人:

  1. GPT 视觉认知。支持了 OpenAI 最新的 gpt-4-vision 模型,视觉识别,只需上传图片,即可识别图片内容,然后基于此进行对话。
  2. TTS & STT 语音会话。这一功能在 ChatGPT 的官方客户端上就能体验,通过语音转文字或者文字转语音,与人工智能助手进行对话。
  3. Text to Image 文生图。即支持通过插件唤醒 GPT-4 内置的 DALL-E 3 模型,直接调用文生图工具进行绘画,我在 Bing Create 上使用该功能绘制 Daily 图片,仅用一句诗,就能生成与之相符的图片。

如果开通了 ChatGPT Plus,以上三点应该可以轻松实现并体验,但对我来说太贵,便找到了平替方案。

LobeChat 部署

LobeChat 提供了 Docker 镜像,也提供了 Vercel 的自托管版本,两种方式我都进行了测试,都可以正常部署并使用。

Docker 部署

在 VPS 终端输入以下命令,就可以一键安装并启动 LobeChat 服务:

docker run -d -p 3210:3210 \
  -e OPENAI_API_KEY=sk-xxxx \
  -e OPENAI_PROXY_URL=https://api-proxy.com/v1 \
  -e ACCESS_CODE=lobe66 \
  --name lobe-chat \
  lobehub/lobe-chat

其中涉及到一些环境变量,OPENAI_API_KEY 是从 OpenAI 获取到的 API Key,如果你使用的 API Key 并不是来自官方,则需要加一条环境变量OPENAI_PROXY_URL配置代理地址,比如我使用的是第三方 API Key,由 AIGC API 提供,ACCESS_CODE是访问密码,建议设置。最后需要确保 VPS 端口 3210 保持开启且未被占用,然后通过 IP:端口的方式进行访问即可,或者进行反向代理,绑定域名使用。

Vercel 部署

使用 Vercel 部署更加方便快捷,不用登录 SSH,也不用输入命令。

进入 GitHub 项目页面,fork LobeChat 项目之后登录 Vercel,选择对应的仓库进行导入。

使用 Vercel 免费部署 LobeChat - 第2张图片

在环境变量部分填入相应的 Key 和 Value,如下图所示,我填写了ACCESS_CODEOPENAI_API_KEYOPENAI_PROXY_URL,这样就可以通过 AIGCAPI 提供的第三方 API Key 使用 GPT-4 等模型。

使用 Vercel 免费部署 LobeChat - 第3张图片

注意,如果在环境变量里填写了OPENAI_API_KEY等其他模型服务商的 API Key,则该服务部署成功之后可以直接使用,无需再在网站中填写 API Key,这一点在项目文档中写得比较清楚。

点击 Deploy,等待部署完成。

使用 Vercel 免费部署 LobeChat - 第4张图片

即可访问网站,使用服务。

使用 Vercel 免费部署 LobeChat - 第5张图片

切换 GPT-4 模型,打开内置的 DALL·E 3 插件,即可开启文生图模式。

使用 Vercel 免费部署 LobeChat - 第6张图片

除此之外,还内置了各种 AI 助手,涵盖写作、翻译、代码等方面。

使用 Vercel 免费部署 LobeChat - 第7张图片

最后给大家分享一家我一直在使用的第三方 API Key 提供商,AIGC API,提供高效且稳定的 OpenAI 聚合 API,相比官方20$/月的 ChatGPT Plus,它提供的 API,价格低至1美元只需要2元人民币,除了 GPT-4 模型,图中这些也可以进行调用。

使用 Vercel 免费部署 LobeChat - 第8张图片

最近因为写毕业论文需要,便使用 LobeChat 和 AIGC API 的服务部署了一个网站,给自己和同学使用,效果还不错。

小试自定义GPT

最近不是在折腾LLM嘛,于是就试了两条路子:用openai的api,以及直接在openai的界面里面创建GPT。

前者没啥特别的,chatgpt的api做的很成熟了,from openai import OpenAI 之后直接在python里面调用几个现成的函数就好了。可选的参数其实也不多,主要就是prompt写的好一点就行。我的要求也不高,试了试基本满足。此外我还用到了微软 azure api,也很方便,两者一结合基本一个app就搓出来了,只是暂时还只能在命令行运行,没写前端ui罢了。

后者就麻烦了。我想着自己写前端ui还挺麻烦的,就想偷个懒直接在GPT里面弄弄看看行不。结果呢,现在这个版本实在是太挫了,只支持最最基本的action,虽然可以调用其他api,但还没研究出来怎么实现用户上传的文件扔到action api call里面。搜了搜他们的论坛也没啥结果,然后心累就到此为止了。

最后贴一下如何在openai 的GPT里面调用azure api。主要是api key那里实在是反用户直觉,我找了好久……一定要选 custom 然后把自定义的名字设为 Ocp-Apim-Subscription-Key 才可以。贴个图。

自定义 action -> authentication -> custom header name

当然azure api的文档做的也很差就是了,经常搜出来的是过时的文档,试一试都是404错误。哎,时间都花在这些琐碎的调试bug上了。

最后的结论是,在现在这个阶段,openai GPT的多模态做的还是太封闭,只适用于比较基础的交互需求,得等到后面允许自定义编程更丰富一些才可以。想做的稍稍复杂一点,写ui是逃不掉的了。web版还可以写个python+js凑和一下(flask这么轻量级的web开发框架真的是效率提升利器),app版xcode看了半天发现也是一等一的复杂……说好的ai改变程序开发呢?叹口气……

视障同学通过电子邮件完成 hCaptcha 验证的方法

  最近玩 OpenAI ChatGPT 的视障同学挺多的(我也是其中之一),在注册和登陆的时候,我们会遇到 hCaptcha 人机验证。跟谷歌的 reCAPTCHA 一样,hCaptcha 提供视觉验证,但不同的是,hCaptcha 的“绿色通道”是通过电子邮件来完成的,这难倒了不少同学(您先别急着表示不屑,没准您是一位运气王)。下面,让我们开始吧!

准备一个能接收国外邮件的电子邮箱

  这个很容易获得,你有 QQ 邮箱吧?这就挺好,如果你还绑定了微信,那就更好了,那位说了,我还在电脑上登陆了微信,诶呀,这就太好了。

触发挑战

  在有 hCaptcha 验证码的页面上,通常你会碰到“hCaptcha复选框。选择以触发挑战,或者如果您具有可访问性cookie,则绕过它”复选框。按空格键选定这个复选框,然后你会听到“获取有关hCaptcha和辅助功能选项的信息。 菜单按钮 已折叠”,这里按空格键。按下空格键后,会打开一个菜单,第一个选项就是“辅助功能”,按回车键。你会听到“对话框”,这里,按 Tab 到“检索可访问性cookie”链接,然后按回车键。

输入邮箱,获取验证链接

  现在打开了一个新的页面,在“电子邮件”中,输入你的 QQ 邮箱账号,然后点击“注册”按钮。十秒钟后,你的 QQ 邮箱就会收到 hCaptcha 的邮件,标题是“Instructions for using hCaptcha Accessibility”。
打开这封邮件,按 Tab 可以导航到“获取可访问性 Cookie”链接,点击它就可以访问 hCaptcha 的验证页面。不过,微信打开 QQ 邮箱后有个问题,点击“获取可访问性 Cookie”链接后,会要求登陆 QQ 邮箱。所以,变通的解决方法是复制它下面的链接,通常以 https://accounts.hcaptcha.com/verify_email 开头,复制的时候要注意删掉读屏软件在末尾添加的“链接”,复制后,回到“Sign up for hCaptcha Accessibility Access”页面,在地址栏粘贴。

获取辅助功能 Cookie

  完成了上面的步骤后,我们来到了 hCaptcha 的验证页面。按 Tab 可以导航到你的邮箱账号,例如我这里是 armstrong@contoso.com,再按一下 Tab 就可以导航到“设置Cookie”按钮。用空格键点击这个按钮,顺利的话,就会听到“Cookie集”的语音提示,如果没有听到,按一下下光标也可以导航到这句话上面。听到这句提示,就表示验证通过了,可以进行后续操作。

疑难排解

  上面的操作很顺利吧?是的,我们没有遇到任何问题。实际上,我们会经常遇到下面的情况:

无法发布Cookie。如果此问题继续发生,请发送电子邮件至support@hcaptcha.com。

  使用代理服务器上网的同学经常会遇到这个问题,这个问题是由于 hCaptcha 阻止了代理服务器的 IP 导致的,可以暂时关掉代理,或者切换到其他节点,然后在点击一次“设置Cookie”按钮。

点击“设置Cookie”按钮后,一分钟还是没有收到 Cookie?

  请查看你的邮箱的垃圾箱是否有 hCaptcha 的邮件,如果没有,更换一个邮箱。或者,输入邮箱后,点击注册,你听到了错误提示,就请暂时关掉代理,也可以尝试换一个节点。

后续步骤

  经过前面的操作,我们就可以进行后续步骤了。关掉提示“Cookie集”的页面,然后点击“封闭模态”按钮,焦点就会回到“hCaptcha复选框。您已通过验证”。现在就可以进行下一步操作啦,比如登陆,注册等等。

后记

  根据我的观察,使用 hCaptcha 验证码系统的网站除了 openai 还有 CloudFlare,解决问题的方法也都是一样的。同学们一定要举一反三哦。

排队76天获得微软Azure OpenAI GPT-4的服务

一、如愿以偿

总算收到微软Azure 的OpenAI GPT-4 的服务邀请了。做了一番研究之后,在Azure 上部署了GPT-4 的服务,先在playground 里玩一玩,这是在国内通过相对正规渠道获得GPT-4 服务的唯一方法,其他的渠道和途经,都有被OpenAI 官方封禁的可能,我已经被折磨好几次了。

这次,我先部署的是8K令牌的GPT-4,32K令牌的价格要高不少,目前我的使用场景中并不需要。

二、热度和使用频次都降下来了

经过长达67天的等待,现在对GPT的使用,也已经进入了冷静期,使用热度和频次都已经降下来了,进入了“正轨”。简单做一些总结概括、翻译、改写的工作,就交给GPT-3.5就行,一些需要较高质量回答的内容才交给GPT-4。毕竟,在Azure 上使用OpenAI 的服务都是需要根据使用量来进行计费的。

如果想在国内比较稳定的使用OpenAI 的GPT 服务,我还是建议你留意下微软Azure 所提供的OpenAI 服务,虽然相比官方的API 和ChatGPT 还是有一定的局限性,但在稳定性和合规性方面都有比较不错的支持,对开发也更加有好一些,将OpenAI 服务嵌入到你在微软Azure 云服务中也有更好的支持。

三、时间线

  • 6月14日,审核通过后,我开通了微软Azure 的OpenAI 服务
  • 6月16日,请求加入微软Azure OpenAI 服务GPT-4预览版的等待名单
  • 6月17日,被添加到Azure OpenAI 服务GPT-4预览的等待列表中
  • 9月1日,获得Azure OpenAI 服务GPT-4
审核通过后,我开通了微乳Azure 的OpenAI 服务
加入微软Azure OpenAI 服务GPT-4预览版的等待名单
被添加到Azure OpenAI 服务GPT-4预览的等待列表中
获得Azure OpenAI 服务GPT-4
❌