普通视图

发现新文章,点击刷新页面。
昨天以前阮一峰的网络日志

科技爱好者周刊(第 334 期):年终笔记四则

作者 阮一峰
2025年1月17日 08:17

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

武汉光谷是今年春节晚会的分会场,将表演灯光秀,非常有科幻感。(via

年终笔记四则

下面是过去的笔记,我读到有意思的文章时,记录下来的感想,每一则都不长。

前几天翻阅,觉得可以放在一起,重新发布,今天先发四则。

一、工作也有利息

银行存款有利息,存得越久,利息越多。

工作也是一样,也有利息。如果今年的工作可以节省明年或未来的工作时间,就是一份有利息的工作

工作有利息,意味着你未来的工作时间会变少,多出来的时间,就可以去做别的事情,创造更多的价值。

这提示我们:

(1)不要轻易更换工作领域,否则以前积累的利息就作废了。只有在同一个工作领域,才可能产生长期积累,以前的工作为以后打基础,最终产生巨大的利息。

(2)在职业生涯的早期,积累效果最好,最容易产生复利。开始积累越晚,产生复利就越少。

(3)有些劳动没有积累效果,不会产生利息,比如重复性的机械劳动(快递、咖啡店员、门卫......),你明年还是要重复做这些事情。

(4)最好的人生策略就是,找到你深感兴趣、可以长期做下去的领域,在上面投入大量的工作时间(包括质量和数量),然后随着年龄增长,享受以前工作的复利。

二、巴菲特的选人标准

巴菲特说,他考察候选人,就看三个"i"

  • integrity(正直)
  • intelligence(智慧)
  • initiative(主动)

这三个"i"当中,"主动"最重要。"正直"和"智慧"的人到处都是,但如果不主动,不是自己想去做些什么,就什么也不会发生。

三、快乐机

1974年,一个美国哲学家提出一个假设,如果世界上有"快乐机",只要插上电源,就能带来源源不断的快乐,并且无法分辨,这种机器快乐与现实世界的快乐有何不同。

哲学家说,我们就可以观察人们的选择。

如果大多数人选择快乐机,而不是现实生活,这就证明人生的目标是体验尽可能多的快乐(享乐主义)。

当时因为不可能造出快乐机,所以无法验证他的假设是否正确。现在不一样了,有了游戏机、VR 头盔、短视频平台......

四、未来的三种关键能力

未来,你需要三种能力。

(1)专业能力。你需要有一个专长。

(2)写作能力。未来是远程工作,团队成员分散在各地,以写作----而不是当面交流----作为主要的沟通手段。

(3)视频制作能力。以前,文字能影响大众,现在视频是最强的大众传播渠道。如果你能制作好看的视频,将想法和产品可视化,就更容易让更多用户看见。

[本周软件] Midscene.js:浏览器自动化利器

本周介绍一个很特别的浏览器自动化工具:Midscene.js

它的最大特点,就是自然语言驱动(需要自行接入 AI 模型),操作浏览器,以及理解网页内容,将结果以 JSON 数据返回。

大家可以安装它的浏览器插件,直接输入自然语言指令,进行体验。

比如,交互指令(点击搜索按钮)、查询指令(返回所有商品的链接)、断言指令(页面是否有三个按钮)。

有了它,你可以编写 YAML 脚本,完成浏览器自动化;也可以将它接入 Puppeteer 和 Playwright,让后两者接受自然语言指令。

使用自然语言驱动之后,自动化脚本变得容易维护、效果更稳定。

总之,如果你需要浏览器 UI 测试,或者抓取网页数据,就不要错过 Midscene.js。它在 GitHub 已经获得2700颗星。

科技动态

1、VR 审判

美国最近的一起民事案件的审判中,被告律师让法官戴上了 VR 头盔。

律师说,他们制作了一段 VR 动画,可以让法官从被告的视角,沉浸式了解整个案件的过程。

这是历史上第一次,法庭审判使用 VR 头盔。

所有人在法庭上都戴着 VR 头盔,场景很魔幻。完全可能的是,整个审判以后可能都会搬到虚拟世界,不必所有人到场。

2、亚马逊最大的树

亚马逊原始森林有无数棵树,没人知道哪一棵最大。

一个美国科学家通过卫星照片,找到了一棵可能是亚马逊最大的树。

卫星照片只能拍到树冠,只要识别出最大的树冠,就应该是最大的树。

科学家发现,有一棵树的树冠,直径超过60米,相当于树下可以停五辆头尾相连的大巴,可谓树王。

3、其他

(1)中文互联网语料资源平台发布,一共 2.7TB 中文资料,向社会开放,专门用来训练大模型。

(2)一位国外用户购买了亚马逊的视频会员,震惊地发现,电视机明明开了静音,但是广告时间居然会自动取消静音。

文章

1、一个副业应用的开发心得(中文)

本文总结2018年作者为自己的安卓应用,加了一个收费功能的开发心得。(@javayhu 投稿)

2、俄罗斯和乌克兰各自有哪些知名软件?(中文)

本文介绍了两国的知名软件,都有不少很厉害的项目。(@mzhren 投稿)

3、为什么要学习写编译器(英文)

作者谈为什么你应该试试自己写一个编译器,并且提供了三个入门的学习资源。

4、国际数学奥林匹克金牌得主的去向(英文)

国际数学奥林匹克是高中生的数学比赛,作者做了一个调查,历届金牌得主后来怎么样?

5、AWS S3 与 Cloudflare R2 比较(英文)

AWS S3 是一个老牌的存储服务,Cloudflare R2 是它的新兴对手。本文比较这两种服务。

6、无限滚动轮播的 CSS 实现(英文)

本文教你只用 CSS 实现类似弹幕的无限滚动轮播效果,还能用鼠标悬停。

7、如何将笔记本用作第二个显示器(英文)

一篇电脑使用的教程,如何将笔记本当作显示器使用。

工具

1、barba.js

一个 JS 库,让网站页面的切换产生平滑的动画效果。

2、httpdbg

一个 Python 程序的桌面调试器,在类似浏览器控制台的环境里调试 HTTP 请求。

3、BiliMusic

一个 macOS 桌面程序,让用户播放 B 站收藏的音乐。(@609529897 投稿)

4、ScreenShot

免费的 App 预览图制作工具,支持华为、小米、OPPO、VIVO、鸿蒙、AppStore的应用商店预览图制作。(@ovelv 投稿)

5、猫步简历

免费开源的简历制作工具,提供各种模版和主题,可以定制化模块。(@Hacker233 投稿)

6、KeyClicker

开源的 macOS 应用,打字时模拟机械键盘和打字机的声音,有200多种声效。(@jaywcjlove 投稿)

7、Peek Focus

一个 Chrome 插件,点击时,不在新的标签页、而在页面浮层里打开链接。(@zerosoul 投稿)

8、Docker 镜像拉取工具

该工具用于下载 Docker 镜像,无需 Docker 环境,支持自定义仓库地址,配置国内镜像源。(@topcss 投稿)

9、壁纸样机生成器

生成电子设备壁纸效果图的免费工具。(@leven-z 投稿)

10、BlogKeeper-文捕

在线博客文章解析下载工具,支持微信公众号/博客园/CSDN/掘金/简书/思否等平台,可以保存成多种格式。(@GailZhangJY 投稿)

AI 相关

1、Raphael AI

基于 Flux.1-DEV 模型的 AI 图像生成网站,免费、无使用量限制、不需要注册。(@markliuyuxiang 投稿)

2、AI Shortcuts

Chrome 浏览器扩展,一键查询不同 AI 。(@taoAIGC 投稿)

3、Audio Transcription

将播客或音频转录成文本,并给出摘要,基于 Next.js 和 OpenAI Whisper,代码开源。(@winterfx 投稿)

4、Get Your Perfect Chinese Name

AI 给外国人起中文名字。(@syhdeclan 投稿)

资源

1、BestBlogs.dev

精选中文科技文章的阅读平台。(@ginobefun 投稿)

2、自洽的程序员

一本中文电子书,作者分享如何调整心态,解决职场常见问题,提供在线阅读。(@zhangchenchen 投稿)

3、我的 3D 主页

作者用 React Three Fiber 构建的 3D 个人主页,非常华丽。

4、Staying

代码可视化网站,可以将 Python 和 JS 代码的运行步骤,以动画形式展示,内置了许多常见算法的演示。(@lezhu1234 投稿)

图片

1、错误的数学

一位美国网友注意到,一家设计公司在社交媒体上,发布了下面的图片。

图片声称,33000英尺(1万米)高空的飞机,比5000英尺(1500米)的飞机,在飞向同样目的地时,花费的时间是后者的4倍(假定飞行速度相同)。

这位网友第一反应是,这是在开笑话吗?它为什么忽略地球半径。

地球半径(设为 R)大约是1800万英尺,这意味着外圈长度只比内圈,多了不到1%。

而且,由于33000英尺高空的空气阻力减小,该高度的飞行时间实际上可能更少。

2、报时球

报时球(time ball)是19世纪港口使用的一种报时装置,供海上的水手校准时间。

平时,球都在杆子顶部。每天中午1点,球就会落到杆子的底部,看到的人就知道1点到了。

在1点前5分钟,球会落到杆子的一半,让大家做好准备。完全落下后,过了两三分钟,球就会重新升起。

文摘

1、照明的历史

工业革命之前,世界是漆黑的,灯光极其昂贵,火是唯一的人造光源。

历史上,人造光一直是富人和有权势的人的特权,生产和维护既费力又肮脏,可用性和质量都很差。穷人很难获得人造光,总是生活在黑暗中。

古代房屋在夜晚有蜡烛照明,是巨大财富的标志。当时,蜂蜡制成的优质蜡烛是最好的光源,但天然蜂蜡的供应有限,加上手工制作的繁琐,除了最富有的人之外,其他人都买不到优质蜡烛。

一位作家写道:"打开你的冰箱门,你召唤出的光线比18世纪大多数家庭所享受的光线总量还要多。"

后来人们发现,鲸油(鲸鱼的皮下脂肪)是更好的蜡烛材料,燃烧时发出干净、稳定的光,是工业革命早期了最好的照明,但它也非常昂贵。

捕鲸业为世界带来了照明,但也将一些鲸鱼物种推向了灭绝的边缘。仅在1700年至1800年间,为了得到鲸油,就至少有300,000头鲸鱼被屠杀。

1800年代初,欧洲和美国出现了燃气照明,燃烧煤气来发光。然而,燃气照明的安装和维护费用昂贵,而且有危险。所以,煤气灯一般不用在家里,而用在工商业和大城市的路灯。

煤气灯很亮,比之前的任何灯至少亮20倍。使用燃气照明是人类第一次体验明亮的照明。

1846年,天然气生产的副产品煤焦油(简称煤油)做成灯,用来照明。煤油开始取代鲸油,导致照明成本直线下降,并且燃烧时明亮、无味。

正是因为煤油,夜间第一次变得明亮了,天黑后也能生产和娱乐。

19世纪后半期,托马斯·爱迪生(Thomas Edison)发明了电灯,电照明的时代从此来临。

言论

1、

人类一种可能的未来是,人工智能精英坐拥惊人的财富,与世隔绝,然后拿出最少量的施舍,来保证广大的失业人员不闹事。

-- 李开复《AI·未来》

2、

互联网早就不是缺少管制、充满颠覆性创新的领域了,如今人们正在寻找一种新的监管和治理框架,以应对极少数大型数字企业对互联网的垄断。

-- 《2024年 IP 地址报告》

3、

如果你仔细想想,最好的书实际上是一个极其漫长的咒语,它让你在余生中变成另一个人。

-- @thisone0verhere.bsky.social

4、

父亲要求我,只要有时间,就总是参加葬礼,哪怕这对我有一些不方便和情绪压抑。因为这样做,你就参与分担了他人生活中那些不可避免的、偶尔发生的灾难。

-- 《总是参加葬礼》

5、

我不明白,99%进入 AI 底层模型开发的公司,能得到什么好处?

如果 AI 模型真的像宣传的那样,能做到任何事情,那么大多数公司只需要等待,就能获得跟自行开发模型同样的好处。很多公司似乎都非常害怕错失良机,其实根本不存在这一点。

-- Hacker News 读者

往年回顾

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月17日

AI 搞定微信小程序

作者 阮一峰
2025年1月16日 08:23

一、前言

AI 生成代码,早不是新鲜事了,但是 AI 生成微信小程序,似乎还不多见。

究其原因,大概是小程序的开源项目较少,模型训练不好搞。

上周,我遇到腾讯的同学,得知"腾讯云开发"最近有一个大的版本更新,大幅加强了小程序的 AI 能力。我还挺期待的,腾讯自己搞小程序 AI,要比其他人更合适。

后来,我试用了本次更新的 AI 功能,有一个强烈的感觉,微信小程序可能很快就会成为国内 AI 应用(又称"智能体")的主要载体

因为本次更新以后,小程序调用 AI 模型,以及生成智能体,变得非常方便。并且,小程序从 API 到开发工具,都把 AI 整合进去了,整个开发过程都有 AI 辅助,不仅开发效率提高了,而且大量代码可以通过 AI 生成。

下面就是我的试用过程的介绍和记录。这些功能都是公开的,大部分已经上线,剩下的也即将发布,大家现在就可以跟着做,体验 AI 生成小程序。

二、云开发助手:进入方法

我的第一步是体验小程序的"云开发助手"(又称云开发 Copilot)。它的作用是通过 AI 加快小程序的开发

它的全功能版,目前要通过"腾讯云开发平台"网站使用。

此外,还有一个游客版的小程序,可以体验部分功能。如果你手边只有手机,可以先试试游客版。

手机上,点击"从 AI 开始探索云开发",就能进入。

手机版看一下就可以了,正式的开发还是要使用网站。本文下面的内容,都是基于网站的全功能版。

首先,登录"云开发平台"后,页面右下角就会出现小助手图标。

点击它,就能打开"云开发助手"。

它的右上角有一个"全屏"图标(下图)。

点击进入完整界面。

三、云开发助手:文档功能

"云开发助手"的主要功能如下图。

这些功能可以分成两大类,一类是文档相关的功能,另一类是代码生成。

先看看文档功能。

(1)Copilot

这个功能是 AI 问答引擎,任何关于小程序的问题,都可以向它提出。

这大大减少了文档查阅,有些简单的函数,可以让它生成,还能让它教你如何开发小程序。

(2)AI 识图

这个功能是通过上传页面截图(或者设计稿),生成需求文档。

我上传了一张抽奖的转盘。

它生成了如下的需求文档,用文字详细复述了这个页面的界面布局、设计细节、功能需求等。

大公司的程序员,一般都是根据产品需求文档(PRD)进行开发,所以这个功能可以简化产品经理的工作,需求文档也可以作为 AI 代码生成的文字记录保存下来。

生成的需求文档,下一步可以传入"云开发助手",来生成页面代码,所以它也是 AI 生成小程序的中间步骤。

(3)写需求高手

这个功能跟"AI 识图"作用相同,都是生成需求文档,区别是它输入文字描述。

由于不需要截图,它适合只有功能需求、没有设计稿的场景,即让 AI 来设计页面。

四、云开发助手:生成小程序前端代码

接着,我们就来试试,让"云开发助手"生成小程序的前端代码。

选择左侧菜单的 "AI 生成可视化应用",这个功能就是根据截图或者文字描述,直接生成应用(Web 或者小程序)。

上传一张微信页面的截图。

它会自动生成该截图的页面代码,可以预览效果(下图)。

可以看到,生成的页面还原了原始布局,但是有许多细节差异。

目前阶段,好像还做不到100%还原,比较适合当作代码基础,在它生成的页面基础上,进行手动细节调整。

除了上传截图,还可以输入文字描述(或者上一节的需求文档),也能生成应用。

让它生成程序员的个人小程序,效果还是可以的。

预览初步效果后,你可以在云开发平台上,直接线上编辑代码。

编辑完这个页面以后,还可以反复这个过程,向小程序添加更多页面(下图)。

有了多个页面,就能设置页面之间的跳转,这样就基本是一个可用的小程序了。

调整小程序的样式时,云开发助手还提供了一个贴心的功能"AI 编辑组件样式",也就是根据指令,自动修改样式。

上图就是让 AI 为页面添加渐变背景,这样修改样式,就方便了很多。

大家可能看到了,左侧菜单栏还有一个"AI 生成组件"的功能。该功能用来生成页面的组件,适合为现有的页面添加功能。但是,它暂时只支持 Web 应用,不支持小程序,所以这里就忽略不介绍了。

完成前端开发以后,云开发平台可以直接发布小程序。当然,你也可以复制或者下载代码,通过微信开发工具发布。

五、云开发助手:生成小程序后端代码

小程序除了前端 UI 代码,还需要后端的业务逻辑和数据库读写。"云开发助手"也能生成后端代码,主要用到下面两个功能。

(1)AI 生成云函数

云函数是微信平台在云端执行的函数,可以用来获取各种后端能力。

"云开发助手"可以帮我们生成云函数。下图就是让 AI 生成获取小程序 OPENID 的云函数。

AI 在给出示例代码的同时,还会展示各个文件的写法(下图)。

如果你觉得可以接受,就点击"创建云函数"按钮 ,代码就会进入新打开的云 IDE 环境,用来编辑和调试。

编辑完成后,点击"部署"按钮,就可以将云函数部署到线上了。

(2)AI 生成数据模型

这个模型用来生成数据库的数据模型(也就是"表结构")。

比如,生成一个博客的数据模型,包括文章、作者和评论。

点击"查看",显示一个 JSON 数组,表示数据结构。

点击"确认生成",数据结构就会以表格形式呈现,确认没有问题,就可以保存。

六、AI 大模型接入

上面都是介绍"云开发助手",即 AI 辅助小程序开发。下面介绍 AI 开发的另一个重头戏:如何做出 AI 智能体的小程序,也就是让小程序本身具有 AI 功能。

还是在"云开发平台",左侧菜单选择 AI+。

这时,页面会让你选择,接入大模型还是开发智能体(下图)。

(1)开发智能体(AI Agent)

这里可以简单把"智能体"想象成一个 AI 对话应用,用户输入要求,AI 给出响应。

腾讯云开发平台将"智能体"的后端大模型,默认指定为腾讯的混元模型。

你自己需要定制开场白、提示词、知识库(你自己的训练材料)。

然后,定制前端界面(对话组件)。

基本流程就完成了:用户在前端界面,根据开场白的提示,输入他的要求,系统收到后,传给后端模型,再将回复展示给用户。

是不是很简单?一个智能体就这样做好了。

(2)AI 大模型接入

如果选择自己接入大模型,页面会根据开发类型(Web/小程序/云函数),给出接入指引。

小程序 API 已经对大模型做了适配,按照指引,只要几行代码就能接入。

具体来说,从小程序基础库3.7.1开始,新增了wx.cloud.extend.AI对象,专用于 AI。

  • wx.cloud.extend.AI.createModel():用来接入大模型
  • wx.cloud.extend.AI.bot:用来调用智能体

用了这个 API,就不需要任何 SDK,也不需要后端服务器,系统直接负责 AI 接入,同时处理好鉴权、加密、流式传输,不需要用户介入。

下面是示例代码,详见官方文档

七、总结

以上就是我试用的全部内容,我的总体感觉是,这些已经做好的部分,对小程序的开发有巨大的助力。如果你正在开发小程序,一定要试试这些功能。

小程序的 AI 能力,后面还会持续扩展。腾讯希望把云的基础设施、微信小程序、AI 大模型都打通,从而让小程序开发的门槛更低,效率更高。

我听腾讯的同学说,下一阶段有几个开发重点。

(1)用 AI 生成前后端完整的小程序,进一步与微信开发环境打通。

(2)加强 AI 的代码生成能力,搭配小程序模版和低码编辑器,快速生成小程序。

(3)在 AI 的帮助,无痛接入数据库和调用云函数。

(4)客户端、服务端、大模型三者之间数据交互的标准化和统一接口。

上面的每一点,都能解决目前小程序开发的痛点,期待早日看到突破。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月16日

科技爱好者周刊(第 333 期):一切都要支付两次

作者 阮一峰
2025年1月10日 08:14

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

42层的深圳金融科技研究院大楼,去年6月封顶了,采用了不规则外形的设计。(via

一切都要支付两次

有一句古语"书非借不能读也",大家可能都听过。

它的意思是,很多人买了书却不读,觉得不着急,拥有书就相当于已经开始学了,后面就慢慢来吧,反而是借来的书有急迫感会抓紧读完。

这种事情很多。网址保存成书签,就扔在那里了,再也不去看它了。

我最近看到一篇老外的文章,他给这种现象起了一个全新的名字,让人觉得很贴切。老外的概念化能力真是强。

他提出,人们买书却不读,是因为没有意识到每样东西都需要两次支付

第一次是货币支付,你付出货币,得到自己想要的东西,比如一本书,一个 App,一辆自行车,一颗卷心菜等等。

但是,你还必须支付第二次,才能真正消费这个东西。这次你付出的是你的时间和努力,来获得它的收益。

第二次支付可能比第一次支付贵得多。假设一本书的第一次支付是20元,第二次支付可能就是10小时的阅读时间。只有支付第二次,你才算真正消费了这本书。如果没有第二次支付,第一次支付就意义不大了,跟把钱扔进垃圾箱差不多。

生活中,到处都是两次支付的例子。购买 App 后,你必须学习如何使用,并且经常使用,才能得到它的价值。购买自行车后,你必须忍受痛苦的初学者阶段,然后才能上街骑行。购买蔬菜后,必须切碎、蒸熟并咀嚼,然后才能为你提供营养。

我们经常犯的一个错误,就是只完成了第一次支付,没有第二次支付,比如未使用的会员资格,未读的书籍,未玩的游戏,未编织的毛线。由于没有第二次支付,所以你并没有真正使用,第一次支付的钱实际上扔进了垃圾桶。

这种行为方式的深层次原因,就是现代社会太强调消费,过于看重第一次支付的经济价值,而忽视第二次支付的实际结果。人们受到消费主义的影响,以为支付了商品价格,就完成了一次消费。

合理的消费方式应该是,只有当你确定会有第二次支付,才进行第一次支付。这样就可以避免许许多多的浪费。

新的一年,大家购买商品时,可以先问问自己,你会不会第二次支付,即会不会为它付出时间和努力?只有确信自己会,再掏钱购买它。

有一种商品,天然支持先进行第二次支付,再进行第一次支付,那就是软件。

软件不同于实体商品,边际成本接近零,又是长期消费,完全可以先让用户免费用(试用版或者试用期),等他用习惯了,再向他收费。

很多软件就是这样做的,这大概就是为什么,软件的不理性消费行为,要比实体商品少得多的原因。

语义防火墙:雷池 WAF 升级

服务器一直被攻击,怎么办?我的体会是,这种事情很难预防,只能用防火墙去挡。

周刊以前介绍过"雷池 WAF",就是知名的软件防火墙,GitHub 已经有14500颗星。

它有一个好用的图形管理后台(上图),可以配置各种拦截规则,高效过滤恶意请求。

即使不配置规则,它自带的语义引擎,也会通过机器学习,自动识别和拦截恶意请求

本周,雷池 WAF 进行了重大升级,发布了语义引擎3.0版,加强了 AI 语义分析能力。只要2~8小时的自动训练,识别准确率就能达到99.99%,还能用自然语言解释,遇到了什么攻击。

如果你有线上服务器,不妨试试它的拦截效果。个人网站使用开源版就够了,企业可以考虑商业版,本次升级引入的 AI,主要就是强化商业版的企业级服务。

科技动态

1、从地图删除巴士线路

桂尔公园(下图)是巴塞罗纳的第二大景点,每天都挤满了世界各地的游客。

很多游客乘坐116路公交车去公园,周围居民意见很大。每趟车都挤满了游客,本地居民反而挤不上去。

居民们想了一个办法,让市议会出面,要求谷歌地图和苹果地图删除116路公交车。

这招非常有效,从此以后,就几乎没有外地人乘坐这辆车了,座位都空出来了。

这反映了一个现实,在如今这个年代,如果你不存在于数字世界,对于外人来说,你就是真的不存在。

2、陆空一体汽车

东南大学研发的"东大·鲲鹏1号",最近公开亮相。

这是一辆陆空一体汽车,既可以当作汽车四轮行驶,也可以用四轴螺旋桨飞行。

当作汽车时,它的最高时速是60公里。

当作飞行器时,它的最大起飞重量500公斤,最大飞行高度300米,最长飞行时间20分钟。

3、液态空气储能电站

河北石家庄的液态空气储能电站,近日并网运行成功,属于国内首个,一天可以储能发电4000度。

它采用空气液化储能,在需要储能时,把空气降温到零下170摄氏度,转化成液体,就储存在下图这个高12米、直径2.5米的罐子里。

需要用电时,再把液态空气升温变回气体,体积会膨胀600多倍,推动发电机的叶轮旋转发电。

它的最大优点是不受地理条件限制,如果证明了经济上可行,就可以大规模建设。

4、其他

(1)研究发现,那些每月新增50星以上的 GitHub 项目,15%都是买的假星星,整个 GitHub 共有450万的假星星。

(2)用户在微软浏览器 Edge 键入"google",会跳出一个很像谷歌、其实属于 Bing 的页面(下图)。

(3)北京天文台正在举办《问月》展览,展出月壤实物,还有月球基地的想象图。

文章

1、段永平浙大师生见面会问答实录(中文)

段永平1月5日重返母校浙江大学,与现场观众进行交流,这是2万字的现场实录。"我没有鼓励过(别人创业)。我觉得该创业的人根本就不需要你鼓励,你有个很强烈的想法,你就会去做。"(@851235550 投稿)

2、如果 GPU 那么好,为什么我们还用 CPU(英文)

本文通俗地介绍 GPU 和 CPU 的差异,解释为什么它们彼此不能替代,写得很好。

3、如果不断要求 AI 改进代码会怎样?(英文)

作者做了一个有趣的实验,他让 AI 生成一段代码,然后要求 AI 改进这段代码,这样连续做四次,看看会发生什么。

4、关于 SQLite 的各种趣事(英文)

SQLite 是世界使用最广泛的数据库,本文收集关于它的各种趣事。

5、搭建免费的企业邮箱(中文)

本文使用 Gmail + Resend + Cloudflare 搭建免费的企业邮箱,可以接收/发送企业域名邮件。(@javayhu 投稿)

6、旧台式电脑的10个用途(英文)

本文介绍怎么利用旧电脑,提供了一些有用的思路。

工具

1、Sourcebot

开源的代码搜索工具,可以快速对代码建立索引。

2、facad

一个查看目录的命令行工具,类似ls命令,但会显示彩色图标。

3、opfs-finder

在浏览器中实现 macOS Finder。(@hughfenghen 投稿)

4、Termora

开源的终端模拟器,可以当作 SSH 客户端使用,支持 Windows,macOS 和 Linux,采用 Kotlin/JVM 开发。(@hstyi 投稿)

5、Fake Mail

开源的一次性电子邮件服务,使用 Cloudflare worker + Astro 开发,收到的邮件存在 Cloudflare KV,2小时后自动删除。(@CH563 投稿)

6、AYA

开源的跨平台桌面应用,用来简化对安卓设备的操作控制,可以看作 ADB 的图形用户界面。(@surunzi 投稿)

7、简历生成工具

简历生成的开源 Web 应用,通过拖拽和配置,自定义简历布局和内容。(@Arman19941113 投稿)

8、在线剪贴板

作者用 AI 生成的一个简单项目,在线的文本分享网站,会生成分享链接,可设置密码,包括前端和后端。(@zxcv0221 投稿)

9、qrframe

一个定制二维码的网页工具,提供大量选项,代码开源

10、Pipet

一个从 HTML/JSON 提取数据的命令行工具,可以跟 curl 搭配使用。

AI 相关

1、Ollama OCR for web

基于视觉大模型的开源 OCR 文字识别工具,自带 Web 前端。(@dwqs 投稿)

另有一个类似的项目,基于 Gemini 的 OCR 识别。(@cokice 投稿)

2、DeepSeek AI 浏览器插件

开源的浏览器插件,直接在网页上与 DeepSeek 大模型互动,获取选中文本的总结或解答。(@DeepLifeStudio 投稿)

3、AI 生成涂色书

输入关键词,生成免费的涂色书。(@meetqy 投稿)

4、AI Minecraft

Minecraft 与 AI 相结合,打造实时响应、动态生成的开放世界游戏。(@boqiwen 投稿)

5、Smart Bookmark

Chrome 浏览器插件,收藏网页时,自动生成相关标签,无需手动归类。(@howoii 投稿)

6、AnyVoice

AI 声音克隆,只需3秒音频就可创建逼真的声音克隆。(@markliuyuxiang 投稿)

资源

1、如何像计算机科学家一样思考(英文)

一本在线的编程入门教材,以 Python 语言为例,适合用来学习编程。

2、FreePngZone

免费的 PNG 图片搜索,好像只支持英文。(@wangdachui332 投稿)

3、泡泡白噪音

一站式白噪音平台。(@nettsz 投稿)

4、Data Commons

谷歌发布的一个数据网站,提供许多公开的数据集,以及配套的工具,让你可以检索和处理这些数据。

图片

1、积雪乐高

一位瑞典艺术家自制塑料模具,将积雪做成乐高积木的形状。

小朋友用它们搭建雪屋,就像 MineCraft 里面的屋子。

2、AI 乐高模型

Instagram 的账户 @brick4world 专门发布 AI 生成的乐高积木模型。

AI 生成的模型,似乎比人类设计的更有想象力、更漂亮、更吸引人。

文摘

1、AI 的压力

我在谷歌的 AI 团队 DeepMind 工作,感到了 AI 带来的巨大压力。

几个月前,我参加了一个朋友举行的生日派对,很多来宾我认识,但也有很多人不认识。

当时,我的身体状态不太好,无意与其他人多交谈。但是,大家知道我在 DeepMind 工作,就在我的身边排起了小队,每个人都想跟我谈谈 AI。

这么多人对我的工作感兴趣,真是让我受宠若惊。银行家、律师、医生和管理顾问都想了解我对 ChatGPT 的看法,尽管很少有人声称大量使用它,但是所有人都认为他们应该多了解 AI。

我是一名研究人员,这种在社交场合无法关机的感觉,让我觉得压力很大。

后来,情况变得更糟了。我在自己家里,都觉得有压力。一打开新闻网站,里面都在谈 AI。

我就不看新闻了,因为害怕引发焦虑。但即使观看足球比赛或电视剧,广告也会提到 AI。

我想过收拾行李,去那些遥远的小城市,住在寺庙里,但如果那里也以某种方式被 AI 渗透了,我也不会感到惊讶。

事实上,行业里面的大公司都在竞争,看谁能开发最大、最好的大模型,只要你为这些公司工作,这本身就带来压力。

此刻做 AI 研究感觉像是参与了一场战争。模型性能的小小波动,可能就会带来股价几十亿美元的变化。

另外,AI 也为我们带来突然的财富,这也带来各种心理问题。

过去两年,我在 AI 世界的经历是混乱和疯狂的,内心充满焦虑。我想,这并不是个别现象。

言论

1、

根据人均寿命,2025年出生的婴儿将活着看到下个世纪。

-- 《新一代人类》

2、

摩尔定律预测,芯片性能大约每年会翻一番。但是,AI 芯片的发展速度比这快得多。

今天我们发布的 GB200 NVL72 芯片,运行 AI 推理的速度,比去年的上一代 H100 快了30倍,比10年前的芯片快了1000倍。

我们正在超越摩尔定律,AI 适用超级摩尔定律。

-- 黄仁勋,Nvidia CEO

3、

比亚迪正在走特斯拉没有走下去的道路:一面扩大电池和汽车产量,一面降低成本。

-- Hacker News 读者

4、

人类所有的问题,都源于人无法独自安静地坐在房间里。

-- 帕斯卡尔,法国哲学家

5、

正常的小说是自然的顺序,第一章介绍英雄,第二章是英雄开始行动。

但是,你可以交换这两章,现在第一章是英雄开始行动,小说可能以一把枪指着英雄的头部开始。就在紧张气氛达到顶峰时,然后是第二章介绍英雄。这样的话,读者就更有理由想了解这个角色。

同理,先演示幻灯片的第二部分,可能有同样的效果。

-- 《从第二张幻灯片开始演示》

往年回顾

蓝色指示灯的解决方案(#286)

中国的阳光地带(#236)

低纬度,高海拔,气候优势(#186)

利特伍德奇迹定律(#136)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月10日

科技爱好者周刊(第 332 期):西蒙·威利森的年终总结,梁文锋的访谈

作者 阮一峰
2025年1月3日 09:10

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

世界最长的高速公路隧道"天山胜利隧道"本周贯通,长达22.13公里,汽车要在里面开20分钟。它连接了被天山隔断的南疆和北疆。(via

西蒙·威利森的年终总结,梁文锋的访谈

英国程序员西蒙·威利森(Simon Willison)最近两年非常出名,他的个人网站有很多文章,介绍 AI 的最新进展。

本周,他发表了很长一篇的2024年大模型回顾(非官方的中译),非常精彩。

他提到,AI 的发展速度快得难以想象。

一年前的2023年底,排名第一的 AI 模型是 OpenAI 公司的 GPT-4,没有其他模型能超过它。

一年过去了,大家猜猜,GPT-4 现在排名多少?

答案是第69位(上图),已经有18家公司的大模型超过了它。其中的一些模型,甚至可以在笔记本电脑运行。

短短一年,榜首模型就被大量竞争者轻松超过,家用硬件就能达到它的运行效果。AI 的进化速度就是这么惊人。

西蒙·威利森特别提到了来自中国的大模型 DeepSeek V3

DeepSeek V3 是2024年12月25日发布的,来自杭州的量化基金公司幻方量化。一经发布,它就引起了国际范围的轰动。

它在多个参数上,击败了 OpenAI 公司最新的 o1 模型。目前,它在大模型排行榜上排名第7,要知道前十名里面,只有它是开源模型,而且是最少限制的 MIT 许可证,其他都是大公司的专有模型。

而且,它的运行效率很高,训练成本估计只有 Meta 公司的 Llama 3.1 405B 模型的11分之一,而后者的效果还不如它。这就是说,DeepSeek 找到了高效使用硬件、提高模型效果的方法。

西蒙·威利斯说:"DeepSeek V3 的训练成本不足600万美元,是一个极好的迹象,表明 AI 模型的训练成本可以而且应该会继续下降。"

西方媒体就非常好奇,DeepSeek 是怎么做到的?

幻方量化创始人梁文锋,跟其他 AI 模型的研究者不同,没有海外经历,毕业于浙江大学电子工程系人工智能方向。

西方媒体对他充满了好奇,专门将他以前的访谈译成了英文

我觉得,原始的中文访谈( Part 1Part 2)很值得一读,我分享他说的几段话,展示了中国顶级研究者的视野和抱负。

(1)我们要做的不是生成式 AI,而是通用人工智能 AGI。前者只是后者的必经之路,AGI 会在我们有生之年实现。

(2)任何 AI 公司(短期内)都没有碾压对手的技术优势,因为有 OpenAI 指路,又都基于公开论文和代码,大厂和创业公司都会做出自己的大语言模型。

(3)在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

(4)我们不会闭源。我们认为先有一个强大的技术生态更重要。

(5)当前阶段是技术创新的爆发期,而不是应用的爆发期。大模型应用门槛会越来越低,创业公司在未来20年任何时候下场,也都有机会。

(6)过去很多年,很多的中国公司习惯了别人做技术创新,拿过来做应用变现,自己等着摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。中国也要逐步成为贡献者,而不是一直搭便车。

(7)大部分中国公司习惯 follow,而不是创新。中国创新缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才。我们没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

(8)我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

(9)我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

(10)我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

(11)中国产业结构的调整,会更依赖硬核技术的创新。很多人发现过去赚快钱很可能来自时代运气,现在赚不到了,就会更愿意俯身去做真正的创新。

(12)我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多,因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

科技动态

1、AirTag 充电盒

苹果公司的 AirTag 可以追踪物品,但如果没电,就无法追踪了。

一位国外程序员就遇到了这个问题。他的1万美元装备的相机包放在车后座被偷了,当他打开追踪时,才发现里面的 AirTag 忘了换电池,已经无法追踪了。

他痛定思痛,发明了一个 AirTag 充电盒,把两节五号电池跟 AirTag 封装在一起,为后者充电。

据他说,这个充电盒可以持续工作10年,完全不用担心没电。

只要把这个小盒子跟你要追踪的物品,放在一起,就不用管它了,一直可以追踪。

2、无护照过海关

从2024年9月30日开始,新加坡公民通过樟宜机场出入境,不再需要护照了。

机场会使用人脸识别和虹膜识别,来代替护照。这样更省时、成本更低。

纸制护照已经过时了,也许不久将来就会消失。

3、世界最大 3D 打印社区

美国得克萨斯州即将完工世界最大的 3D 打印社区,共有100幢住宅。

这些房子都是一个巨大的 3D 打印机生成的。

房屋的打印材料是混凝土粉末、水、沙子、添加剂的混合物,喷嘴将混合物像牙膏一样挤出,沿着预先编程的路径层层堆叠,形成墙壁。

建筑公司表示,3D 打印房屋更快、更便宜,现场只需要一个操作员,并且最大限度地减少了建筑材料浪费。

单层的三居室或四居室住宅,大约需要三周才能打印好所有墙壁,然后再用传统方式加固地基和安装屋顶。

4、其他

(1)网友发现,Spotify 歌单里面,有些音乐家根本不存在,他们的作品很可能是 AI 生成的,Spotify 以此减少付出的版权费。

(2)百度推出"Ai 搜",汇集了各种 AI 相关功能。

文章

1、2024年 Linux 发行版推荐(英文)

作者介绍他心目中,各种用途最佳的 Linux 发行版。

2、中美工作感想(中文)

"过去四年五个月,我随着工作从 SF 搬到北京,再搬到上海,后来搬回美国在洛杉矶住了一年半。"本文是国内做工程师和美国做工程师的对比。(@wukan 投稿)

3、开发者应该知道的10个终端命令(英文)

本文简单介绍10个终端命令,比如 grep、awk、sed、find 等。

4、Meta 四次面试经历(中文)

"这些年,我一共面试了四次 Facebook/Meta。虽然都未成功,但收获颇多。"(@DoctorLai 投稿)

5、算法面试心得(中文)

本文是作者对如何应付一般的算法面试的知识总结和心得。(@javayhu 投稿)

6、我们用 React 取代了 Next.js(英文)

作者难以忍受 Next.js 的庞杂和性能,改为直接使用 React,不再用基于它的框架了。

7、Windows 的增强剪贴板(英文)

我很少用 Windows,现在才知道它的剪贴板有同步功能,还能永久保存。

工具

1、Ghostty

一个终端模拟器,使用 GPU 渲染 UI,支持 mac 和 Linux。作者是 HashiCorp 公司创始人,参见介绍文章

2、Black Candy

一个自搭建的音乐流媒体服务器,自带手机和 Web 客户端,相当于自己的云音乐平台。

3、curl-impersonate

一个 curl 的改写版,使其发出的 HTTP 请求就像 Chrome/Firefox 发出的。

4、RSS.Beauty

将普通的 RSS/Atom 订阅源转换成美观的阅读界面,代码开源。(@ccbikai 投稿)

5、AI Shadcn 主题生成器

输入关键词,就可以免费生成 Shadcn 主题。(@meetqy 投稿)

6、懒猫书签

开源的 Chrome 插件,一键清理失效链接和空文件夹。(@Alanrk 投稿)

类似插件还有 Bookmark Pro。(@wincatcher 投稿)

7、Nping

Rust 语言开发的 Ping 工具,支持多个地址并发 Ping,并附带实时折线图展示。(@hanshuaikang 投稿)

8、peepDB

一个命令行工具,连接各种主流的关系型数据库,查看表内容。

9、File Pilot

非官方的 Windows 文件管理器,号称可以取代官方的资源管理器。

10、Doggo

一个易用的 DNS 命令行查询工具。

它的官网首页还提供 DNS 在线查询。

AI 相关

1、DeepSeek Coder

根据提示生成 App,基于 DeepSeek V3 模型。(@sing1ee 投稿)

2、GodView

语义化地图,用自然语言查询地图,比如输入"请展示上海的前10大图书馆"。

3、对话 CEO

与马斯克、张一鸣、任正非对话,效果还可以。(@5A59 投稿)

4、ithy

AI 模型聚合网站,输入关键词,同时返回 Lllma 3.1、o1-mini、Sonnet 3.5、Grok 2、Gemini 1.5 pro 的生成结果。

5、AutoMouser

开源的 Chrome 浏览器插件,将鼠标操作通过 AI 转为 Selenium Python 脚本,需要 OpenAI key。(@guoriyue 投稿)

资源

1、search the arXiv

arXiv 论文库的搜素引擎,使用自然语言搜索。

2、《算法(第4版)》的 C++ 实现

这个仓库包含《算法(第4版)》教科书介绍的算法的 C++ 语言实现,与原书的 Java 实现相对应,(@landerrosette 投稿)

3、EmojiClick

使用自然语言搜索 Emoji 符号。(@yijianbo 投稿)

4、独立开发者工具

该仓库收集独立开发者出海技术栈和工具。(@yaolifeng0629 投稿)

图片

1、世界最美钞票

2023年,国际钞票协会评选当年的"世界最美钞票"。得奖者是东加勒比中央银行发行的2元纸币。

这张钞票色彩缤纷,确实非常漂亮。正面是当地板球明星,以及银行标志、乌龟和鱼。

背面是鱼、珊瑚、海龟、蓝色岛屿地图。

2、行业圣诞树

上周圣诞节,美国媒体贴出了,各行各业搭建自己圣诞树的照片。

披萨店的外卖盒圣诞树。

家装店的玻璃圣诞树。

修路队的交通锥圣诞树。

书店的圣诞树。

电脑店的圣诞树

超市的香蕉圣诞树

文摘

1、亚马逊河为什么没有桥?

南美洲的亚马逊河是世界第二长的河流,仅次于非洲的尼罗河。

但是,这条河没有一座桥,是唯一一条没有任何桥梁的世界主要河流。这是为什么呢?

首先,每年的雨季,亚马逊河都会泛滥,河流的宽度会从旱季的5公里变成50公里,就像下图那样,很难造桥。

其次,亚马逊河沿岸人烟稀少,只有很少几个城镇。最大一个城市的人口只有50万,不存在前往河对岸的强烈需求。

最后,亚马逊河两岸都是原始森林,并没有现成道路。如果造桥就需要砍伐大量森林,修建引桥和公路,环境代价很大。近年来,环保意识逐渐高涨,反对造桥的呼声也就越来越大。

言论

1、

由于 AI 的出现,英语正在成为最热门的新编程语言。

-- Andrej Karpathy,著名的 AI 科学家

2、

除非手机可以当成电脑使用,否则我不打算再为性能升级手机了,不再为越来越快的 CPU 买单了。

-- Android Authority 专栏作家

3、

保护海底光缆不出事是不可能的,你唯一能做的就是建立大量冗余,在不同位置铺设数十根光缆可能比保护它们更便宜。

-- Hacker News 读者

4、

强大的工程师不在于速度快或产出高,而在于能够完成其他工程师无法完成的任务。弱小的工程师几乎任何任务都完成不了。

如果你和一个弱小的工程师一起工作,你可以帮他,但一定要保护好你的时间,防止他把你的时间都消耗光。

-- 《强大的工程师与弱小的工程师》

5、

人工智能并不是释放我们的想象力,而是外包它们。

-- 英国《卫报》

往年回顾

为什么 PPT 不如备忘录(#285)

青年失业率与选择创业(#235)

美国宪法拍卖,一个区块链案例(#185)

什么行业适合创业?(#135)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月 3日

科技爱好者周刊(第 331 期):你可能是一个 NPC

作者 阮一峰
2024年12月27日 08:19

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

南京城北万象汇商场,与红山动物园合作,架设了一个38米高的长颈鹿。(via

你可能是一个 NPC

最近,美国发生了一起轰动的大案,一家医疗保险公司的 CEO 当街被人击杀

嫌疑人很快抓到了,是一个26岁的青年,名为路易吉·曼吉奥内(Luigi Mangione)。

媒体纷纷挖掘这个青年的背景,发现他是一个作家的粉丝。

就在几个月前,他向作家打赏200美元,并进行了多次视频通话。

媒体就去采访作家,询问两人在通话中说了什么。

作家详细地回忆了他们的通话内容。其中有一段,我觉得很有意思,分享给大家。

曼吉奥内对作家说,他很喜欢作家的一篇文章《你可能是一个 NPC》

NPC 指的是电子游戏的"非玩家角色",比如路人、门卫、警察等等,用来模拟现实环境,由程序控制,一举一动都是设计好的,没有自主意识。

作家的那篇文章提出,人类越来越像机器人,彷佛 NPC 那样,行为逻辑都是预设好的

曼吉奥内高度认同这个观点。他前不久去日本旅行,认为日本充满了 NPC。他说了一件亲身见闻。

一天早上,他在街上看到一名男子癫痫发作,倒在地上。他跑到最近的警察局求助,警察就跟着他去现场。

路上遇到了红灯,警察立刻就停下来,坚持要等绿灯再过马路,即使那时马路上根本没有汽车。

曼吉奥内很不理解,病人正在发病,神智不清,可能有生命危险,警察却坚持遵守交通规则。救人难道不是更重要的事情吗?

他由此认为,日本人"缺乏自由意志",规则怎么说就怎么做,不会自主行事,就是活着的 NPC

他还观察到,日本存在一种"隐蔽族"(hikikomori),他们不出门,一个人整天待在卧室里,用电子游戏、上网、视频来消磨时间。

曼吉奥内认为,这些人也是 NPC,他们失去了对生活的控制,无法参与社会生活,就选择放弃,等于丧失了生活的自主权。

他观察到,这种现象不仅存在于日本,正在向全世界蔓延,世界各地越来越多的人正在成为 NPC。他们要么无法自主的生活,要么无法选择自己的行为,而是根据规则和指令来行事,就像被程序控制一样。

科技公司推动和加剧了这种趋势,互联网使得人们越来越分心,把时间都花在网上肤浅的娱乐,不再集中注意力于自己的生活,把生活都交给程序,无法形成自主的意识和行为。

以上就是曼吉奥内的观点,我认为是很真实的观察。一方面,人工智能使得机器人越来越像人类,另一方面,人类的自主性在消退,越来越像机器人。现实与游戏、人类与机器人,越来越难以区分了。

AI 编程挑战赛,即将报名截止

这几期的周刊一直在介绍,正在举行的全国 AI 编程挑战赛。

它的报名马上就要截止了。

(1)应用赛道的作品提交,到1月5日截止。如果你有好的创意,能用 AI 做出可运行的作品,就可以报名参加。

(2)如果你善于刷题,可以报名参加算法赛道,但不能用 AI 来解算法题。

我是鼓励大家参加。大赛有丰厚奖品,设了20万的奖金池,获奖者还有机会拿到岗位 offer。就算没得奖,也是一个很好的锻炼,能够动手编程、熟悉 AI。

大赛由豆包 MarsCode 和稀土掘金技术社区共同主办。详细介绍和报名方法,请看前两期的周刊,或者点击这里

科技动态

1、观鸟神器

一个美国女子发明了一种观鸟神器,在网上引起了轰动。

她在墨镜上挂了一个托盘,上面洒了鸟食。小鸟就会停在上面,完全没有意识到,就停在她的鼻子前面。

这种观鸟神器,简单又体验独特,怎么以前没人想到。

2、自豪版本规范

一个开发者提出自豪版本规范(pride versioning),对软件版本进行编号。

如果你对新功能感到非常自豪,就发一个大版本(递增第一个版本号),否则就发一个小版本(递增第二个版本号)。

如果你对某个地方感到尴尬和羞耻,就发一个补丁版本进行改正(递增第三个版本号)。

3、能量收集电子贺卡

一位国外的程序员,制作了一张可以收集能量的电子贺卡。

这张贺卡就是信用卡大小,上面有电路,但是不带电池,通过收集周围环境的能量,LED 灯会闪烁。

最简单的方式,就是放在灯光下,它会收集光能。

你也可以用 USB 供电。

它甚至可以放在路由器或微波炉旁边,吸收 WIFI 和微波的能量。

4、糖打印机

你想过用糖来 3D 打印吗?有人就真的做出了一台糖打印机。

它用热风枪,将白砂糖吹塑成型,打印出各种形状。

下面是它打印的一颗钉子。

它可以打印出很复杂的形状。

这些东西都可以食用,因此这种机器在食品行业应该很有用,在夜市可能也会很轰动。

文章

1、我的几何人生(中文)

著名华人数学家丘成桐,回顾自己的成长道路。

2、编程十年的感悟(中文)

"代码写多了才意识到,程序员的竞争力并不是写代码,也并不是哪门语言或者框架, 其核心竞争力是通过技术解决问题的能力"。(@ramsayleung 投稿)

3、我给博客添加 dark mode(中文)

作者介绍他为博客添加 dark mode 的处理方法和注意事项。(@Spike-Leung 投稿)

4、七个最佳的生产力 Docker 镜像(英文)

本文介绍七个可以自己用 Docker 镜像架设的生产力服务。

5、不可变 Linux 发行版(英文)

越来越多的开发者开始使用不可变的 Linux 发行版(immutable Linux distro),即系统文件在运行期间不可更改。这样会让系统更稳定,也更容易迁移和回滚。

6、macOS 命令行内置的工具程序(英文)

本文介绍 macOS 内置的一些命令行工具程序,比如 security、open、pbcopy、pbpaste 等。

工具

1、YunoHost

一款虚拟机软件,内置了常见的云服务,可以一键启用,省去了安装云服务的麻烦,参见介绍文章

2、MarkItDown

微软官方推出的工具,将各种格式的文件(主要是 Office 文件)转成 Markdown 格式。标题是 GitHub 仓库链接,下面是线上体验

3、爱幕

在线字幕编辑器,支持音频提取和字幕翻译,免费使用,自己部署需付费。(@zhw2590582 投稿)

4、Beautify Screenshots

截图美化工具。(@cxhello 投稿)

5、单词收藏助手

Chrome 插件 + 微信小程序,在网页上收藏单词,建立自己的词库,然后通过小程序加强记忆。(@yuuk 投稿)

6、Free Open Graph Image Generator

根据模版制作"网页分享图"(open graph)的在线工具。(@javayhu 投稿)

7、Kyanos

一个命令行的网络流量采集和分析工具,具有较强的数据过滤和分析能力。(@hengyoush 投稿)

8、在线 Excel 协同编辑器

一个开源的类 Excel 电子表格网页应用,支持多人协同编辑。(@nusr 投稿)

9、红枫云盘(maple-file)

一个多协议云端文件存储的客户端,支持安卓和 macOS,基于 Flutter + Go 开发。(@honmaple 投稿)

10、GitHub Cards

将 GitHub 用户个人数据转换成卡片图。(@iAmCorey 投稿)

AI 相关

1、GCOP

基于 AI 的 Git 提交消息生成和工作流程优化工具。(@Undertone0809 投稿)

2、github-assistant

该网站可以对 GitHub 代码库提问,由 AI 来回答,比如"过去30天谁的提交次数最多"。

3、Liubai

开源的微信机器人,在微信里面同时调用三个 AI 模型,完成各种任务。(@yenche123 投稿)

4、AI OCR

在线免费 AI OCR(图片文字识别)工具,所使用的前端代码和 AI 提示词见这里,灵感来自 llama-ocr。(@ringcrl 投稿)

5、Smart Alt Text Generator Generator

上传图片,生成 SEO 友好的 alt 描述,支持多种语言。(@wang1309 投稿)

6、AI 调色盘生成器

该网站可以根据输入的关键词,生成对应的色彩组合。

资源

1、WebSpy.Site

网站流量分析平台,根据域名查询网站流量情况。(@wincatcher 投稿)

2、PNGFree.ai

免费的百万级 PNG 图片库。(@shawnlee000 投稿)

图片

1、无头鸡

1945年,一个美国科罗拉多州的农民杀鸡时,砍掉了一只五个半月大的鸡的大部分头部。

但是没有砍到颈静脉,并且一只耳朵和大部分脑干完好无损。因此,这只鸡虽然没有脑袋了,仍然可以保持平衡并笨拙地行走。

农民发现这只鸡没有死,就决定继续养它,用滴管给它喂食。

后来,这只鸡被巡回展出,门票是25美分,每月为主人带来4,500美元收入。

1947年3月,它死于巡回展出途中。

2、Windows 3.1 时钟

市场上出现了 Windows 3.1 时钟,钟面就是 Windows 3.1 的桌面,看上去很有怀旧感。

注意,上图的钟面不是液晶屏,而是印刷上去的。它是石英钟,使用一节五号电池。

文摘

1、长期软件开发

有些领域的软件会持续运行几十年,比如发电厂、起搏器、飞机、桥梁、重型机械的软件。它们可能几年都不会改动,然后推出一个新的大版本。

如果一个软件的开发周期长达几十年,需要长期维护,那么最好做到下面几点。

(1)尽量减少依赖。

软件的依赖项越多,长期越难以维护。依赖包括开发时依赖和运行时依赖,都是越少越好。

现在,很多软件在运行时会调用云服务,这也不利于长期维护。

(2)完备的测试用例。

测试对于重构、删除/添加功能,会提供极大的帮助。当你中断3年后,重新开始开发,测试也会让你快速了解系统。

(3)减少复杂性。

复杂性是软件开发的头号敌人,会让最好的程序员和团队都铩羽而归。

由于熵增定律和人类行为,除非你有意识地遏制,否则复杂性总是会增加。

因此,你需要养成严格的开发习惯:尽早和频繁地重构,删除不必要的或重复的代码,花时间简化。

(4)编写简单无趣的代码。

代码越简单越好,重点是代码的运行逻辑要显而易见。你永远不会后悔编写了简单的代码。

那些看上去很聪明、很高深的代码,会让后期的调试和理解变得复杂。特别注意那些高性能代码,只有当你正确理解它们时,它们才有效。

另外,那些眼下时髦、被热炒的明星技术,如果没有得到充分验证,也需要规避。

你最好只使用至少有10年历史的可靠技术。有一条规则是,某项技术的寿命与它们当前的年龄成正比,即存在越久的东西越可能继续存在。

(5)日志、遥测和文档

如果软件不是持续更新,开发者的注意力就会转到其他地方,不会立即跟进,所以需要有日志和遥测,能把运行过程记录下来。

文档则可以帮助我们理解几年前、甚至十几年前,编写原始代码时的想法。可能的话,记录所有事物,不仅仅是代码,还有理念、想法和为什么。

(6)团队

团队人员变化是很常见的。在许多地方,在一个团队呆三年,就已经很久了。虽然你可以用良好的文档和出色的测试,来抵消这种人员变化,但这很困难。

软件长寿的最简单办法之一,就是让开发成员长期稳定,保持工作十年。这意味着,你必须给你的程序员提供良好待遇,否则人们会离开。

在某些地方,软件是外包公司或咨询顾问写的,他们将代码丢到你的系统中后离开。对于长期运行的软件,这是非常糟糕的安排。

(7)开源

让你的代码暴露在外界的眼光,是保持代码可靠的好方法。一个有趣的事实是,只有质量良好的代码,人们才愿意对外分享,也就是说,如果不开源,人们会愿意在组织内部接受质量更差的代码。

开源代码有更高的标准、更多的测试,这是让代码不过时的绝佳机制。

言论

1、

银行的 API 特别难用,设计得也很奇怪。我在为银行工作时,发现了原因。

API 不是银行通信的方式,文件才是。银行执行的指令,不是通过我们习惯的 API 传送,而是通过文件接收。

-- 《为什么软件工程师与银行整合如此痛苦?》

2、

美国有很多问题,绝非理想的社会,但是第三世界国家的很多人,尤其是低收入人群,尽管对美国的真实情况一无所知,依然非常向往。

在他们心目中,美国有财富、空间、自由、人性化管理等等。这不是真实的美国,而是美国在他们心目中的投影,他们向往的其实是自己想象中的生活方式。

这是美国的一个很大的优势,尽管自身的诸多问题,依然能够对其他国家的人民产生吸引力。

-- 《美国比欧洲好吗?》

3、

产品经理的职责就是三件事:(1)了解用户需求;(2)提出解决方案;(3)安排任务执行。

-- 《产品经理的 AI》

4、

一个生物学家说过:"每个细菌的梦想都是变成两个。" 这是生活的基本真理:你经历的一切只是使自己更加重要的一种手段。

-- Sean Carroll,进化生物学家

5、

我喜欢科学的一点是,无论你喜不喜欢,它都会让你相信。

-- 肖恩·卡罗尔,物理学家

往年回顾

YouTube 有多少个视频?(2023 #284)

AI 聊天有多强?(2022 #234)

政府的存储需求有多大?(2021 #184)

未来的游戏业比现在大100倍(2020 #134)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月27日

科技爱好者周刊(第 330 期):李开复梳理人工智能

作者 阮一峰
2024年12月20日 08:17

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上个月正式开放的杭州良渚玉湖公园,公园的设计象征良渚文化和运河文化的连接。(via

李开复梳理人工智能

前些日子,我读了李开复老师的两本书:《AI·未来》(浙江人民出版社,2018)和《AI·未来进行式》(浙江人民出版社,2022)。

这两本书都是面向社会大众解释 AI,不是技术类书籍,但是有一些段落,阐述 AI 概念。

李开复老师用通俗的语言来解释,人工智能、机器学习、神经网络、深度学习......这些词到底是什么意思?彼此有什么关系?

我觉得,这些介绍对理解 AI 的体系,挺有启发的。它们分散在各个章节,我将它们整理在一起。

为了行文连贯,我没有完全照搬原文,而是用自己的语言重新叙述,如果有错误,也归咎我。

(1)人工智能

1956年夏天,计算机科学家约翰·麦卡锡(John McCarthy)首次提出"人工智能"(AI)这个概念。

人工智能指的是,通过软件和硬件,来完成通常需要人类智能才能完成的任务。它的研究对象,就是在机器上模拟人类智能。

(2)机器学习

早期,人工智能研究分成两个阵营。

第一个阵营是规则式(rule-based)方法,又称专家系统(expert systems),指的是人类写好一系列逻辑规则,来教导计算机如何思考。

可想而知,对于复杂的、大规模的现实问题,很难写出完备的、明确的规则。所以,这种方法的进展一直很有限。

第二个阵营就是机器学习(machine learning),指的是没有预置的规则,只是把材料提供给计算机,让机器通过自我学习,自己发现规则,给出结果。

(3)神经网络

神经网络(neural network)是机器学习的一种主要形式。

神经网络就是在机器上模拟人脑的结构,构建类似生物神经元的计算网络来处理信息。

一个计算节点就是一个神经元,大量的计算节点组成网络,进行协同计算。

神经网络需要极大的算力,以及海量的训练材料。以前,这是难以做到的,所以20世纪70年代开始,就陷入了停滞,长期没有进展。

(4)深度学习

深度学习是神经网络的一种实现方法,在20世纪80年代由杰弗里·辛顿提出。它让神经网络研究重新复活。

深度学习是一种让多层神经元可以进行有效计算的方法,大大提高了神经网络的性能。"深度学习"这个名字,就是比喻多层神经元的自主学习过程。

多层神经元包括一个输入层和一个输出层,它们之间有很多中间层(又称隐藏层)。以前,计算机算力有限,只能支撑一两个中间层,深度学习使得我们可以构建成千上万个中间层的网络,具有极大的"深度"。

(5)Transformer

早些年,深度学习用到的方法是卷积神经网络(CNN)和循环神经网络(RNN)。

2017年,谷歌的研究人员发明了一种新的深度学习处理方法,叫做 Transformer(转换器)。

Transformer 不同于以前的方法,不再一个个处理输入的单词,而是一次性处理整个输入,对每个词分配不同的权重。

这种方法直接导致了2022年 ChatGPT 和后来无数生成式 AI 模型的诞生,是神经网络和深度学习目前的主流方法。

由于基于 Transformer 的模型需要一次性处理整个输入,所以都有"上下文大小"这个指标,指的是一次可以处理的最大输入。

比如,GPT-4 Turbo 的上下文是 128k 个 Token,相当于一次性读取超过300页的文本。上下文越大,模型能够考虑的信息就越多,生成的回答也就越相关和连贯,相应地,所需要的算力也就越多。

豆包 MarsCode 动手实验室(杭州站)

先提一下,上周说的全国 AI 编程挑战赛

应用赛道的作品提交,从12月16日已经开始了,大家可以上传自己用 AI 完成的作品了。

算法赛道目前还在报名中,只要你有信心,在 AI 的辅助下解出算法题,不妨报名试试,也是一种体验和锻炼。

比赛规则和报名链接,请访问这里,也可以看上周的周刊。

(此处有分隔线)

本周介绍的活动,是12月28日(星期六)下午两点,在杭州的字节工区举行的豆包 MarsCode 动手实验室

到时,大家可以现场深度体验豆包 MarsCode 的 AI 编程能力,并跟字节的同学当面交流。在动手环节,你可以用 AI 实现自己的创意。如果你的作品很优秀,还有机会直通 AI 编程挑战赛的决赛。

活动的详细介绍,以及报名链接,请访问这里

科技动态

1、硬盘打孔机

硬盘报废时,一般需要擦除数据。最保险的方法,莫过于物理破坏硬盘。

但是,这样很费事,你要找把锤子,把硬盘敲碎了。

为了解决这个问题,一家日本公司推出了"硬盘打孔机"。这种机器可以在硬盘上轻松打四个孔,保证彻底破坏数据。

它采用电动液压系统,产生12吨的压力,足以穿透任何硬盘。

它的尺寸为 410 x 289 x 187 毫米,跟台式电脑差不多大小,但是重达18公斤,适合那些有成千上万硬盘需要销毁的大公司。

2、沙子国际象棋

一位英国设计师用沙子作为材料,3D 打印了一套国际象棋。

他说,这样做只是为了追求一种奇特的感觉。沙子是一种无形且流动的材料,塑造成坚固耐用的东西,让人感到难以把握、随时可能变化。

而且,沙子表面是不光滑的,当你用沙子下棋时,会有真实的、与众不同的触觉。

3、玻璃砖

大家考虑过吗,房子为什么需要墙?难道不能建造一所没有墙、全部是窗户的房子吗?

回答是不能,因为建筑的重量由墙承受,窗户不承受重量。如果把墙全改成窗户,建筑物就会倒塌。

那么,能不能用玻璃来造墙呢?玻璃既可以承重,又可以透光。

麻省理工学院的科学家,最近就发明了这样一种全透明的玻璃砖(上图),根据测试具有跟普通砖相同的承重能力。

除了透光,玻璃砖还有一个好处,可以重新利用。只要高温加热,玻璃砖就会融化,能够塑造成其他形状,还能 3D 打印,但这也导致它不防火。

总的来说,玻璃砖比红砖更环保,在很多场合有推广潜力。

4、其他

(1)本周发生了一笔史上最大的风险投资,AI 公司 Databricks 一次性募集了100亿美元。

(2)GitHub 宣布,编程助手 GitHub Copilot 向所有用户免费开放。

(3)OpenAI 推出了免费电话 1-800-ChatGPT,北美用户可以拨打该电话,跟 AI 语音聊天,每月额度为15分钟。

(4)小米官方开始支持,小米物联网设备接入智能家居管理助手 Home Assistant。

文章

1、汇编语言的一点入门介绍(中文)

这篇短文通俗解释了汇编语言的基本概念。

2、CSS 网格区块详解(英文)

这篇长文详细介绍 CSS grid 布局的区块功能(template area)。

3、网页如何插入 JSON-LD 语义数据(中文)

本文详细介绍网页的 JSON-LD 数据块,用来插入机读的语义数据。

4、13个对前端开发有用的 Chrome 插件(英文)

本文介绍13个用于前端开发的 Chrome 插件。

5、谷歌不再是最好的搜索引擎(英文)

本文是一篇新闻分析,作者认为 Perplexity 的 AI 搜索体验已经优于谷歌了。

6、如何为 Windows 添加6个 macOS 最好的功能(英文)

一篇 Windows 使用技巧,教你怎么为 Windows 添加一些 macOS 功能,比如文件浏览器可以文档预览。

工具

1、Presenterm

将 Markdown 文件转成幻灯片,在命令行播放的开源工具。(@lengyijun 投稿)

2、Rslib

制作 JavaScript 软件包的工具,可以直接开发组件库和命令行工具。(@fi3ework 投稿)

3、Midscene.js

AI 驱动的网页 UI 自动化测试框架,通过文字描述,生成 UI 测试用例。(@yuyutaotao 投稿)

4、wechatDataBackup

Windows 桌面 PC 端的微信聊天记录一键导出。(@git-jiadong 投稿)

5、MoeMail

基于 Next.js + Cloudflare 技术栈构建的临时邮箱服务,在线体验。(@beilunyang 投稿)

6、my-github-2024

一个 Python 程序,生成你在2024年的 GitHub 代码提交统计。(@WCY-dt 投稿)

7、Vanilla

Canonical 公司的 CSS 框架,就是 Ubuntu 官网采用的样式。

8、OpenAuth

网页登录的第三方认证的集成库。

9、Schemio

基于 Web 的示意图可视化编辑器。

10、Buzee

一个桌面软件,提供本地文件的全文搜索(包括图片里面的文字),支持 Windows 和 Mac。

AI 相关

1、Hika AI

免费的 AI 搜索。(@atlas-comstock 投稿)

2、Slea.ai

免费的 AI Logo 生成器。(@aaamomo64 投稿)

3、AI 音效生成器

免费生成各种音效,比如雨声、风声。(@aurthur 投稿)

资源

1、SQL 风格指南

一份书写 SQL 语句的风格约定。

2、颜色代码表

在线配色设计工具集,做在一个网站。(@nettsz 投稿)

图片

1、机器蜻蜓

美国首都华盛顿的中央情报局博物馆,有一只上个世纪70年代制造的机器蜻蜓。

它其实是一架微型直升机,飞到目标对象附近,窃听对方的谈话。

这只蜻蜓可以飞200米,然后落下来,通过激光捕捉空气振动,来还原谈话声。

但是,它不防风,也难以控制,所以从来没有实际用过。

2、荷兰的邮资代码

荷兰寄信不用邮票,而是用一种9个字母和数字组成的代码。

你花钱买一个代码,以 3 x 3 的格式写在信封上,就能代替邮票,作为付款证明。

因为代码的有效期只有五天(以邮戳为准),需要购买后及时寄出,被猜到的可能性很小。

文摘

1、没有编程生产力这样的东西

正如马丁·福勒(Martin Fowler)所观察到的那样,程序员的编程生产力无法有效地衡量,因为它不存在。

软件开发并不是一项必然会产生任何东西的活动。

假设你有两个开发人员在同一个项目上工作,并且偶然地,他俩在同一天接受了相同的任务。

甲写了一个1000行的框架,完美地解决了这个问题。代码编写良好,并经过充分测试,每一步都有详细记录。

乙则是当天去了公园,一边喂鸽子一边思考问题,然后漫步回到办公室,删除了100行代码,部署了更改......问题就解决了。

请问谁的生产力更高?

回答是,这不重要。重要的是乙解决了问题,同时降低了团队的长期维护成本。甲也解决了这个问题,但是他通过增加代码,增加了维护成本,因此(在其他条件相同的情况下)他的解决方案较差。

我们能说,乙具有更高的生产力吗?显然,很难找到编程生产力的正确衡量指标。

我认为,优秀的软件开发者所做的就是解决问题。但是,生产力的衡量指标,比如代码、文档、数据等等,都只是解决问题的工具,并不是解决问题本身。

言论

1、

我写 SQLite 的时候,从来没人教过我 B 树的知识。我需要自己实现 B 树,我就从书架取下高德纳的《计算机编程艺术》,找到了 B 树的章节。他描述了算法,我就照着实现。

有趣的是,高德纳详细介绍了搜索 B 树和插入 B 树的算法,没有提供从 B 树删除数据的算法,这是放在本章末尾的练习。所以我在实现自己的 B 树之前,还必须先做完该章的练习。谢谢高德纳,我真的很感激。

-- 理查德·希普《SQLite 不为人知的故事》

2、

瑞典南部的马尔默市,洗一次10分钟的淋浴,电费高达2.65欧元(约20元人民币)。原因是该市接入的是德国电网,德国能源短缺,推高了电价。

-- 《瑞典能源危机》

3、

职业生涯最重要的一课是,你需要认识到,你工作的目的不在于使得公司的客户满意,而在于使得那些控制你的加薪、奖金和晋升的人满意。

-- Hacker News 读者

4、

正在开发的水下无人机技术,会使得以航空母舰为中心的海军战略过时,从而大幅削减军事开支。

举例来说,美国开发的水下无人机 Orca XLUUV,可以携带8吨的有效载荷,行驶数千英里,并且不需要长时间浮出水面。

-- Hacker News 读者

5、

我第一次尝试 MidJourney(文生图工具)和 Suno(文生音乐工具)时,我想知道未来是否每个人都会成为数字艺术家。

很快,我就意识到我没有"创作冲动",即使看过很多别人的创作,我也常常不清楚自己想要创作的东西。

因此,未来的 AI 即使具备无比强大的绘画和编曲能力,还是只有少数人能成为画家和音乐家。程序员也是如此,即使 AI 会编程,也无法人人成为程序员。

-- 《Cursor 深度体验》

往年回顾

没有目的地,向前走(2023 #283)

生活就像一个鱼缸(2022 #233)

腾讯的员工退休福利(2021 #183)

贵州变瑞士,有没有可能?(2020 #133)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月20日

科技爱好者周刊(第 329 期):示意图利器 D2

作者 阮一峰
2024年12月13日 08:06

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

哈尔滨冰雪大世界即将开园,工人正在松花江上采冰,每天需要开采近万块大冰块。(via

示意图利器 D2

制作示意图的工具有很多。

我喜欢使用基于文本代码的作图工具,来绘制线框图,比如 Mermaid、Plantuml、Graphviz。

它们都能根据代码,生成图片,非常适合放入代码仓库,进行版本管理。

最近,我发现了一个更易用的同类工具 D2,简单直观,功能强大,下面介绍给大家。

D2 可以命令行使用,也可以浏览器使用。假定你有一个图片代码文件example.d2,那么生成图片的命令如下。

$ d2 example.d2

大部分时候,我都通过浏览器使用它。它有一个线上生成器 play.d2lang.com(下图),把代码贴进去,按下"compile"按钮,马上生成图片。

想要 A 节点(节点的名称为 A),直接输入 A 就可以了。

A

A 只是节点名称,如果要定制节点的内容,就像下面这样写。

A: 甲

接着,添加一个节点。

A: 甲
B: 乙

把它们连起来。

A: 甲
B: 乙
A -> B

连接可以用正箭头(->)、也可以用反箭头(<-),甚至双向箭头(<->)。如果不需要箭头,就直接连线(--)。

箭头上还能添加文字。

A: 甲
B: 乙
A -> B: 连接

节点之间可以有多根连线。

A: 甲
B: 乙
A -> B: 请求
A <- B: 响应

节点的连接也可以写在一行。

甲 -> 丙 <- 乙: 连接

阶段一 -> 阶段二 -> 阶段三 -> 阶段四
阶段四 -> 阶段一: 反馈

这些语法就够画出基本的线框图了,是不是挺简单。

D2 可以绘制非常复杂的图,更多语法参考文档

最后提一下,如果想修改节点形状,方框改成圆形,就像下面这样写。

A: 甲
A.shape: circle

形状甚至可以改成一朵云,表示云服务。

A: 甲
A.shape: cloud

线条颜色也可以改。

A: 甲
A.style.stroke: red

[活动] AI 编程挑战赛

程序员同学看过来,全国性的 AI 编程大赛来了。

只要你善用 AI 编程,在 AI 的帮助之下,做出创新应用,或者快速解出算法题,就能参赛。

参赛不仅锻炼 AI 编程能力,还能丰富自己的经历,如果得奖,就能在简历上写一笔,帮助就业。

(1)比赛总奖池20万,一等奖的奖金4万元。学生和非学生分开评奖,获奖者还有 offer 机会,可以直通终面(包含实习岗与正式岗)。

(2)比赛分为算法和应用两个赛道,可以提交自己的创新应用,也可以选择完成算法题。

(3)大赛现在已经开始报名。创新应用在12月16日开放作品提交,算法比赛现在可以参加线上常规赛,决赛是线下举行的黑客马拉松。

(4)两个赛道的决赛阶段,都要求使用豆包 MarsCode 的 AI 编程能力,作为辅助工具。

本次 AI 编程巅峰挑战赛,由豆包MarsCode 和稀土掘金社区共同发起,面向全国程序员。大赛规则和报名入口,详见活动官网,也可扫描上方海报二维码,祝愿大家得奖。

科技动态

1、深湖冷却

加拿大最大城市多伦多,就在安大略湖旁边。安大略湖是一个很深的湖,最深处达到244米。

多伦多市正在建设一个非常酷的项目,使用安大略湖底的冷水,为城市提供冷却系统。

安大略湖底部的水温是很低的,该项目从水底85米处取水,即使盛夏,水温也只有4摄氏度。

这些水经过40公里的管道,进入市中心的热交换站,为城市带来天然的冷气。

2、自走桌

一位国外工程师,制作了一张会自己行走的桌子。

这张木头桌子有12条腿,每次可以同时移动三条腿,每条腿都用电机驱动。

桌子内部有无线接收器,用来接收遥控信号。远端计算机发出遥控命令,并计算出移动哪几条腿,每条腿移动的角度和幅度。

3、瘫痪网络的机器狗

很多犯罪分子都在屋外装了摄像头,监控室外的风吹草动。

美国国土安全部研发了一款机器狗,它的唯一作用就是瘫痪无线摄像头的通信。

这个机器狗配备了一个天线阵列,接近目标后,会侦测周围无线信号的频率和信道,然后发送大量干扰信号,使得网络堵塞,无法通信。

所有无线通信的智能家居设备,都会因此失效,包括摄像头。所以,重要地点的摄像头必须是有线的。

4、无豆咖啡

一些西方公司最近推出"无豆咖啡",就是不使用咖啡豆制作的咖啡。

它采用废弃的枣子或果核,提取生物质,然后添加提取自茶叶的咖啡因,使其具有咖啡的味道。

因此,它比较环保,可以减少食物垃圾,也不必破坏森林种植咖啡树。

据说,它的味道非常接近优质咖啡,普通人喝不出差异。只是成本不便宜,略高于传统的优质咖啡豆。

文章

1、CSS 重置(2024版)(英文)

作者提出,最新的 CSS 重置(CSS reset,即更改浏览器默认样式)只需要9条规则,每一条都详细解释。

2、Monokai 的历史(英文)

本文介绍流行的代码编辑器配色方案 Monokai 的诞生历史。

3、并发运行(Concurrency)和并行运行(Parallelism):以 JavaScript 为例(英文)

本文解释并发和并行的区别,然后给出 JavaScript 的示例。

4、直接链接网页的某段文本(英文)

浏览器现在支持,URL 直接链接到网页的某个文本片段(text fragment)(上图的高亮部分),本文介绍如何使用。

5、了解多重 DNS(英文)

多重 DNS 就是同一个域名有多个 DNS 解析记录,可用来均衡负载。作者就测试了,均衡负载是否真能生效。

6、感知器是什么(英文)

本文解释神经网络的基础概念"感知器"(Perceptron)。

工具

1、EasyTransfer

开源的文件传输工具,匿名加密,只需访问网页,即可连接到其他设备,基于 webRTC 和 Vue.js,访问试用网址。(@ch3ny4ng 投稿)

2、Screen Sharing

从浏览器分享你的屏幕给其他人,适合用来演示。(@markliuyuxiang 投稿)

3、PMAtron

将 phpMyAdmin 用 Electron 封装成跨平台桌面软件。(@MaskerPRC 投稿)

4、FastExcel

基于 Java 语言的 Excel 文件解析工具,可以用来提取数据。(@JerryFan626 投稿)

5、Readest

一款开源电子书阅读器,跨平台桌面应用,基于 Next.js 15和 Tauri v2。(@chrox 投稿)

6、IMG2AVIF

一个网页工具,将各种格式的图片转成 AVIF 格式。(@malagebidi 投稿)

7、YT Pics

一个 Web 应用,输入 YouTube 网址和指定时间,它会自动截取该时间的截图。

8、Web2pdf

一个命令行工具,将网页保存成 PDF 文件,有很多增强功能(自定义样式、生成目录等)。

9、CheerpJ

浏览器里面的 JVM 编译器,让 Java 程序可以在浏览器运行。

10、fuzzy-search

一个前端的模糊搜索库,支持东亚语言。

AI 相关

1、BabelDuck

基于 AI 的口语对话练习应用。(@Orenoid 投稿)

2、AIGIF

GIF 动图搜索,可对图片人物进行换脸。(@markliuyuxiang 投稿)

3、Imagenie

跨平台的桌面应用,使用 AI 在本地处理图片,比如人像修复、超分辨率放大、背景移除。(@zhongweili 投稿)

资源

1、启动过程:Android 与 Linux

这篇文章记录了 Linux 和 Android 各自的系统启动顺序。

2、深入高可用系统原理与设计

开源的中文电子书,梳理网络、云、容器、集群等知识。(@isno 投稿)

3、English News in Levels

英语新闻分级阅读网站,实时更新新闻,分为三种难度,有重点词汇、理解测试和朗读音频。(@meterscao 投稿)

4、GitHub Weekly

这个网站将周刊讨论区的投稿,转成新闻卡片形式呈现。(@inshub 投稿)

图片

1、密室照片

2010年,美国互联网上流传一组密室照片,看上去非常空旷神秘。

它们没有任何说明,不知道是在哪里拍的,也不知道是谁拍的。

这样反而激起了网友的兴趣:昏黄的灯光,陈旧潮湿的地毯,黄色的荧光灯和墙壁,无限的空房间,没有任何窗户,你被困在里面。

经过不断转发,这些照片逐渐成为美国互联网经久不衰的一个神话,成为了很多电影和游戏的灵感,比如《命运规划局》、《黑暗城市》、《异次元杀阵》。

最近,通过互联网档案馆(archive.org)的努力,现在终于查明,这组照片是一家家具店的二楼,当时正在进行翻新,一间间的小房间正是家具的陈列室。

文摘

1、大众审美

人们眼中的美和丑,其实都是受到社会的影响,很少有人拥有自己独立的审美标准。

1990年代初期,两位俄罗斯艺术家委托一家美国市场研究公司,进行市场调查,向1001位美国人询问下面的问题。

  • 你最喜欢的颜色是什么?
  • 你喜欢锐利的曲线还是柔和的曲线?
  • 你喜欢光滑的笔触还是厚重的笔触?
  • 你喜欢裸体还是穿着衣服的人物?
  • 你喜欢休闲的人物还是工作的人物?
  • 你喜欢室内场景还是室外场景?
  • 你喜欢什么样的风景?

调查完成后,两位艺术家根据大多数人的偏好,绘制一幅画。理论上,这幅画应该受到最多社会大众的喜爱。

后来,他们又在其他国家做这个调查,得到一个惊人的结果:每个国家的调查结果(即大众偏好),几乎都是一致的。

"人们想要的都是风景画,周围有几个人物,前景是动物,主要色调是蓝色。"

他们根据11个不同国家的调查结果,画出来的11幅画看上去几乎一样。

这证明了,全世界的大众审美正在趋同。从电影到时尚,从建筑到广告,全世界的人们喜欢差不多的东西,各国审美越来越接近,独特性越来越少。

举例来说,AirBnB 上面的公寓,不管是哪个国家,装潢风格很多都是雷同的,可以称为 AirBnB 美学:白墙、原木、胶囊咖啡机、扶手椅、裸砖、木搁板、灯泡。

这种 AirBnB 美学既有工业主义的粗犷原始,又有古典主义的优雅极简。

这种风格还影响到了咖啡店。

世界各地的咖啡店(包括餐厅),也慢慢变得相似:粗糙的木桌、宽大的窗户、朴素的吊灯。

总之,随着互联网连接全球,全世界正在形成统一的大众审美。以后,无论去到哪个国家,旅馆和咖啡店可能都是一样的装修。

言论

1、

我生活中一切顺利的事情都遵循相同的过程:

(1)我关注自己喜欢的​​事情。

(2)我找到多做这些事情的方法。

(3)我让有趣的人很容易发现我在做这些事情。

(4)我和他们一起出去玩,一起做项目。

-- 亨里克·卡尔森

2、

伟大的科学家是想法大胆的人,但是对自己的想法同时持有高度批判的态度。接受自己的猜想之前,他们首先会严厉尝试反驳它。

只有发现很难反驳成功时,他们才相信自己的想法是对的。

-- 卡尔·波普尔,科学哲学家

3、

作为一个至少用过十几种语言进行过商业开发的程序员,我完全不同意有人说,一种语言的编程速度优于另一种语言。

语言的编程速度因人而异,符合程序员的个人经历和思维习惯的语言,写起来最快。

-- Hacker News 读者

4、

我长期以来一直认为地球是一个"水星球",存在着大量的水覆盖星球。

直到我做了数学计算,才意识到地球实际上是太空中的一块湿岩石,更像是用喷雾器喷了十几次的保龄球。

-- Hacker News 读者

往年回顾

电动皮卡 Cybertruck 的 48V 供电(2023 #282)

好用的平面设计软件(2022 #232)

新人优惠的风险(2021 #182)

快能力和慢能力(2020 #132)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月13日

科技爱好者周刊(第 328 期):AI 模型不是一门好生意

作者 阮一峰
2024年12月6日 08:18

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上海南站正在改造,车站的北半部在施工,南半部正常运营,中间用巨大的帘布隔开。

AI 模型不是一门好生意

微软的 Microsoft 365 最近涨价了,涨幅最高的地区为41%。

微软解释,涨价原因是多了 AI 助手 Copilot 的成本。中国大陆因为没有 Copilot,所以不涨价。

无独有偶,OpenAI 也说要涨价,涨幅更夸张。新模型的订阅费可能从现在的每月20美元,涨到每月2000美元

(最新消息是,昨晚发布的 ChatGPT Pro 已经上涨到每月200美元。)

这两条新闻证明了一件事:AI 模型太烧钱,即使世界最有钱的公司都承受不起,只能大幅涨价。

不止微软和 OpenAI,所有经营 AI 模型的公司其实日子都不好过,目前都是亏本卖 AI 服务,争夺市场占有率。

这种运营压力恐怕将长期存在,因为以下的原因,注定了 AI 模型不是一门好生意。

(1)AI 模型需要投入大量资金

OpenAI 每年的运行经费据报道是70亿美元,Anthropic 今年预计支出27亿美元,Facebook 向 AI 部门最近增加了数十亿美元的投入。

这么高的投入,要有上亿的付费用户,才可能获利,谈何容易。

(2)模型成本没有规模经济

绝大多数行业,规模越大,单位成本越低。但是,AI 模型正好相反,模型越大,单位成本可能更贵。

因为随着模型变大,进一步改进可能更加困难,训练新模型所需的计算量也在增加。这就像攀登珠穆朗玛峰,到了8000米以后,每一步都越发艰难。2024年训练一个顶级模型,要比2023年训练顶级模型,计算量更大更贵。

偏偏 AI 模型的效果与规模有关,规模和计算量越大、模型效果越好。因此,大模型公司的运营费用无法下降,只会变大。

(3)AI 模型快速贬值

AI 模型公司为了市场份额和投资回报,必须不断推出更好、更快、更强的新模型。

如果行业不断推出新模型,那么旧模型就会快速贬值。当你可以使用 GPT-4 时,还会有人想使用 GPT-3 吗?如果竞争对手推出了更好的模型,还会有人用你的模型吗?

为了始终在市场占有一席之地,你必须始终是市场最好的 AI 模型之一。这意味着,你的投入始终无法减少。

即使由于接近了技术极限,AI 行业无法继续推出更强的新模型,旧模型依然会快速贬值。因为市场上存在开源模型,比如 Llama 和 Mistral,如果商业模型停止进步,开源模型就将迅速缩小差距,那么旧的商业模型也就不值钱了。

举例来说,Anthropic 公司历史上开发过十个模型,为此陷入严重亏损。其中八个模型现在已经毫无价值,第九个模型是开源的,第十个模型让它现在能保持微弱的技术优势和市场活力。

它只有继续开发第十一个模型,才有可能在未来生存下去。

(4)AI 模型公司无法保持垄断优势

OpenAI 是目前的市场领先者,它的优势建立在大量计算的基础上。这些计算所需的物理资源,都是租用云服务商的设备,而不是自家的。只要有足够的钱,任何人都可以使用相同的资源。不难想象一小群高级工程师离开 OpenAI,筹集大量资金,租用计算资源,在几个月内就能对 OpenAI 的核心业务构成威胁。

换句话说,云服务商花费数十亿美元建设的数据中心是一种护城河,OpenAI 花费数十亿美元构建的 GPT 早期版本(比如 GPT-2 和 GPT-3)不是护城河,因为现在有更好的模型已经在 Github 上免费提供。

大模型公司搭建自己的机房,也无济于事。因为对手可以租用云服务商的机房,投入更少,效果是一样的。

综上所述,AI 模型似乎是一个可怕的行业:每年必须不断地巨额投资,应对持续上升的模型成本,以及当前模型一两年后就会被淘汰的竞争压力。你也没有防止竞争对手的有效手段,你最好的员工可能会离开,你的技术专长很难成为持久的优势。

所以,那些还在考虑推出 AI 模型的商业公司,进入这个行业之前,需要三思。

至于已经走上这条路、现在正运营 AI 模型的公司,由于模型如此烧钱,筹集最多资金的公司会赢(活得最久),所以当务之急应该是尽可能多、尽可能快地筹集资金。

此外,应对之策还包括,让你的模型差异化,以便留住用户。比如,记住用户的个人数据,可能是一种对策。模型应该可以记住用户的问题,从而更好地了解用户。用户使用它越多,就越难切换,因为它知道所有你的历史、你提出的问题、你关心的事情。

豆包 MarsCode 系列活动

豆包 MarsCode 是专业的大模型编程助手,字节旗下的产品。

它与稀土掘金技术社区(juejin.cn)合作,本月14日在深圳,19日在上海,将举行两场系列活动,让更多同学一起参与进来,探索 AI 编程的潜力。

(1)12月14日,深圳将举办"豆包 MarsCode 动手实验室",让大家亲手参与 AI 编程。

参与者以"队"为单位(最多三人,也可单人成队),现场直接用 AI 编程,完成一个小游戏。豆包 MarsCode 的同学会当场指导,与大家深度交流,并评出优胜作品。

通过现场 AI 技术交流实践,大家可以看看创意怎样通过 AI 快速落地

点击这里,或者扫描上方海报二维码,了解详情并报名。

(2)12月19日,上海举行豆包 MarsCode 编程挑战赛。参赛者借助 AI,在规定时间内完成4道算法题。

这可以作为面试练习,如果获奖还可以当作个人资历。点击这里了解详情并报名参赛。

科技动态

1、树莓派掌上电脑

一支国外团队推出了"树莓派掌上电脑",看上去很酷。

它就是一个全功能的 Linux 系统,带有7小时续航。

它还有一个可组装版本,屏幕是单独分离的。

下面可以配上键盘,也可以配上手柄。

它是开源的,制作团队希望将成本控制在250美元。

2、超声波洗澡机

1970年的大阪世博会,三洋公司展出了一台超声波洗澡机。

人坐进去,头露在外面,机器里面是水。

按下按钮,机器就会释放出超声波,通过震动达到清洁的目的。

它与现在市场上的"超声波清洁机"的原理是一样的,只不过它用来给人洗澡。

这台机器从未投入生产。明年2025年,大阪将再次举办世博会,一家公司重新生产了这台机器,专门用于医疗保健领域。

3、升缩鞋

青少年的鞋子往往只能穿一年,然后就穿不下了。

一家美国公司设计了升缩鞋,鞋会跟着脚一起长。

它的做法就是把鞋底分成两块,中间使用弹性材料连接。

如果脚变大了,鞋也会随之被撑开。

为了穿着舒适,鞋面也采用升缩材料,编织成袜子状的网眼结构,穿进去也比较容易。

这种鞋的另一个好处,就是不用区分脚码,一双鞋适合多个脚码。

4、其他

(1)三星工程师做出了一个"拍照机器人",只要你告诉它想拍什么样的照片,它就会自动摆出最佳姿势,为你拍照。

文章

1、我们为什么转向 Astro(英文)

作者原来使用 Next.js 框架,因为受不了 React 和 Next.js 的种种问题(主要是复杂性),转向了 Astro 框架,本文是使用感受。

2、Phoenix LiveView 1.0.0 发布了(英文)

Phoenix LiveView 是 Elixir 语言的 Web 开发框架,(目标是)用更简单的模型,实现 React 框架的所有功能,同时还支持高并发。本文是它的介绍。

3、我如何用机上 WiFi 获知飞机方位(英文)

作者乘坐飞机时,利用航空公司的服务器,绘出了当前飞机的飞行路线。

4、如何用 Cloudflare 重定向 URL(英文)

作者的个人网站更换了域名,他就用 Cloudflare 将旧网址重定向到新网址,完全免费。

5、不要用 SQL 的 count(*) 语句与 0 比较(英文)

一篇 SQL 科普文章,不要用 count(*) 等于 0,来判断不存在符合条件的记录。

6、如何用手机远程解锁 Windows(英文)

Windows 11 有一项功能,允许你用手机的指纹识别或人脸识别,解锁 Windows。

7、如何用 Docker Compose 安装 phpMyAdmin(英文)

一篇初学者教程,关于怎么用 Docker Compose 在本机架设数据库应用。

工具

1、Bananas

一款跨平台的桌面应用,利用点对点连接与其他人共享您的屏幕,无需帐户或任何服务器(初始连接除外)。

2、jsontr.ee

一个 JS 网页库,将 JSON 数据转成可视化的树状图。

3、WatchAlert

开源的轻量级监控告警系统,基于 Go + React。(@Cairry 投稿)

4、Easy Resizer

一个在线工具,批量调整图片的大小。(@mywebtools 投稿)

5、IconEase

开源的跨平台桌面应用,用来管理本地的图标文件。(@JiuRanYa 投稿)

6、X.Ryder

一套网站后台的 UI 开发模板。(@pipijoe 投稿)

7、Peninsula

基于 macOS 刘海的窗口管理器和消息中心。(@Celve 投稿)

8、Summary Cat

用户提交一个 YouTube 视频网址,它会用文字总结出该视频的内容。

9、ubicloud

一个可以自己搭建的云环境,能够直接运行 GitHub Actions 脚本。

10、matcha.css

一个加强浏览器的网页默认样式的 CSS 库。

AI 相关

1、Bylo.ai

免费的 AI 图像生成网站。(@aaamomo64 投稿)

2、Color Diffusion

一个开源的 Python 程序,使用 Diffusion 模式对黑白照片上色。

3、AI 聚合搜索引擎

该网站聚合多个 AI 搜索引擎入口,可以切换不同的搜索引擎进行搜索。(@ovelv 投稿)

资源

1、Hi Speaking

一个英语跟读网站,你按照课本读一句,它会自动播放下一句,省去了手动点击。(@jiweiyuan 投稿)

2、In Pieces - 30 endangered Species

一个很有创意的网站,用30个碎片拼出30种濒危动物,只使用 CSS。

3、数据可视化目录

这个网站按照用途,将数据可视化分类,便于查找你需要的图表类型。

图片

1、乐高面板

乐高积木可以搭建各种机器和宇宙飞船,所以有很多控制台单元,使用了各种各样的设计。

从中可以学习,怎样的控制台设计才是好的。

下面是一些糟糕的设计,你根本分不清,什么操作用什么按钮。

如果将功能相近的按钮,分成几个区块,辨识度就会大幅提高。

上图中,最右边的设计辨识度最好。

下面三个控制台最简单干净,带有可视化元素,属于最好的设计。

2、为什么老照片的人们不微笑?

19世纪末和20世纪初的老照片,人们的表情往往很严肃,即使微笑,也非常轻微。

一个主要原因是,那时的照相机需要长时间曝光,人们必须静坐好几分钟才能拍照。

微笑是一种快速反应,而不是一种持续的表情状态。当你必须静止几分钟才能拍照时,你根本不可能保持微笑那么久。

文摘

1、10亿次心跳

哺乳动物随着体型变大,心跳逐渐放慢,这是为什么?

比如,仓鼠的心跳是每分钟450次,猫是150次,猪是70次,大象是30次,鲸是20次。

原因可以这样理解,假定猫的体积是仓鼠的10倍,那么猫的新陈代谢率(它燃烧能量的强度)也应该是仓鼠的10倍,毕竟猫有10倍的细胞在消耗能量。

但是这不可能,如果真的这样,猫就会因为体温过高而死亡。因为新陈代谢会产生热量,需要散热,但是猫的表面积并没有仓鼠的10倍,必定有一部分热量无法散发出去,导致体温过高。

为什么猫的表面积没有仓鼠的10倍?

中学数学告诉我们,表面积增长的速度,慢于体积增长的速度。举例来说,如果球体的体积增长一倍,变成原来的两倍,表面积只是原来的1.59倍。

既然无法散发所有的热量,所以大型动物的新陈代谢必然慢于小型动物。相应的表现就是心跳放慢,降低新陈代谢的强度。

这就是为什么体型越大,心跳越慢。

动物学家还发现一个有趣的现象,哺乳动物不管体型大小,一生的总心跳大概在10亿次左右。

仓鼠的寿命是3年,猫是15年,猪是25年,大象是70年,鲸是80年。

结合它们的心率,不难算出,仓鼠一生的总心跳是7.1亿次,猫是11.8亿次,猪是9.2亿次,大象是11亿次,鲸是8.4亿次。

这些动物的总心跳都在10亿次左右。

奇怪的是,人类不符合这条规律。人每分钟心跳60次,平均寿命70年,总心跳是22.1亿次。

言论

1、

萨尔瓦多政府将比特币作为国家储备,目前拥有5,940个比特币,价值5.82亿美元。

但是,他们怎么保管钱包的密钥呢?万一密钥泄漏,国家岂不是破产了。

-- Hacker News 读者

2、

19世纪的德国哲学家尼采,以前的写作风格是不断的长句,复杂的推理和解释。

后来,他用上了打字机,写作风格逐渐从长篇论证变成短篇的格言警句,变得像电报那样。

-- 《打字机如何改变尼采》

3、

内部平台效应(inner-platform effect)指的是,程序员倾向于创建一个可定制的内部系统,成为他们正在使用的外部软件的复制品,而且通常是一个糟糕的复制品。

-- 维基百科

4、

我爱那些渴望不可能的人。

---- 歌德

5、

我通常不愿意对技术做出预测,但我感到相当有信心的是,因为 AI 如此善于写文章,几十年后懂得如何写文章的人一定不会很多。

-- 保罗·格拉汉姆,硅谷创业导师

往年回顾

新基建的政策选择(2023 #281)

互联网公司需要多少员工?(2022 #231)

移动支付应该怎么设计?(2021 #181)

你的头脑是二值逻辑,还是三值逻辑?(2020 #131)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月 6日

AI 应用无代码开发教程:工作流模式详解

作者 阮一峰
2024年12月2日 18:39

一、引言

一个月前,我写了一篇《AI 开发的捷径:工作流模式》,引起了很多读者的兴趣。

大家都认同,AI 应用是开发者的机会,而图形化、低代码/无代码、不需要编程基础的"工作流模式",正是 AI 应用开发的入门捷径。

但是,我的那篇文章只介绍概念,没有操作步骤。很多读者实际上手时,遇到了困难,有些地方不理解,做不下去。

今天就是后续,我详细演示,一步步图解,没有编程基础,如何搭建一个最简单的 AI 应用。只要你跟着做,就能做出来。

二、开发工具

这篇教程使用的开发工具是扣子(Coze),所有操作都在它的浏览器 IDE(集成开发环境)中完成,

选择扣子(Coze),主要原因有三个。

(1)它是国产的 AI 应用开发平台,字节跳动的产品,界面、文档、客服都是中文。

(2)它有无代码编辑器 Project IDE,包含组件拖拽的 UIBuilder,可以生成全功能的前端界面,上手门槛相对低。

同时,它也提供后端数据库,可以数据读写。

(3)它免费使用(只要不超过使用额度),发布上线也不收费,适合新手练习。

三、示例项目

我们的示例项目,是一个最简单的"AI 文言文生成器"。

大家先看成品,可以点进去试用。(建议 PC 访问,UI 还没有适配手机。)

输入一段汉语白话文,点击按钮,AI 就会自动生成文言文。

架构上,它非常简单:前端是一个网页表单,将用户的输入发送给后端的 AI 模型,并展示后端的返回结果。

它的开发只需要两步,第一步先让后端的 AI 模型跑起来,第二步做一个网页,连接后端即可。

扣子的方便之处在于,前后端的生成都是图形化操作:后端是编排工作流的节点,前端是 UIBuilder 的界面拖拽组件。

下面就是开发步骤。为了保证大家跟得上,我写得比较详细,看起来有点长,但是实际操作是很快的,熟练的话,10分钟就能完成。

四、创建项目

首先是开发的准备工作,先创建 AI 应用。

(1)访问扣子官网,点击右上角的"基础版登录"。(基础版只比专业版少一些企业级功能,普通用户完全够用。)

(2)登录后,自动跳转到个人主页,点击左侧菜单的"工作空间"。

工作空间里面,有"项目开发"和"资源库"两个页面。进入"项目开发",可以看到你所有的项目。

(3)点击右上角的"创建"按钮,跳出一个弹框。

上面有两个选项,"创建智能体"是创建一个传统的 AI 聊天,"创建应用"则是创建一个自定义界面的 AI 应用。

(4)选择"创建应用",这时会让你选择应用模版,点击"创建空白应用"。

接着,输入项目的名称,这里是"AI 文言生成器"。

至此,项目创建完毕,系统会自动进入"AI 文言生成器"的应用主页(下图),正式的开发工作就要开始了。

五、业务逻辑

应用主页的最上方,有"业务逻辑"和"用户界面"两个分页,默认是"业务逻辑"页面。

这一节就讲解如何创建业务逻辑,也就是后端的 AI 模型。

我们采用工作流模式,即将业务逻辑编排成一个个节点。

(1)点击左侧菜单的"工作流"后面的"+"号,选择"新建工作流"。

输入工作流的名称和描述。(注意,名称只能是英文字母、数字和下划线,本例是 classicalchinesecreator。)

(2)工作流创建成功后,名称会出现在左侧菜单的"工作流"标签下方。点击它,就进入该工作流的"节点编排"画布。

画布上,默认有"开始"和"结束"两个节点。

(3)点击下方的"添加节点",添加一个新节点,类型设为"大模型"。

然后,将这三个节点连起来(通过拖动边框上的控制点)。

(4)配置"开始"节点。双击该节点,在配置框增加一个 content 变量,表示用户的输入内容。

(5)配置"大模型"节点。

配置窗口的各个选项,填写如下。

模型:可以按自己的需要选择,这里保持默认值"豆包 Function call 模型"。

输入:将原来的 input 参数改名为 content,并跟"开始节点"的 content 变量连接起来。

系统提示词:输入以下内容,用来设定大模型的行为。

角色

你是一个专业的汉语文言文作者,能够准确地将用户输入的汉语白话文内容改写为文言文,不进行随意扩写。

技能

技能 1:文言文写作

  1. 当用户提供一段汉语白话文时,迅速将其改写成文言文。
  2. 确保改写后的文言文的准确性和完整性。

限制:

  • 只进行文言文改写,不回答与文言文改写无关的问题。
  • 严格按照用户提供的汉语白话文进行改写,不得擅自增加内容。

用户提示词:输入以下内容,作为给系统的直接命令。

将用户输入的汉语白话文{{content}}改写成文言文。

上面文本中的{{content}},表示此处系统将插入 content 变量的内容。

输出:将输出格式改为"文本"。

(6)配置"结束"节点。首先点击配置框上部的"返回文本"。

输出变量:将 output 参数关联"大模型"节点的 output 变量。

回答内容:输入{{output}}(表示插入 output 变量的内容),并打开"流式输出"(即打字机效果)。

至此,整个工作流的搭建全部完成,可以单击画布右上角绿色的"试运行"按钮,测试工作流是否正常运行。

在 content 输入框,输入测试内容,比如"今天天气很好"。

然后,点击下方的运行按钮,就可以得到运行结果(今日,天善)。

如果一切正常,就可以开始搭建用户界面。

六、用户界面的搭建:页面布局

(1)点击进入画布上方的"用户界面"分页。

(2)在左侧菜单的组件面板,找到布局组件 > 容器组件,将其拖入中间的画布,作为页面的标题区域。

系统自动将这个容器命名为 Div1,双击进行配置。

尺寸:宽度为100%,高度为 60px。

布局:排列方向为"横向"。

样式:去除背景色,将边框设为灰色(#E2E8F0)。

(3)在 Div1 下方,再拖入一个容器组件,系统自动命名为 Div2,用作功能区域。

配置基本一样:尺寸部分,宽度和高度都设为填充容器;布局部分,排列方向为横向;样式部分,去除背景色。

(4)在 Div2 内部的左侧部分,拖入一个容器组件 Div3,用作用户输入区域。

宽度设为50%,高度设为 550px,样式删除背景色。

(5)在 Div2 内部的右侧部分,拖入一个容器组件 Div4,用作展示结果区域。

宽度设为50%,高度设为 550px,样式删除背景色。

至此,页面布局如下图。

七、用户界面的搭建:页面细化

做好布局后,下一步完善页面细节。

(1)在 Div1 内部,拖入推荐组件 > 文本组件,作为标题文本。

标题内容设为"AI 文言文生成器",字号改成24,字重为粗体。

(2)在 Div3 中拖入一个表单组件,删除不需要的元素,只剩下文本输入框和按钮。

表单组件:宽度和高度都设为填充容器,并删除边框。

文本输入框:拉伸高度,宽度设为填充容器,标签和占位文案设为"输入汉语白话文"。

按钮:文本改为"生成文言文"。

完成后的表单效果如下图。

(3)在 Div4 中拖入一个展示组件 > Markdown 组件,作为展示文言文区域。

删除 Markdown 组件的已有内容,改成"###### 生成结果"。高度和宽度改为填充容器,圆角设为10,内边距设为20,边框设为灰色(#CBD5E1)。

至此,页面细化完成,单击属性面板上方的预览,查看效果。

八、用户界面的搭建:配置事件

页面外观做完后,要配置事件,将后端的业务逻辑与用户界面连接起来。

(1)点击"生成文言文"按钮,在配置面板切换到"事件",点击"新建"。

事件类型设为"点击时",执行动作设为"调用 Workflow",workflow 设为已经创建好的"classicalchinesecreator",并将工作流的入参content设为文本输入框的值 {{ Textarea1.value }}。

(2)配置生成结果区域,展示工作流的返回结果。

选中 Markdown 组件,点击"内容"栏的扩展按钮。

扩展面板中,在###### 生成结果后面添加一行,插入工作流的返回结果{{ classical_chinese_creator.data }}

完成所有配置后,单击右上角"预览"按钮,测试整体效果。

如果一切正常,这个 AI 应用就算开发完成了。

九、应用发布

开发完成后,就可以发布该应用,让其他人也可以使用。

点击右上角"发布"按钮,版本号设为 v0.0.1,发布平台设为发布到扣子商店。

至此大功告成,"AI 文言生成器"就登录扣子商店,向世界公开了。

十、总结

大家可以根据这个示例,改变输入 AI 模型的提示,让它做不同的任务,就能变化出很多不同功能的应用。

比如,官方的"AI 翻译"示例,就是让 AI 把用户输入的中文译成其他语言,跟"AI 文言文生成器"异曲同工。

除了文本生成,扣子还提供许多其他能力,比如抓取外部数据、数据库读写等,从而可以做出更强大的 AI 应用。

总之,"工作流模式"使用图形化界面搭建一个 AI 应用,简单而便捷,随时查看效果,一键发布,值得大家尝试。

(此处有分割线。)

最后是一个活动预告。

扣子邀请我,参加12月19日在上海举行的"扣子开发者日",也欢迎大家参加。

届时,字节的 AI 工程师会跟大家面对面交流,如何开发和推广 AI 应用。这是很好的学习交流、获取资源的机会,点击这里了解详情。

扫描下方海报二​维码,或者点击链接现在就可以线下报名参加,或者线上预约直播

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月 2日

科技爱好者周刊(第 327 期):没有链接的互联网

作者 阮一峰
2024年11月29日 08:17

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

杭州钱江世纪城东部的一大片农田,号称"稻田 CBD",最近迎来了丰收。该农地被政府保留,让城市与田园融合。(via

没有链接的互联网

你能想象吗,没有链接的互联网是什么样?

不用想了,这正在变成现实。

2017年,脸书(Facebook)出台了一项政策:只要帖子里面有(外部)链接,就会减少这个帖子的曝光。

也就是说,只要你贴了链接,别人就(几乎)看不见你的帖子了。这样做是为了防止用户跳出脸书,也为了防止用户为其他网站引流。

所以,你现在访问脸书,就会看到一种奇特的做法:大家发帖都没有链接,有些帖子甚至只是一句话的图片(下图),真正的链接放在帖子的置顶评论里面。

后来,其他的互联网平台纷纷跟进,限制链接。

最典型的就是推特,它不断增加防止用户跳出的措施。先是推出"话题"功能(thread),后又解除字数限制,允许发布长文,尽量消除用户张贴链接的动机。最近,它将链接自动转成预览图时,甚至会隐藏页面标题,让用户察觉不到这是一个链接。

就连谷歌这种搜索引擎,也在防止用户跳出。搜索时,谷歌会直接显示一段 AI 生成的内容总结(下图),避免你去点击外部链接。

国内平台也是如此,有过之而无不及,比如微信、抖音,都严格限制外部链接。

总之,大型互联网平台都在排斥链接。它们的共识就是,必须把用户留在自己的花园,防止他们离开。

这种情况,将来恐怕愈演愈烈。因为 AI 可以实时生成内容,更没有必要让用户访问外部内容了。

没有链接可点击,这将彻底改变互联网生态。我看到一篇文章,列出这种趋势的七大后果,总结得很好。

(1)独立网站会消失,因为没有流量来源了。所有人都依赖大平台,只能在平台上发布内容,否则没人能看到。

(2)数字出版行业终结,因为不需要单独的出版环节了,直接发布到大平台就可以了。

(3)域名不再具有价值,因为小网站不管采用什么域名,都没有访客。大多数域名注册商会关门。

(4)网络托管业务将会收缩,因为网站数量将减少,个人架设网站的需求越来越少。

(5)独立的互联网广告业也会消失。所有的互联网广告,都将由平台控制,独立的广告联盟一钱不值。小网站也不可能通过互联网广告赚到钱。

(6)SEO 无用了。小网站没有流量了,优化搜索引擎的排名有何意义呢?

(7)信息表面化。因为用户不太可能在平台上贡献深层次的详细内容,所以平台提供的大多是表面信息,能够帮助用户的深层次的内容将难找到。

[本周软件] 扣子 Project IDE

如果你还不知道扣子(Coze),我简单说一下。它是字节旗下的 AI 应用开发平台,帮助用户开发各种基于 AI 模型的应用软件

要是你有 AI 相关的创意,但不知道怎么做成软件,就可以用它:图形化界面,低代码操作,没有编程经验的人也能使用。

昨天,它发了一个大更新,推出了全新的浏览器编程界面 Project IDE(下图)。

用户点击"创建"按钮后,选择"创建应用",就可以进入。页面上提供多个 UI 组件,只要拖拽就能生成前端界面(UBuilder),并且适配移动端。

同时,它还简化了后端数据库的读写 也就是说,你只需要在浏览器里面点击,就能生成完整的前端 + 后端的 AI 应用

完成后,可以立即上线运行,发布在扣子、微信、抖音等多种平台,也可以 API 调用。

想用 AI 模型开发的同学,不妨试试它,完全免费(不超出使用量额度)。

另外,"扣子开发者日"的线下活动,12月19日在上海举办,字节的 AI 工程师会跟大家面对面交流,如何开发 AI 应用。扫描下方海报二​维码,现在就线下报名参加/线上预约直播

科技动态

1、露西50周年

50年前的1974年,美国人类学家在埃塞俄比亚的偏远地区,发现了一具320万年前的南方古猿化石,取名为"露西"。

她的身形跟一个四岁女孩差不多,后来被确认为目前发现的最古老的人类祖先化石。有人称她为"人类的祖母"。

在发现她之前,科学家认为,人类是先进化出大脑,再直立行走。但是,露西的大脑很小,却是直立行走的,因此人类是先直立行走,再进化出大脑。

2、鲨鱼皮飞机膜

曾经有一种鲨鱼皮泳衣,模仿鲨鱼的皮肤特征,可以大大减少水的阻力,从而提高游泳速度。

因为这种泳衣的作用太明显,国际泳联不得不在2010年禁止在比赛中使用它。

现在,有人想到一个点子,如果把这种鲨鱼皮做成膜,贴在飞机表面,不就能大幅降低空气阻力了吗?

瑞士航空采纳了这个点子,在他们的12架波音777上,全部贴上鲨鱼皮飞机膜。上图的飞机表面反光处,就是贴了膜。

他们现在宣布,经过一年的尝试,取得了良好效果,去年节省了近2,200吨煤油。

这种鲨鱼皮的膜并不完全光滑,有特定的凹槽,符合流体力学特征,有利于减少表面与空气的摩擦。

以后,飞机可能跟手机一样,使用之前都要贴膜。

3、宽带的标准是多少?

现在上网,全部都是宽带。但是,宽带到底需要多宽,却有着不一样的说法。

以前的资料说,带宽 512kbps 以上就是宽带。这也未免太窄了,最高下载速度只有 64KB/s,下载一个 100MB 的文件,超过26分钟。这算什么宽带?

美国联邦通信委员会 FCC,今年提高了宽带的标准,下行速度从 25Mbps 提高到 100Mbps,上行速度从 3Mbps 提高 20Mbps。

也就是说,百兆是宽带的最低速度,低于100Mbps 就不叫宽带了。

4、其他

(1)微软的在线会议软件 Teams,允许用户克隆自己的声音,以便用另一种语言跟其他国家的人交谈。

(2)Starlink 宣布,明年推出手机卫星上网,但需要手机直连天空,也就是不能室内使用。

(3)新加坡为了节约淡水资源,推出用净化的污水生产的啤酒

文章

1、iTerm2 如何设置状态栏(英文)

iTerm2 是 Mac 电脑的终端模拟器,它有一个内置的状态栏,本文教你怎么设置。

2、我用投影仪当作显示器(英文)

作者的家庭办公室,使用投影仪当作显示器,如果你也想这么做,可以参考本文。

3、家庭机房的搭建感受(英文)

作者介绍搭建家庭机房的六点感受,其中一点是电费很贵。

4、浏览器的数据存储方法比较(英文)

本文介绍浏览器现在的几种数据存储方法: LocalStorage、IndexedDB、Cookies、OPFS、WASM-SQLite。

5、Bluesky 可以托管网站(英文)

Bluesky 是一个类似推特的微型博客服务,但使用开放协议。该协议允许上传和直接返回文件,因此可以用它托管网站。

6、Jest 与 Vitest(英文)

Jest 和 Vitest 是两个流行的 JS/TS 测试框架,本文对它们进行比较。

工具

1、Graphite

一款在线版的图像编辑器,代码开源。

2、Gimel Studio

平面图像编辑软件,最大特点是每一个编辑步骤都用一个节点表示,让你直观地编辑每个节点的参数。

3、Karpor

开源的 Kubernetes 可视化工具,提供搜索、洞察、AI 等能力。(@elliotxx 投稿)

4、dmMiniPlayer

开源的浏览器插件,在视频播放的画中画窗口里,配置进度条、音量等功能。(@apades 投稿)

5、四象限编辑器

开源的在线工具,在网页上编辑、生成四象限图,可用于插图、PPT 等。(@KwokKwok 投稿)

6、Git Stats

VS Code 插件,可视化查看团队成员的代码提交情况。(@lixianmin 投稿)

7、Bootstrap React Logic

基于 BootStrap 封装的 React 组件库。(@dafengzhen 投稿)

8、rmtrash

macOS 命令行工具 rm 的替代方案,用于将文件移动到废纸篓。(@TBXark 投稿)

9、mpv

一个命令行的视频播放器,跨平台。

10、Animate.css

一个网页动画的 CSS 库,指定 DOM 元素的类名,产生动画效果。

AI 相关

1、Lobe Chat

开源的 AI Chat 工具,支持几乎所有 AI 大模型。(@tcmonster 投稿)

2、AI git commit

一个 Jetbrains 插件,使用 AI 生成 git 的提交信息。(@HMYDK 投稿)

3、UICloner Extension

浏览器插件,一键克隆任意网页 UI 组件,生成代码。(@AndySpider 投稿)

4、MagicMirror

一个开源的桌面应用,一键 AI 换脸、换发型和穿搭。(@idootop 投稿)

资源

1、GitHub Insights Pro

GitHub 的数据分析与可视化平台,提供项目和用户的各种统计信息,以及排行榜和趋势榜。(@wincatcher 投稿)

另有一个同类项目 GitHub Persona。(@Ray-D-Song 投稿)

2、Visual Sorting

各种排序算法的可视化演示,代码开源。

3、看见概率论

一个中文的数学教育网站,通过交互式可视化演示,讲解概率论知识。(@wincatcher 投稿)

图片

1、比亚迪的厂房

下图是比亚迪的郑州工厂与特斯拉的得州工厂的大小对比。

左边的白色厂房群是比亚迪郑州工厂,宽度约为3.2公里。

右边是同样比例尺的特斯拉得州工厂。

2、发向 M13 星团的消息

1973年11月16日,美国科学家通过波多黎各的阿雷西博望远镜,向 M13 星团发出一条二进制消息。

这条二进制消息,解码后是一个长条的图形,包含了很多内容:人类长什么样、哪些化学元素和生物分子构成了人类的 DNA,太阳系的行星系统、1974年人口数量等等。

该消息将在大约25000年后,到达 M13 星团。

文摘

1、高效率时段

一天24小时,你无法每时每刻都保持专注。

一个人每天的高效率时段,只能持续一会,然后就会消失,无法再恢复。

所以,如果某个时候,你不能保持专注了,那就不要再反复尝试,接受这个事实,转而去做一些更简单、不需要那么专注的事情。

亚马逊创始人杰夫·贝佐斯,就曾经说过:"我喜欢上午10点举行重要会议。如果到了下午五点,我的脑子就什么也想不了,只能把事情推迟到第二天上午10点。"

所以,你最好的选择就是,每天尽早完成尽可能多的工作。这段时间要限制外界的干扰,多做困难的事情,直到你感到疲劳为止。

当你觉得疲劳、无法保持专注了,那就不要抵抗它,把还没做完的事情推迟到第二天,转向更简单的任务,或者干脆什么也不做了。

有些人为了专注工作,会每天早起。我的一个朋友则是习惯在晚上11点到凌晨4点,全力工作。

他们都会避开白天的高峰时段:炎热的天气,每个人都在忙,消息满天飞。即使你的能力再强,此时都无法逃脱外界的干扰。

请记住,每天你一醒来,时间就在一分一秒流逝,你不知道自己的精力能维持多久。你需要做的,就是问自己:在你无法保持专注之前,能做多少事情?

言论

1、

几年前,马斯克宣布 Starship 飞船的火星计划时,我开玩笑说,等到它把人类送上火星时,英国还没有开通前往曼彻斯特的高铁。

不幸一语成谶,英国首相今年早些时候宣布,取消曼彻斯特的高铁计划。

-- 彼得·黑格,英国天文学家

2、

SUSE 公司的 Linux 企业级发行版,在2019年推出时,承诺对这个版本提供支持直到2038年。

为什么支持期长达19年,而不是18年或20年?原因是 Unix 时间原点是1970年1月1日零点,32位系统会在2038年发生时间溢出。所以,他们就支持到2038年,时间溢出就不用管了。

-- 《SUSE 为什么有19年支持期》

3、

为什么法律的语言这么难懂?一种解释是,这类似于咒语,古代的咒语也非常难懂,跟日常语言截然不同,这样象征着一种特殊的权威。

-- 《为什么法律以难以理解的方式书写?》

4、

我非常不喜欢,电视播放交响音乐演奏会。交响音乐会本质上是声学体验,但是电视使得人们的注意力转移到画面,变成了视觉体验。

这对音乐不利,音乐的存在是为了听而不是为了看。

-- 《电视交响音乐毫无意义》

5、

斐波那契数列有一个有趣的特性,连续的两个数(比如,5和8,21和34)是英里和公里的关系,比如5英里约等于8公里。

-- 《斐波那契数转换英里与公里》

往年回顾

机器点餐与宅文化(2023 #280)

电子产品的用电量(2022 #230)

你想住在中国哪里?(2021 #180)

低龄化的互联网(2020 #130)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月29日

科技爱好者周刊(第 326 期):世界没有那么多财富

作者 阮一峰
2024年11月22日 08:00

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

内蒙古库布其沙漠的光伏基地,一望无际的光伏发电板铺设在沙漠之中。(via

世界没有那么多财富

维基百科有一个页面"人均财富排名"。

它列出了不同国家/地区的人均财富,可以用来比较生活水平:人均财富越多,生活水平越高

需要注意的是,它比的是财富,不是收入。

财富的范围更广泛,除了收入,还包括其他资产(比如房产、股票、汽车等等)。财富的计算公式是,你的资产减去你的负债

财富 = 资产 - 负债

这个页面提供了很多统计数据,我分享其中一些。

(1)2022年底,全世界的总财富是454.3万亿美元。

我们常说"把蛋糕做大",这就是蛋糕目前的大小。它除以全世界53.6亿的成年人口,可以得到,每个成年人拥有财富8.47万美元(约60万人民币)。

所以,如果你的财富超过60万元人民币,就超过全世界至少一半人了

(2)美国的人均财富是55.1万美元,中国是7.57万美元,只是美国的七分之一。

因此,我认为,中国未来的增长空间巨大。理由是中国没可能停留在人均财富只有美国七分之一的水平,就增长不动了。

(3)中国人均财富7.57万美元,相当于55万人民币。乍一看,你可能觉得,一个成年人拥有55万人民币的财富,这并不少。

但是,实际上是很少的。

假定这55万都是现金,那么即使过得很节俭,房租+日常消费每月3000元,也只够生活15年。想靠这些钱退休还差得远,你还是必须工作赚钱。

假定这55万里面包括了不动产和固定资产(比如汽车),由于存在折旧和市场波动,它们可能会不断贬值。等到变现的时候,你的财富很可能大幅缩水。

结论就是,55万人民币的人均财富,实际价值比名义价值低很多,根本不够支撑长期生活。

(4)这就是世界的现状:现有的财富总量,不足以让每个人摆脱贫穷

对于普通人来说,即使能够达到平均值,你的财富也是不够的,这个世界就没有那么多财富。

一个社会想要致富,归根结底还是需要创造更多的财富。 真正的财富不是财富本身,而是创造财富的能力。如果你能够创造财富,那才是真正的财富,比那些静态的财产更有价值。

"创造财富"的方法,就是能够不断生产出人们需要的东西。这才是国家和个人最应该培养的能力。

[本周软件] Rspack 工具栈

现在有一个趋势,JS 工具纷纷使用 Rust 语言重写,速度可以提高至少一个数量级。

最近,我就在使用这样一个"新生代工具" Rspack,感觉很不错,介绍给大家。

Rspack 本身是 Rust 应用,用来取代老牌的 JS 构建打包工具 Webpack。

使用后的速度提升,非常明显,Rspack 的耗时大概是 Webpack 的十分之一。如果 Webpack 需要10秒,Rspack 就是1秒。

但是,它的最大优势还不是快,而是 Webpack 的无缝替换。你基本上不需要改动配置,直接把配置文件webpack.config.js改名为rspack.config.js即可。

Rspack 不仅兼容 Webpack 的语法,还兼容插件。根据官方文档,下载量最高的50个 Webpack 插件,80%以上可以直接使用,剩下的也有替代方案。

Rspack 团队为了保证兼容性,向 Webpack 官方仓库做了100多次提交。甚至 Webpack 的主要维护者之一的 Alexander Akait 亲自动手,让很多插件可以在 Rspack 正常运行。

另外,Rspack 的功能也更多。比如,Webpack 模块联邦(Module Federation)的作者 Zack Jackson 加入了 Rspack 团队,为 Rspack 实现了模块联邦 2.0。

它在社区已经得到很多好评,发布一年多以来, GitHub 仓库有9800颗星星,今年还获得了 GitNation 基金会的"年度突破开源项目"奖。

今年8月,它发布了 1.0 版,API 已经稳定了,可以放心用于生产环境。

不过,由于全盘继承 Webpack,Rspack 也同时继承了前者的体验问题:配置麻烦,上手不算容易。开发团队为了解决这个问题,在 Rspack 的基础上,封装了一系列更简单易用的衍生工具

  • Rsbuild: 专注于构建 Web 应用。
  • Rslib: 专注于构建 JS 软件包。
  • Rspress:专注于生成静态站点,比如文档和博客。
  • Rsdoctor:专注于构建分析。

以上这些工具,底层都是 Rspack,分别用于不同的用途,统称为"Rspack 工具栈"。

其中,Rsbuild 是更简单易用的构建打包工具,对标 ViteRsbuild 的底层是 Rspack,就像 Vite 的底层是 esbuild + Rollup 一样。构建项目时,你可以选择 Rspack,也可以选择 Rsbuild,后者的配置更简单一些,体验更好,针对性的功能更多。

对于国内开发者,Rspack 工具栈还有一个好处。虽然它来自一个国际化团队,但是属于字节开源出来的工具,字节内部大量项目已经采用,中文支持和中文文档都是优先的。

大家使用 RspackRsbuild 后,如果遇到问题,就去项目仓库提 issue,官方都会快速回应。

科技动态

1、风力发电飞艇

一家北京公司推出了风力发电飞艇。

这个飞艇长23米、直径15米,艇中央有一个直径5米的涵道,里面安装了风力发电机,叶片长2.4米。

飞艇飞到500米的高度,风力发电机进行发电,然后通过电缆将电力传回地面。

高空的风远大于地面,因此高空风力发电的效果更好。

这个飞艇的远期目标是飞到"风能密度为地面200倍、年发电时长为地面4倍以上的平流层(高度约1万米)",将风力发电成本降到现在的十分之一。

2、局域网游戏室

一个美国程序员出于怀旧,在家中地下室建造了一个局域网游戏室。

游戏室一共可以容纳12人对战,电脑台都是折叠的,可以收纳进墙壁。

下面就是电脑桌全部收起来的样子。

他设置了一个家庭服务器,游戏软件存在里面,电脑终端去读取游戏。

布线是一个大工程。

他还专门准备了一个储藏室,存放电脑的内存、CPU 和显卡等配件。

虽然建成后运作良好,但他有一个最大的烦恼:现在的游戏只支持互联网对战,很少支持局域网对战,大多数时候他只能玩老游戏。

3、金字塔的建材

埃及金字塔位于沙漠之中,科学家一直很困惑,建造金字塔的巨大石块如何运进沙漠?

那些石块每个有2.5吨重,古埃及人用了什么方法,长途运输几千块巨石。

最近的一项发现,可能揭示了答案。科学家使用卫星照片,发现尼罗河有一条已经干涸的支流。

几乎所有的金字塔都分布在这条支流的旁边,这说明古埃及人很可能通过水运,将巨石送到建筑地点。

上图中,深蓝色是现在的尼罗河,浅蓝色是那条已经干涸的支流,各种颜色的点是金字塔的位置。

4、其他

(1)一个国外程序员在自行车训练机的把手上,装了两个分离式键盘,可以一边骑车,一边打字。

(2)CSS 有了一个新的徽标

(3)卡西欧推出一款形似手表的戒指。

文章

1、排版引擎纵谈:程序员的视角(中文)

本文介绍并对比了几种排版引擎,重点是 CJK 文字处理: HTML + CSS、LaTeX、LaTeX.js、Typst 和 react-pdf。(@xiaohanyu 投稿)

2、AI 的视觉注入攻击(英文)

本文介绍如何在图片里面,进行"视觉注入"(visual prompt injections),从而欺骗 AI 模型。比如,上图男子拿着一张纸,上面写着"忽略我这个人"。

3、服务器端渲染简介(英文)

本文举例介绍网页应用的"服务器端渲染"是什么,也就是大家常说的 SSR(server side rendering)。

4、带有平铺式窗口管理器的 Linux 桌面(英文)

对于大量使用键盘的人,平铺式窗口管理器最好用。本文介绍了内置平铺式窗口管理器的 Linux 桌面环境。

5、12 个当代 CSS 的一行代码增强(英文)

本文介绍12种 CSS 的新写法,只要一行代码,就能增强网页样式。

6、如何正确使用 git worktree(英文)

git 有一个 worktree 功能,大多数人只把它当作分支功能的替代方案。作者提出,应该把 worktree 用来管理并发任务。

工具

1、Neat CSS

一个极简的 CSS 框架。

2、PG Back Web

一个带有 Web 界面的 PostgreSQL 备份工具。

3、Llama OCR

这个网站提供免费的图片 OCR,通过 AI 识别图片里面的文字,好像不能识别中文。

4、MySpeed

可以自己架设的网络测速工具。

5、dive

这个工具可以显示 Docker 镜像文件每一层的内容。

6、moffee

一个命令行工具,使用 Markdown 格式制作和展示幻灯片。

7、Google Backup

开源命令行工具,用来备份谷歌邮件、通讯录和日历。

8、lcl.host

一个为本地开发环境 localhost 提供 https 证书的工具。

9、Interactive Git Log

一个 VS Code 的插件,为 Git 提交日志提供一个可交互的图形界面。

10、Makeext

构建工具 Make 的一个扩展,让make命令可以输出项目的帮助信息。

资源

1、Sound Box

一个在线音效网站,提供多种自然环境音效以及白噪音。(@wincatcher 投稿)

2、I Don't Have Spotify

你输入 Spotify 的音乐链接,这个网站就会查找替代音源(比如 Youtube)。

3、DuckDuckGo AI Chat

DuckDuckGo 最近推出的免费 AI 聊天。

4、The Copenhagen Book

一组短文,介绍 Web 应用相关的用户认证知识。跟充满术语的加密学文章不一样,这组文章简明好懂。

图片

1、祖父的小提琴

前些日子,一位纽约程序员偶然得到了1912年拍摄的他祖父(下图拉小提琴者)的老照片。

他用 AI 模型为老照片上色。

他突然意识到,自己小时候见过照片里面的小提琴。

祖母去世时,家里人把祖母的东西都存放在阁楼。在他印象中,里面就包括一把小提琴。

他就跟妻子一起,回到老房子的阁楼找找看。

小提琴居然还在。

他请人修复了这把小提琴,把它交给自己的女儿。

他写道:看着女儿拿着100多年前她曾祖父的琴,不禁让人有一种时间穿越的感觉。

文摘

1、燃烧 NeXT

1990年,乔布斯决定推出新型号的 NeXT 电脑,外壳要用镁合金制作。

镁是一种相对昂贵的金属,非常坚固且重量轻。乔布斯认为,这样的外壳不仅美观,而且可以节省搬运和制造成本。

我当时是一名报道计算机行业的记者,但以前学的是化学。我对这个决定很感兴趣,我知道镁燃烧时会发出明亮的白色火焰,我不禁好奇地想,如果 NeXT 烧起来会是怎样。

1991年秋天,我采访了 NeXT 的硬件副总裁。采访结束后,我提出,能不能送给我一个 NeXT 的外壳,让我烧烧看。他笑着同意了。

第二天,我开车去工厂,拿到了电脑外壳。

我很快就发现了问题:镁合金需要高温才能点燃,普通火焰点不燃,但是我无法制造这样的高温。于是,我无可奈何,只能把电脑外壳寄放在朋友家里。

一年后,朋友告诉我,她厌倦了保留这个玩意。而且,NeXT 已经决定停产这个型号,于是我开始认真考虑怎么烧掉它了。我想,它燃烧的照片正好配合停产新闻,作为杂志封面。

设计燃烧方案时,我考虑到,镁燃烧时会发出明亮的白色火焰和大量的白烟,虽然烟雾无毒,但可能引起警察或消防部门的注意。于是,我给消防部门打电话,询问有没有燃烧许可证。但是,他们不清楚这些事情,没人烧过这么多的镁。我还被告知,必须获得空气污染的许可证。

最后,我沮丧地决定执行原来的计划:开车去沙漠深处,然后把它烧掉。

但是最后一刻,我想到了加州的劳伦斯·利弗莫尔实验室,这是一个隶属于能源部、由加州大学伯克利分校管理的实验室。很多武器在那里实验,我确信那里肯定有燃烧几公斤镁的设施,而且也有必要的许可证。

我打电话给他们,他们同意了借给我照明弹的实验室。这让我的摄影师特别高兴,因为室内燃烧更容易拍出好的效果,阳光直射下几乎不可能看到火焰。

正式燃烧的前一天,我又找了一台旧的 NeXT 电脑作为备用。

到了正式燃烧时,我们用气焊枪点燃了它。气焊枪的蓝色火焰,接触到了电脑外壳,半分钟后,它开始发出独特的橙色光芒,然后慢慢融化。突然间,一道耀眼的白光闪过,然后是稳定的白色火焰。

我知道镁燃烧得很明亮,但我不知道有多快。我想至少会持续一分钟,但事实证明,镁的燃烧速度非常缓慢。当火焰最终熄灭时,剩下的只是一些块状的奶白色灰烬----氧化镁。

下面我们那一天拍到的照片。

言论

1、

我不戴手表。原因很简单,因为现在是最重要的时刻。我不追求做更多的事,而是追求把当前的事做得更好。

-- 黄仁勋,Nvidia 的 CEO,解释为什么不戴手表

2、

15年前,一位巴西营养学家发现,尽管巴西家庭对糖和油的消费减少,但肥胖率却在上升。为什么人们吃得更健康,却变胖了?

他认为,这是因为精细加工食品的出现,促进了人们对食品的消化。他因此创造了"超加工食品"(ultra-processed foods)这个词。

从此,这成了科学界的共识:想要健康,应该吃一些粗粮,避免多吃精细加工的食品。

-- 《关于超加工食品的风险》

3、

AI 研究已经70年了,人们最近才发现,让 AI 成功的真正方法是大量的计算。

根本原因就是摩尔定律,它使得计算成本持续呈指数式下降。

-- 《马斯克的梦想和 AI 的教训》

4、

我遇到一个程序员,他完全不想使用 AI。因为他用过一次,发现错误很多,就不想再用了,也不想了解。

这件事令我很困惑。我理解 AI 被过度炒作了,可能对你正在做的事情没有用处。我不理解的是,在2024年,你怎么可能成为一名程序员,却对一项据说会从根本上改变我们未来编程方式的技术一点也不好奇。

-- 《他们都使用它》

往年回顾

网络社区的悲剧(2023 #279)

手机充电问题的解决(2022 #229)

AR 技术的打开方式(2021 #179)

创业的凸函数和凹函数(2020 #129)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月22日

科技爱好者周刊(第 325 期):VS Code 编辑器的下一站是 Zed?

作者 阮一峰
2024年11月15日 08:05

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

温州江心屿是瓯江里面的一个小岛,最近完成了改造工程。(via

VS Code 编辑器的下一站是 Zed?

程序员离不开编辑器,眼下最流行的代码编辑器肯定是 VS Code。

VS Code 其他都好,但有一个很大的缺点:性能。

它运行在 Electron 的沙箱里面,资源占用多,速度慢。我现在调用某些插件,就有明显的延迟。

它还有点臃肿,安装包 100MB,需要磁盘空间 500MB。

所以,当我听说有一个新的编辑器 Zed,性能出众,功能强大,就立刻安装了,下面就是我的使用体会。

首先说一下,为什么 Zed 吸引我?

(1)它的作者是原来的 Atom 编辑器的作者,以及 Tree-sitter 解析库的作者。

(2)它基于 Rust 语言,充分利用多核 CPU 和 GPU,追求极致性能,速度极快。

(3)它内置了 VS Code 的很多插件功能,比如 LSP(语言服务器协议)、代码提示补全、多人实时编辑、AI 助手等。

(4)它的开发非常活跃,GitHub 仓库的星星已经达到了 49K。

安装后,我一打开就觉得非常清爽,极简主义的界面,布局跟 VS Code 类似,没有学习成本,可以直接上手。

它的速度真是快,不管什么操作,一点即开。用久之后,再用 VS Code 都不习惯了。

编程需要的功能,大部分开箱即用。如果没有的话,可以去插件市场找找。

有些功能,我觉得很实用。比如,它有一个大纲面板(下图左),列出当前脚本的所有函数,点击函数名可以跳转到函数实现。

它还可以添加参与人(必须有 GitHub 账号),让你跟多人实时协作、聊天。

参与者的头像显示在窗口右上角。

虽然它有上面这些优点,但也有一些难以忽视的问题。

(1)它不是真的跨平台,目前只有 Mac 版本最完善,Linux 版本我遇到了不少问题,Windows 版本官方暂未支持。

(2)很多地方还没来得及做,你经常会遇到一些小功能缺失,找不到解决方法。

(3)它的设置就是一个大的 JSON 文件,没有图形设置界面,动不动就要查文档。

(4)AI 助手只支持 OpenAI、Claude 和本地运行的 Ollama 模型。

我的结论是,它的表现非常出色,但没有完全准备好,只适合那些看重性能、愿意自己解决问题的程序员。

总的来说,Zed 是 VS Code 很好的替代品,奉行极简主义,不臃肿,内置功能完备。明年的这个时候,它也许会让 VS Code 不再那么流行。

[本周软件]302.AI

面对层出不穷的 AI 模型,你会不会有一种想法,如果存在一个统一的使用入口该多好?

事实上,真有这样的产品。周刊以前介绍过一个网站 302.AI,就是这种思路。

它的定位是"AI 应用超市",可以看作是一个适配层,适配了各种各样的 AI 模型,让你都能通过它来使用。

你可以直接使用各种模型,也可以使用"工具超市"预置的30多种 AI 应用,比如下图的"AI 学术论文搜索"。

它还提供 API 调用,通过它的服务器,调用各种模型的 API。

它有试用额度,此后按照使用量收费,一般是底层模型原始价格的五折。

最后,它本周开源了,各种官网工具的源码都放出来了,仓库地址 github.com/302ai。他们用 Next.js,你可以用来开发自己的 AI 应用。

科技动态

1、34阶魔方

普通的魔方是3阶的,即长宽高各3个色块,但也有其他阶的魔方。

上图是2阶、4阶、5阶的魔方。

最近,有人用 3D 打印机做了一个世界最高阶的魔方,达到34阶。

这么大的魔方,转动起来很不方便,已经不适合用来游戏,而是适合摆弄许多奇特的造型。

随着 3D 打印的普及,做出更高阶的魔方也不是难事,但是缺乏实际意义。目前,量产的最高阶魔方是17阶。

2、Ping 时钟

ping 是一个命令行工具,用来显示本机到服务器的信号传输时间。

一位国外程序员突发奇想,制作了一个 Ping 时钟,在钟面上显示 ping 的耗时。

它的钟面有两根指针,长指针是每次 ping 的毫秒数,短指针是最长耗时。

钟面下部是液晶显示屏,显示当前所在网络,以及目标服务器。

每次只要运行 ping 命令,就能很直观地看到,长指针不停地摆动,网速可视化了。

这个时钟的源码,已经开源了,使用 ESP32 芯片、一个微型电机和定制的 PCB 电路板。有电路基础的同学,完全可以自己动手制作。

3、麻雀的新用途

麻雀有什么用?澳大利亚科学家想出一个新用途。

澳大利亚是世界主要的铅生产国,有28个铅矿。铅会造成人体中毒,对儿童影响尤其大。

科学家一直寻找监控方法,能够测试环境的铅泄漏。他们想到了麻雀。

麻雀比人类,更早摄入环境中的化学物质。只要抓住麻雀,测一下它们的血铅,就能了解是否有铅泄漏,从而可以早期发出报警(下图)。

4、其他

(1)一位美国物理学家总结出猫的行为方程,已知猫的质量和疲劳系数,可以算出猫从 t0 到 t1 的位移,该公式的目的是"唤起非专业人士对经典力学的兴趣"。

(2)CDN 服务商 bunny.net,推出边缘函数功能,基于 Deno,可以备用。

文章

1、如何简化 PATH 环境变量(英文)

Linux 系统有一个环境变量 PATH,指定可执行文件的默认路径。本文告诉你,怎么简化这个变量,更容易管理。

2、AppData 目录的作用(英文)

一篇科普文章,Windows 11 有一个 AppData 目录,它有什么用。

3、蓝牙版本的变化(英文)

本文介绍蓝牙协议如何进化,每个版本的特点是什么。

4、业务逻辑不要放入数据库(英文)

本文提出,数据库最好只用来存放数据,不要加入业务逻辑,让应用程序处理业务逻辑。

5、SAML:技术入门(英文)

一篇长文,介绍企业用的登录协议 SAML。开头部分是 SAML 简介,写得挺好,后面是技术细节,可以不看。

6、质能公式与光速(英文)

一篇物理学科普长文,谈怎么理解质能公式 E=mc^2,为什么包含光速的平方。没有数学,我觉得很有启发。

工具

1、PasteBar

开源的桌面软件,用来管理剪贴板,可以搜索剪贴板历史,以及预设常用的粘贴项(比如地址),支持 Windows 和 Mac 系统。

2、FastHTML

一个 Python 的 Web 框架,Django 的替代品,用起来更简单。

3、Kagi 翻译

搜索引擎 Kagi 推出的翻译服务,类似于谷歌翻译。

4、Star

一个 Web 应用,在手机打开以后,它会利用手机的运动传感器,显示某一颗你指定的卫星相对你的方位。

5、kkTerminal

一个开源的网页终端,在网页上通过 SSH 连入远程主机。(@zyyzyykk 投稿)

6、ReactPress

一个基于 Next.js 的博客和 CMS 系统,查看 demo 站点。(@fecommunity 投稿)

7、PDFMathTranslate

开源的命令行工具,使用 AI 翻译 PDF 文件,完整保留排版。(@Byaidu 投稿)

8、dimmer

开源的 Chrome 浏览器插件,暗黑模式一键切换。(@slc3a2 投稿)

9、ThriveX

一个开源的博客系统,基于 Next14 + Spring Boot。链接是前端仓库,另有后端控制台。(@LiuYuYang01 投稿)

10、Trayce

这个工具拦截本地开发环境中 Docker 容器发送和接收的 HTTP(S) 请求。

11、ngtop

一个命令行工具,用来查询 nginx 日志。

12、InputShare

电脑连接安卓设备之后,这个工具可以把电脑的键鼠和剪贴板,共享给安卓设备,只支持 Windows。(@BHznJNs 投稿)

资源

1、逆向工程教程(Reverse Engineering For Everyone)

面向初学者的逆向工程英文电子书,涵盖了 x86 和 ARM 架构。

2、一站式 iframe 生成器

HTML 的 iframe 元素有很多属性,这个工具网站可以查看所有属性值,并生成最终代码。(@wincatcher 投稿)

3、Chromium 的命令行开关

这个网页收集 Chromium(Chrome)浏览器的命令行开关,居然有1600多个。

4、Typst 介绍(英文)

Typst 是一种排版工具,可以生成论文、小册子、表格等,功能类似于 LaTeX,但是写法类似于 Markdown,用起来相对简单。

图片

1、犰狳化石

一个阿根廷农民发现,路边有四个奇怪的大土块。

后来经过生物学家辨认,这居然是四个巨型犰狳的化石,这种动物已经在一万年前灭绝了。

犰狳是一种看上去很像穿山甲的动物,外面披着一身铠甲。下面就是现代小型犰狳的照片。

巨型犰狳的灭绝原因,有一种说法是跟人类有关,古人想要它们的铠甲。

2、因纽特人的雪镜

雪地和冰面会强烈反射阳光,导致视力受损,这叫做"雪盲症"。因此,雪地活动都需要佩戴墨镜或保护镜。

因纽特人是美洲北极圈的原住民,已经在那里定居了几百年。他们在原始条件下,怎么防止雪盲症呢?

原来他们使用各种材料(骨头、木头、鲸须)制作雪镜,戴在眼睛前,只留出一条窄缝观察外界。

这种眼镜限制了进光量,保护了佩戴者的眼睛,也有助于提高视力。它就像针眼相机一样,狭缝聚焦光线,使得远处的物体看起来更清晰。

文摘

1、语音 UI(大多数情况下)很糟糕

AI 的发展,使得语音可以成为用户界面,这称为"语音 UI"。

有人认为,语音 UI 将是终极 UI,因为当你可以直接说出命令,为什么还要费心使用键盘和鼠标呢?

我不相信语音会成为通用界面,原因有很多。

(1)声音本质上无法表达抽象思想。很多时候,我们的大脑里面只有零碎的意识,很难找到正确的词语,将它们表达出来。

(2)语音让很多事情变得更难而不是更容易。理论上,说出"叫一辆网约车去机场"似乎是完成任务的最简单方法,但是如果你还有其他要求,比如指定车型和限价,口头表达就会很麻烦。

(3)语音侵犯隐私。你说出指令的时候,愿意被别人听到吗?

(4)视觉 UI 可以展示软件的局限性,语音 UI 就不行。很多事情,软件无法做到,视觉 UI 可以帮助我们了解软件的功能。如果没有视觉 UI,你很难发现软件不能做什么事。

(5)用户不喜欢一直说话。使用语音完成简单的任务是可以的,但要完成所有事情很快就会变得烦人,难道你要一直说个不停吗?

(6)语音无法解决现实世界中的歧义。语言表达可能存在大量歧义,无法通过纯语音界面轻松解决。人工智能可能无法正确理解你想要完成什么。

当然,视觉 UI 也有歧义,但是这会更困难,因为你的操作有视觉反馈。

言论

1、

美国的在线教育公司 Chegg,业务是帮助完成家庭作业。学生输入题目后,它会分发给印度的数千名承包商,让他们提供答案。

ChatGPT 诞生后,学生不再使用这个服务了,而是直接问 ChatGPT。Chegg 的股价已经下降了99%。

-- 《ChatGPT 如何击垮在线教育巨头》

2、

大多数哲学的目的,都是强化你的身心,让你学会,对于那些自己无法控制的事情要漠不关心、

-- 《禁欲主义》

3、

作为一个德国人,我每月支付的医保费用是1000欧元左右,另外还要支付差不多金额的个人所得税。但是,如果我停止工作,结婚并生1-2个孩子,我拿到的失业救济金 + 生育补助,比我现在的税后收入还要多。这完全是不可持续的,但政治家们没人谈论这些。

-- Hacker News 读者

4、

经常有人问我,为什么2019年决定将 Keras 库合并到 TensorFlow。

这不是我的决定,而是 TensorFlow 团队主管的决定。当时我是谷歌 L5 级员工,而他是 L8。如果我不同意这个决定,就需要从谷歌离职。

-- 弗朗索瓦·乔莱(Francois Chollet),神经网络库 Keras 的作者,本周宣布从谷歌离职

5、

创业公司的最大风险不是失败,而是一种不敢尝试的文化。

-- 《容忍失败的领导者》

往年回顾

棘手的 AI 版权(2023 #278)

人类和人生的意义(2022 #228)

家庭太阳能发电的春天(2021 #178)

这个社会是否正在变成"赛博朋克"?(2020 #128)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月15日

科技爱好者周刊(第 324 期):人类已知的最大质数

作者 阮一峰
2024年11月8日 08:15

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

世界最大博物馆之一的卢浮宫,在阿联酋的阿布扎比有一个分馆。这个分馆建在一个海岛上,游客可以划着皮划艇进入参观。(via

人类已知的最大质数

上个月,有一个不太引人注目的科学发现:人类已知的最大质数诞生了。

除了数学家,大概没人会对这个消息感兴趣,它离日常生活太远了。

但是,本周《华盛顿邮报》的一篇报道,却把这个发现跟普通人拉近了距离。

大家恐怕想不到,发现这个数字的人不是数学家,而是程序员。《华盛顿邮报》就是讲述背后的精彩故事,我看得津津有味,科学报道就该这么写,下面分享给大家。

====================

2024年10月10日,美国程序员卢克·杜兰特 (Luke Durant) 发现了人类已知的最大质数。

那天晚上,他收拾衣物,准备从加州返回阿拉巴马州的老家。出门之前,他决定远程登录服务器,看一下正在运行的脚本。

他原以为,就像过去一年的每次远程登录一样,脚本要么没有结果,要么报错。但是,那天晚上不一样,脚本给出了运行结果。

杜兰特意识到,他刚刚发现了世界上新的最大质数。他立刻告诉同伴这个消息,然后顾不上回老家了,开始仔细检查脚本的结果。

他发现的这个质数,后来被命名为 M136279841。它大得离谱,足足有41,024,320个十进制位。如果你每秒读一位,需要475天才能读完。这个数字等于2的136,279,841 次方减一。

为了算出这个数字,杜兰特花了差不多一年,自掏腰包大约200万美元,去购买 GPU 计算时间,用来运行脚本。

今年36岁的杜兰特,曾经在 Nvidia 公司担任程序员。公司的股价上涨,让他赚到了足够的钱,于2021年离职,开始投入自己的项目。

他选择的项目,就是计算梅森质数。他在 Nvidia 的经历,让他能够熟练使用 GPU 编程,去完成高速计算。

17世纪,法国传道士马林·梅森(Marin Mersenne)提出,存在无数个质数,可以表示成 2n - 1 的形式,比如3等于22 - 1,7等于23 - 1。

目前,人类已知的梅森质数有52个(包括杜兰特发现的那个)。寻找新的梅森质数,早就成了数学迷的一种爱好。

上个世纪90年代,互联网出现后,一个美国程序员乔治·沃尔特曼(George Woltman)组织了"互联网梅森质数搜索计划"(Great Internet Mersenne Prime Search,简称 GIMPS 计划)。

GIMPS 计划的目的,就是使用计算机程序,寻找梅森质数。它的官网提供程序下载,你可以在自己的电脑上运行这个程序,它会在计算机的空闲时间进行计算,寻找下一个梅森质数。

目前,全世界大约有3,000~5,000名志愿者在运行这个程序。梅森质数实在太难算了,在过去的28年里,GIMPS 计划一共发现了18个梅森质数。

上一个数字发现于2018年,比杜兰特发现的第52个梅森质数短了1600万个十进制位。

杜兰特的不同之处在于,在他以前,所有人都使用 CPU 进行计算,只有他使用 GPU。CPU 一两周的计算量,GPU 大约只需要一两天的时间。

杜兰特为了找到这个数字,动用了17个国家/地区24个机房和两家云服务商的服务器,进行协同计算。

他说:"如今个人的能力比历史上任何时候都强得多,你能调用的云计算,规模令人难以置信。我们拥有这样神奇的强大系统,所以最好弄清楚如何利用它们。"

梅森质数没有任何实际用途,科学家寻找它只是为了乐趣和探索人类知识的边界。

杜兰特由于这个发现,得到了3000美元奖金。他把这些钱捐给了阿拉巴马州的公立寄宿学校,那是他去加州理工学院读大学前的母校。

他发现的最大质数已经到了4100万位,GIMPS 计划依然在悬赏第一个找到十亿位质数的人。

活动

本周有两个很不错的活动,大家看看。

豆包 MarsCode 校园发布会

大学生怎么学 AI,提升竞争力?学习中遇到困难,怎么解决?毕业后怎样加入该行业?

这都是同学们非常关心的问题。

现在,豆包大模型旗下的豆包 MarsCode 正式进入校园,推出一系列活动,为同学们服务,举办课程、活动、mvp 评选等,帮助大家找到自己的未来。

下周六(11月16日)下午是发布会直播,当天除了介绍各种 AI 相关的校园活动,还有来自全国各高校的学长学姐分享学习成长之路,与豆包 MarsCode 专家对话 AI 职业发展等。

从今天开始,就可以报名。为了鼓励参与,每天都有接力奖、惊喜开奖、微信群福利,直播当天还有抽奖。奖品非常多,都是同学们想要的。

现在扫描上方海报二维码,或者点击这个链接,了解详情和报名。

[竞赛] 扣子 AI 挑战赛

字节旗下的"扣子 Coze"正在举办模板挑战赛。我介绍一下这个比赛。

11月22日前,你只要用它创建一个 AI 应用,提交到官网的智能体商店,就能参加比赛。

扫描上方海报二维码,或点击这里,了解详情。

大家不要觉得这比赛很难,扣子是"工作流模式"(参考我的介绍文章官方文档),全图形界面,通过编排节点,自动生成 AI 应用,没有编程基础也能上手。

而且,扣子本周还开通了付费模板。你可以为自己的应用模板设置价格,实现变现。别人基于你的应用进行修改,必须付费购买模板,从而为你带来收入。

本次比赛会根据模板复制的数量,给予1000元~10000元的奖金。搭建 AI 应用不收费,大家不妨从模板商店寻找灵感,试试用低代码编程,完成 AI 开发。

科技动态

1、旧金山胶囊旅馆

旧金山市中心有一家月租的胶囊旅馆,由于太受欢迎,想入住的人必须网上申请,然后进行抽签。

结果,17个床位有300个人申请。

一个上下铺的床位,月租价格是700美元(约人民币5000元),包含水电费、上网费、公共淋浴、厕所、一个储藏柜和共用厨房的使用权。

这么贵的铺位,还如此抢手,原因是你在旧金山再也找不到如此便宜的住宿了。

由于有硅谷,旧金山是美国房价最高的地区。公寓里面的一个合租单间,月租要3000美元~3500美元,普通美国人也租不起。

2、伯明翰的 Oracle 灾难

2022年,英国伯明翰市政府更换 ERP 系统,使用 Oracle 替换已经运行20多年的 SAP 公司产品。

上线后才发现,Oracle 无法生成现金审计报告,市政府迫不得已改用人工审计。

Oracle 系统的更换成本,已经最初估计的1900万英镑(约1.75亿人民币)增加到1.31亿英镑(约12亿人民币)。

该问题何时解决,还不得而知,成本将进一步上升。这件事情反应了,更换大型的线上系统的风险有多高。

3、AI 虚构的万圣节晚会

上月底是万圣节,两个巴基斯坦青年做了一个网站,上面是全世界各地的活动信息。

但是,他们没有披露,为了节省数据搜集的成本,这些活动都是 AI 生成的,实际上不存在。

结果,一个不知情的爱尔兰访问者转发了活动信息,更多的人看到后,又转发到 Tiktok 和 Instagram。

结果,万圣节那天晚上,爱尔兰首都都柏林的某条大街上,聚集了上千人,都等着参加活动。

大家在街上站了几个小时,发现上当了,根本没有活动。为了避免更多人聚集,警方不得不发出通告。

第二天,这个事件就上了国际媒体,那两个巴基斯坦青年不得不道歉。它凸显了,内容注明"AI 生成"的必要性。

4、其他

(1)中国开始向民众征集月球车名称,并披露了两种月球车设计方案。

(2)Etched 公司宣布了世界第一款实时 AI 游戏《绿洲》,基于 MineCraft 进行训练,游戏画面都是 AI 实时生成,参见网友介绍网站

(3)OpenAI 公司启用域名 chat.com,跳转到 chatgpt.com 。

文章

1、ChatGPT 搜索 vs 谷歌搜索(英文)

上周,OpenAI 公司推出了 ChatGPT 搜索,跟谷歌发生正面竞争。

网络媒体就去对比了两者的搜索结果,结果就是一句话:谷歌有麻烦了。

2、为 Git 命令设置别名(英文)

作者介绍怎么为 git 命令设置方便的别名,比如git add -A可以设为git a

3、如何生成简历网页(英文)

作者用静态站点生成器 Eleventy(基于 JS 语言),为自己做了一张简历网页(上图),还可以本地打印为 PDF 文件。

4、我为 VS Code 贡献了代码(中文)

VS Code 内置的 TypeScript 语言服务器,有一个 bug,作者修复了这一问题。(@imbant 投稿)

5、如何将 makefile 用于 Node.js 项目(英文)

本文详细教你怎么用 makefile 管理 Node.js 项目的各种内部操作。

6、Lit 框架开发 Web Components 入门教程(英文)

一篇不错的 Lit 框架入门教程,教你怎么写一个 Web component。

7、Ruby 如何加载模块(英文)

一篇初学者教程,介绍 Ruby 程序的模块加载方法的历史演变。

工具

1、flyscrape

一个网页抓取的跨平台命令行工具,使用 Go 语言编写,但是它的操作脚本是用 JS 写的,方便用户提取网页内容。

2、uv

Rust 语言写的 Python 包安装器,可以替代 pip,运行速度更快,参见介绍文章

3、ChatTCP

一款 Mac 的 TCP 数据包分析工具,致力于简化 TCP 分析,核心功能免费。(@wujiuye 投稿)

4、typing-practice

开源的英文打字练习工具。(@wincatcher 投稿)

5、云搭

开源的低代码平台,用来搭建小程序、H5、问卷、图文文章等多种应用,试用 Demo。(@wangyuan389 投稿)

6、NextTalk

一个基于 Next.js 的网页版实时聊天工具,使用说明详见它的桌面版,可以作为开发参考。(@Mebius1916 投稿)

7、dazhengTools

开源的纯前端在线加/解密工具箱,可以离线使用。(@dazhengs 投稿)

8、TempMail

临时邮箱服务,支持 iOS 和网页端。(@houzhongjian 投稿)

9、自动化巡检系统

一个开源的网址状态定时巡检工具,防止指定网址出现白屏、服务无响应等问题,有异常会发送钉钉、企业微信、飞书警报,体验 Demo。(@zdx0122 投稿)

10、Magika

一个命令行工具,可以检测某个文件是什么类型(比如图片文件还是文本文件),有网页的 JS 版。它是谷歌的产品,谷歌内部也在用它检测文件类型。

AI 相关

1、AI Hear

一款离线运行的桌面软件,实时语音转文字、实时翻译、字幕导出,支持 Mac、Windows。(@phonechan 投稿)

2、5ire

开源的大模型桌面客户端,支持 Windows、Mac。(@nanbingxyz 投稿)

3、CR-Mentor

一个开源应用,自己搭建 AI 服务,自动对 GitHub 的代码提交进行 code review。(@Gijela 投稿)

4、APIPark

开源的一站式 AI 网关,搭建企业自己的 AI 开放平台,方便同时接入多种模型,进行 API 调用。(@Frey2024 投稿)

5、Srcbook

一个开源编程平台,给出文字描述,然后通过 AI 生成 JS 的全栈应用。

6、Claude Artifacts

Claude 模型的 Artifacts 功能,与上一条的作用相同,可以生成一个单页应用,但是不开源,本文介绍该功能。

7、Browser-Use

一个 Python 库,可以通过 AI 模型,完成浏览器自动化。

资源

1、Unfaked

一个免费图片库,收集可以乱真的 AI 生成图片。

2、系统设计面试:内幕指南(中译)

《System Design Interview: An Insider's Guide》一书的中文翻译,介绍如何设计不同目的的软件系统,可以用来准备面试。(@Admol 投稿)

3、Auth Wiki

一个维基网站,收录各种与身份验证、授权和身份管理相关的条目,解释很详细。

4、3D 卫星图

这个网站可以实时查看所有运行中的地球卫星,选择一个地点,可以看到该地上空现在是什么卫星。

图片

1、太阳能板

太阳能板的价格,正在快速下降,已经接近或低于普通的挡板。

以后,我们看到的建筑物,很可能都会采用太阳能板作为外墙。

文摘

1、为什么美国医院还在使用寻呼机?

寻呼机是上个世纪的通讯工具,现在已经淘汰了。

但是,近80%的美国医院还在使用寻呼机,这是为什么?

这有几个原因。

(1)信号问题。

寻呼机使用的是类似调频广播的信号,不是手机的 3G/4G/5G 信号,穿透性更好,覆盖范围更广。医院的某些死角,收不到手机信号和 Wi-Fi,但是寻呼机依然有信号。

这使得寻呼机比手机更可靠,如果发生灾难,寻呼机比手机更不容易断网。

(2)续航。

寻呼机的电池寿命很长,可以两周充电一次,而手机一般是每天一充。

(3)简单性。

寻呼机比较简单,不易被攻击或破解。即使落在别人手里,泄漏的信息也很有限。

言论

1、

一项美国的调查发现,81%的公司发布过虚假的招聘广告,目的有几个:(1)在招聘网站持续亮相,(2)建立人才库,(3)让现有员工感到自己是可替代的,从而不敢松懈。

-- 《幽灵工作对科技从业者的破坏》

2、

现代硬件的速度快得难以置信,苹果的 M1 Max 芯片运行频率为 3.2GHz,即每秒32亿个时钟周期。

然而,我用它打开微软的 Teams 需要3秒,我不相信这需要花费96亿个时钟周期。我知道这样说过于简化,我的意思是:硬件变得如此之快,我们使用的应用程序却变慢了,这究竟是怎么回事?

-- preyneyv.dev

3、

一项调查发现,科学论文中 might 和 probably 这种表示不确定的修饰词的出现频率,过去20年中下降了40%。

这表明科学论文的不可靠、夸大其词的论断,正在令人担忧地增多了。

-- Science 官网

4、

"中产阶级"这个词在美国的含义,正在改变。以前的中产阶级,是指有足够资金进行投资的人,他们有稳定的工作,有房子、汽车、家庭和退休金。

现在的中产阶级,更像不稳定阶层。你有一份工作,但随时可能失去它。你买不起房子,无力为退休储蓄,平时仅仅支付账单就手头紧张。

这是美国的新常态。我的一个银行朋友说,他的大多数客户,支付租金后的账户余额最多只有几百美元。

-- Hacker News 读者

5、

美国心理学会的一项研究表明,消耗脑力的思考,会导致烦躁、沮丧或其他负面情绪,所以"思考不利于健康"这个观点是对的。

-- 合众社报道

往年回顾

工作台副屏的最佳选择(2023 #277)

脸书的公司入职教育(2022 #227)

iPad 的真正用途(2021 #177)

未来人人开发软件,几乎没人编码(2020 #127)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月 8日

科技爱好者周刊(第 323 期):技术公司的口号比拼

作者 阮一峰
2024年11月1日 08:08

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

去年建成的乌鲁木齐文化中心,包含图书馆、博物馆、大剧院等的六栋大楼。它们组成一个环形,中间是象征花蕊的文化塔(上图),里面有餐厅和观光平台。(via

技术公司的口号比拼

技术公司一般有一个口号(slogan),用来介绍自己。

全世界最有名的公司口号,大概就是下面这个。

我最近读到一篇老外的文章,提出两个指标,判断口号的优劣。

  • 清晰度(clarity):口号是否准确传达了公司的特点。
  • 影响力(impact):市场是否接受该口号,即口号是否广为人知。

根据上面两个指标,公司口号可以分成四类。

  1. 高清晰度、高影响力
  2. 低清晰度,高影响力
  3. 高清晰度、低影响力
  4. 低清晰度、低影响力

第一类"高清晰度、高影响力"是最佳情况,口号清晰传达公司目标,并且深入人心。比如,GitHub 的口号"世界构建软件的地方"。

再比如,Notion 的口号"写作、计划、组织"。

第二类"低清晰度,高影响力"是市场记住了口号,但是口号过于笼统含糊,无法让人联想到公司。比如,Snowflake 的口号"AI 数据的云"(AI data cloud)。

第三类"高清晰度、低影响力"是口号很符合公司特点,但是市场记不住,消费者没感知。比如,Stripe 的口号"你的收入增长的金融基础设施"(Financial infrastructure to grow your revenue)。

第四类"低清晰度、低影响力"是最糟糕的情况,口号含糊不清,消费者视若无睹。比如,Dell 的口号"做得更多的力量"(The power to do more)。

再比如,Dropbox 的口号"简化你的生活"(Simplify your Life)。

我套用这个标准,对国内公司的口号进行分类。以下都为个人看法,纯属娱乐。

"高清晰度、高影响力"。

  • 阿里巴巴:让天下没有难做的生意
  • 百度:百度一下,你就知道
  • 抖音:记录美好生活

"低清晰度,高影响力"。

  • 网易:网聚人的力量
  • 快手:拥抱每一种生活

"高清晰度、低影响力"。

  • 华为:构建万物互联的智能世界
  • 美团:帮大家吃得更好,生活更好

"低清晰度、低影响力"。

  • 支付宝:生活好,支付宝
  • 小米:永远相信美好的事情即将发生
  • 荣耀:活出我的荣耀
  • DJI:The Future of Possible(未来无所不能)

科技动态

1、猩猩的工具

一位游客在捷克的布拉格动物园,拍到了一张神奇的照片。

一只猩猩使用布条,去捞取漂浮在水面的篮子。

这证明猩猩是有智能的,会使用工具。

这件事最神奇之处,还不是这个,而是布条原本挂在树上,是干的。这只猩猩先从树上扯下布条。

然后,它把干布条甩进水里,使得布条变重。

接着,它把变重的湿布条,去勾取篮子。

2、二维码门铃

一位外国程序员没有门铃,朋友要求他装一个。

他突发奇想,能不能用二维码代替门铃?

他就开发一个手机 App,里面的二维码(上图)可以打印出来,贴在门上。

访客用手机扫描这个二维码,它会打开 App 的官网。该网站调用手机摄像头,让你跟屋主人实时通话(下图)。

二维码的好处是除了实时通话,还可以在网页预留信息。门牌旁边贴个二维码,可能是一个不错的主意。

3、威尼斯青铜狮子

威尼斯圣马可广场有一只标志性的青铜狮子,是这个城市的标志。

但是,谁也不知道它从哪里来,为什么会放在广场上。人们只知道,最早在1293年就有它的记录。下图是1870年代的照片。

最近,科学家对狮子的成份做了化验,根据铜的同位素比对,震惊地发现,这些铜来自中国。

这只狮子很可能是在中国铸造的,因为它很像唐代的镇墓兽,来到威尼斯后,才被加上了翅膀。

现在的问题是,古代的人们为什么大费周章,将这只庞然大物从中国运到威尼斯呢?

文章

1、OpenAI 如何发送数据(英文)

OpenAI 的 AI 使用"服务器发送事件"(sse),向浏览器主动发送数据,本文演示它的数据格式。

2、谷歌的三次面试记录(中文)

作者记录了在2016年、2020年、2024年三次面试谷歌软件工程师的经过。(@DoctorLai 投稿)

3、画布与文档(英文)

本文认为,网页设计已经从文档演变成画布,更有设计感。他给出了很多例子,可以当作首页设计的参考。

4、纯 Web 视频剪辑(中文)

本文介绍使用 WebCodecs API,构建一个基于网页的视频剪辑产品的原理。(@hughfenghen 投稿)

5、BGP 协议简介(英文)

BGP(边界网关协议)是互联网各个子网之间的路由协议,本文是一篇简单介绍。虽然写得不太清楚,但可以看看。

6、机器学习的嵌入(embedding)是什么(英文)

嵌入(embedding)是机器学习的重要技术,本文解释它是什么,写得不错。

7、提升 Shell 脚本用户体验(英文)

Shell 脚本难读难写,本文给出6个小技巧,可以提升用户体验。

工具

1、Garage

一个开源分布式对象存储工具,AWS S3 的替代品,兼容 S3 的客户端,可以建立自己的网络存储系统。类似工具还有 SeaweedFS

2、Transcribro

安卓的语音输入法,底层使用 whisper 模型。

3、StarLocator

一个开源的天文学网页应用,上传星空的照片,就可以识别拍摄位置。

但是,限制条件比较多,需要照片清晰,并且包含至少5个天体,以及给出拍摄时间和多条铅垂线。(@cheanus 投稿)

4、iCraft Editor

绘制 3D 架构图的网页应用,免费使用。(@yuanguandong 投稿)

5、HotHub

开源的热点话题查看和搜索网站,展示话题的热度趋势,基于 Next.js。(@w4n9hu1 投稿)

6、Web Archive

网页收藏备份的 Web 应用,基于 Cloudflare Worker,数据保存在 Cloudflare。(@Ray-D-Song 投稿)

7、RSS Impact

一个开源的 RSS 在线订阅工具,支持各种机制的 Hook(网络钩子),可以用来触发各种操作。(@CaoMeiYouRen 投稿)

8、codess

快速生成和在线管理 VS Code 代码片段。(@yayaluoya 投稿)

9、Bookmarks Artist

开源的 Chrome 浏览器插件,提供一个查看浏览器书签的全新界面。(@liujuntao123 投稿)

10、PgManage

一个跨平台的 Postgres 数据库的桌面客户端,提供图形界面。

AI 相关

1、Skyvern

一个开源项目,将 AI 模型与计算机视觉结合起来,用自然语言完成浏览器自动化。

2、URL Parser Online

这个网站将 URL 转换成大模型可以输入的格式(Markdown、TXT、HTML)。(@jiangwei909 投稿)

3、电子元件分类器(Electronic Component Classifier)

一个本机的 AI 工具,用摄像头识别电子元件。

4、爱享写作

Windows 桌面软件,无需 GPU,离线生成万字长文。(@taotaow 投稿)

资源

1、地震地图

这个网站是地震地图,标识出了1980年后大于5.2级的地震(共10万多次),可以清晰地看到地震带,也可以查看某个地区发生过的地震。

2、自己动手写 Git(中译版)

本教程使用 Python 从头实现简化版 Git,帮助读者理解 Git 的核心原理。(@hanyujie2002 投稿)

3、Kill the Newsletter!

这个免费服务可以将邮件列表,转为 RSS Feed。

4、了解电池

一本免费的英文书籍,向普通读者介绍电池的基本知识。

图片

1、钥匙圈的窍门

如果你还在使用钥匙圈,那么提高使用效率的一个窍门是,所有钥匙的牙齿朝向同一个方向。

这样的话,使用钥匙时,就不用切换方向。

另外,大多数人是顺时针切换钥匙,钥匙的排列顺序可以跟开门顺序对应起来。

最后,钥匙圈上面可以挂一个饰物,位置在第一把钥匙与最后一把钥匙之间。只要摸到饰物,根据顺时针,马上就能确定第一把钥匙和最后一把钥匙。

文摘

1、为什么自由职业不是人们想象的那样

很多人听到"自由职业",想到的就是自己当老板,穿着睡衣工作,在咖啡馆喝拿铁咖啡,在海滩散步,同时赚大钱。

根本不是这样,自由职业压力巨大。

(1)你的每个月都是一场赌博。这个月,你拿到高薪;下个月,客户就不来联系了,你不停刷新收件箱,什么也收不到。

自由职业是不可预测的。客户随时会消失,你可能尽了最大努力,还是连续几周没有一个项目。

除非你有很厚的家底(大多数人没有),否则,没有客户会让你晚上难以入眠,不知道怎么偿付房租和账单。

(2)自由职业不会带来财务保障。全职工作所拥有的健康保险、退休储蓄、带薪休假,甚至可能还有休息室里的一些免费零食,自由职业全都没有。

作为一名自由职业者,你赚到的每一分钱都不容易。你不仅要设法赚钱,还要搞清楚你自己的税务、健康保险、退休计划。你只要请假就意味着没有收入。

你某一次的报酬可能看起来不错,但一旦考虑到税收、保险和费用,你很快就会意识到,自由职业并不具备传统工作所具有的财务缓冲。

(3)自由职业不具有扩展性。你一个人就是整个公司,销售、会计、客服都要管,这意味着你能承受的工作量很有限。

你想多做几个项目,很可能会精疲力尽。你也很难提高收费。

到了某个时候,你会意识到,无论你多么努力工作,多么忙碌,一天的时间就只有这么多。自由职业者稍微忙碌,就会达到自己的上限,如果没有资源来雇人,你会感觉自己就是一只困在轮子上的仓鼠----不断地奔跑,但永远不会真正到达任何地方。

(4)自由职业听起来像是自由,但它可能会变得非常孤独。在家工作意味着没有同事可以交流,没有办公室文化,也没有饮水机八卦,只有你和你的电脑。

这种孤独会比你想象的更快地导致倦怠。你很容易感觉自己一直在工作,因为没有下午5点的下班时间,你可能午夜还在回复电子邮件,周末还在接听电话,不断感受到必须更加努力工作的压力,因为如果不这样做,可能会没有收入。这让人筋疲力尽,从长远来看是不可持续的。

(5)结论:自由职业并不适合所有人。如果你能够承受不稳定的收入和心理压力,并且能够像专业人士一样管理自己的财务,那么你可能可以尝试自由职业。但是,你必须时时刻刻准备好,事情一旦出现问题,你有可靠的后备计划。

言论

1、

我热爱消费者市场,讨厌企业市场。我们推出了一种产品,告诉每个人,大家自己决定要不要买,这很简单。但是,企业市场不是这样,使用产品的人自己做不了主,而做主的人不使用产品。

-- 乔布斯

2、

我非常支持某些名校的录取条件,他们面试的前两项就是"你是否照顾过孤儿,是否照顾过孤寡老人",如果没有,你就没有履行社会责任。

这些名牌大学,培养的都是企业领袖、国家领袖、社会领袖......如果你不爱社会,只是为了多赚钱,你就是社会价值观的破坏者,而并不是社会的建设者。

-- 任正非,《与 ICPC(国际大学生程序设计竞赛)成员的座谈》(2024年10月14日)

3、

两百多年来,美国从一个非常落后的国家变成一个非常发达的国家,在于其开放性、包容性,全球人才都到美国去创新,带来文化多元化、社会多元化、以及科学技术的多元化,创造了伟大的美国。

美国给全世界的所有国家、所有公司树立了榜样,那就是必须开放,如果封闭起来就要落后。华为要向美国学习开放性、包容性。

-- 任正非,同上

4、

人们不断为 JavaScript 语言发布新的捆绑器、压缩器、转译器、包管理器。这是一个警告,表明这门语言有些地方出了问题。

显然经过一次次重写,问题还没有得到解决。对我来说,这表明存在根本问题:我们没有在正确的层次上解决问题,或者可能根本无法解决。

-- Hacker News 读者

5、

我的生活态度是,早上起床想一想,我有可能活不到今天晚上,晚上上床想一想,我有可能活不到明天早上。

-- 德图里子爵(1776-1854),法国贵族

往年回顾

内容行业的衰落(2023 #276)

谷歌出了什么问题?(2022 #226)

中国法院承认 GPL 吗?(2021 #176)

内卷化是什么?(2020 #126)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月 1日

AI 开发的捷径:工作流模式

作者 阮一峰
2024年10月31日 03:24

一、引言

大部分人使用 AI,大概都跟我一样,停留在初级阶段。

平时,就是向 AI 提问(又称聊天),偶尔也用一些现成的服务:生成图片、生成代码、翻译文章等等。但是,时间久了,就觉得不够用,很多个性化需求,根本找不到工具,需要自己想办法。

我想,这是很多人面临的问题:如果深入使用 AI,就必须自己做开发

今天,我就介绍一种 AI 开发的简单方法,没有那么高的门槛,普通人也可以上手。

二、AI 开发的三种模式

按照从难到易,我把 AI 开发分成三种模式。

(1)自建模型:自己搭建 AI 模型,并寻找数据进行训练。

这种模式难度高,成本大,必须是 AI 专业人士或大公司,才会使用。

(2)API 调用:自己编写脚本,去调用他人运行的模型 API。

这种模式要求使用者必须会编程,优点是适应性强,什么需求都能编程解决,缺点是编写和调试脚本要花不少时间,还要自己部署服务端。

(3)工作流模式采用 AI 服务商提供的工作流(workflow),编排每个步骤,形成自动化操作。

这种模式最简单,不懂编程的人也能上手,可以不编写脚本,有现成的服务端,省时省事。缺点是受限于 AI 服务商提供的能力,对方不提供,就做不了。

我是 AI 新手,就选择了最后这种模式,尝试 AI 开发。

三、GPT 商店和 Copilot 模板

很多 AI 大厂都提供"工作流模式",允许开发者在他们的模型上,定制自己的应用。

最有名的大概就是 OpenAI 公司的 GPT 商店

它开放 ChatGPT 的底层能力,让开发者定制某个领域的专用 GPT,比如学术论文的 GPT、处理 Excel 文件的 GPT 等等。

微软的 Copilot 也有类似的功能,叫做"模板"(template)。

不过,这些都是国外的服务,需要收费,服务器在境外。好在国内有免费的替代品,我就选择了国内产品。

四、工作流演示

我先演示一下,工作流的操作界面。大家就能明白,它是怎么回事了。

工作流其实就是把一个 AI 应用,分成若干个步骤。每个步骤是一个节点,你在上面设置这一步的操作,然后所有节点按照流程,完成任务。

上图是扣子 AI(coze.cn)的工作流编排界面,包含四个节点。

扣子是字节跳动旗下、免费的 AI 应用开发平台。使用过程非常直观,就是在网页画布上,通过图形化操作,一步步创建 AI 应用。我就用它来演示。

它的开发页面左侧是不同类型的节点,下图是其中一部分。

新建节点时,点击对应类型就可以了。一般来说,第一步总是新建"模型节点"或"插件节点"。

新建模型节点后,如果你想用自己的数据训练模型,可以在项目管理页面上,新建一个知识库,上传数据文件。然后在工作流里面,创建一个"知识库节点"。

如果你想启用持久记忆能力,记住用户的历史对话,那么可以新建数据库,保存用户数据,然后在工作流创建"数据库节点"。

所有节点设置完毕,这个 AI 应用就可以运行了。最后一步,就是发布该应用。

扣子会让你选择发布渠道(上图),目前支持发布到商店(在扣子平台使用)、第三方平台(在飞书、抖音、微信使用),以及 API 和 SDK(在用户自己的软件使用)。

以上就是工作流模式的使用界面,只是一个简单介绍,大家有一个大概的理解就可以了,具体操作可以看文档

它还是很容易上手的,熟练以后,开发一个 AI 应用,一两个小时就可以搞定。

五、工作流开发的例子

为了加深理解,我举一个实际开发的例子。某餐饮企业想要搭建一个 AI 应用,用来分析用户的点评。

为此新建一个工作流,基本功能只需要三个节点----输入节点、分析用户点评的 AI 模型节点、输出节点。

然后,把这个工作流发布成 API。用户的点评传入这个 API,它就会返回一段 JSON 数据,里面有 AI 模型识别出的用户评价(正面、负面、中性),以及点评关键词(环境/服务/菜品)。

上图是这个工作流的预览调试界面,输入了一段真实的点评,运行结果以 JSON 格式返回。

可以看到,AI 识别出该用户对产品是中评,对环境是差评,对上菜速度是好评。

六、模板功能

工作流除了自己使用,还可以保存成模板(template),发布到模板商店,让别人使用和借鉴。

在模板商店,你可以看到官方和其他用户搭建好的工作流,目前已经有上千个,还在快速增长。

这些工作流可以直接使用,也可以作为模板复制。用户复制模板后,对它们进行学习和修改,将其改造为适合自己的应用。

对于模板作者来说,可以对模板设置价格,实现变现。

很多模板提供非常有意思的功能,值得一看。比如,"抖音转小红书"的模板。

你输入一个抖音的短视频链接,AI 自动生成10个可用标题和一段文案,你可以把它们连同视频一起发到小红书。

七、教程:情感故事爆文专家

网上已经有不少工作流模板的开发教程,大家可以去搜一下。

我看到一篇"情感故事爆文专家"的模板教程,非常有趣。情感类的网文现在流量很好,作者就开发了一个 AI 应用,专门生成这类文章。

先看成品,点击这个模板链接,体验一下它的效果。你输入一个文章主题,比如

一对情侣在大学里认识,毕业后分手,10年后再次相遇。

这个 AI 应用会输出文章的大纲和正文。

还带有配图,可以直接发布。

它背后的工作流,大致分成六个节点。

  1. 开始节点:接收用户输入的文章主题
  2. AI 模型节点:通过 AI 模型,根据文章主题,生成文章的大纲。
  3. 扩写节点:根据文章大纲,进行内容扩写,生成正文。
  4. 内容总结节点:根据正文,生成文章的内容总结。
  5. 文生图节点:根据内容总结,生成文章配图。
  6. 结束节点:汇总所有内容,输出结果。

设置完成后,点击"发布"按钮,这个 AI 应用就可以直接使用了。

八、结束语

工作流模式相比自己从头写,容易和快捷很多,服务端也一起解决了。如果你有 AI 开发的需求,可以试试这种模式。

下一步不妨就从文档开始,做出你的第一个工作流节点,发布到模板商店。

任何开发问题(估计肯定会遇到),可以加入官方咨询群去问,下面是微信群二维码。

我遇到问题,就咨询扣子的同学。他们告诉我,现在正好有两个活动,有大量的奖品,建议我参加。

我看了觉得很不错,下面把活动信息转发出来。如果你正好做了模板,就不要错过。

(1)模板比赛

工作流开发完成后,上架到模板商店,现在可以获取奖励

你可以对模板设置价格(官方审核通过后),实现模板变现,他人复制模板需要付费。在活动期间,官方根据模板复制的数量,会发放1000元到10000元的奖金,以及随机抽取的50个无线充电器的纪念奖。

(2)万圣节抽奖

官方现在有一个万圣节抽奖,在那里上传你的照片,会得到一张万圣节主题照,以及一次抽奖机会。

抽奖的奖品有 iPhone 16 Pro Max、Switch、咖啡机。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月31日

科技爱好者周刊(第 322 期):内容行业的内幕

作者 阮一峰
2024年10月25日 08:06

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

浙江上虞的曹娥江人行桥,是一座景观桥。每天晚上,一边放音乐一边喷水。(via

内容行业的内幕

有一个行业,这些年蒸蒸日上,快速增长,加入的人越来越多。

它就是内容行业,生产各种各样的内容:文字、图片、音乐、影视、短视频、直播......

为什么内容行业这么兴旺?

因为现代人的时间,都花在网上。网上有什么?就是有内容啊。人们越是投入互联网,内容行业就越兴旺。

很多人被这个行业吸引,一门心思为互联网炮制内容,因为生产成本低,需求多,市场大,获利快......但是他们未必知道,它也有吃人的一面。

今天,我想分享一个老外程序员的文章。他是前端程序员跳槽到内容行业,干了8年,不想干了,写了自己的体会,披露这个行业的内幕。

2015年的时候,流行"知识付费"。他受到了影响,就写了一本 React + D3 的教程,放到网上卖,作为付费内容。

结果,反响不错,真的有不少人掏钱。

他受到了鼓舞,觉得内容行业可以干,赚钱容易,后来索性全职来做。

他加大力度,在网上宣传自己的内容,不断更新,推出系列课程,还拍视频。生意这样做大了,他忙不过来,就雇了兼职员工,组建了团队。

几年下来,他算了一下,单单 React + D3 这一门课,就赚了近50万美元。

他总结出来,内容行业的商业模式是:免费内容用于建立受众,然后再通过广告或收费内容获利

内容创作者遵循这样一个公式。

  1. 你的大部分时间用来扩大受众。
  2. 你不断培养这些受众,作为销售内容的市场。
  3. 你创造可以获利的内容产品,投向这个市场。
  4. 重复第一步。

这个公式能够运作起来的关键是,你必须定期推出一些真正有意思或者真正有用的内容,才能培养出受众,激起他们的兴趣,愿意关注你,等待接下来的内容。这是在内容行业长期生存的唯一方法。

但是这样做,意味着你不能停下来,会非常累。如果你停止生产新内容,就无法找到新的受众,老的受众也会流失。

那个老外程序员就遇到了这个问题。到了2023年,他实在干不动了,对自己写的内容充满倦怠,想要休息一下。他说:"每一天,我都在想接下来要写什么?太累了,这些事情不再像以前那样带来快乐了。"

他就停下来了,想歇一段时间,恢复精力了再回来干。

但是,他马上发现,一旦停止工作,不更新也不宣传自己的内容,他的课程销售立刻就慢了下来。再过一两个月,几乎就停止盈利了。

这就是内容创造者面临的最大问题:你不能停止工作,也不能重复使用以前的内容,必须保持更新和宣传,紧跟市场的热点,这样才有人来消费你的内容,否则一切就会回到起点。

这个问题的根本原因是,内容行业是快餐文化,热点随时切换,人们只对新的内容感兴趣,快速抛弃旧内容。而且,热点切换速度正在加快,这一周的互联网热点,下周就被遗忘了,你只有加快生产速度,才跟得上。

这就是内容行业的缺点:生产出来的内容只被消费一次,以前的内容一旦被消费过,未来就不构成新的刺激了。你必须生产新的内容,带给受众新的刺激,才会有新的消费。

这注定了,内容创作者不能停下来,必须挖空心思,不断想出以前没有写过/拍过的新内容,否则你以前的投入就没用了。最终,你就陷入了一种周而复始、停不出来、把自己消耗光的怪圈。

那个老外程序员得出结论:自己是这个行业的一次性消耗品,等到被消耗光,再也写不出新东西,就是市场抛弃你的时候。

想明白这一点,他就知道自己回不到以前了,厌倦了那种炮制内容的生活,于是下定决心,放弃现在的付费课程,退出内容行业。这篇文章就是他临走的告别心声。

我希望,加入内容行业的人,都能了解这个行业的快餐本质,这里没有积累,只会掏空你。加入的时候,最好就有思想准备自己被消耗光。

===此处有分隔线===

最后,我还想提一下"知识付费"。

知识付费也有同样的问题。你生产的付费课程,并不是真正的积累,一旦停止推广和更新,就会无人问津。

此外,它还受到 AI 的威胁。针对初学者的课程,以前还能赚到一些钱。现在有了 ChatGPT,初学者课程这门生意可能已经死掉了,因为 AI 可以回答所有的新手问题,而且回答得比你好。

AI 不能提供的,大概只有那些来之不易的深刻见解和体悟,但是它们很难包装成可以销售的课程,只能在实践中通过高手指点和自己摸索获得。

所以,知识付费在 AI 时代,前景很难说,它的最高峰可能已经过去了。

科技动态

1、垂直峡谷

马岩松在美国丹佛市设计的"垂直峡谷"大楼(One River North),本月正式竣工开业。

这栋楼非常奇特,仿佛从中间裂开,分成了三块。

这是为了体现丹佛市的特色。这栋楼正对着落基山脉,那里有美国著名的自然景观----科罗拉多大峡谷。

马岩松别出心裁地在大楼内部,设计了一个类似峡谷的裂缝,将自然景观与住宅融合在一起。

裂缝内部是一个楼内的开放空间,布满了绿植,住户可以活动、登高、远眺,就像在山上一样。

2、状态钟(Busy Status Bar)

一家美国公司模仿软件的状态栏(status bar),发明了状态钟。

钟的屏幕上,可以设置你的当前状态,以及一个倒计时,表示何时结束这种状态。

你把这个钟,放在办公桌上,别人就可以看到你的状态了。

钟的另一面也有一个显示屏,用来提示自己。

这个钟的另一个特点是,带有多个实体按钮,用起来很方便,只要用手点一下,就开始倒计时。

3、太空船票

江苏民营航天公司"深蓝航天",开始发售太空旅行船票。

本次飞行预定在2027年,一共有两个座位,每个的价格是150万元人民币,飞行时间约为12分钟。

乘客将坐在一个高约4米、直径3.5米的载人舱内,舱内配置6扇全景舷窗,可以观看太空风景。

飞船将穿越100公里高的卡门线(大气层与外太空的分界线),乘客将至少体验5分钟的失重状态,随后飞船返回地球。

4、其他

(1)中国推动2027年底淘汰一维的商品条形码,升级成二维码。

(2)宇树科技的机器狗,在泰山测试运垃圾,最高负重120公斤。

(3)曼哈顿出现"加密货币游泳池",通过服务器运行的热量加热水温。

文章

1、require() 支持 ES6 模块了(英文)

最新的 Node.js 23 支持 require() 加载 ES6 模块。本文介绍这个功能,但也质疑这是否明智。

2、从 Vite 迁移到 Rspack(中文)

作者介绍他们公司,为什么将前端打包工具从 Vite 改成了 Rspack。(@bamboofive 投稿)

3、如何使用 Tailscale 架设内网 VS Code 服务器(英文)

本文介绍使用 Tailscale,在内网架设一个 VS Code 服务器,从而可以在各种设备(包括 iPad)使用远程 VS Code 编程。

4、如何自动备份 Obsidian 笔记(英文)

Obsidian 是一个很优秀的笔记工具,但是它的自动同步(备份)功能是要收费的,本文介绍一种免费的自动备份方案。

5、纯 CSS 实现网格背景(中文)

作者介绍几种方法,使用纯 CSS,实现网页背景的网格效果(上图)。(@fantingsheng 投稿)

6、Nginx 日志详解(英文)

本文详细介绍如何配置 Nginx 的访问日志功能。

7、如何用 Git Bisect 命令找出错误(英文)

git bisect 是一个很有用的命令,但是很多人不知道怎么用,本文是一个简单的示例。

工具

1、whodb

一个基于浏览器的数据库管理工具,支持 Postgres、MySQL、SQLite、MongoDB、 Redis。

2、Docmost

一个基于浏览器的维基和文档工具,Confluence 和 Notion 替代品。

3、notifier

一个 Cloudflare Worker 应用,监听 GitHub 仓库的各种事件,自动发送信息到 Telegram。(@byodian 投稿)

4、wechat-article-exporter

开源的微信公众号文章在线导出工具,可用来批量下载某个公众号的文章。(@jooooock 投稿)

5、NewsNow

开源的新闻热榜网站。(@ourongxing 投稿)

6、Image to Excel

表格图片转成 Excel 文件的在线服务。(@showwaychen 投稿)

7、加水印

图片加水印的网页工具,纯前端应用,不需要服务器,代码开源。(@pdmaker 投稿)

8、Theia

Eclipse 推出的代码编辑器,VS Code 的替代品。

9、JSBEN

一个在线页面,用来比较不同 JS 代码的性能。网站上有很多现成的例子

AI 相关

1、Agent.exe

开源的 Windows 应用,使用自然语言操作你的电脑,上图是用它自动点披萨,底层是 Claude 模型。

2、llmc

一个开源的命令行工具,输入自然语言,执行需要的 shell 操作。(@guoriyue 投稿)

3、ai-commit

一个开源的命令行工具,使用 AI 生成代码的 Git 提交信息。(@guanguans 投稿)

资源

1、crt.sh 证书查询

这个网站可以查询颁发给某个域名(含二级域名)的所有加密证书。

2、Pastebin

一个新的 Pastebin 网站,除了文本,还可以分享二进制文件(不超过 50MB),不需要注册。

3、数据结构可视化(Visual Data Structures Cheat-Sheet)

这篇长文收集了数据结构相关的各种可视化解释。

4、useHooks

这个网站收集 React 框架的各种有用的 Hooks。

图片

1、恐龙看彗星

上期周刊介绍了,最近光临地球的紫金山-阿特拉斯彗星。外国网友借着这颗彗星,摆拍了一张《恐龙看彗星》的照片。

最绝的是,下面配了一行说明,模拟恐龙的内心活动:"难道又来了?"。令人联想到,引发恐龙灭绝的小行星撞击地球。

2、五万年前的牛肉

1979年,阿拉斯加的金矿工人在开采金矿时发现,冻土里面埋葬着一头五万年前的野牛。

这头野牛完整地保存了下来,就好像昨天还活着一样。

它的皮肤、骨骼、脂肪、肌肉,都完好无损,仿佛放在冷库冻了五万年。

工人们将这头牛送到博物馆,后者着手将它做成标本。

制作标本时,野牛的内脏和肌肉都必须去除,否则将来会腐烂。

标本师觉得,牛肉就这样扔了,未免太可惜。他跟领导商量了一下,决定在自己家里组织一个晚宴,大家一起吃掉这些牛肉。

那天晚上,一共来了8个人,都是博物馆工作人员。他们先将牛肉解冻,然后跟大蒜、洋葱、胡萝卜、土豆一起煮。上桌后,再配上酒,就成了一顿丰盛的晚餐。

在场的八个人,就成了世界仅有的吃过五万年前牛肉的人。

其中一人后来回忆说:"它跟普通牛肉没什么区别,不难吃,带有一点泥土的味道。"

今天,如果你去阿拉斯加大学博物馆,就能看到这头五万年前的野牛标本。

言论

1、

2022年10月,有一只鸟创造了世界记录,不停顿地飞行了13500公里,不着陆、不进食、不喝水,以每小时48公里的平均速度,飞行了11天。

完成这一壮举有很多原因,其中很重要的一点就是羽毛。羽毛能够保持一整夜的温暖,还能挡雨,并且构成了翅膀的表面。羽毛是生物进化的神奇发明。

-- 《羽毛是生物进化的神奇发明》

2、

互联网每个 IPv4 地址,背后平均有7个设备。

-- 《向 IPv6 过渡》

3、

除了数学之外,对母语的出色掌握是一个有能力的程序员最重要的资产。

-- Edsger W. Dijkstra,著名计算机科学家

4、

简单的东西很难卖出去,因为简单的东西看起来很容易,谁愿意为容易买单呢?

商人们早已明白这个秘密,容易的东西往往被包装成复杂的东西,让用户觉得它很特别,从而为这种特别性付出高价。

-- 《贩卖复杂性》

5、

创业者的工作重点始终是优化业务,而不是优化代码库,除非代码库就是你的业务。

-- 《使用 HTMX 构建 SaaS 产品》

往年回顾

彼得·蒂尔的实验(2023 #275)

NPC 演员也是一种职业(2022 #225)

知识广度 vs 知识深度(2021 #175)

数字人民币要取代谁(2020 #125)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月25日

科技爱好者周刊(第 321 期):傅盛回忆录

作者 阮一峰
2024年10月18日 07:50

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上海新开张的耀雪冰雪世界,号称世界最大室内滑雪场,内部不仅有雪道,还搭建了一个北欧小镇。(via

傅盛回忆录

傅盛是谁?百度百科是这样写的。

1978年生于江西景德镇,2003年加入3721公司(后为奇虎360)。

2010年出任金山网络 CEO,2014年金山网络改名为猎豹移动,担任 CEO 至今。

最近,我读了一本他跟别人合著的书《创业就是要细分垄断》(文化发展出版社,2017),以及他在2018年的一篇演讲

他在里面回忆了,自己这一路的创业经历,反反复复用了几万字,就在回答一个问题:

"一个杀毒软件公司,为什么现在还活着,而且活得不错?"

他的故事很精彩,下面分享给大家。我看了很佩服,在这个急速变化的时代,一个互联网企业如何求生,可以参考这个故事。

一、金山毒霸时期

2010年,雷军有一次对金山的董事会说:​"我们的杀毒业务不行了,我要从外面找一个年轻人过来,这个人30岁,没管过大团队,他叫傅盛。​"

当时,360推出了免费的 PC 杀毒软件,让收费杀毒的瑞星和金山极为受伤,市场崩盘,收入飞速下滑。

傅盛上任后立即决定,金山毒霸也免费,收入改为依靠流量广告。就这样稳住了局面,收入停止下滑,在杀毒软件市场活了下来。

傅盛说:"这件事让我们明白了,快速奔跑是多么重要,公司的名字也变成了'猎豹'。"

二、打不过360

自从360成了市场老大,傅盛想了很多办法苦苦追赶,金山毒霸的市场份额最高追到360的三分之一,就再也追不上去了。

傅盛想了一个大招----"敢赔"模式。只要用户打开该模式,如果发生钓鱼网站、网购木马造成的财产损失,金山毒霸承诺赔付,单笔最高6000元。

这个措施引发了市场轰动,但是两周之后,360就推出了一模一样的服务,并且将赔付金额提高到36000元。

傅盛说:"我曾寄希望于360的执行不如我们快,所以不停地创新。可是,我们推出新服务两周后,360就出了一样的服务,我实际上成了360的产品经理。"

"那个时候我想明白了,我做的所有创新,360都可以做,而且做得比我们还好。在它视野之内的 PC 安全领域的任何创新,我都打不过,只不过它的迭代周期比我晚两周而已。"

你做出什么功能,大公司直接找一群产品经理按照这个思路做就行了。一个大公司的战略动员能力远远超出你的想象。

三、移动互联网的机会

在360的步步紧逼之下,金山毒霸的市场份额不断下滑。傅盛意识到,小公司不可能在大公司的正面战场上战胜大公司,要想活下去,必须跳出 PC 杀毒软件,寻找其他战场

幸运的是,移动互联网革命此时来临了,一个比 PC 市场更大的移动市场开始出现了。

智能手机的安全领域,成了新的战场。傅盛说:"当时我每天都在焦虑和思索,怎么才能拿到移动互联网的这张船票?"

更幸运的是,360因为自身的战略原因,无法全力投入移动市场。当时,360正忙于与腾讯进行"3Q 大战",除了 PC 杀毒软件,还在做搜索引擎和安全浏览器。

傅盛判断,360的主要市场在国内的 PC 端,不会在海外市场和移动端投入重兵。他因此决定,金山毒霸要专门针对海外市场,做一款移动安全工具。

四、手机清理大师 Clean Master

"当时我们看谷歌的安卓应用排行榜,发现 Utility(工具应用)排行榜的第三名叫 Advanced Task Killer,是哈尔滨的一个程序员做的。我们又发现图片应用排行榜里一个叫 Photo Grid 的程序不错,是杭州的一个程序员做的。这两人都没出过国。"

"我就想,现象即规律嘛,和一个中国没有出过国的程序员相比,我不仅出过国,还有2000人,可以动用的战略资源是上亿人民币。他们的应用能够上榜,我全力以赴打这场仗,难道不能排到第一去吗?想了半天我觉得这件事一定可以做到,后来就开始全力以赴了。"

为了尽量避开杀毒软件的老对手,傅盛没有做手机的杀毒软件,而是选择做清理工具。

"大家都在做安全软件,没有本质的差异化,不如在安全软件旁边再开一条线,叫清理。360的大部分团队都扑在安全软件、搜索、浏览器上,就算要在海外市场做手机清理,也只能抽出边缘团队了。"

猎豹的海外工具团队一开始只有四个人,做了一款手机清理大师 Clean Master,发现很受欢迎。

傅盛于是下定决心,集中几乎所有的力量,都投在这个产品上面。

"我从珠海把二三十位骨干从 PC 团队直接调到北京,立刻投入海外移动市场的清理领域,由这二三十人做骨架,迅速形成100人的规模。我们把 PC 端的盈利全部用来支持海外市场,保证了我们在这个战场的胜利。"

五、公司上市

Clean Master 只用了两年时间,就实现了日活过亿。傅盛抓住这个拳头产品,一口气推出了衍生的工具矩阵。

猎豹就这样成了 Google Play 全球下载榜排名前三的公司,月度活跃用户超过6亿,其中80%的用户来自海外。

2014年,借助这样辉煌的成绩,猎豹在纽约上市,实现了从 PC 安全软件到移动工具开发商的跨越。

在这期间,为了减少国内同行的关注,傅盛从来不在国内宣传自己在做海外市场,Clean Master 甚至都没有国内版,奉行"哈巴狗"战略,坚决不咬人。

六、工具软件的瓶颈

傅盛曾经认为,安全工具可以一直做下去,需求始终存在。这个领域可以作为公司长期发展的根据地。

但是,他错了。

随后几年,手机系统快速变化,谷歌和苹果不断收紧控制权,开放的系统权限急剧变少,许多工具都内置了。

第三方的手机安全工具的生存空间越来越小,手机杀毒这个行业几乎完全消失。

清理大师 Clean Master 想要保持高速增长,已经不现实了。傅盛面临再一次转型。

七、多元化投资

猎豹上市时,共募集资金1.6亿美元。傅盛决定将这笔钱投向其他领域,多元化投资,分散安全工具的风险。

他发现移动广告是一个巨大的风口,就收购了几家广告公司,建成自己的移动广告平台,一方面利用自家工具软件的流量,另一方面分销 Facebook 广告,还因此拥有了很强的大数据分析能力。

据傅盛说,只用了两年时间,猎豹就成为了 Facebook 广告平台全球最大的流量贡献方。

另一个重大举措是,猎豹在2014年投资了对口型的唱歌应用 Musical.ly,是后者的主要天使投资人。

Musical.ly 推出后很受欢迎,引起了今日头条公司的注意,后者就做了一个模仿品,起名为"抖音"(国外名 TikTok)。

2017年,傅盛同意今日头条以10亿美元收购 Musical.ly,随即今日头条就将 Musical.ly 合并进抖音。

最近,有人问傅盛,是否后悔卖掉了 Musical.ly。傅盛说不后悔,如果留在手里,做不到今天这么好,何况当时也拿到了满意的财务回报。

八、新方向

多元化投资并不能弥补,猎豹主营业务的放缓。由于没有达到收入增长目标,猎豹的股价在2016年出现了重挫。

傅盛说:"稳定了情绪之后,我意识到一个可怕的事实:随着内容等优质流量的崛起,工具类流量的重要性已经显著下降。系统工具产品作为一个品类,已经不在移动互联网的主赛道上了。"

他因此做出一个重大决定,公司将逐步淡出系统工具行业,再一次转型,全力投入两个新领域。

首先,全面转型移动内容平台,做了海外直播平台 LiveMe,在海外模仿头条的模式,同时加强轻游戏投入,用直播和游戏这样的内容流量,代替工具流量。

其次,成立子公司"猎豹星空",做 AI 和机器人产品,目前的主要产品是接待服务机器人"豹小秘"。

机器人"豹小秘"早期的交互功能很弱,只能用来查询、送菜、做咖啡、红外测体温等等。

2022年生成式 AI 诞生后,傅盛又看到了希望,猎豹星空的定位已经变为大模型解决方案公司,"豹小秘"将尝试内置本地的 AI 模型,变成真正的智能机器人。

九、小结

猎豹的转型还在进行,它能成功变成一个内容平台和 AI 大模型的方案公司吗?让我们拭目以待。

有一点可以肯定,如果发展得不好,傅盛未来还会再一次转型。

他用自己的创业经历,证明了只要有强烈的求生求变意志,一家公司的发展可能性是无法被定义的。

即使你的行业,如同杀毒软件那样消失了,你依然可以继续发展,并且发展得很好,你的发展可能性也是无法被定义的。我想这就是他的故事对普通人的意义。

[活动] 码上奇妙夜

我很少给读者送福利,但这次不一样,真的很多礼品,甚至有万元大奖

下周四是一个特别的日子,10月24日代表1024,一年一度的"程序员节"。

当天晚上7点,字节旗下的豆包 MarsCode 和稀土掘金技术社区(juejin.cn),将联合举办技术嘉年华"1024码上奇妙夜"

内容很丰富,有前沿的技术展示,有精彩的互动环节,有行业大咖在线交流,还有动手实操环节,通过 AI 将创意落地。

届时将在豆包 MarsCode 官网直播间直播,并通过抖音、视频号两大平台同步转播。

本次活动是全国性的,准备了超级丰厚的奖品。

(1)现在进入官网直播间,进行抽奖预热,奖品有智能耳机、拍立得、京东卡、吹风机、水杯等。

(2)在官网直播间点击"分享海报",邀请朋友参加。根据邀请人数,赢得奖品,最高可得小米14手机。

(3)10月24日晚上,三大直播间超多轮万元大奖:4天3晚泰国跟团游(两个大人一个小孩)、山西年票旅游券(黑悟空路线+周边)、iPhone 16 pro、苹果手表 10、智能耳机、宠物食品等等。

祝愿大家都拿大奖,现在就去官网直播间报名吧!扫描上面海报,或者点击这个链接

科技动态

1、紫金山-阿特拉斯彗星

紫金山-阿特拉斯彗星(国际编号C/2023 A3)10月9日进入近地点,直到26日离开。这段时间内,肉眼可以清晰看到。

这几天,世界各地的天文爱好者拍下了许多照片。

城市、海洋、沙漠、雪山......都留下了这颗彗星的踪迹。

该彗星在2023年被紫金山天文台发现,所以由中国天文台命名。

发现之初,曾预测该彗星的最大亮度可达0等(北斗星的亮度是2等),但是目前实际亮度只有4等,即使如此,它也是近期难得的亮彗星。

它的轨道周期是6万多年,上次光临地球的时候,人类还是石器时代。

2、特斯拉有没有抄袭

上周,特斯拉在美国举行新产品发布会,一口气展示了 Cybercab(无人驾驶出租车)、Cybervan(无人驾驶小货车)和 Optimus(人形机器人)。

这件事引起了2004年科幻电影《我,机器人》(I, robot)导演的愤怒。

导演震惊地发现,特斯拉的新产品与电影很相似,于是指控特斯拉抄袭。

上图左侧是电影,右侧是特斯拉的新产品。说实话,确实有点像。

3、其他

(1)有人在电源插排植入窃听器,然后在网上出售,现已被抓。

(2)一所葡萄牙高校,创下了现场人数最多的编程课的世界记录,共有1668名学生到场参加。

上课内容是《零基础 Python 入门》,从零开始解一个数独游戏。老师在课后领取了吉尼斯世界纪录证书。

文章

1、SpaceX 的"筷子"式回收强在哪?(中文)

SpaceX 公司使用机械臂,夹住返回地面的火箭助推器。本文分析这种打破脑洞的回收方法的优点。

2、AI 假图在美国泛滥(英文)

美国最近遭遇了飓风,社交媒体出现了一张灾民的照片(上图),进行政治宣传,实际却是 AI 假图。这种事情在美国越来越多。

3、我们如何在五个月内推出 Threads(英文)

Threads 是 Meta 公司推出的替代品,从立项到发布,只用了五个月。

这是 Threads 工程师的一个演讲稿,介绍了该项目的开发内幕。

最有意思的一段话是,这个项目基于 Instagram 的代码库,内部人开玩笑,两者只是布局不同:Instagram 是图片在上,文字在下,Threads 正好反过来。

4、JavaScript 信号简介(英文)

"信号"(signal)是 JavaScript 引入的一个新概念,本文简单解释它是什么。

5、微软的远程桌面应用(英文)

微软推出了一个叫做 Windows App 的应用,支持苹果设备和安卓,甚至可以浏览器使用,用来打开 Windows 系统远程桌面,本文是这个 App 的介绍。

6、为什么单线程 Redis 这么快(英文)

本文解释 Redis 的单线程架构,为什么可以这么快,以及什么情况下,使用 Redis 的多线程。

7、为什么葡萄干在汽水中"跳舞"(英文)

一篇科普文章。将葡萄干放入汽水,葡萄干会上下跳动,本文解释这是为什么。

工具

1、Chisel

一个 Linux 命令行软件,在 HTTP 通信上建立 TCP/UDP 隧道,由服务端和客户端两部分组成。

2、faces.js

一个生成随机卡通头像的 JS 库。

3、NotesHub

一个 Markdown 笔记软件,具有插入图表、曲谱、公式等多种功能,有 Web/桌面/手机客户端,支持 Git 仓库同步。

4、Faker Server

一个基于 Faker.js 的 mock 服务器,用来模拟 API 的返回结果,自带一个前端的接口管理页面。(@Ray-D-Song 投稿)

5、Logcat in devtools

在 Chrome 开发者工具中查看安卓设备的 adb 日志。(@nieheyong 投稿)

6、Astro AntfuStyle Theme

一个 Astro 框架的博客网站皮肤,使用该框架时可作为参考。(@lin-stephanie 投稿)

7、vitepress-demo-plugin

Vitepress 插件,支持在文档页面中插入 Vue/React/HTML 组件。(@zh-lx 投稿)

8、BroadcastChannel

将你的 Telegram Channel 转为微博客。(@ccbikai 投稿)

9、DNS.Surf

检查域名在全球不同地区的 DNS 解析结果,代码开源。(@ccbikai 投稿)

10、notion2md

一个示例项目,将 Notion 作为数据源,通过 GitHub Action 转成 Markdown 文件,生成网站。(@thinkerchan 投稿)

AI 相关

1、Bolt.new

StackBlitz 公司推出的一个全栈应用的 AI 生成器。

只要输入需求,它就会生成你要的全栈应用,前端代码和后端代码同时生成。你可以在它的页面上运行、编辑和部署该应用。

2、文字转语音

免费的在线文字转语音工具,支持74种语言318种声音。(@bingal 投稿)

3、Chat100.ai

免费使用 GPT-4o 和 Claude 3.5 Sonnet 的 AI 在线聊天。(@aaamomo64 投稿)

资源

1、Font sensei

谷歌字体选择器,按照标签选择字体,包含中日韩字体。(@mrbirddev 投稿)

2、Signature

一个生成英语艺术签名的网站。(@nansshan 投稿)

3、今天的上网感受

这个网站模拟,一个普通用户从搜索引擎点进网站,所遇到的各种打扰。

图片

1、韩国地铁的电梯标识

韩国首尔的地铁站里,有这样一个标识。

瘦人的图案指向楼梯,胖人的图案指向电梯。

这可能是为了激励胖人去走楼梯,运动减肥。但是,有人觉得这是公然的歧视。

2、中世纪城堡

欧洲中世纪城堡的表面,经常有一个个突起的小房间,而且向下开口。

你知道它是干什么的?

言论

1、

只要能够获得自然光,人们就可以生活在地下或土堆下,那么我们就可以拥有一个看起来像公园的城市!

-- Hacker News 读者

2、

想法并不那么重要,执行和营销才是成功的决定因素。

-- Hacker News 读者

3、

2014年,时任百度首席科学家、斯坦福大学副教授吴恩达表示,有些人担心 AI 会取代人类,这就好像担心火星出现人口过剩和环境污染一样。这种担心大致相当于在1850年撰写 iPhone 用户指南。

-- 《超级智能,10年后》

4、

工程团队可以分为防守和进攻两种角色。进攻角色负责开发新产品和增加功能,防守角色负责维护产品。

这两个角色都很重要,但是公司往往更重视进攻角色。

-- 《将工程团队分为防守和进攻》

往年回顾

加密通信的最后一块拼图(2023 #274)

Figma 为什么赢了 Sketch(2022 #224)

全能程序员 vs 特长程序员(2021 #174)

华为如何考核员工(2020 #124)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月18日

科技爱好者周刊(第 320 期):乒乓仓

作者 阮一峰
2024年10月11日 08:11

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

甘肃省瓜州县的戈壁滩上,有一座6000多根白色钢管搭建的雕塑作品《无界》,象征唐代的边关。(via

乒乓仓

如果有人给你一笔钱,让你准备一个商业计划,你会选择什么项目?

很大可能,你根本想不出干什么。现在的商业计划太难了,所有领域的商业竞争空前激烈,几乎找不到高增长的领域。

但是前些日子,我看到一篇报道,关于一家美国创业公司的故事,觉得他们的点子非常聪明,可以照搬到国内,不需要很大投资,盈利的可能性很高。

他们选择了一个别人想不到的创业方向:乒乓球。

创始人是一个纽约的股票分析师。他有一个烦恼。每天晚上结束加班,想打一会乒乓球,但是周围根本找不到球馆,就算找到了,也已经关门了。

他后来发现,很多人都有这个需求,想打球但是找不到球场。

终于有一天,他下定决心,既然没有人做这件事,那么我来做。

他租下闲置的店面,改造成乒乓球室,起名为"乒乓仓"(PingPod)。

每个仓室放一张乒乓球桌,全天24小时营业,无人管理,通过手机 App 预订,App 会告诉你开门密码。

可以几个朋友一起来打球,也可以一个人来玩。他们提供发球机。

你就跟机器对打,还能调节机器发球的力度和难度。

每个乒乓仓都配有多个摄像头,除了监控,还能将比分显示在屏幕。

屏幕下方有一个粉红色的 REPLAY 按钮,点击后,会回放刚才那一分的录像。

你还可以在手机 App,查看整场比赛的录像,精彩片段可以分享到社交网站。

这个服务一推出,就大受欢迎。每天打球的人络绎不绝。短短几年,乒乓仓已经发展到了70多个,运动项目也从乒乓球,扩展到了台球、棒球击球、匹克球、高尔夫模拟器等。

为了更快的增长,他们现在改成了加盟制,你可以购买 PingPod 品牌经营权,使用他们的 PodPlay 系统,开设自己的乒乓仓。这样一来,他们就从经营体育场地变成科技公司,利润更高。

我觉得,这个项目在国内可行。现在各地有很多空置的商业空间,就可以改成这种付费的"乒乓仓",全天开放、价格实惠、使用方便、还有配套的数字化服务。

这样大大增加了体育活动的场所,降低了参与门槛,同时使用数字科技提升体验,一定会有很大的需求。

[活动] 叠纸技术周

游戏开发感兴趣的同学看过来。

国内著名的手游公司"叠纸游戏",马上要举办技术周,游戏开发团队跟大家面对面

简单介绍一下叠纸游戏。它成立于2013年,打造出《奇迹暖暖》《恋与制作人》《闪耀暖暖》《恋与深空》等超人气作品,还有多款在研游戏。

截止今年上半年,全球累计注册用户数近4亿,其中《恋与深空》的流水已达15.9亿元,是流水最多的乙女游戏。

他们的技术周是下下周 10月23日-10月26日,地点在上海杨浦区的叠纸大厦,活动内容如下。

  • 技术大咖面对面:CTO 和在研游戏技术负责人,跟大家现场对话。
  • 技术负责人分享:不同开发岗位背后的技术挑战。
  • 在研游戏试玩:现场实机体验《无限暖暖》、《万物契约》、《恋与深空》VR 试玩版。
  • 叠纸一日生活:感受公司企业文化和生活日常。
  • 面试/Offer 直通:有机会速通面试拿Offer.

活动面向25届、26届在读学生,现场感受第一线的游戏开发,同时跟招聘相结合,提供实习/工作机会

如果你有志于游戏开发,不要错过这个机会,现在扫描下方二维码报名。

科技动态

1、披萨盒

外卖披萨都装在盒子里,很少有人想过,怎么利用这个盒子。

披萨连锁品牌"必胜客",最近在纽约推出了一种全新的做法。

他们发现,75%的求职简历从未被认真读过,那么如果把简历印在披萨盒子上,是不是可以让更多的人看到?上图就是一个叫做 John Dough 的人的简历。

求职者可以向披萨公司付费,将自己的简历印到盒子上,并且指定希望送到哪些区域。

当该区域的公司订购披萨时,这些盒子就会送过去。高管们吃披萨时,就会看到盒子上的简历。

2、小五机器人

腾讯 Robotics X 实验室,发布"小五"机器人(The Five),用于家居环境,适合养老、医疗等场景。

该机器人有四条腿,轮足复合设计,在平地、斜坡、鹅卵石地面都可以行走,还可以爬梯。

它的两只手可以搀扶老人,也可以搬运物品。

不需要的时候,它还能折叠起来,便于收纳和运输。

3、太空旅行的食物

地球到火星的旅程,单程最少需要6个月,如果去更远的星球,则需要更长的时间。宇航员的食物如何解决?

目前的飞船无法携带大量食物,长期任务的食物只能在飞船上生产。

为了解决这个问题,美国国防部正在开展一项实验,使用小行星的碎片生产食物。

上图是一颗叫做"贝努"的小行星碎片,主要成分是碳氢化合物。科学家将这些碎片喂给细菌,产出有机物,作为人类食品的原料。

据估计,重达8550万吨的小行星"贝努"可以让一名宇航员吃上约600年,最理想的情况下,可以吃17,000年。

但是,这是不是意味着在航行途中,飞船必须去捕获小行星,然后带着它一起飞?

4、中国天眼阵列

"中国天眼"是世界最大的射电望远镜之一,直径500米。

为了提高分辨率,天文台决定在周边的山头上,再建设24台直径40米的射电望远镜。

这样的话,一共25台射电望远镜,组成一个阵列,可以大大提高太空图像的清晰度。

上个月,第一台试验机已经开始建设。

5、其他

(1)中国公开登月服,宇航员将穿着它登陆月球表面。

(2)佛罗里达即将遭遇米尔顿飓风,房主使用绷带固定屋顶,防止被吹走。

文章

1、垫紫草的诱惑(中文)

作者是中科院植物所的研究员,讲述在云南白马雪山4800米海拔处,发现垫紫草的故事。

2、如何使用 CSS flexbox 制作时间线(英文)

一篇简单教程,教你使用 flex 布局,制作出上图的时间线(timeline)样式。

3、服务器的基本设置(英文)

本文介绍,如果自己搭建一台公开访问的服务器,怎么进行设置。

4、我如何构建自己的博客(英文)

这篇文章详细介绍作者的博客技术方案,这个方案比较复杂,基于 Next.js + MDX。

5、LLM 书签收藏方案(中文)

作者介绍了自己的书签收藏工作流:收藏书签后,自动抓取全文,并用 AI 生成页面摘要,以备未来查找和回顾。(@jerrylususu 投稿)

6、btop 使用介绍(中文)

Linux 系统一般使用 top 命令,查看系统运行情况,本文介绍更好用的 btop 命令。(@xiaobox 投稿)

工具

1、MiKaPo

一个纯前端的二次元动作捕捉方案,在网页上,从视频/图片/摄像头提取动作、表情来控制动画角色。(@AmyangXYZ 投稿)

2、LockPass

作者模仿 1password,做了一个开源的密码管理器。(@ftyszyx 投稿)

3、Copi

macOS 系统的剪贴板替代工具,防止第三方应用程序访问剪贴板。(@s1ntoneli 投稿)

4、词悦(Ciyue)

mdict 词典的安卓 App,使用 Flutter 开发,代码开源。(@mumu-lhl 投稿)

另有一个命令行的 mdict 词典。 (@lengyijun 投稿)

5、独白

一个练习口语的 iOS App,你不断朗读句子,进行录音,支持多种语言。(@sniperboy0829 投稿)

6、 photo4you.win

免费在线证件照制作。(@huangzhuo492008824 投稿)

另外,有一个类似的开源项目 HivisionIDPhoto

7、OneIMG

一个开源的、纯前端的文字转图片的网页应用。(@byodian 投稿)

8、WebChat

开源的浏览器插件,基于 WebRTC,为同一个页面的访问者建立去中心化、无服务器的匿名聊天,可用于任意网站。(@molvqingtai 投稿)

9、TvT.js

一个基于 ThreeJS + Vue + TresJS 封装的框架,用 Vue 组件的方式写 3D 可视化项目。(@hawk86104 投稿)

10、Hexo Theme Sea

一款开源的 Hexo 博客主题,支持国际化和暗黑模式。(@hai-zou 投稿)

11、联网麻将游戏

麻将游戏的一个开源实现,分成服务端和客户端。(@liumengniu 投稿)

12、X Guard

一个 X(Twitter)内容过滤的浏览器插件。(@zmzimpl 投稿)

AI 相关

1、NotebookLM

谷歌推出的一个新服务,可以将一篇文章转成学习笔记或者播客。

也就是说,你上传文章后,它可以将文章转成一个英文的广播节目,内容是两个 AI 主持人一问一答介绍这篇文章,参见官方的介绍。它甚至能将 Youtube 的视频转成播客。

下面是一篇使用感受,作者用它将一篇地质学论文,转成几分钟的播客节目,放给8岁的儿子听。

2、Silo

纯前端的多模型对话、文生图工具,可以在网页同时使用多个 AI 模型,进行比较,代码开源。(@KwokKwok 投稿)

3、Praises

跨平台的文本转语音的桌面工具,支持调用多个 API,免费使用。(@ElmTran 投稿)

4、AI PPT Maker

免费的 PPT 生成服务,有模板和多语言支持。(@icaohongyuan 投稿)

资源

1、Trieve HN Discovery

第三方的"黑客新闻"搜索引擎,使用体验很不错。

2、Zeli

这个网站实时给"黑客新闻"每个链接生成摘要。(@mazzzystar 投稿)

3、TypeRoom 类型小屋

TypeScript 题库 Type Challenge 的网页版。(@vortesnail 投稿)

4、开源许可证选择器

回答几个问题,帮你选择一个开源许可证。(@wincatcher 投稿)

图片

1、黑洞光束

哈勃望远镜拍到了一张令人惊叹的照片。

银河系中心的 M87 星系,向外喷出一根巨大的光束,长度足足有3000光年。

据美国宇航局的解释,M87 星系的中心是一个黑洞。黑洞本身不发光,但是周围物质会围绕它快速旋转。有时,吸入黑洞的物质会"改变路线"成两股喷流,向相反的方向发射。

2、拉格朗日标准模型

拉格朗日标准模型是一个描述粒子行为的统一方程,非常复杂。

这个方程有几十行,分成5个部分。尽管如此,它依然是描述粒子行为最简单、最紧凑的形式。

文摘

1、巨型光学望远镜的衰落

巨型光学望远镜,指的是透镜直径超过10米的望远镜。

为了建造下一代巨型望远镜,美国政府准备拨款不超过16亿美元。这是很大一笔钱,但可能还不够,这样的望远镜预计将耗资30亿美元或更多。

但是,我有不同想法。我认为,巨型光学望远镜不值得建造,应该用小型光学望远镜(直径 0.5米~1米)的组合取代它

巨型光学望远镜的建造,需要削平整个山头,建立牢固的地基和同样巨大的配套设置。为了运送建筑材料,要先在山上开辟公路。一条两车道的公路只有5米宽,怎么运输这面10米直径的透镜都成了大问题。

我们这个时代,技术设备正变得越来越小,计算机从房间大小变成了口袋设备,摄像头可以做到微米级的像素产品,为什么望远镜要越做越大呢?

(1)小型望远镜成本更低。在美国购买一台0.5米直径的光学望远镜,价格是56,000美元;一台性能优秀的直径1米的光学望远镜,价格现在是57万美元。即使购买100台这样的望远镜,也不过几千万美元,而一台巨型望远镜需要投入30亿美元。

(2)天文学图像的重点,已经从光学照片转移到了软件处理。完全可以在多个夜晚对天空的同一区域进行多次曝光,然后用软件将它们组合成一张图像,而不需要更大更清晰的镜头。

以上两点,使得我们完全可以将许多小型望远镜组合在一起,而不是建造单个巨大的望远镜。我们可以让望远镜组合扫描整个天空,再拼成一张巨型照片。

这种向小型望远镜的转变,将从根本上改变望远镜工程。天文望远镜将从结构和机械工程,变成一种软件开发。

这种转变很有吸引力,因为软件可以渐进式改进,天文学家还可以轻松利用各种软件工具,处理大量数据。

此外,小型望远镜的组合也更灵活。使用巨型望远镜,你只能指向一个方向,但使用许多小型望远镜,你可以将视野分开,还可以每个镜头使用不同的滤光片。

最后,如果某个零件发生故障,巨型望远镜需要整个停机,而小型望远镜的组合只需要停掉那一台,其他还能正常工作,这样更方便系统维修。

言论

1、

技术繁荣本身不一定能让人们幸福,但它会明显改善世界各地人们的生活。

-- 奥特曼,OpenAI 公司 CEO

2、

城市并不吵闹,汽车才吵闹。电动汽车没有发动机噪音,会让城市重新回归安静。

-- 《电动汽车的声音应该是什么样?》

3、

JavaScript 世界的"一代"有多长:六个月、一年、还是三个月?JS 工具之间的竞争之激烈令人震惊。

-- Lobste.rs 读者

4、

每天花8个小时以上的时间,开发和维护你不关心的东西,会导致你的不快乐。

-- Hacker News 读者

往年回顾

任正非的三篇最新谈话(2023 #273)

程序员需要担心裁员吗?(2022 #223)

网络收音机的设计(2021 #173)

互联网公司与湘军的军制(2020 #123)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月11日

后面试时代与 AI 刷题

作者 阮一峰
2024年10月10日 08:15

一、引言

七月的时候,我写了一篇文章《AI 编程助手测评:GitHub Copilot vs 豆包 MarsCode》,推荐了后者。

豆包 MarsCode 团队最近就邀请我,试用他们的新功能"代码练习",它专门用来准备面试和刷题。

试用以后,我有很多想法。

我觉得,AI 会改变程序员的面试,以后是 AI 刷题的后面试时代

二、面试的 LeetCode 刷题

现在的程序员面试,一般都有算法解题。

为了准备面试,大家都会去刷算法题,最常见的就是使用 LeetCode 题库。

LeetCode 是世界最流行的算法题库。它源自美国,专门收集各种面试算法题,目前已经超过了3000道,不少是互联网大厂的真题。

很多同学坚持不懈,每天投入几个小时,做里面的题目,训练自己的算法能力。一般来说,至少要刷200题,面试才较有把握。

(图片说明:上图是某个老外的刷题统计面板,他一年365天,每天都在刷题,一共刷了1500题。)

三、AI 颠覆 LeetCode

生成式 AI 出现后,越来越多的人发现,有了 AI,人肉刷题似乎不那么必要了。

今年(2024)8月份,一位美国网友在 Reddit 论坛发了这样一个帖子。

他说,自己写了一个脚本,让 AI 自动求解 LeetCode 算法题,一天之内做了633道题目,正确率达到了86%,成本只要9美元。

这个帖子引起了巨大反响。

既然 AI 可以提示正确答案,为什么不参考 AI 来准备面试呢? 何必坚持苦思冥想、徒手 LeetCode 刷题。

四、AI 助手的解题能力

我们完全可以跟着 AI 刷题,做到事半功倍。

我选一道 LeetCode 题目,展示一下这是多么简单的事情。


你是一个 JavaScript 程序员,请补充完成下面的函数。

要求是输入一个代表罗马数字的字符串(比如"IX"),该函数会返回对应的阿拉伯数字(比如9)。

 /**
  * @param {string} s 
  * @return {number} 
  */ 

var romanToInt = function(s) {


};

选择上面这道题,主要是因为它很短,便于展示。而且,这道题的难度不大,但需要考虑多种情况,很适合用在初级面试。

我选择的 AI 工具,就是 VS Code 编辑器的豆包 MarsCode 插件,它是免费的。

在 VS Code 代码编辑器里,从左边栏打开该插件(如果未安装,可以在插件市场搜索"MarsCode")。然后,在对话框输入题目。

稍等片刻,AI 就会给出答案以及代码解释。

哪个地方看不懂,就向 AI 询问。

这节省多少时间啊,大大加快了刷题速度。

五、后面试时代

可以看到,AI 能够快速解决面试算法问题,那么,基于算法解题的面试模式,是不是应该有所改变了?

现在的互联网大厂,都允许工作中使用 AI 模型,面试再要求"徒手解题",已经有点过时了。

AI 将越来越普及,如果未来的面试不使用 AI,就好像不使用 IDE 编辑器一样不合理,应该允许程序员在面试中使用日常工具。

我的想法是,面试的考察重点可能会改变,从让面试者解题,变成让面试者解释和审查 AI 生成的代码。

面试时,给你一段 AI 生成的解题代码,让你解释这段代码,并且修正里面的错误和没有考虑到的地方。

这样做有很多好处:(1)更贴近程序员的实际工作模式;(2)能看出程序员的代码阅读和理解能力;(3)难以事前准备或作弊;(4)更能反映一个人的协作能力;(5)也适用于偏向阅读代码而不是编写代码的岗位,比如项目经理、架构师等等。

这可以称为"基于 AI 的后面试时代",即面试从考察编码解题能力,演变到考察代码的审查理解能力。

六、AI 陪练功能

现在已经有很多工具,为面试提供 AI 辅助训练。

豆包 MarsCode 的"代码练习"就是一个最新的尝试。我用了以后,觉得对准备面试、有效刷题真的有帮助,可以训练自己与 AI 协同编程。

它是一个基于云 IDE 的专门页面,内置了上百道字节跳动的面试真题

所有相关操作都集中在这个页面上,只要有浏览器就可以使用,刷题全过程不必切换页面,大大方便了使用:选题、解题、调试、AI 对话......

而且,它是免费的,大家现在就可以试试看:进入豆包 MarsCode 官网,点击顶部菜单的"代码练习",就可以进入。

这个页面是云 IDE,不需要任何安装,打开后直接在浏览器使用。

默认状态下,页面分成四栏。左侧是面试真题的目录,目前有100道,以后还会不断增加。选中一道题目,点击后可以看到具体内容。

页面右侧是代码框和 AI 框。

在代码框,需要首先选择你的编程语言,共有8种可选(Python、JavaScript、Go、C++、C、Java、Rust、TypeScript),上图是 JavaScript。然后,输入解题代码,再点击顶部的运行按钮,就可以看到运行结果。

在 AI 框,则是三个预设选项,点击后就可以让 AI 提示思路、代码、检查代码。下方还有对话框,用来跟 AI 对话。

一般来说,拿到题目后,(1)先点击"需要一点思路提示",让 AI 帮助你理解题目。(2)再点击"给我一些代码提示吧",让 AI 给出初步代码。(3)你修改和完善代码,再点击"帮我检查一下代码",看看会不会报错。

此外,这个页面还集成了 IDE 功能,比如语法检查和代码调试。随着代码键入,会自动给出用法提示(下图)。

这样的"代码练习",堪称面试刷题的利器,我觉得,面试指导书籍和辅导班可能都不需要了,以后都会被淘汰。

七、总结

AI 改变软件行业,也必然改变程序员的面试求职。

AI 刷题是未来的趋势,善用者将更容易通过面试,拿到心仪的 offer。

但是,需要提醒的是,AI 只是工具,生成的代码不一定正确和安全,而且项目之中也不应该有黑箱。

正确的做法是,使用 AI 但不依赖,思路比答案更重要,只有理解了每一行代码,才能接受它的结果。我们使用 AI 的首要目的,永远是提升自己的能力,而不是让 AI 替代我们,代码的最后责任人的不是 AI,而是你。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月10日
❌
❌