阅读视图

发现新文章,点击刷新页面。

科技爱好者周刊(第 340 期):技术炒作三十年

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

成都建筑师刘家琨,本周获得号称"建筑界诺贝尔奖"的普利兹克奖,上图是他的作品苏州御窑金砖博物馆。(via

技术炒作三十年

大家有没有发现,每隔一段时间,媒体就会大肆炒作一种新技术,宣扬它将对人类产生巨大影响,全社会都在关注,人人都在谈论。

这种炒作就是大家常说的"风口"吧。突然之间,风就起来了,如果正好站在风口,猪也能飞起来。

你能举出多少个这种炒作的例子?

一个国外程序员根据回忆,列出了过去三十年主要的几次技术炒作。

  • 1998-2001 年:互联网 WWW
  • 1999-2006 年:Java
  • 2004-2007 年:Web 2.0
  • 2007-2010:云计算
  • 2010-2015:社交媒体
  • 2012-2015:物联网
  • 2013-2015:大数据
  • 2017-2021:区块链
  • 2021 年至今:人工智能

大家觉得,这个时间列表是否准确?

我的亲身感受是差不多。这是主要的几次技术炒作,而且这些技术都成功了,所以炒作的时间才会持续这么久,两年到五年,然后被下一个热点取代。

当中,还有许多次小的技术炒作,但都没有那么成功,持续时间就没有这么久,很快退潮了,比如元宇宙、Web 3、AR/VR 眼镜、3D 打印、自动驾驶等等。

一种新技术能够带来大规模、长时间的炒作,有一个前提条件,那就是它有真东西,确实能对社会经济带来非常有感的变化

上面列表的每一种新技术,确实都是大的突破,改变了技术方向,没有一个是虚的。如果再加上智能手机、短视频、加密货币,可能就把最近三十年大的技术"风口"都包括了。

我以前有一个误区,看不起技术炒作,认为那只是一窝蜂的音浪,跟娱乐版的明星炒作没什么不同。

人到中年,我才意识到,这种观念大错特错,技术从业者千万不能有这种想法。每一次技术炒作,不仅是音浪,更是机会,会带来空前的关注、疯狂涌入的资金、以及切切实实的需求。炒作规模越大、程度越厉害,带来的机会和资金也就越大。

每一次大规模的技术炒作,都会诞生一些快速增长的指标公司,创造巨大的财富效应。如果你正好身在其中,事业和财富都会随之起飞。

让我们现实一点,一个工程师最有技术生产力、创造力、事业起飞的时间窗口,就只有那么几年。如果个人事业要快速起来、为未来铺好道路,光有技术还不够,还必须赶上至少一个大的技术风口,用外部的资金和需求放大个人努力。

否则,单靠自己的成果积累,就太慢了,很难快速到达更高的层次,很可能辛辛苦苦干了二十年,还是在做一些基础的事情。如果出现技术升级,使得你的技能过时了,后面的路就难了。技术风口其实是实现个人阶层飞跃、人生翻转的最可行的路径。

所以,每一轮大的技术风口并不完全是一哄而上的炒作,里面包含了一些真正的机会,值得关注和跟上。这也是为什么周刊每一次都对新技术倍加关注、积极评价的原因。

当然,赶上技术风口的前提,还是要有真才实学,能做出实打实的产品。否则,真遇到风口,你也无法脱颖而出,拿到技术炒作的红利。

[活动] AI FOR CODE 创意挑战赛

上周提到的全国 AI 编程大赛,大家还有印象吗。

这次大赛为了让更多人参与,除了常规的"应用赛道",还特别设置了"创意赛道"。

只要有创意,就能参加,不需要具体的实现,实现交给 AI。

创意赛道从今天(3月7日)开始,就可以提交作品了,到3月27日截止。

如果你有想让 AI 实现的创意(点子),不妨发布到作品提交专区。发布时,需要按照模版要求提交。

注意,发布的创意需要公开可见,这样才能让大家投票。得票高的创意,将有丰富的奖品。

每个人最多提交5个创意。如有团队使用你的创意完成项目开发,你将获得神秘大礼!

不要错过本次大赛,只要你有想法,就有机会得奖。提交创意和投票的详细介绍,可以点击这里,或者扫描上面海报的二维码。

修复壁画的新方法

意大利帕多瓦教堂,曾经有一幅巨大的中世纪壁画,非常精美。

但是,这幅壁画在1944年的第二次世界大战被炸毁。

下面是壁画的虚拟重建图(局部)。

壁画被炸毁时,人们把墙壁的碎片收集起来,一共有88000多块,存放在博物馆。

下面是碎片的照片,这些碎片大概只占原始壁画的10%。

碎片的数量太大,缺失又太多,从来没人敢于尝试将它们还原。

但是,1992年的时候,博物馆曾经将所有碎片拍成了数码照片。

慕尼黑工业大学的数学教授马西莫·福纳西耶(Massimo Fornasier)得知了这件事,决定基于这些数码照片,使用计算机进行壁画还原。

这幅壁画在战前,曾经有过一张黑白照片(下图),可以作为修复的依据。

马西莫教授的第一步,是将这张照片上色,还原成彩色照片。

然后,将碎片进行图像吻合,一块块找到它们的位置(下图)。

下面是碎片上墙的样子。

缺失的部分,团队用灰白颜色补全。

全彩的虚拟效果图如下。

科技动态

1、美国萤火虫航天公司的"蓝色幽灵"登陆器,成功登陆月球,成为第一家登陆月球的民营企业。

2、一家美国生物技术公司,改造了老鼠的毛发基因,成功培养出了长毛鼠

他们下一步的目标,是培育长毛象。

3、本田公司推出一款口袋妖怪摩托车,外形非常惊艳(下图)。

4、联想推出一款太阳能笔记本,上盖覆盖了太阳能电池。

据说阳光下放20分钟,可以播放视频1小时。但是怎么看,都不如外接一个太阳能发电板实用。

5、微软将在今年5月关闭通信服务 Skype,由 Teams 替代。智能手机出现之前,Skype 是最流行的国际电话软件。

文章

1、流式 HTML(英文)

AI 的聊天对话都是流式加载的,本文介绍一个技巧,不使用 JS 也能加载流式内容。

2、不要用 TypeScript 枚举(英文)

TypeScript 官方已经不建议使用 enum(枚举)语法,作者建议改用字符串的联合类型代替。

3、我如何使用 roboscribe 音频转文本(英文)

一篇教程,作者使用软件 roboscribe 将播客转成可用的文本,这事要比听上去麻烦。

4、如何测试电梯(中文)

本文将电梯抽象成一个"有限状态机",设计测试用例。(@lezhi12 投稿)

5、我为什么选择 Firefox(英文)

作者介绍 Firefox 浏览器胜过 Chrome 的几个地方,有些功能大家可能未必知道。

6、脚本代替别名(英文)

常用的终端命令,往往可以设置别名(alias)作为快捷方式,作者提出一种新的方式,用脚本代替别名,更容易维护。

7、Tailscale 对我很有用(英文)

作者介绍自己的 Tailscale 用法,将不同的设备组成一个虚拟局域网。

工具

1、Yaak

一个测试 API 的开源桌面软件,功能比较全。

2、cleanmac

清理 macOS 系统的一个命令行脚本。

3、Lynx

字节开源的一款跨平台原生应用开发工具,使用 Web 语法,生成各个平台的原生应用,类似于 React Native。

4、appstat

监控 Windows 应用的资源占用(内存、CPU、网络)的一款工具。

5、Maestro

一个 Web 和 手机的 UI 测试工具,只要写好配置文件,就能自动运行测试。

6、Git Worktree Manager

VS Code 插件,方便在不同的 Git 仓库、不同的分支之间切换。(@jackiotyu 投稿)

7、Hugo Translator

一个 Python 脚本,将 markdown 格式的中文 Hugo 博客帖子,翻译成英文。(@Rico00121 投稿)

8、O-Spy

一个 Web 应用的记录并回放用户操作的工具,用来远程调试。(@wqcstrong 投稿)

9、MTranServer

开源的离线翻译服务器,号称资源消耗低,CPU + 1G 内存即可运行,支持调用沉浸式翻译。(@xxnuo 投稿)

10、Screen Sharing Application

一个开源的 Next.js 应用,通过点对点通信,实时分享你的屏幕。它会生成一个房间码,其他人访问这个房间,就能看到你的屏幕。

AI 相关

1、olmOCR

一个使用 AI 模型进行文字识别(OCR)的 Python 工具。

2、Probly

一个基于 AI 的电子表格软件,可以在浏览器中对表格运行 Python 代码。

3、Hacker News 每日播报

每天自动抓取 Hacker News 热门文章,通过 AI 生成中文播客。(@Y024 投稿)

4、语析

基于大模型,进行知识库管理与生成知识图谱的工具。(@xerrors 投稿)

5、DiffRhythm

西北工业大学 ASLP 实验室开发的一个 AI 音乐生成模型。(@JoeDeanx 投稿)

资源

1、Meta 的 AI Demo

Meta 公司的 AI 实验室,展示最新的成果。

2、ProWords

一个基于 AI 的单词记忆平台,根据职业身份生成例句,代码开源。(@winterfx 投稿)

3、圣彼得大教堂 3D 导览

梵蒂冈的圣彼特大教堂(St. Peter's Basilica)是世界最大教堂,这个网站提供它的 3D 模型还原。

4、Shapecatcher

这个网站根据你画出的形状,返回匹配的 Unicode 字符,包括 Emoji 字符和东亚文字。

图片

1、奥乐齐的条形码

奥乐齐(Aldi)是一家德国连锁超市,为了方便用户扫描条形码,把条形码印刷得特别长。

小包装商品无法放置那么长的条形码,奥乐齐就会设法放置多个条形码。

上图的奶酪通心粉,在侧面和底部都有条形码。

2、乐高日心仪

国外网友使用乐高积木,搭建了一个可以转动的日心仪。

上图中,中间黄色的是太阳,地球围绕太阳公转,并且有22.5°的倾斜角。

地球的旁边还有月亮。月亮其实有5.15°倾角,但是肉眼不容易察觉。

它是可以实际运转的,内部结构很复杂,有大量齿轮。

文摘

1、高管与普通员工的脱节

作者:伊森·埃文斯(Ethan Evans)

我是已经退休的亚马逊副总裁,在亚马逊待了超过15年,领导过800多人的国际团队。

我任职期间,亚马逊股票涨幅高达9082%,因此我对普通人的许多生活困境并不了解。比我更高级的副总裁和首席执行官,就更是如此了。谈论自己的财富是大多数高管都避而不谈的禁忌话题。

今天我想谈谈一个小问题,先介绍一下我自己的情况,就举四点:1) 我没有任何抵押贷款,2) 每两周有一个女佣为我打扫一次住宅,3) 我付钱请别人帮我的花园割草, 4) 我50岁就退休了。

普通家庭,即使是工程师和知识分子,也没有这些福利。

在我上面的高管,享有的福利就更多了,我看到的就有:1) 有专门的度假屋,雇了多个工作人员长期看守;2) 私人飞机;3) 私人助理,不用自己付账单、买杂货或接孩子,助理处理一切;4)私人司机;5)孩子上贵得惊人的私立学校;6)他们想住哪儿就住哪儿。

经济成本从来不是这一类人的障碍。

现在让我们看一个例子,说明高管与员工是如何脱节的:结束远程工作,重返办公室。

高管的财富使他们有不同的选择。大多数高管把工作和职业成功放在生活的首位。如果他们不这样做,他们很少能成为高管。他们中的大多数人(包括我自己),利用财富为自己购买时间。他们大部分时间都花在工作上,小部分时间花在家人身上。如果工作是你生活的重心,那么重返办公室就自然是一个优先事项。

你想象一下高管的工作场景:无需通勤,司机会送你到家,你一心工作,无需赶回家接孩子,助理会帮你做这些,你也无需购物、打扫或做饭,佣人会做这些,无需辅导作业,好学校会提供辅导。在这种情况下,回到办公室感觉非常"值得"。

这不是一篇反对高管个人财富的长篇大论。毕竟,我付出了25年的生命,得到了一些财富。相反,这是一种解释,以便你了解高管与普通员工的脱节。

如果你需要影响高管,而他们的经历可能与你的现实生活脱节,请通过故事、视频和数据帮助他们看到现实。请记住,他们确实生活在另一个世界。这并不一定会使他们变得邪恶,只是脱节了。我不想发生"脱节",但必须承认这种情况确实会随着时间的推移而发生。

言论

1、

兼职创业不是可以长期坚持的事情。如果你上班时整天面对电脑,回家后又坐在另一台电脑前开发自己的软件,那将让你筋疲力尽。

你可以这样做几个月,但问题是,企业通常需要更长的时间才能起步,很多人就会放弃。

-- 《关于独立开发》

2、

在开始一个项目时,一定程度的天真是必不可少的。如果我知道这条路有多难,我可能永远不会开始。但由于我完全不了解未来的挑战,所以我只是一头扎进去,一路摸索。

-- 金茨·齐巴洛迪斯(Gints Zilbalodis),拉脱维亚导演,他的作品《猫猫的奇幻漂流》(Flow)获得今年的奥斯卡最佳动画片奖

3、

你编写的每一行代码都可能是一个潜在的 bug。除非你绝对需要这行代码,缺了它程序就会受影响,否则就不要写。不要编写你用不到的抽象层。如果优化会增加任何复杂性,就坚决不要优化。

-- 《每一代码都可能是 bug》

4、

我对 AI 的看法是,AI 本身不会创造,需要人类与它共同创造,创造的结果好坏与使用它的人的质量高度相关。

与 AI 交谈不像在与一个人交谈,而像在与人类的集体思维交谈。AI 不应该让你减少思考,而应该帮助你增加思考,AI 是你的杠杆,可以让你拓展自己。

-- Alex Komoroske,美国程序员

5、

10个人开会,可以没有主持人。100个人开会,必须有主持人。1000个人开会,需要一个组委会。

扩大10倍,需要将知识/资源推向极限,但是扩大100倍,需要跳出现有的维度,重新安排一切。

-- 《你的下两个零》

往年回顾

一周是一年的2%(#293)

与孔子 AI 聊天(#243)

前端与后端,谁更难?(#193)

世界尽头与冷酷仙境(#143)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年3月 7日

Trae 国内版出来了,真的好用吗?

年初一月份,我就看到新闻,字节面向海外发布了一款 AI IDE,叫做 Trae

我心想,现在的 IDE 都有 AI 插件,功能完备,字节自己也有 MarsCode 插件,有必要再做一款单独的 IDE 吗?

我就没有特别关注这个工具。

上周,我遇到字节的同学,得知 Trae 国内版就在本周发布,我还提前拿到了内测版,这可是国内市场的首个 AI 原生 IDE。

今天,就来说说我的使用心得,顺便也探讨一个更大的问题:AI 工具已经这么多了,该不该造新的轮子?

先透露一下结论:Trae 国内版值得用。它作为一个 AI IDE,整体比插件好用,而且内置的大模型----豆包 1.5 pro、DeepSeek 满血版----无限量免费使用。

一、国外版与国内版

介绍使用体会之前,我先解释一下,两个版本的区别,主要是模型的差异。

Trae 国外版使用国外的模型,对于国内用户来说,存在连接不上、等待时间长、网速较慢等问题。

Trae 国内版使用国内的模型,连接可以保证稳定快速,界面也根据国内用户的习惯进行了定制。

我也问了字节的同学,Trae 国内版和 MarsCode 是什么关系。回答是,它们是同一个团队的作品,适用于不同场景

如果你想保留原来使用的 IDE,只增加 AI 编程相关功能,那就用 MarsCode 插件。如果想体验一个全新的围绕 AI 设计的原生 IDE,那就试试 Trae。

这两个产品后续都会长期开发,可以根据自己的需要选择。

二、安装

Trae 国内版需要去官网 trae.com.cn下载。

目前,有三个版本:Windows 版、macOS Intel 芯片版、macOS M 系列芯片版。

安装启动后,会出现下面的画面。

接着,让你选择亮色/暗色主题,以及语言(简体中文)。

它还会问你,要不要导入原来 IDE(VS Code/Cursor)的配置,算是很贴心的设计了。

最后,问你要不要登录。不登录也可以用,只是某些功能会受到限制。登录的话,就跳转到 Trae 官网,用你的手机号登录。

一切完毕,就会进入使用界面。

三、使用界面

Trae 的使用界面,相当简洁。左侧就是 VS Code 的界面,熟悉的话,上手没有任何难度。

界面的右侧是 AI 区域。可以看到,它分成两个模式:Chat 和 Builder。

Chat 模式是默认模式,也就是问答模式。AI 回答问题,也可以生成代码,但不会生成项目,需要自己手动把代码复制过去。

Builder 模式是项目模式,你给出文字描述,让 AI 一键生成项目。

下面,就来试试这两个模式。

四、Chat 模式

Chat 模式的主体就是一个对话框,右下角按钮可以选择底层模型。

国内版目前有三个模型可供选择。

  • 豆包 1.5 pro
  • DeepSeek R1
  • DeepSeek V3

这三个模型都是免费无限量使用,DeepSeek 系列模型都是满血版。我实测,速度令人满意,能够较快地给出回答,没有遇到"服务器繁忙"的提示,包括最耗时的 DeepSeek R1 模型都是如此。

至于,回答问题的质量,老实说,现阶段领先的大模型,这方面已经没有太多可挑剔的了。

任何问题都可以问,包括非技术类的问题。

我直接让它生成代码,回答的格式非常友好。

大家注意,上图中,第一个代码块是终端代码,右上角有三个按钮(下图)。

上图右上角的三个按钮,分别是"复制"、"添加到终端"和"运行"。如果点击后两个按钮,会直接把代码传入 Trae 内置的终端,就像下面这样。

这部分,我感觉用起来比插件版流畅,整体感更强,这大概就是把 AI 做成 IDE 的好处了。

五、Builder 模式

再看 Builder 模式,它可以一键生成项目。

点击上方的标签页,切换到该模式。可以看到,第一次进入,会有一个"启动 Builder"按钮(下图)。

系统会提示你(下图),这里可以从零到一完成项目构建,并且所有修改会自动保存,并显示两个示例项目:贪吃蛇和 Todo List。

为了测试正常的流程,我就直接在下方的对话框输入:"请用 React 生成一个 Todo List 应用。"

系统会提示你指定一个目录,作为项目目录。然后,它不断给出操作步骤(下图)。

上图中,需要执行具体的命令时,它会附有"运行"按钮,要你点击确认。

点击后,Trae 会自动打开内置的终端,执行该命令(下图)。

然后,它会一个个生成所需的文件,要求你审查。

所有文件生成完毕,就出现了启动本地预览服务器的命令。

运行后,Trae 会启动一个内置的 webview 页面,展示渲染效果,实时更新。

这个很赞,任何修改都可以马上看到结果。

但是我必须说,不知道是不是内测版的缘故,Builder 模式目前还不完善,只适合为项目生成架构,做不到一步到位,离理想状态有些差距。我试了多次,如果需求复杂一点,生成的代码很难一次就跑起来,需要多次修改。大家对它要抱有合理期待,这个模式后续还需要不断完善。

六、其他功能

除了两大模式,Trae 的其他功能也可圈可点。

(1)代码智能补全。

这是 AI 编程助手的基本功能,就不多说了。只要按回车键换行,Trae 会阅读并理解当前代码,然后自动补全后续代码。

如果有注释,它会根据注释,生成缺少的代码。

(2)指定上下文。

Trae 允许指定对话的范围(上下文)。具体方法是在对话框输入#号。

上图中,在对话框输入#后,系统就会自动弹出一个菜单,让你选择上下文(context),一共有四种。

  • Code(代码)
  • File(文件)
  • Folder(文件夹)
  • Workspace(工作区)

默认的上下文是当前工作区(Workspace,即目前打开的项目),也可以指定为某个函数或类(Code)、某个文件(File)、某个文件夹(Folder)。

一旦指定了上下文,AI 的回答会更有针对性。比如生成代码时,就会结合上下文的场景。

(3)一键转对话。

为了方便地将代码编辑框的内容,传送给 AI,Trae 提供"一键转对话"按钮,省去了复制粘贴的麻烦。

上图中,选中某段代码,系统就会弹出"添加到对话"的浮动菜单,一键复制到 AI 对话框,便于提问。

终端窗口的报错信息,也有这个功能(下图),这就很方便让 AI 来 debug。

(4)模型自定义功能。

我听字节的同学说,Trae 后面会支持模型自定义功能,用户可根据自己的喜好,接入对应的模型API。

七、总结

我试用 Trae 国内版后,感到它有几个显著优点。

(1)产品设计周全,最常用的场景都考虑到了,用户体验比较流畅。

(2)界面友好,交互设计良好,开发者容易上手。

(3)AI 模型(包括满血版 DeepSeek)无限量免费使用,响应始终稳定快速。

不足之处是 Builder 模式还不够强,生成的程序有 bug,第一次生成往往跑不起来,需要不断调整,耗时较多。

总结就是,一个完整的 AI IDE 还是比 AI 插件,用起来更容易,有"一体感",达到了更大的定制程度。

随着 AI 的能力进一步发展,AI IDE 的想象空间会更大,也许会成为未来 IDE 发展的主要方向。

Trae 国内版刚刚上线,开发团队希望大家下载试用,多提宝贵意见。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年3月 3日

科技爱好者周刊(第 339 期):代币是什么

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

西安咸阳国际机场,新开放的 T5 航站楼里面,有一座博物馆,展示机场建设工地发现的文物。(via

代币是什么

现在,媒体经常出现一个词"代币"(token),今天就来谈谈这是什么?

首先声明,代币属于加密货币,有交易市场。我完全不想碰这一块,只想谈谈它们的原理。

大家读了就能理解,它们为什么可以发行,可以交易。作为技术实验,这是很有意思的。

我想谈这个题目,是因为前些日子读到一篇文章《去金融化与超金融化》,让我想通了代币与金融的关系。

加密货币的起源,与纸币的弊端有关。纸币(比如美元)都会越发越多,形成通货膨胀,长期中贬值,购买力不断下降。

人们因此不愿意持有现金,而是想法设法保值增值,从而形成"金融"活动,比如储蓄、投资、购买房产等等。

所以,金融就是现金的对立面,货币越发越多,人们越不愿意持有现金,导致金融活动也越来越多。

比特币的最初动机,是创造一种无法增发的货币机制。由于比特币总额是确定的,所以如果把它当作货币,就肯定不会发生通货膨胀。

因此,人们会愿意持有比特币现金,而不是拿它去消费和投资。由此推论,比特币的世界应该没有太多的金融活动,它可以"去金融化",减少金融投资的规模。

但是,没有想到,后来出现了"以太坊"。

以太坊跟比特币一样,建立在区块链之上,区块链可以看作是一个写入后无法修改的公开账本。此外,它还有一个比特币没有的特点,就是"智能合约"。它允许用户写自己的程序,放上区块链,让区块链去执行。

这意味着,用户可以基于"智能合约",在区块链上发行自己的代币。比如,你在区块链上写入一条记录(可以是任意内容),然后用智能合约规定,这条记录的所有权分成10000份(即关联10000条子记录),每一份都可以单独交易。

这样一来,你就创造了一种自己的代币,总额为10000份。你对外出售这些代币,只要有足够的人愿意买,就会形成这种币的交易市场。

这里的关键是,你写入区块链的原始记录,可以是"任意内容"。这意味着,任意东西都可以代币化,比如一条笔记、一段录音、甚至一件衣服,都可以发行成代币,只要保证写入区块链的内容能够代表原始物品即可。

根据这个原理,就出现了各种奇奇怪怪的代币发行,比如狗币、猫币、月亮币、火星币、大蒜币等等。它们统称为 meme coin(中文译为迷因币或模因币)。

代币可以是同质的(每一份可以互相替代),也可以是非同质的,即每个代币都是独一无二,相当于有编号证书。后者称为"非同质代币",英文为 NFT(Non-fungible token),曾经一度非常火爆。

2022年,一只称为"无聊猿"的猿猴头像,它的一份 NFT 最高价格到过147个以太坊(约42万美元)。本质上,你花了这么多钱,买到的只是区块链上你名下的一条记录,你有权再把这条记录转给其他人,仅此而已。

由于任何东西都能变成可以交易的代币,因此代币创造了一种"超金融化",即任何东西都变成金融化的可交易资产。

所以,事情就有点讽刺了,加密货币发明的原意是"去金融化",诞生一种有稳定购买力的货币,现在却变成了"超金融化",无数原本不可交易的东西,变成了金融资产,从来没有稳定的价格。

GeeLark 云手机

国内很多个人和企业,现在都在做跨境电商,需要工具来管理境外的社交媒体平台。

今天,就介绍一款这样的工具 GeeLark

它的定位是"跨境营销一站式运营平台",服务中国品牌出海。

功能上,它是云手机,让你在电脑上,通过云端操作各种手机 App,比如 TikTok、Instagram、YouTube、Facebook、WhatsApp 等(上图)。

大部分商家,还在用实体手机管理 TikTok 账号,如果有几个账号,就需要使用多部手机,非常麻烦。云手机就是解决这个问题,

(1)每个云手机是一个单独隔离的环境,没有任何学习成本,跟操作实体手机一样。系统版本的选择非常丰富,从 Andorid 10~Android 14 供选择。

(2)账号管理方便,一部电脑管理全部的手机和账号。

(3)常规操作全部自动化:自动批量发视频、发图集、修改文案、AI 养号、互动评论等。

(4)分组授权。团队成员可以设置单独的访问权限,可以分组管理,成员可以不知道媒体平台的账号密码,确保账号安全。

(5)TikTok 账号管理功能强大,可以一站式创建、管理和自动化运营账号,支持直播。

(6)提供 API。用户自己编写脚本,通过 API 实现对云手机的操作,执行自动化任务,还可以开启 ADB 远程控制云手机。

(7)GeeLark AI。最新版本上线了 AI 功能(下图),接入了 DeepSeek 模型。云手机可以在 AI 操作下,像真人一样使用 TikTok,浏览特定关键词或博主的视频,从而让系统为账号打上合适的标签。

发布视频或图集时,AI 可以帮你写文案,还可以生成不同版本的视频,帮助测试分发效果。

GeeLark 免费试用。新用户注册后,可以使用两部云手机,免费时长总共为60分钟。如需要更长的时间,或者更多的云手机,则需要付费。

感兴趣的朋友,不妨现在访问官网 geelark.cn 下载试用,无需绑定信用卡。新手入门操作可以看这篇文章

[活动] AI FOR CODE 创意挑战赛

为了推广 AI 编程,探索技术创新,全国"AI FOR CODE 创意挑战赛"即将举行。

本次大赛为了鼓励更多同学参与,降低参加门槛,除了常规的"应用实现"赛道,还特别增设"创意征集"赛道。

只要你有想法,哪怕没有时间完成落地开发,都可以参加。你只要有创意,为参赛队伍提供灵感,让 AI 去实现,即使无法参与亲自开发,也有机会让自己的灵感变为现实,从而参与评奖。

大赛的启动仪式将在下周一(3月3日)晚上18点举行,详细介绍赛制,以及本次大赛的指定的 AI 编程环境 Trae。

直播期间将有大量抽奖。另外,预约直播后分享海报,邀请他人参加,也有丰厚奖品。

关注 AI 编程的同学,不要错过本次大赛。现在点击这里,或者扫描上面海报的二维码,预约参加直播,了解详情。

科技动态

1、月球机房

本周,美国通过猎鹰9号火箭,发送了一个月球登陆器。

登陆器将一个迷你服务器(下图)送到了月球表面,它重约1公斤,带有 8TB 硬盘。

这个服务器是为了测试,月球机房这个想法是否可行。

相比地球,月球没有自然灾害,没有风和雨,也没有水份和氧气,更没有战争和人为破坏。事实上,只要不遇到陨石撞击,月球地表几万年也不会改变。

于是,就有人提出,能不能把机房放到月球上,数据就不会损坏了,可以长期保存。

本次实验就是为了验证,通过太阳能供电,服务器能不能在月球上正常工作,经受极端的高温和低温。

2、飞行汽车

马斯克投资的飞行汽车,上周进行了原型试飞。

这辆车的奇特之处,在于它的外形就是普通的汽车,没有外露的螺旋桨,难道藏在车体内部。

它也飞不高,目击者说离地高度不超过5米,然后保持这个高度,向前飞了一段距离,就落地了。

厂商说,它的使用场景之一是,如果前车抛锚堵塞道路,它就可以飞过前车。另一个场景是飞过水面。

该车售价30万美元(约人民币217万),预计年底可以交付,可能成为世界第一辆上市的飞行汽车,只是不知道多少人会买。

3、天基太阳能

太阳能发电正在快速发展,但是它有一个重大缺点,就是无法全天发电,每天最多工作12小时,还不能有阴雨天气。

早就有人设想"天基太阳能",为什么不把光伏板放到太空呢?全天24小时发电,再把电力传回地球。

一家美国创业公司,就打算开展这项业务,计划于2026年发射第一颗实验卫星。

它的设计类似于"星链":多颗光伏卫星排列成一条直线,将太阳光转换为电能,再通过红外激光向地面传送。

地面设有多个接收站,每个站接收头顶卫星发来的能量,当前卫星飞过以后,再接收下一颗,就跟卫星上网差不多的模式。

4、其他

(1)湖南省严禁使用 AI 为病人开处方

(2)埃及新发现一个法老墓,入口藏在山谷底部,很不起眼(下图)。上一次发现法老墓,还是1922年的图坦卡蒙墓,已经相隔百年了。

文章

1、本地部署 DeepSeek 模型保姆级教程(中文)

网友的教程,家用 PC 怎么跑 DeepSeek,当然跑不了满血版,只能跑小参数的版本。(@lovefc 投稿)

2、从头构建大模型(英文)

作者按照教材(上图),从零开始做一个大模型,本文简要解释了大模型原理。

3、Svelte 5 不是 JavaScript(英文)

Svelte 是一个流行的前端框架,去年发了5.0版。作者使用后感觉,它的抽象层次太高,已经不像 JavaScript 语言,而像一种新的语言。

4、面试伦敦谷歌(中文)

作者面试伦敦谷歌,最后被拒,全程的记录。(@DoctorLai 投稿)

5、Proxmox 虚拟机的10个项目(英文)

Proxmox 是现在很流行的虚拟机软件,本文介绍它在家庭实验室的10种用途。

6、我如何用手势模拟鼠标(英文)

一篇教程,作者用谷歌的 MediaPipe 和 OpenCV,将摄像头捕获的手势动作,转化为鼠标操作,也就是不需要鼠标了。

7、如何制作网页的毛玻璃效果(英文)

本文介绍如何制作一个网页的毛玻璃透明区块。

8、CSS 局部作用域 @scope(英文)

本文介绍 CSS 局部作用域语法 @scope,它定义的规则只对当前区域生效,Chrome 浏览器已经支持。

工具

1、digiKam

开源的本地照片管理软件。

2、Web Awesome

一个 Web Component 组件库。

3、WhiteSur

一个类似 Mac 的 Linux GTK 桌面主题。

4、mdq

一个从 Markdown 文件提取信息的命令行工具,类似 处理 Markdown 文件的 jq 命令。

5、Electro

一个命令行的图片浏览器,Rust 语言写的,速度快。

6、链图

一个开源的在线工具,将网址转成一张包含二维码、网站标题和简介的图片。(@wind-liang 投稿)

7、MinMail.app

免费的临时邮箱服务。(@withoctober 投稿)

8、MoePush

基于 NextJS + Cloudflare 的消息推送服务, 支持钉钉、企业微信、Telegram 等多种渠道。(@beilunyang 投稿)

9、Ant Design X Vue

Ant Design X 的 Vue 移植,专门用来做 AI 的前端界面。(@wzc520pyfm 投稿)

10、New SVG Viewer

开源的 SVG 预览网站。(@liujuntao123 投稿)

11、Statusnook

一个需要自己部署的服务,用来架设一个简单的网站,检查指定网址是否在线。

12、llm-commit

使用大模型生成 Git 仓库的提交信息,用法简单,基于 Python 工具 llm。

资源

1、中日文翻译

该网站将中文翻译为日语,并显示假名和罗马发音。(@zhanghuid 投稿)

2、3D 陶器动手做

谷歌的网页小游戏,在网页上做一个 3D 陶器,挺有趣的。

3、苏特罗塔 3D 模型

苏特罗塔是旧金山的电视塔,高298米。作者用几千张无人机的照片,合成了它的 3D 模型,效果极佳。网站上有方法介绍。(@YuJianrong 投稿)

4、椭圆曲线加密(Elliptic Curve Cryptography)

这个英文仓库有椭圆曲线加密的简单介绍。

图片

1、分形台钳

台钳是一种常用的金属加工工具,用来固定零件。

常见的台钳都是下面的样子,只适合固定那些固定形状的零件。

但是,还有一种分形台钳,利用多个可调整角度的固定块,去固定不规则形状的零件。

文摘

1、如果没有人读博客,为什么要写呢?

让我们坦率一点吧,你写了一篇博客,根本就没有人读。

至少,没有你想要的那么多读者。你把自己的想法倾注在文章,精心构思每个句子,选择合适的图片----然后什么反响也没有,没有点赞,没有分享,没有互动。

那么写博客的意义何在?

首先,关于写博客,有两个误解。一个是只要我写出了好文章,读者自然就会来。不,他们不会来,网上有几十亿篇博客,好像浩浩荡荡的飓风一样,你的博客只是风里的一片叶子,谁会注意呢。

另一个误解是如果没有人阅读,写作就是浪费时间。

博客有自己隐藏的价值。你写博客不是为了别人的掌声,而是因为你自己的需要。

博客使人头脑清晰。它帮你理清思绪,锐化视角。当你写作时,你会思考得更好。当你思考得更好时,你会做出更好的成果。

博客的目标读者,其实不是互联网人群,而是未来的你,你的文章会让你看到自己思想的演变。

此外,未来也许有一天,某个真正需要你文章的人,会找到它。一篇有深度的文章比一篇病毒式传播的文章,影响力更持久。

写博客有点像街头摄影。你手拿相机,漫步在城市中。你看到一个场景----一个充满光、影、人性的瞬间,就拍下了它。

没人关心你拍到了什么。但这不是你摄影的原因,你摄影是因为你看到了一些东西

写博客也一样。你写博客是因为你在思考,因为你在观察,因为你希望把它放在某个地方

如果有人读了,那就更好了。如果没有,工作还是完成了。

这才是真正的重点。

言论

1、

有些大型科技公司,只招募中高级程序员,不招募初级程序员。我认为,这样做不对。

因为现代企业是知识型企业,初级程序员会迫使团队去教导、训练、合作,从而发现知识、创造知识。

-- 《你的公司需要初级程序员》

2、

我们公司的高管(没有一个是工程师)完全相信"AI 取代开发者"的炒作。我们的 CTO 曾说过:"使用 GPT 编写代码,这是一天内就能完成的任务,应该不会超过一天。"

他们真的相信 AI 可以在一夜之间取代熟练的程序员。同时,他们从未使用过 GPT 自己编写生产代码,他们只是阅读了公关宣传并认为 AI 很神奇。

-- 《应对破碎的开发文化》

3、

最终,我希望机器人能做我不想做的事情,比如洗碗、洗衣服。我不希望它们代替我播放音乐、编写代码、写字。

-- 《我能合乎道德地使用大模型吗》

4、

日本铁路公司拥有车站附近的大量土地,为了提高客运量,会在车站旁做很多建设,吸引客流,比如开设酒店。

他们甚至会开设剧团,日本著名的宝冢歌舞团就是阪急铁路公司创立的,为了吸引人们乘坐火车去看演出。

-- Hacker News 读者

5、

人们首先解决生存需要,然后寻求实用性,接着追求舒适性,后来又享受快乐,从而变得荒唐奢侈,最终变得疯狂并浪费物质。

-- 维柯,意大利哲学家

往年回顾

所有代码都是技术债(#292)

一次尴尬的服务器被黑(#242)

最大的机会来自新技术(#192)

2020年才是21世纪元年(#142)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年2月28日

科技爱好者周刊(第 338 期):重新思考 6G

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

图片

重庆巫山的悬崖上,有一座民宿,可以俯瞰三峡,图片是民宿的后院。(via

重新思考 6G

上周,国际电气电子工程师学会(IEEE)的网络杂志《科技纵览》(IEEE Spectrum),发表了一篇文章《重新思考 6G》

它提出一个很有意思的观点:带宽需求可能已经饱和了

文章的大意是,对于绝大多数的普通用户来说,目前的网速已经够用了。上网速度即使进一步提高,消费者很可能无感。

它的证据是,手机的 5G 网络从2018年开始部署,已经6年多了,至今没有出现杀手级应用。绝大多数应用的网速需求,4G 网络就能满足

为了让大家有一个概念,我简单列一下网速的数量级,4G 是每秒 100 Mb,5G 是每秒 1 Gb(1Gb 等于 1000Mb),拟议中的 6G 是每秒 10 Gb。

注意,这里的"b"是小写,表示比特位(bit)。平时使用的 MB 和 GB 的"B"是大写,表示字节(Byte),一个字节等于8个比特位。

大家知道吗,最吃带宽的应用,网速需求是多少?

视频应用对网速的需求最大,Netflix 的 4K 视频,网速要求是每秒 15 Mb,4G 网络下可以同时打开三、四个窗口播放。

只有极少数应用,网速需求达到了 5G 的门槛。 目前,网速要求最高的应用之一是微软飞行模拟器2024,达到了每秒 180 Mb。

这就是说,现阶段根本没有应用,必须用到每秒 1Gb 的网速。大多数用户从 4G 升级到 5G,不会有明显感知,更不要说将来从 5G 升级到 6G 了。

结论就是,(对于普通用户)网络带宽可能到头了,目前的 5G 网速足以满足绝大多数人的需求

这有点像民航飞机,过去50年,大型喷气式民航飞机的飞行速度,基本没有变化,一直是每小时900公里左右。并不是造不出更快的飞机,而是这个速度是最佳平衡点,旅客可以接受,飞行成本也不会过高。

通信网络可能也到了这个阶段。5G 够用了,升级到 6G 不是那么迫切,也许很长一段时间都不会发生。一方面,市场需求不大,另一方面,即使升级到 6G,设备和流量的价格也会非常高昂,消费者很可能没有意愿买单。

这意味着,过去几十年来,一直轰轰烈烈、巨额投资的通信设备市场,将要放缓。电信公司的网络建设投资,将会大幅减少。

一旦通信公司不再能通过网络升级获得新客户,就必须采用其他手段,来发展业务:(1)流量降价;(2)提高网络的覆盖范围,减少信号差的地区;(3)提升客户服务。

当民航的飞行速度不再提高后,就出现了廉价航空公司。可以预期,未来也会出现廉价的通信商,出售非常便宜的流量。

AI 动态(两则)

AI 的研究模式

2025年,AI 大模型的进展是什么?

答案肯定是研究模式。早期一问一答的对话,已经进化到了思考和推理。

遇到需要深入思考的问题,AI 会先思考框架、拆解步骤,再查找大量文献资料,分析整合出最后的结果,思考步骤还是很全面的。

国外,Google、OpenAI、Perplexity 等公司都已经纷纷上线了 Deep Research。国内,对标 Perplexity 的"秘塔 AI"也上线了新的研究模式。

它的背后是"双模型架构":需要深度推理的部分,由满血版 DeepSeek R1 完成,需要快速响应的信息搜索、资料整合部分,由秘塔自研的模型完成。

下面是一个例子,你要写一篇论文《基于区块链的碳信用交易系统》,研究模式就会给出思考步骤,最终生成研究框架。

再加上秘塔 AI 自己的学术数据库,保证了参考资料的真实性,使用下来发现有些回答会好于 DS 官网。

体验到这些是完全免费的,而且操作零难度。大家有需要研究和分析的问题,可以去试试看

VS Code 使用 DeepSeek 的方法

在 VS Code 编辑器,怎么使用 DeepSeek 模型?

国内用户的最简单方法,大概就是 MarsCode 编程助手

它最新的 VSCode 插件(1.1.62版本)和 JetBrains 插件(1.2.1.15版本),都支持 DeepSeek。已经安装的朋友,IDE 内直接更新,新安装可以去官网下载

使用时,在 AI 对话框下方,点击模型按钮,目前有三个模型:doubao-1.5-pro、DeepSeek R1/V3(满血版)。不需要任何配置,全部免费使用

这三个模型的能力都很强,插件效果(代码解释、注释、修复、优化、上下文问答)都表现更好了,大家可以自己比较。其中,DeepSeek R1 模型在后台由火山方舟部署,TPS(每秒 Token 生成速度)、TTFT(首 token 出现等待时间)等指标,第三方测评结果称,其 DS 方案性能排名表现优异。

这一次,MarsCode 官方正在举办"体验有礼"活动,在社交平台(小红书、CSDN、掘金开发者社区)分享自己的使用截图和不少于30字的使用心得,艾特他们的官方账号"@豆包MarsCode",就可以在他们的官方微信账号参与抽奖,中奖率高。

另外,MarsCode 团队上个月发布了一款 AI 原生的 IDE -------- Trae,注重提升整体的 AI 体验,大家也可以试试。

科技动态

1、时间码的身份验证

很多应用采用一次性时间码(TOTP),按照当前时间和用户生成一串数字,来验证用户身份。

一个程序员想到,完全可以用这种方法,验证是否见到了本人。

举例来说,A 和 B 从未见过,如何在见面时,确认来的是本人?

他们可以访问这个网址,输入双方的名称,系统分别为他们生成一个二维码。

他们将自己的二维码,保存到手机的验证器,以便生成时间码。见面时,如果双方的时间码一致,就表明来的是本人。

2、机载大地磁场探测器

中国科学院最近研制了,中国首套机载大地磁场探测器。

建设高原铁路,需要了解沿线的磁场情况。但是,沿线都是无人居住的高原山区,人工勘探很危险,成本也非常高。

科研人员就将磁场探测器,安装在一个环形支架上,吊挂在直升飞机下方。

飞机在飞行过程中,就能读取磁场数据,完成探测。

3、被缚的机器狗

一个日本艺术家创作了一个叫做《被缚的机器狗》的作品。

只见两条机器狗被铁链拴住,不停走来走去,有时会趴着休息。

如果有人经过,它们会冲过来,好像要攻击似的。

但是,铁链把它们拉住了,它们最后只能退回去,悻悻得叫几声。

看着这个作品,给人的感觉很复杂:恐怖、怜悯、荒谬......

4、其他

(1)NBA 的苹果 Vision Pro 应用,添加了直播的 3D 桌面模式,球场的实时画面变成了一张 3D 棋盘。

(2)美国宇航局宣布,一颗名为"2024 YR4"、直径40米~90米的小行星,在2032年撞击地球的概率是三十分之一(3.1%)。如果相撞,可能毁灭一个城市。

文章

1、废弃 Create React App(英文)

React 官方宣布,正式废弃 Create React App,建议通过框架来使用,也就是不建议直接用 React。

2、Unicode 字符的迷你柱状图(英文)

本文介绍怎么使用 Unicode 字符,来生成迷你的柱状图(上图)。

3、多页应用不输给单页应用(英文)

单页应用(SPA)是网页应用的主流,本文提出多页应用也可以做到 SPA 的各种优点。

4、详解 Linux 硬链接和软链接(英文)

Linux 有两种特殊文件:硬链接和软链接,本文详细解释它们的区别。

5、了解 CSS 的 overflow: clip(英文)

CSS 的 overflow 属性,有一个 clip 值,可以截去溢出部分。通过它,可以做出很多页面效果。

6、什么是网页的元信息?(英文)

本文介绍如何在网页中插入元信息(比如作者、关键词、内容描述等等),便于计算机检索。

7、如何安装 ADB(英文)

ADB 是电脑连接安卓手机必需的,本文分别介绍 Windows/macOS/Linux 如何安装 ADB。

工具

1、ElevenReader

一个手机 App(支持 iOS 和安卓),把电子书转成有声书,支持中文,但是内置的老外语音读起来很生硬。

2、GIXY

一个开源的命令行工具,检查 NGINX 的配置文件是否有错误。

3、uchū

一款互联网调色板,提供预设的 CSS 配色方案。它采用新的oklch()函数声明颜色,这里有一篇oklch()的介绍文章

4、Bun Shell

使用 Bun 作为解释器的 Shell 环境,可以在命令行直接运行 JavaScript 脚本。

5、Spotube

一个另类的 Spotify 跨平台客户端,从 Spotify 获取数据,然后播放来自其他音源(比如 YouTube)的音频,从而不必购买会员。

6、Kener

一个自托管的状态页,用来监控指定网站是否正常在线。类似工具还有 Uptime Kuma

7、gtrash

Linux 和 Mac 系统的被删除文件的垃圾桶,可以在终端里面还原文件,参见介绍文章

AI 工具

1、DeepSRT

一个 Chrome 插件,观看 Youtube 视频时,在浏览器侧边栏展示视频总结和字幕。(@tsungmin 投稿)

2、Deep Research Web UI

AI 深度研究的前端 UI,可以接入各种大模型,结合搜索引擎和网页抓取,对各种主题进行迭代式深入研究。(@AnotiaWang 投稿)

3、AI 翻译助手

开源的 AI 翻译网站。(@321208008 投稿)

4、GitSeek

给定一个代码库,使用自然语言搜索需要的代码片段。(@i-richardwang 投稿)

5、AI 多人聊天室

一个开源的、基于 React和 Cloudflare Pages 的 AI 聊天室,跟多个 AI 模型同时聊天。(@maojindao55 投稿)

资源

1、四级词汇手册

使用 DeepSeek 编写的四级词汇手册,提供单词的词义、词根、例句、辅助记忆、助记图像等。(@vxiaozhi 投稿)

2、唐韵

一款界面简洁的古诗词网站。(@LLSean 投稿)

3、News Digest

欧美科技网站头条新闻的 AI 摘要,实时更新。

4、Discuo

一个极简主义的论坛,不需要注册就能发言,类似于 Reddit,可以创建各种频道。

图片

1、饼图与直方图

同样的百分比数据,分别使用饼图和直方图表示,可读性不一样。

首先是饼图。

其次是直方图。

大家觉得,哪张图更易读?

一般来说,直方图更易读,饼图比较难读。原因是人类比较长度的能力远强于比较角度的能力。

2、瑞士护照

新版的瑞士护照,每一页都有紫外线水印。

紫外线灯下,护照封面会显示瑞士国徽(一个十字)。

其他页面会显示山脉的等高线和地图。

文摘

1、旅行50年的一点经验

作者:凯文·凯利

我已经认真旅行了50多年,学到了很多东西。

旅行有两种模式。一种是休息模式,人们通过旅行来逃避常规的工作,进行放松和重振精神。这种模式下,你会去轻松的地方,悠闲地度过假期。

另一种是体验模式,你旅行是为了发现新事物,获得新体验,投入一场结果不确定的冒险,遇见异类。这种旅行是一种学习,我的经验主要适合这种模式。

很多人旅行有一个误区,就是想看遍所有地方。因为你很可能再也不会来了,所以忍不住想最大化你的行程。既然我们在 X,而 Y 和 Z 又很近,我们不妨去看看 Y 和 Z 吧......

其实,在更少的地方待更长的时间,远比把时间花在一堆地方好得多。你更应该放慢旅行的速度,多休息。

旅行最难忘的时刻----与陌生人的交谈、被邀请参观、发现隐藏的地点----通常发生在你停下来的时候。

你可以前往旅行成本最低的地方,从而同样的预算,就可以待更长的时间。而且,便宜的、非主流的目的地通常值得一游。

为了获得最佳的旅行体验,你要么投入很多钱,要么投入很多时间。这两种选择中,时间比金钱好得多。因为金钱可以买到时间,但金钱买不到时间所能提供的东西。

言论

1、

我发现,AI 大模型生成代码时,总是优先使用2022年11月 ChatGPT 发布之前流行的技术。AI 给予这些技术的优先待遇,将扩展它们的采用和寿命。

-- 《人工智能正在抑制技术采用》

2、

我认为欧洲真的要加强。在过去的20年里,美国经济和中国经济的增长速度远远快于欧洲经济

如果不放松对人工智能技术的严格限制,欧洲有可能成为一个"博物馆"。

-- 克里斯特松,瑞典首相

3、

在商业领域,最先做到的人有优势。但是,在研究和学术领域,成功往往不属于最先理解的人,而属于理解得最好的人,真正的优势来自于深刻、基础性的见解。

-- 《我在麻省理工学院的时光》

4、

先行者开辟了道路,后来者用更少的计算资源迅速缩小差距,这就存在了先发劣势。

-- Hacker News 读者

5、

以谦逊和好奇的态度对待工作时,你会学到更多,参与得更充分。初学者的心态是一种财富。保持真实的自我有助于你找到自己真正的使命。

-- 《我在麻省理工学院的时光》

往年回顾

AI 没有护城河(#291)

中国的增长动力在内陆(#241)

一个程序员的财务独立之路(#191)

封闭系统的胜利(#141)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年2月21日

科技爱好者周刊(第 337 期):互联网创业几乎没了

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

秦皇岛海边的某楼盘,像乐高积木一样,每层都有私人露台花园以及公共天台花园。(via

互联网创业几乎没了

上周我写了,AI 削弱互联网,网站行业前景黯淡。

发布后,我突然想到,如果这个判断正确,那么,互联网创业也差不多结束了

我说的"互联网创业",指的是那些纯粹线上、不涉及线下的创业项目。

大家有没有同样的感觉,互联网创业者正在急剧减少

我没有数字,但是自己的观察是,投身线上的开发者,一年比一年少。现在,除了 AI 和游戏领域,其他的互联网创业项目几乎没人敢碰。

回想十年前的氛围,简直天壤之别。那时,互联网创业堪称火爆,街头巷尾都在谈论。哪怕还没有一行代码,只要创业计划书写得好,就可能拿到风投。

那时的热门词汇是"互联网思维",彷佛只要沾上互联网,就有钱景,就可以火箭式增长。

时过境迁,十年前的盛况,如今烟消云散。到了今天,创业意愿低落,创业者少,鼓励你创业的人更少。更多的人劝你求稳,尽量选择体制内或者留在大公司。

就算你还是想创业,寻找风险投资也非常困难。投资者一看是互联网项目,就加倍警惕,一再追问现金流和利润有没有保证。

为什么互联网创业现在几乎消失了?

我看到一篇文章,总结了四点原因。

(1)互联网行业已经成熟了,留给创业者的机会大幅减少。互联网的大部分果实已被摘取,早期的高增长难以再现。真正的创新机会即使还能找到,也会被现有的大公司快速抄袭,不会留给创业者。

而且,AI 大模型出现后,互联网本身都在衰弱,它的创业机会就更少了。

(2)创业的机会成本变大了。一个大厂的高级工程师,现在的薪酬(包括股票期权)超过百万,创业很难打动他了。

(3)风险投资的商业模式难以实现了。风投的模式是,项目高速增长,最终实现上市退出,这越来越难做到了,能够指数式增长的线上项目现在基本找不到。

(4)创业者的生活态度发生了变化。人们比以前更重视生活质量,越来越不愿意接受创业带来的没日没夜的劳作、倦怠、失败的人际关系、心理健康问题。

上面的四条,第一条是根本原因:互联网的高增长结束,行业的机会少了。

Hacker News 社区的一位网友说得好:"浏览器技术已经到头了,通过 HTML 和 JS 在网页上组织信息、创造娱乐,并从中获利,很难翻出新花样了,你能创新的地方非常有限。"

总之,单纯的互联网创业,应该再也不会像以前那样兴旺了,很可能就是社会的平均增长率和回报率。未来互联网的机会更多是与其他行业结合,就好像现在的 AI 创业,很多都是 AI 为主,互联网为辅。

火山引擎 DeepSeek API 介绍

DeepSeek 是现在最热门的模型,但是你不一定要使用官方 API,完全可以用第三方 API 替代。

因为 DeepSeek 是开源模型,任何人都可以架设,第三方 API 其实跟官方的效果完全一样。

我用的就是第三方 DeepSeek API,服务商是火山引擎,今天就来说说怎么用。

火山引擎是字节旗下的云服务部门,实力和可靠性都有保证。除了自家的豆包大模型,它也提供其他大模型。

相比官方 API,它有一些显著的优点。

(1)免费额度高,50万的免费 token 额度,用完才收费。

(2)成本低。现在是五折优惠,R1 模型的百万 token 的输入价格为2元人民币,输出8元,比 DeepSeek 官方价格都要低。

(3)流量大。每分钟 token 限额(TPM)是500万,每日 token 限额(TPD)是50亿,都是全网最高,不用担心超过限额。

(4)延迟低。它在国内有多个机房,不管哪里连接,响应时间都在几十毫秒、甚至十几毫秒。

(5)联网搜索能力。它允许 DeepSeek 模型联网搜索,并且还允许用户定制联网能力(内容源、引用条数等)。

下面就是它的 DeepSeek API 的接入教程,很简单。

首先,登录它的大模型开发平台"火山方舟",选择左侧菜单的"在线推理",然后点击"创建推理接入点"(下图)。

接着,填写接口名称和选择模型,建议选择"DeepSeek-V3"(下图)。

接口开通成功后,系统会分配一个模型名称(比如,下图的 ep-20250213185631- 6b6r2),这个名称要记下。

下一步,就是客户端接入 DeepSeek API 了。本周正好有一篇读者投稿笔记软件 Obsidian 如何接入 DeepSeek API》,大家可以参考它,进行客户端配置,我不重复了。

客户端配置的关键一步,就是上面的配置页。Model Name 是系统刚才分配给你的模型名字,Provider 选择 OpenAI Format,Base URL 填写https://ark.cn-beijing.volces.com/api/v3,API key 就是你在火山引擎模型详情的"API 调用"里面,让系统生成的 API 密钥。

客户端配置完成后,就可以开始使用 DeepSeek API 了。

科技动态

1、人类的最后考试(Humanity's Last Exam)

今年1月份,两家美国 AI 公司推出了一个测试集,包含3000道各种学科的题目。

据他们说,只要 AI 模型通过了这个测试集,就表明 AI 智力已经超过了人类,也就是达到了 AGI(通用人工智能)的水平,所以起名为"人类的最后考试"。

截止2月3日,AI 模型取得的最佳成绩是26.6%的正确率。

按照专家的说法,AI 超过人类的智力,似乎是板上钉钉的事情了,唯一的悬念是何时能超过。这个"人类的最后考试"给出了衡量的具体方法。

2、VR 旋转椅

一家英国创业公司,推出了 VR 旋转椅,让玩家可以在 VR 世界里面,随着画面一起转身。

它在 VR 头盔的上方加了一个传感器(上图)。传感器能感知头部运动,从而发出指令给椅子。

当你坐在椅子上转动头部,椅子就会跟着你的头自动旋转。如果你的头向左旋转45°,椅子也会向左旋转45°。

它可以逼真地还原 VR 虚拟世界的转身体验,还消除了因为视野旋转而导致的眩晕感,提高了大脑对 VR 旋转的耐受度。

据发明者说,它还能提高生产力。如果你面前有一组虚拟显示器,只需转动脖子,你的整个身体就会从一个显示器切换到另一个显示器,虚拟键盘总是正对着你。

3、水下住宅

一家英国公司正在建造"水下住宅",将试验让人类在80米的水下生活。

上面是他们的设计图,下面是实际建造中的照片。

建造完成后,住客通过潜水艇,进入和离开这所水底房屋。

这看上去,只是一个有钱人的旅游项目,距离真正的"水下居民点"相差甚远。

事实上,人类移民水底的意义不大,不如建造海面上的"浮动城市",更有现实价值。

4、陶瓷砖熔炉

炼钢需要高温,融化铁矿石。炼钢的熔炉都烧煤炭,产生环境污染和排放二氧化碳。

钢铁厂无法改用电加热炼钢,因为普通的电加热达不到炼钢的温度,需要特殊材料的电热丝,那是非常贵的。

一家美国创业公司发明了不用煤炭的熔炉(上图),使用陶瓷砖来产生高温。

陶瓷砖(下图)有一个特点,可以不断升温,并能保持热量。只要用电不断加热,就能最终达到1,800摄氏度,融化铁矿石。

这个发明有助于钢铁厂告别煤炭,利用太阳能和风能产生的电力,让钢铁业变成绿色行业。

文章

1、如何用 OPNsense 搭建家庭防火墙(英文)

OPNsense 是一个开源的防火墙和路由软件,本文介绍自己安装的详细步骤。

2、《软件设计哲学》笔记(英文)

作者阅读了《软件设计哲学》这本书,对怎样减少软件的复杂性,做了详细的笔记,给出了代码示例。

3、CSS 的 backdrop-filter 属性(英文)

本文介绍 backdrop-filter 属性,可以产生毛玻璃的效果。

4、为什么你应该用 Canva 制作幻灯片(英文)

本文提出 Canva 是比 PowerPoint 更好的幻灯片制作工具。

5、在虚拟机中开发(英文)

作者介绍在 MacBook Pro 安装 Ubuntu 虚拟机,所有开发都在虚拟机里面完成,保证本机系统始终是干净的。

6、基于 signal 的 Web 组件(英文)

作者介绍自己写的一个 Web 组件,可以在不加其他 JS 库的情况下,实现 signal 功能。

工具

1、You-Get

一个从影音网站下载视频的命令行工具,比 yt-dlp 简单一点。

2、Zettlr

一个桌面的写作软件,可以管理文章,将其做成一本可出版的书。

3、Bruno

一个开源的 API 调试的桌面客户端,类似于 Postman。

4、Windows 容器

一个 Docker 镜像文件,在 Docker 容器里面运行 Windows。

5、Timeshift

Linux 的时光机器,定期对文件系统生成增量快照,可以返回到指定时点。

6、Pages CMS

一个静态网站的内容管理系统,在 Cloudflare Pages 托管你的网站,文章直接在网站上编辑,数据存放在 GitHub 仓库。

7、Pragmatic drag and drop

Atlassian 公司新发布的一款网页元素的拖拽库,Trello、Jira、Confluence 都在使用它。

8、Press UI

基于 uni-app 的小程序组件库。(@novlan1 投稿)

9、鸿蒙 ArkTS VSCode 插件

ArkTS 是华为鸿蒙系统的开发语言,属于 TypeScript 的超集,这是它的 VSCode 插件。(@Groupguanfang 投稿)

10、AutoSwitchTranslate

一个开源的 Chrome 插件,根据用户输入的语言,自动在谷歌翻译的页面上,切换中译英或英译中。(@wa008 投稿)

AI 相关

1、RAG Web UI

一个开源的 AI 桌面应用,可以上传文档,生成本地的知识库问答系统,基于 RAG(检索增强生成)技术。(@JohannLai 投稿)

2、TEN Agent

一个 AI 的工具框架,快速打造语音相关的 AI 应用。(@SyunWong 投稿)

3、We0

开源的 AI 代码生成方案,对标Cursor。(@we0-dev 投稿)

4、Gemini Pro Chatbot

一个开源的谷歌 Gemini Pro 手机客户端,基于 React Native。(@bravekingzhang 投稿)

5、Ncurator(馆长)

一个浏览器插件,通过导入文件或者爬取网页,建立自己的知识库,与内容聊天。(@Yoan98 投稿)

6、LLMs-Zero-to-Hero,完全从零手写大模型(视频)

网友投稿的一个视频,用一小时讲解从数据处理到模型训练,理解算法原理。(@bbruceyuan 投稿)

7、FreeParser

结合 OCR + LLM 的文档信息免费提取工具,适合处理发票、收据、简历等。(@hr98w 投稿)

8、AI 头像生成器

免费的头像合成网站。(@lyqtzs 投稿)

资源

1、WikiTok

网友用抖音风格制作的维基百科,每次划动出现一个随机页面。(@jianpingliu 投稿)

2、富文本编辑器比较2025版(英文)

这个页面详细比较了 JS 的富文本"所见即所得"编辑器,一共十几个库,详细介绍每个库的特点。

3、C 程序的可移植性

这篇长文用简单通俗的语言,总结了 C 程序移植到其他系统时需要注意的各种问题。

图片

1、小猫台灯

网友制作了一个小猫台灯,可以 3D 打印,提供源文件下载。

猫眼睛就是灯珠,猫的伊丽莎白圈是灯罩,放在屋里很有趣。

2、1920 年前的滑板车

许多人可能认为滑板车是最近才发明的,但实际上它们早在1915年就出现了。

当时,滑板车是一种经济实惠且高效的交通方式,比汽车和摩托车更便宜和省油。

文摘

1、中国的高科技产业集群

近年来,中国企业在电动汽车、手机和无人机等消费产品领域变得极具竞争力。与此同时,它们在各种高价值零部件和机械产品领域也变得极具竞争力,例如计算机芯片、机器人、激光雷达和电池。

中国企业是如何突然在所有这些领域都表现出色的?西方的一种常见的解释是,政府给予这些行业大量补贴,但一个叫做凯尔·陈(Kyle Chan)的学者有不同的解释。

他的观点是,上面这些产品属于相关技术的单一集群。

首先,很多东西都有助于生产其他东西。电池用于电动汽车、手机和无人机,芯片也是如此,工业机器人有助于制造所有其他东西,诸如此类。

如果你把所有上游产业都放在同一个国家----或者,如果可能的话,放在同一个城市----那么你就可以很容易地同时在所有下游产业中具有竞争力。这使得大国比小国更具优势----拥有更大的国内市场,更容易支持更多种类的上游产业。这对产业政策也非常重要----它告诉我们,建立一个完整的本地产业生态系统可以产生积极的外部效应。

其次,很多技术似乎正在融合。汽车与手机之间的区别已经比以前小了很多,基本上,电动汽车和手机都是由金属和塑料包裹着电池和一些计算机芯片。无人机就是这些东西加上一个发动机。

这意味着,如果一家公司擅长制造其中一种产品,那么它很容易开始制造其他产品。这就是小米能够如此迅速地建立电动汽车业务的原因。这也意味着,如果一家公司生产所有下游产品,那么它很容易扩展到上游行业----就像比亚迪成为芯片制造商一样。

不管怎样,Kyle Chan 关注的是中国的优势,而不是美国的劣势。但很容易看出,美国在这个新兴技术集群中的竞争将面临很多麻烦。美国的保守派领导人狂热地反对电动汽车和电池,而工会普遍反对自动化。这将使美国的工业生态系统出现巨大漏洞,最终损害半导体、手机和无人机行业。

但同时,我认为 Kyle Chan 描述的现象最终可能会给中国企业带来挑战。他指出,中国大公司越来越多地生产完全相同的产品。这种缺乏差异化将导致恶性价格竞争,从而导致利润率低下。

上世纪80年代泡沫时期,日本大型制造公司也发生了类似的事情----松下、索尼、日立、东芝、夏普、JVC、三洋等公司基本上都生产同一种电子产品、家电、零部件和机械。由于它们在每个产品类别中都展开竞争,因此利润率一直很低。同样,我们可能会看到比亚迪、小米、华为和其他一批中国大公司相互竞争,争夺利润。

言论

1、

程序员们不再互相提问,AI 回答了大部分问题。

-- 《AI 的数周相当于人类的几十年》,自从 AI 大模型问世后,问答网站 StackOverflow 日益冷清

2、

有一句老话:创意很廉价,执行才是一切。然而,AI 颠覆了这个说法,执行现在很廉价,整个开发时间和交付速度的概念都不同了。

未来属于那些有想法、还能动手去做的人。

-- ghuntley.com

3、

有时候,与那些固执己见、不肯改变观点的人,进行辩论是值得的。也许他永远不会让步,但你可以帮助其他人,看清他的胡说八道。

当然,你要警惕,不要给不法之徒提供表演的舞台,而且你的时间和精力是有限的。

-- Reddit 读者

4、

创办一家公司并不真的需要一个商业计划,而只需要前进。

-- 马云,第一次与蔡崇信见面时说的话

往年回顾

苹果头盔的最大问题(#290)

教育年限可以缩短吗?(#240)

产品化思维(#190)

印度人的工资是多少?(#140)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年2月14日

科技爱好者周刊(第 336 期):面对 AI,互联网正在衰落

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

漳州钟法路的大榕树新春彩灯。(via

面对 AI,互联网正在衰落

这一段日子,新闻焦点全是 DeepSeek,其他重要事件就不显眼了。

我说的重要事件是,1月23日,就在 DeepSeek R1 模型发布三天后,OpenAI 公司推出了一个新的 AI 工具,叫做 Operator(操作员)。

我认为,这个工具可能预示着,传统互联网的最终衰落

Operator 与其他 AI 产品截然不同。它不是一个内容生成工具,而是一个自动化工具,能够自动操作网页。

OpenAI 公司展示了一个例子,你对 AI 说,去旅游网站 Tripadvisor 预定评分最高的"罗马一日游",AI 就自动帮你预定了,你根本不必离开当前窗口(下图)。

大家想一想,这意味着什么?

以前,你要预订一个旅游产品,是这样操作的:首先去谷歌搜索 Tripadvisor 网址,然后访问该网站,找到发布"罗马一日游"的所有旅游社,最终预订评分最高的那一家。

现在,AI 把这些中间步骤都取代了,你不再需要访问谷歌、Tripadvisor 和旅行社的产品页了,AI 帮你自动访问了。

用户的体验就是,我不需要其他网站了,只要有 AI 就够了。

AI 越是强大,其他网站的重要性就越低。

如果未来的 AI 强大到无所不能,那么你有可能不需要访问任何网站,只要对着 AI 提出要求,它都可以帮你操作。

你可以让 AI 帮你买东西、叫外卖、投资证券、播放视频,而不再需要去电商网站、外卖网站、券商网站、视频网站了。

这意味着,传统的、以网站形式存在的互联网将走向消亡

我看到,一个老外预测,以后的商业模式可能是,各种服务商不直接面对用户,也不搭建网站展示自己了,而是把服务卖给 AI 公司,或者提供 API 让 AI 付费访问。

互联网将不再面向用户,而是面向 AI,因为消费者最终可能只使用 AI。未来的互联网,可能会有一个结构化数据层,取代现在的网站,专门供 AI 使用。

科技动态

1、2025年的气温

缅因大学的气候变化研究所,有一个网站,展示过去50年的全球平均气温图。

可以看到,上图的最上方是一根橘黄色曲线,这就是2024年的全球平均气温。

2024年是有气象记录以来最热的一年,所以它的曲线在其他年份的上方。

但是,如果你仔细看这张图的左下角(上图),会发现有一根咖啡色的短曲线,在橘黄色曲线的上方,那是2025年的实时气温曲线。

也就是说,2025年1月份的全球气温已经超过了2024年1月,这很可能预示,2025年比2024年更热。

2、域名错误

瑞士巴塞尔在发给市民的报税信函中,误将报税网址 esteuern.bs.ch,写成 esteuern.bs(下图)。

工作人员漏掉了瑞士的国别域名 .ch,于是巴塞尔的市级域名 bs.ch,变成了加勒比海国家巴哈马的域名 .bs。

等到发现时,信函都已经发出去了。如果再发更正邮件就太贵了,工作人员索性直接注册了这个巴哈马域名。

于是,巴塞尔市民今年就在一个巴哈马域名报税了。

3、显卡的空调冷却

B 站最近出现了一个热门视频,网友用空调的室外机,给英伟达新上市的5090显卡散热,

不过,他们没有用到空调压缩机,只用到了室外机的风扇和散热管,就相当于外接了一个巨型散热器。

机箱内部的热量,通过管道流向散热空调,冷却后再传回机箱。

根据现场测试,散热效果十分显著。

烤机之前,GPU 显存温度2度,核心温度4度。功耗拉到 1000W,烤机40分钟后,GPU 温度依然低于30度。

4、其他

(1)世界第一架民间制造的超音速客机,试飞时成功打破音障。

(2)谷歌宣称,通过 AI 检测,删除了应用商店236万个违规应用,封禁了15.8万个开发者账户。以后,审核不需要规则了,都交给 AI。

(3)Opera Air 浏览器发布,会在浏览时播放背景音乐,以及指导用户进行身体运动。这是不是一个信号,浏览器本身越来越难有大的技术创新了。

文章

1、DeepSeek R1 的推理实例(英文)

DeepSeek R1 会显示推理过程。作者问它,美国对加拿大征收25%的关税,对加拿大 GDP 有何影响。

DeepSeek R1 的回答过程,简直就是一篇经济学论文,而且只"思考"了12秒。

2、Canva 如何建立图像搜索(英文)

本文介绍 Canva 公司如何使用向量嵌入,建立相似图片搜索。

下面是另外一篇类似的文章《基于 pgvector 和 Next.js 构建语义电影搜索》,也是使用向量嵌入。

3、OpenMediaVault 与 TrueNAS Scale 的比较(英文)

OpenMediaVault 与 TrueNAS Scale 是两个开源的 NAS(网络文件系统),需要自己搭建,本文对它们进行比较。

4、同一个 GitHub 用户如何用不同身份 SSH 登录(英文)

有时,同一个 GitHub 用户使用不同的 SSH 密钥,去登录不同的仓库。本文教你这时怎么写 SSH 配置文件。

5、浏览器内置书签是最好的书签系统(英文)

作者认为,浏览器内置的书签系统,是最好用的保存网址的方法。

6、为什么 TCP 需要三次握手(英文)

建立 TCP 连接需要双方的三次通信,本文详细解释这个连接过程。

7、我从中国进口迷你电动挖掘机(英文)

作者是美国人,介绍他新近的一门生意,将中国的迷你电动挖掘机进口到美国来卖。这种挖掘机真的很像大玩具。

工具

1、Lightpanda

轻量级的无头浏览器,可以接入 Playwright / Puppeteer,占用资源和执行速度号称是 Chrome 的十分之一。

2、Dual-Link QR Code Generator

生成包含两个 URL 的二维码,不同角度扫描,返回的 URL 不一样,代码开源

3、isd

用户友好的 systemd 操作工具,会提供命令行菜单供选择,参见教程

4、changedetection.io

一个开源的服务,用来检测指定网页的某个部分是否发生变化。比如,网页上面的商品价格发生变化,它就会通知你。

5、Internet Speed

一个在线测试网速的网站。

6、在线焰火模拟器

网页模拟焰火绽放的效果。(@wincatcher 投稿)

7、MultiPost

一个开源的浏览器插件,一键发布内容到多个平台(知乎、微博、小红书、抖音、推特、脸书等)。(@tymon42 投稿)

8、生财有迹

开源的 Web 应用,用于个人资产分析。(@nicejade 投稿)

9、StayFocused

开源的自然声音和白噪音应用。(@daijinhai 投稿)

10、MacVimSwitch

开源的 Mac 电脑中英文输入法切换工具,可以定制切换键和生效的应用。(@Jackiexiao 投稿)

AI 相关

1、AI as Workspace

开源的全功能 AI 大模型客户端,自带 Web UI。(@NitroRCr 投稿)

2、podscript

一个 Go 语言程序,使用 AI 模型,将语音文件转成文字稿。

3、Voice-Pro

AI 语音工具,具有多种功能(语音识别、翻译、语音克隆、文本转语音),属于 Whisper 模型的 Web UI。

4、Hacker News Wrapped

该网站可以输入一个 Hacker News 论坛的用户名,它会用 DeepSeek 模型总结该用户的特点,描述非常准确而且传神。

5、GenSFX

免费的 AI 音效生成网站。(@andylearnai 投稿)

6、福琪写春联

免费的 AI 春联生成工具。(@itfoxnet 投稿)

资源

1、Arch Linux 初学者配置指南

这是一组系列文章,向初学者介绍如何配置 Arch Linux,要比官网 Wiki 简单易读。

2、Beej 的 Git 指南(Beej's Guide to Git)

著名教程作者 Beej 的最新 Git 教程,基于他向大学学生的课堂讲义。

3、mandobot

一个老外做了这个网站,它可以将中文文章进行分词,并逐一翻译成对应的英语单词,便于学习中文。

图片

1、新春 AI

vivo 手机发布了一个"新春 AI 功能",将普通照片变成新春照片。

上图左侧是原始照片,右侧是 AI 将其变成新春装饰。

2、太阳能烟囱发电

现在的太阳能发电,都是使用光伏板,将光转为电能。

但是历史上,早期的太阳能发电使用的是烟囱。

它的原理是热空气上升,只要我们用太阳能加热空气,使空气通过烟囱上升,再在烟囱底部装一个涡轮机,就能让空气带动涡轮机发电。

1982年,西班牙就建造了这样一个太阳能烟囱,高达194米,周围直径244米范围内都是温室,用来收集热空气。

它的发电功率只有 50 kW,最终运行了7年,1989年因暴风雨倒塌。

太阳能烟囱的缺点主要是,发电效率不大,需要巨大的占地面积,以及建造一个高耸的塔。所以,等到光伏板出现,它就被淘汰了。

文摘

1、AI 让我变成文盲程序员

我长期使用 AI,靠它帮助编程,已经不能在没有 AI 帮助的情况下解决问题了。

我不再阅读文档。既然 AI 可以立即解释一切,为什么还要费心阅读呢?

我的调试技能日益生疏。我甚至不再阅读报错消息,只是把它们复制并粘贴到 AI,让 AI 解读。

我已经成为了一个人肉剪贴板,仅仅是代码和 AI 之间的中介。

以前,每条报错都会让我学到一些东西。现在呢?AI 提供了解决方案,我却什么也没学到。实时答案带来的多巴胺刺激,取代了真正理解的满足感。

另一个受到影响的地方是深度理解。以前,我花费数小时来理解某个解决方案为何有效,现在,我只是照着 AI 建议实施。如果这些建议不起作用,我会改进提示的上下文,再次询问 AI。这种循环使得我对 AI 的依赖性不断增加。

我的情绪也受到影响。以前,解决新问题是编程乐趣的一部分。现在,如果 AI 不能在五分钟内给出解决方案,我就会感到沮丧。

我该怎么办?我不想采取任何激进的措施,比如完全放弃 AI,这是不现实的。我打算每周实行一天"无 AI 日"。

我的感觉是,AI 不会让我们成为10倍效率的程序员,只会让我们对它的依赖程度增加10倍。

每当我们让 AI 解决我们自己可以解决的问题时,我们就是用短期生产力换取长期理解,我们以牺牲明天的能力为代价来完成今天的效率。

我并不是建议放弃 AI,只是建议大家不要放弃尝试独立解决问题。

我们正在创造 AI 一代程序员,他们可以向 AI 提出正确的问题,但不理解 AI 给出的答案。每次 AI 出现故障,他们就会显得无助。到目前为止,AI 还不足以完全取代程序员,但随着 AI 的进步,这种情况只会变得更糟。

言论

1、

DeepSeek 的成本比 Sonnet 低 15 倍。OpenAI 和微软最在乎的事情,莫过于阻止 DeepSeek 以这个价格提供服务。

OpenAI 和 Anthropic 现在的收费如此之高,它们靠这些钱来支持高薪和研发费用。而 DeepSeek 是开源的,免费提供权重,任何公司都可以用它提供服务,唯一的成本只是硬件和支持人员。

-- Hacker News 网友

2、

就算 DeepSeek 明天就消失,但因为它是开源的,它已经进入了全球科技的血液,成为了 AI 行业的一个成本锚。

从此,AI 行业没有垄断的护城河来保证利润,AI 大模型失去了稀缺价值。

-- 《AI 狂热的冷却》

3、

我从未想到会被公司解雇,因为我的表现总是高于公司的期望。

后来我明白了。在裁员期间,你是谁、你做什么似乎并不重要,在大多数情况下,裁员的决定是由那些不认识你的人做出的。

对公司来说,我只是 Excel 表格中的一行。

-- 《裁员改变了我》

4、

现在的苹果公司,很善于延长单一产品的寿命,但是很少表现出一些疯狂的想法。乔布斯离去的一大损失,就是苹果公司不再做很多奇怪的事情了。

-- Asianometry,著名 Youtuber

5、

我们越忙碌,就越能敏锐地感受到自己在生活,对生活也就越有想法。

---- 康德,德国哲学家

往年回顾

宽容从何而来(#289)

未来两种人会增加(#239)

下一个内卷的行业(#189)

生物学的可怕进展(#139)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年2月 7日

科技爱好者周刊(第 335 期):年底的未来已来

这里记录每周值得分享的科技内容,周五发布。([通知] 下周春节假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

香港历史建筑"和昌大押",布置了一条盘旋两层楼的金蛇,迎接蛇年。(via

年底的未来已来

大概两周前,我就在想,龙年的最后一期周刊,要写什么?

正好这一个月,有很多新发明、新技术发布。我想到,可以把它们放在一起,作为下一年的展望。

编辑过程中,它们勾起了我的一点回忆。

十年前,我接了一个活,为北京的一家杂志写文章,向普通读者介绍技术的新进展,以此赚一点稿费。写久了,我就有一个感觉,技术进展太快了,快于所有人的预期。我明明写的是真实事件,但是很多时候像在写科幻小说。

就是在那个时候,我开始意识到,那句有名的话是千真万确:"未来已来,只是尚未流行"。那些我们觉得很遥远、很科幻的事情,其实已经是活生生的现实,很快就会强烈地、不可避免地影响每个人的生活,可能是好的影响,也可能是不好的影响(技能过时了,行业消失了)。

2017年,我把那些文章结集,起了一个书名《未来世界的幸存者》,表达我的这种想法,希望读者对即将到来的时代变革有所准备。

十年后的今天,世界仿佛全然不同,我发现自己还在做同样的事情,还在介绍那些像科幻小说一样的真实技术。不同的是,我已经很明白了,为未来做准备,就是在为现在做准备,做一个未来世界的幸存者,就是做一个今日世界的幸存者。

科技动态

1、AI 陪护

新加坡最近世界首个将 AI 引入了养老院,用来陪护老人。

这个 AI 是一个女护士的样子,每天早上带领老人做早操、玩游戏、唱歌。

她承担不了具体的医疗照护工作(比如喂饭打针),但是可以一天24小时,跟老人互动聊天,减少孤独感。

她还会按时提醒老人吃药,一旦侦测到老人有异常,立刻发出警报。

这是一个信号,养老行业很可能是 AI 和机器人最先落地的传统行业,因为老龄化社会实在太缺少照护人力了。

2、澳网动画直播

澳网公开赛正在澳大利亚举行,组委会为国际观众准备了 3D 动画直播。

它将真实的运动员和比赛场面转成了实时的 3D 动画,配上球场原声和评论,逼真地还原了比赛。

在欧美,澳网是付费观看直播,很多人看不到。免费的 3D 动画直播,有助于让更多的人关注澳网。

该技术使用12台摄像机追踪29个骨骼点,通过实时计算,在两分钟的延迟内生成动画。

这种动画直播,值得各种体育大赛采用。除了免费观看,它还有一个优点,就是相比实况直播,占用带宽小很多,如果做成矢量动画带宽就更小了。

3、边框码

二维码已经得到广泛采用,但是很多场合,它并不是理想的选择。

一位国外程序员打印了一张新年卡片,原想在上面加一个二维码,手机扫描后,可以访问网站。

但是,加了二维码就破坏了卡片的整体设计,于是他想了一个别出心裁的方法。

他为照片设计了一圈特殊的边框(上图),这个边框经过二进制编码,是可以扫码的。

具体规则是,从左上角开始,按照顺时针,黑色方块为0,白色方块为1,按照 ASCII 码,可以还原出一个网址。

这真是一个好主意,将二维码变成边框码,可能适合很多场合。

4、咸味勺

日本麒麟啤酒公司,推出了一种咸味勺,用它吃清淡的食物,也能感到咸味。

它的原理是发出弱电流(勺子自带电池),浓缩食物中的钠离子,从而增加鲜味和咸味。

麒麟公司希望,这种勺子可以减少食盐的添加,同时又让食物不会清淡无味。因为过多摄入食盐,可能导致高血压。

5、自适应遮阳伞

遮阳伞有一个很麻烦的地方,就是有太阳的时候需要打开,没太阳的时候需要收起来。

德国斯图加特大学的一个研究团队,发明了不需要任何能源、自动打开和收起的遮阳伞。

它的奥妙在于,遮阳伞的伞面全部是特殊设计的纤维素鳞片。这种鳞片会随着湿度的变化而展开和卷起。

没有太阳时,湿度高,纤维素材料吸收水分并收缩,导致鳞片蜷曲,相当于遮阳伞收起(上图右)。相反地,太阳直射时,湿度低,纤维素材料释放水分并展开,导致鳞片变平,相当于遮阳伞打开(上图左)。

这种材料还能用来制作窗帘(上图),随着日照自动打开和收起,不需要消耗能量。这对于那些日照充分的热带地区,可能是非常重要的发明。

6、Pi Box

树莓派是最流行的单板计算机,使用时,需要自己准备一大堆外设,很不方便也不好携带。

一位印度开发者,为树莓派设计了一个外壳,起名为 Pi Box,令人耳目一新。

这个外壳将树莓派、电池、液晶显示屏封装在一起,并配上了提手。

它看上去美观,又很实用,让人很想要一个。

作者已经将外壳和供电电路的设计,都公开了,你可以自己动手做。

7、纸板支架

一家韩国设计公司,发明了再生纸制作的笔记本电脑支架。

这家公司称,只需要45克再生纸,就能支撑世界上最重的笔记本电脑。

它的折纸结构,还能保持通风,有助于笔记本散热。

不用的时候,可以把支架收起来,厚度只有3厘米,非常轻巧。

支架的凹口还能放手机。

8、卷屏笔记本

联想展出了世界第一台卷屏笔记本。

这台笔记本打开后,14寸的屏幕可以向上展开为16.7寸。

它的重量为1.7公斤,预计将在今年6月份发售,价格未知。它的屏幕来自三星公司

如果下一步能够推出左右扩展的带鱼屏笔记本,市场估计就更大了。

文章

1、如何减少 Docker 的日志体积(英文)

Docker 容器会产生日志,长年累月变得越来越大,本文教你怎么减少日志文件的大小。

2、如何包装 try...catch(英文)

JavaScript 语言的 try...catch 用起来非常不直观,作者提供了一种方法,将其包装成函数用法。

3、iTerm2 的一些鲜为人知的功能(英文)

iTerm2 是 Mac 平台的终端模拟器,有许多内置的功能,但是很多人都不知道这些功能。

4、架设家庭 DNS 服务器的6个原因(英文)

本文介绍为什么你应该在家里架设自己的 DNS 服务器。

5、寻找易记忆的质数(英文)

本文介绍数学家如何寻找容易记忆的质数,其中提到两个大质数:1234567891 和1、2、3、4、5、6、7、8、9、10、9、8、7、6、5、4、3、2、1(把顿号去掉)。

6、Python 的链式表达式(英文)

作者作为面试官,发现面试者用了上图的奇怪语法。他认为这是错的,但实际却是 Python 的合法语法。

7、推特的纯 CSS 点赞效果(英文)

推特的点赞按钮是一颗心(上图),点击后出现一段动画效果。它是用 CSS Sprite 实现的,本文介绍如何做这个效果。

工具

1、DeskPad

一个开源的 Mac 应用,在应用窗口里面,新建一个虚拟桌面,便于当众演示或分享给他人。

2、Superdiff

一个 JS 库,对两个对象或数组进行 diff 操作,返回差异的部分。

3、VS Code Pets

一个 VS Code 插件,会在编辑器界面插入一个小宠物(小猫、小狗、小鸭等),显示不同动画,提升工作效率。

4、AcousticKeyBoard

一个 Web 应用,可以根据击键声,判断输入内容,另有 App。(@ZhuoZhuoCrayon 投稿)

5、筷字输入法

开源的安卓汉语拼音输入法。(@flytreeleft 投稿)

6、MusicCard

输入网易云音乐链接,自动提取歌曲信息,生成音乐海报。(@aidaox 投稿)

7、Melody Workshop

基于 Web Audio API 实现纯前端的音频处理工具。(@RylanBot 投稿)

8、lemon-template-react

一个基于 React 的移动端 web 应用模板。(@sankeyangshu 投稿)

9、Audiblez

这个工具可以将 Epub 电子书转成有声书,支持中文。

10、PhotoStack

为图片添加水印的在线工具,代码开源

12、story-flicks

一个开源的 AI 工具,一句话生成故事短视频。(@alecm20 投稿)

资源

1、Learn Yjs

Yjs 是多个客户端实时同步状态的 JS 库,这里是它的官方互动教程。

2、1000行代码的操作系统(Operating System in 1,000 Lines)(英文)

免费电子书,讲解如何用 C 语言一步步从头构建一个小型操作系统。(@sir2024 投稿)

3、欧洲程序员工资地图

这张地图列出欧洲各国程序员的平均工资,可以看到第一名是瑞士,第二名英国,第三名爱尔兰,总体比美国低不少。

4、玛雅金字塔

玛雅金字塔的 3D 游览,包括内部隧道。

图片

1、嘉兴火车站

嘉兴火车站,初建于1907年,2019年改建,2021年6月完工启用。

改建后,整个火车站搬到地下,是中国首个全下沉式火车站。地面腾出大量公共空间,改为公园。

设计师马岩松希望将其打造成"森林中的火车站",集火车站与公园于一体。

"中国的火车站一个比一个大,像城市中一个个高大的宫殿,人在其中却感到非常渺小,周边通常是大马路、高架桥、和没有人去的大广场。我想,城市中的火车站有没有可能不追求宏大的纪念性,而具有优美的环境,舒适宜人的尺度,和便捷、人性的交通与城市功能?成为让人们不只是奔波,而是愿意停留、放松的城市公共空间?"

2、仙女座星系全景图

仙女座星系就在银河系的旁边,是人类肉眼可见的最远星系。

天文学家利用哈勃太空望远镜,创建了一幅仙女座星系全景图,包括4.17亿像素,由600多张照片拼接而成。

这张全景图包含了2亿颗恒星,但仙女座星系估计总计有一万亿颗恒星,所以照片拍到的只是很小一部分。

下面是这张全景图的局部。

文摘

1、如果建筑师像程序员一样工作

如果建筑师的工作条件像程序员一样,那么他可能收到下面这样的工作指示。

亲爱的建筑师先生!

请为我设计并建造一座房子。我不太确定我需要什么样的房子,所以你应该自行判断。

我的房子应该有两到四十五间卧室。当你把蓝图带给我时,我会做出我想要的最终决定,到时你只需确保能够轻松添加或删除卧室即可。

另外,请给我提供每种配置的成本明细,以便我可以任意选择一种。

请记住,我最终选择的房子的成本必须低于我目前居住的房子。但是,请确保改正我当前房子存在的所有缺陷(比如,厨房地板会振动,以及墙壁几乎没有足够的隔热层)。

在设计时,还要记住,我希望每年的维护成本尽可能低。

请注意在房屋的建造中使用现代设计实践和最新的材料,因为我希望它成为最新想法和方法的展示场所。但请注意,厨房的设计应能容纳我的1952年冰箱等物品。

请务必仔细权衡所有这些选项并做出正确的决定。然而,我保留否决您做出的任何决定的权利。

当你专门为我设计这座房子时,请记住,迟早我必须把它卖给别人。因此,它应该能够吸引各种各样的潜在买家。在最终确定计划之前,请确保我所在地区的人们一致认为他们喜欢这座房子的功能。

现在请不要用小细节来打扰我。你的工作是制定房子的总体规划。例如,现阶段不需要选定地毯颜色,但是请记住,我的妻子喜欢蓝色。

另外,现阶段不要考虑获取建造房屋本身的资源,您的首要任务是制定详细的计划和规范。然而,一旦我批准了这些计划,我预计房子将在48小时内准备好施工。

请准备一套完整的蓝图。目前没有必要进行真正的设计,因为它们将仅用于施工投标。但请注意,您将承担因后期设计变更而导致的任何建筑成本增加。

您一定很高兴能够从事这样一个有趣的项目!能够使用最新的技术和材料并在设计中获得如此的自由度是很少见的。请尽快与我联系并告知您完整的想法和计划。

附:我的妻子刚刚告诉我,她不同意我在这封信中给你的许多指示。作为建筑师,您有责任解决这些差异。我过去曾尝试过,但未能实现这一目标。如果你不能承担这个责任,我就不得不另找建筑师了。

言论

1、

OpenAI 相比 DeepSeek 有无限的资金,但是无限的资金能做的只是6个月~12个月的领先优势。

-- Hacker News 网友,评论本周发布的 DeepSeek R1 模型性能相当于 OpenAI o1 模型

2、

人的智力高低,未来不会像现在这样重要,AI 可以弥补人的智力。提出正确问题的能力,在未来比找到答案的能力更重要。

-- Sam Altman,OpenAI 公司的 CEO。这令人想到,中国的应试教育考察的是,谁能记住最多的正确答案,真的需要改了。

3、

爱因斯坦一定承受了沉重的心理负担。到处都是白痴。

-- 大卫·林奇,美国著名电影导演,上周去世

4、

在中国有一种很奇怪的现象,互联网公司喜欢把 API 称为"开放平台"。

例如,微信有一个"开放平台" open.weixin.qq.com,支付宝也有一个 open.alipay.com,还有阿里云 open.aliyun.com

-- Hacker News 读者

5、

SpaceX 公司的每一项战略,都是根据是否有利于登陆火星来评估的,这解释了那些在外界看来疯狂的举动。在 SpaceX 看来,无法登陆火星才是唯一重要的风险。如果马斯克觉得,摧毁 SpaceX 公司会增加登陆火星的机率,他会毫不犹豫地这么做。

-- SpaceX 公司传记《Reentry》(重返大气层)的读后感

往年回顾

技术写作的首要诀窍(#288)

停止寻找的最佳时间(#238)

音乐是反社交(#188)

失业难以避免,重构人生规划(#138)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月24日

科技爱好者周刊(第 334 期):年终笔记四则

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

武汉光谷是今年春节晚会的分会场,将表演灯光秀,非常有科幻感。(via

年终笔记四则

下面是过去的笔记,我读到有意思的文章时,记录下来的感想,每一则都不长。

前几天翻阅,觉得可以放在一起,重新发布,今天先发四则。

一、工作也有利息

银行存款有利息,存得越久,利息越多。

工作也是一样,也有利息。如果今年的工作可以节省明年或未来的工作时间,就是一份有利息的工作

工作有利息,意味着你未来的工作时间会变少,多出来的时间,就可以去做别的事情,创造更多的价值。

这提示我们:

(1)不要轻易更换工作领域,否则以前积累的利息就作废了。只有在同一个工作领域,才可能产生长期积累,以前的工作为以后打基础,最终产生巨大的利息。

(2)在职业生涯的早期,积累效果最好,最容易产生复利。开始积累越晚,产生复利就越少。

(3)有些劳动没有积累效果,不会产生利息,比如重复性的机械劳动(快递、咖啡店员、门卫......),你明年还是要重复做这些事情。

(4)最好的人生策略就是,找到你深感兴趣、可以长期做下去的领域,在上面投入大量的工作时间(包括质量和数量),然后随着年龄增长,享受以前工作的复利。

二、巴菲特的选人标准

巴菲特说,他考察候选人,就看三个"i"

  • integrity(正直)
  • intelligence(智慧)
  • initiative(主动)

这三个"i"当中,"主动"最重要。"正直"和"智慧"的人到处都是,但如果不主动,不是自己想去做些什么,就什么也不会发生。

三、快乐机

1974年,一个美国哲学家提出一个假设,如果世界上有"快乐机",只要插上电源,就能带来源源不断的快乐,并且无法分辨,这种机器快乐与现实世界的快乐有何不同。

哲学家说,我们就可以观察人们的选择。

如果大多数人选择快乐机,而不是现实生活,这就证明人生的目标是体验尽可能多的快乐(享乐主义)。

当时因为不可能造出快乐机,所以无法验证他的假设是否正确。现在不一样了,有了游戏机、VR 头盔、短视频平台......

四、未来的三种关键能力

未来,你需要三种能力。

(1)专业能力。你需要有一个专长。

(2)写作能力。未来是远程工作,团队成员分散在各地,以写作----而不是当面交流----作为主要的沟通手段。

(3)视频制作能力。以前,文字能影响大众,现在视频是最强的大众传播渠道。如果你能制作好看的视频,将想法和产品可视化,就更容易让更多用户看见。

[本周软件] Midscene.js:浏览器自动化利器

本周介绍一个很特别的浏览器自动化工具:Midscene.js

它的最大特点,就是自然语言驱动(需要自行接入 AI 模型),操作浏览器,以及理解网页内容,将结果以 JSON 数据返回。

大家可以安装它的浏览器插件,直接输入自然语言指令,进行体验。

比如,交互指令(点击搜索按钮)、查询指令(返回所有商品的链接)、断言指令(页面是否有三个按钮)。

有了它,你可以编写 YAML 脚本,完成浏览器自动化;也可以将它接入 Puppeteer 和 Playwright,让后两者接受自然语言指令。

使用自然语言驱动之后,自动化脚本变得容易维护、效果更稳定。

总之,如果你需要浏览器 UI 测试,或者抓取网页数据,就不要错过 Midscene.js。它在 GitHub 已经获得2700颗星。

科技动态

1、VR 审判

美国最近的一起民事案件的审判中,被告律师让法官戴上了 VR 头盔。

律师说,他们制作了一段 VR 动画,可以让法官从被告的视角,沉浸式了解整个案件的过程。

这是历史上第一次,法庭审判使用 VR 头盔。

所有人在法庭上都戴着 VR 头盔,场景很魔幻。完全可能的是,整个审判以后可能都会搬到虚拟世界,不必所有人到场。

2、亚马逊最大的树

亚马逊原始森林有无数棵树,没人知道哪一棵最大。

一个美国科学家通过卫星照片,找到了一棵可能是亚马逊最大的树。

卫星照片只能拍到树冠,只要识别出最大的树冠,就应该是最大的树。

科学家发现,有一棵树的树冠,直径超过60米,相当于树下可以停五辆头尾相连的大巴,可谓树王。

3、其他

(1)中文互联网语料资源平台发布,一共 2.7TB 中文资料,向社会开放,专门用来训练大模型。

(2)一位国外用户购买了亚马逊的视频会员,震惊地发现,电视机明明开了静音,但是广告时间居然会自动取消静音。

文章

1、一个副业应用的开发心得(中文)

本文总结2018年作者为自己的安卓应用,加了一个收费功能的开发心得。(@javayhu 投稿)

2、俄罗斯和乌克兰各自有哪些知名软件?(中文)

本文介绍了两国的知名软件,都有不少很厉害的项目。(@mzhren 投稿)

3、为什么要学习写编译器(英文)

作者谈为什么你应该试试自己写一个编译器,并且提供了三个入门的学习资源。

4、国际数学奥林匹克金牌得主的去向(英文)

国际数学奥林匹克是高中生的数学比赛,作者做了一个调查,历届金牌得主后来怎么样?

5、AWS S3 与 Cloudflare R2 比较(英文)

AWS S3 是一个老牌的存储服务,Cloudflare R2 是它的新兴对手。本文比较这两种服务。

6、无限滚动轮播的 CSS 实现(英文)

本文教你只用 CSS 实现类似弹幕的无限滚动轮播效果,还能用鼠标悬停。

7、如何将笔记本用作第二个显示器(英文)

一篇电脑使用的教程,如何将笔记本当作显示器使用。

工具

1、barba.js

一个 JS 库,让网站页面的切换产生平滑的动画效果。

2、httpdbg

一个 Python 程序的桌面调试器,在类似浏览器控制台的环境里调试 HTTP 请求。

3、BiliMusic

一个 macOS 桌面程序,让用户播放 B 站收藏的音乐。(@609529897 投稿)

4、ScreenShot

免费的 App 预览图制作工具,支持华为、小米、OPPO、VIVO、鸿蒙、AppStore的应用商店预览图制作。(@ovelv 投稿)

5、猫步简历

免费开源的简历制作工具,提供各种模版和主题,可以定制化模块。(@Hacker233 投稿)

6、KeyClicker

开源的 macOS 应用,打字时模拟机械键盘和打字机的声音,有200多种声效。(@jaywcjlove 投稿)

7、Peek Focus

一个 Chrome 插件,点击时,不在新的标签页、而在页面浮层里打开链接。(@zerosoul 投稿)

8、Docker 镜像拉取工具

该工具用于下载 Docker 镜像,无需 Docker 环境,支持自定义仓库地址,配置国内镜像源。(@topcss 投稿)

9、壁纸样机生成器

生成电子设备壁纸效果图的免费工具。(@leven-z 投稿)

10、BlogKeeper-文捕

在线博客文章解析下载工具,支持微信公众号/博客园/CSDN/掘金/简书/思否等平台,可以保存成多种格式。(@GailZhangJY 投稿)

AI 相关

1、Raphael AI

基于 Flux.1-DEV 模型的 AI 图像生成网站,免费、无使用量限制、不需要注册。(@markliuyuxiang 投稿)

2、AI Shortcuts

Chrome 浏览器扩展,一键查询不同 AI 。(@taoAIGC 投稿)

3、Audio Transcription

将播客或音频转录成文本,并给出摘要,基于 Next.js 和 OpenAI Whisper,代码开源。(@winterfx 投稿)

4、Get Your Perfect Chinese Name

AI 给外国人起中文名字。(@syhdeclan 投稿)

资源

1、BestBlogs.dev

精选中文科技文章的阅读平台。(@ginobefun 投稿)

2、自洽的程序员

一本中文电子书,作者分享如何调整心态,解决职场常见问题,提供在线阅读。(@zhangchenchen 投稿)

3、我的 3D 主页

作者用 React Three Fiber 构建的 3D 个人主页,非常华丽。

4、Staying

代码可视化网站,可以将 Python 和 JS 代码的运行步骤,以动画形式展示,内置了许多常见算法的演示。(@lezhu1234 投稿)

图片

1、错误的数学

一位美国网友注意到,一家设计公司在社交媒体上,发布了下面的图片。

图片声称,33000英尺(1万米)高空的飞机,比5000英尺(1500米)的飞机,在飞向同样目的地时,花费的时间是后者的4倍(假定飞行速度相同)。

这位网友第一反应是,这是在开笑话吗?它为什么忽略地球半径。

地球半径(设为 R)大约是1800万英尺,这意味着外圈长度只比内圈,多了不到1%。

而且,由于33000英尺高空的空气阻力减小,该高度的飞行时间实际上可能更少。

2、报时球

报时球(time ball)是19世纪港口使用的一种报时装置,供海上的水手校准时间。

平时,球都在杆子顶部。每天中午1点,球就会落到杆子的底部,看到的人就知道1点到了。

在1点前5分钟,球会落到杆子的一半,让大家做好准备。完全落下后,过了两三分钟,球就会重新升起。

文摘

1、照明的历史

工业革命之前,世界是漆黑的,灯光极其昂贵,火是唯一的人造光源。

历史上,人造光一直是富人和有权势的人的特权,生产和维护既费力又肮脏,可用性和质量都很差。穷人很难获得人造光,总是生活在黑暗中。

古代房屋在夜晚有蜡烛照明,是巨大财富的标志。当时,蜂蜡制成的优质蜡烛是最好的光源,但天然蜂蜡的供应有限,加上手工制作的繁琐,除了最富有的人之外,其他人都买不到优质蜡烛。

一位作家写道:"打开你的冰箱门,你召唤出的光线比18世纪大多数家庭所享受的光线总量还要多。"

后来人们发现,鲸油(鲸鱼的皮下脂肪)是更好的蜡烛材料,燃烧时发出干净、稳定的光,是工业革命早期了最好的照明,但它也非常昂贵。

捕鲸业为世界带来了照明,但也将一些鲸鱼物种推向了灭绝的边缘。仅在1700年至1800年间,为了得到鲸油,就至少有300,000头鲸鱼被屠杀。

1800年代初,欧洲和美国出现了燃气照明,燃烧煤气来发光。然而,燃气照明的安装和维护费用昂贵,而且有危险。所以,煤气灯一般不用在家里,而用在工商业和大城市的路灯。

煤气灯很亮,比之前的任何灯至少亮20倍。使用燃气照明是人类第一次体验明亮的照明。

1846年,天然气生产的副产品煤焦油(简称煤油)做成灯,用来照明。煤油开始取代鲸油,导致照明成本直线下降,并且燃烧时明亮、无味。

正是因为煤油,夜间第一次变得明亮了,天黑后也能生产和娱乐。

19世纪后半期,托马斯·爱迪生(Thomas Edison)发明了电灯,电照明的时代从此来临。

言论

1、

人类一种可能的未来是,人工智能精英坐拥惊人的财富,与世隔绝,然后拿出最少量的施舍,来保证广大的失业人员不闹事。

-- 李开复《AI·未来》

2、

互联网早就不是缺少管制、充满颠覆性创新的领域了,如今人们正在寻找一种新的监管和治理框架,以应对极少数大型数字企业对互联网的垄断。

-- 《2024年 IP 地址报告》

3、

如果你仔细想想,最好的书实际上是一个极其漫长的咒语,它让你在余生中变成另一个人。

-- @thisone0verhere.bsky.social

4、

父亲要求我,只要有时间,就总是参加葬礼,哪怕这对我有一些不方便和情绪压抑。因为这样做,你就参与分担了他人生活中那些不可避免的、偶尔发生的灾难。

-- 《总是参加葬礼》

5、

我不明白,99%进入 AI 底层模型开发的公司,能得到什么好处?

如果 AI 模型真的像宣传的那样,能做到任何事情,那么大多数公司只需要等待,就能获得跟自行开发模型同样的好处。很多公司似乎都非常害怕错失良机,其实根本不存在这一点。

-- Hacker News 读者

往年回顾

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月17日

AI 搞定微信小程序

一、前言

AI 生成代码,早不是新鲜事了,但是 AI 生成微信小程序,似乎还不多见。

究其原因,大概是小程序的开源项目较少,模型训练不好搞。

上周,我遇到腾讯的同学,得知"腾讯云开发"最近有一个大的版本更新,大幅加强了小程序的 AI 能力。我还挺期待的,腾讯自己搞小程序 AI,要比其他人更合适。

后来,我试用了本次更新的 AI 功能,有一个强烈的感觉,微信小程序可能很快就会成为国内 AI 应用(又称"智能体")的主要载体

因为本次更新以后,小程序调用 AI 模型,以及生成智能体,变得非常方便。并且,小程序从 API 到开发工具,都把 AI 整合进去了,整个开发过程都有 AI 辅助,不仅开发效率提高了,而且大量代码可以通过 AI 生成。

下面就是我的试用过程的介绍和记录。这些功能都是公开的,大部分已经上线,剩下的也即将发布,大家现在就可以跟着做,体验 AI 生成小程序。

二、云开发助手:进入方法

我的第一步是体验小程序的"云开发助手"(又称云开发 Copilot)。它的作用是通过 AI 加快小程序的开发

它的全功能版,目前要通过"腾讯云开发平台"网站使用。

此外,还有一个游客版的小程序,可以体验部分功能。如果你手边只有手机,可以先试试游客版。

手机上,点击"从 AI 开始探索云开发",就能进入。

手机版看一下就可以了,正式的开发还是要使用网站。本文下面的内容,都是基于网站的全功能版。

首先,登录"云开发平台"后,页面右下角就会出现小助手图标。

点击它,就能打开"云开发助手"。

它的右上角有一个"全屏"图标(下图)。

点击进入完整界面。

三、云开发助手:文档功能

"云开发助手"的主要功能如下图。

这些功能可以分成两大类,一类是文档相关的功能,另一类是代码生成。

先看看文档功能。

(1)Copilot

这个功能是 AI 问答引擎,任何关于小程序的问题,都可以向它提出。

这大大减少了文档查阅,有些简单的函数,可以让它生成,还能让它教你如何开发小程序。

(2)AI 识图

这个功能是通过上传页面截图(或者设计稿),生成需求文档。

我上传了一张抽奖的转盘。

它生成了如下的需求文档,用文字详细复述了这个页面的界面布局、设计细节、功能需求等。

大公司的程序员,一般都是根据产品需求文档(PRD)进行开发,所以这个功能可以简化产品经理的工作,需求文档也可以作为 AI 代码生成的文字记录保存下来。

生成的需求文档,下一步可以传入"云开发助手",来生成页面代码,所以它也是 AI 生成小程序的中间步骤。

(3)写需求高手

这个功能跟"AI 识图"作用相同,都是生成需求文档,区别是它输入文字描述。

由于不需要截图,它适合只有功能需求、没有设计稿的场景,即让 AI 来设计页面。

四、云开发助手:生成小程序前端代码

接着,我们就来试试,让"云开发助手"生成小程序的前端代码。

选择左侧菜单的 "AI 生成可视化应用",这个功能就是根据截图或者文字描述,直接生成应用(Web 或者小程序)。

上传一张微信页面的截图。

它会自动生成该截图的页面代码,可以预览效果(下图)。

可以看到,生成的页面还原了原始布局,但是有许多细节差异。

目前阶段,好像还做不到100%还原,比较适合当作代码基础,在它生成的页面基础上,进行手动细节调整。

除了上传截图,还可以输入文字描述(或者上一节的需求文档),也能生成应用。

让它生成程序员的个人小程序,效果还是可以的。

预览初步效果后,你可以在云开发平台上,直接线上编辑代码。

编辑完这个页面以后,还可以反复这个过程,向小程序添加更多页面(下图)。

有了多个页面,就能设置页面之间的跳转,这样就基本是一个可用的小程序了。

调整小程序的样式时,云开发助手还提供了一个贴心的功能"AI 编辑组件样式",也就是根据指令,自动修改样式。

上图就是让 AI 为页面添加渐变背景,这样修改样式,就方便了很多。

大家可能看到了,左侧菜单栏还有一个"AI 生成组件"的功能。该功能用来生成页面的组件,适合为现有的页面添加功能。但是,它暂时只支持 Web 应用,不支持小程序,所以这里就忽略不介绍了。

完成前端开发以后,云开发平台可以直接发布小程序。当然,你也可以复制或者下载代码,通过微信开发工具发布。

五、云开发助手:生成小程序后端代码

小程序除了前端 UI 代码,还需要后端的业务逻辑和数据库读写。"云开发助手"也能生成后端代码,主要用到下面两个功能。

(1)AI 生成云函数

云函数是微信平台在云端执行的函数,可以用来获取各种后端能力。

"云开发助手"可以帮我们生成云函数。下图就是让 AI 生成获取小程序 OPENID 的云函数。

AI 在给出示例代码的同时,还会展示各个文件的写法(下图)。

如果你觉得可以接受,就点击"创建云函数"按钮 ,代码就会进入新打开的云 IDE 环境,用来编辑和调试。

编辑完成后,点击"部署"按钮,就可以将云函数部署到线上了。

(2)AI 生成数据模型

这个模型用来生成数据库的数据模型(也就是"表结构")。

比如,生成一个博客的数据模型,包括文章、作者和评论。

点击"查看",显示一个 JSON 数组,表示数据结构。

点击"确认生成",数据结构就会以表格形式呈现,确认没有问题,就可以保存。

六、AI 大模型接入

上面都是介绍"云开发助手",即 AI 辅助小程序开发。下面介绍 AI 开发的另一个重头戏:如何做出 AI 智能体的小程序,也就是让小程序本身具有 AI 功能。

还是在"云开发平台",左侧菜单选择 AI+。

这时,页面会让你选择,接入大模型还是开发智能体(下图)。

(1)开发智能体(AI Agent)

这里可以简单把"智能体"想象成一个 AI 对话应用,用户输入要求,AI 给出响应。

腾讯云开发平台将"智能体"的后端大模型,默认指定为腾讯的混元模型。

你自己需要定制开场白、提示词、知识库(你自己的训练材料)。

然后,定制前端界面(对话组件)。

基本流程就完成了:用户在前端界面,根据开场白的提示,输入他的要求,系统收到后,传给后端模型,再将回复展示给用户。

是不是很简单?一个智能体就这样做好了。

(2)AI 大模型接入

如果选择自己接入大模型,页面会根据开发类型(Web/小程序/云函数),给出接入指引。

小程序 API 已经对大模型做了适配,按照指引,只要几行代码就能接入。

具体来说,从小程序基础库3.7.1开始,新增了wx.cloud.extend.AI对象,专用于 AI。

  • wx.cloud.extend.AI.createModel():用来接入大模型
  • wx.cloud.extend.AI.bot:用来调用智能体

用了这个 API,就不需要任何 SDK,也不需要后端服务器,系统直接负责 AI 接入,同时处理好鉴权、加密、流式传输,不需要用户介入。

下面是示例代码,详见官方文档

七、总结

以上就是我试用的全部内容,我的总体感觉是,这些已经做好的部分,对小程序的开发有巨大的助力。如果你正在开发小程序,一定要试试这些功能。

小程序的 AI 能力,后面还会持续扩展。腾讯希望把云的基础设施、微信小程序、AI 大模型都打通,从而让小程序开发的门槛更低,效率更高。

我听腾讯的同学说,下一阶段有几个开发重点。

(1)用 AI 生成前后端完整的小程序,进一步与微信开发环境打通。

(2)加强 AI 的代码生成能力,搭配小程序模版和低码编辑器,快速生成小程序。

(3)在 AI 的帮助,无痛接入数据库和调用云函数。

(4)客户端、服务端、大模型三者之间数据交互的标准化和统一接口。

上面的每一点,都能解决目前小程序开发的痛点,期待早日看到突破。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月16日

科技爱好者周刊(第 333 期):一切都要支付两次

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

42层的深圳金融科技研究院大楼,去年6月封顶了,采用了不规则外形的设计。(via

一切都要支付两次

有一句古语"书非借不能读也",大家可能都听过。

它的意思是,很多人买了书却不读,觉得不着急,拥有书就相当于已经开始学了,后面就慢慢来吧,反而是借来的书有急迫感会抓紧读完。

这种事情很多。网址保存成书签,就扔在那里了,再也不去看它了。

我最近看到一篇老外的文章,他给这种现象起了一个全新的名字,让人觉得很贴切。老外的概念化能力真是强。

他提出,人们买书却不读,是因为没有意识到每样东西都需要两次支付

第一次是货币支付,你付出货币,得到自己想要的东西,比如一本书,一个 App,一辆自行车,一颗卷心菜等等。

但是,你还必须支付第二次,才能真正消费这个东西。这次你付出的是你的时间和努力,来获得它的收益。

第二次支付可能比第一次支付贵得多。假设一本书的第一次支付是20元,第二次支付可能就是10小时的阅读时间。只有支付第二次,你才算真正消费了这本书。如果没有第二次支付,第一次支付就意义不大了,跟把钱扔进垃圾箱差不多。

生活中,到处都是两次支付的例子。购买 App 后,你必须学习如何使用,并且经常使用,才能得到它的价值。购买自行车后,你必须忍受痛苦的初学者阶段,然后才能上街骑行。购买蔬菜后,必须切碎、蒸熟并咀嚼,然后才能为你提供营养。

我们经常犯的一个错误,就是只完成了第一次支付,没有第二次支付,比如未使用的会员资格,未读的书籍,未玩的游戏,未编织的毛线。由于没有第二次支付,所以你并没有真正使用,第一次支付的钱实际上扔进了垃圾桶。

这种行为方式的深层次原因,就是现代社会太强调消费,过于看重第一次支付的经济价值,而忽视第二次支付的实际结果。人们受到消费主义的影响,以为支付了商品价格,就完成了一次消费。

合理的消费方式应该是,只有当你确定会有第二次支付,才进行第一次支付。这样就可以避免许许多多的浪费。

新的一年,大家购买商品时,可以先问问自己,你会不会第二次支付,即会不会为它付出时间和努力?只有确信自己会,再掏钱购买它。

有一种商品,天然支持先进行第二次支付,再进行第一次支付,那就是软件。

软件不同于实体商品,边际成本接近零,又是长期消费,完全可以先让用户免费用(试用版或者试用期),等他用习惯了,再向他收费。

很多软件就是这样做的,这大概就是为什么,软件的不理性消费行为,要比实体商品少得多的原因。

语义防火墙:雷池 WAF 升级

服务器一直被攻击,怎么办?我的体会是,这种事情很难预防,只能用防火墙去挡。

周刊以前介绍过"雷池 WAF",就是知名的软件防火墙,GitHub 已经有14500颗星。

它有一个好用的图形管理后台(上图),可以配置各种拦截规则,高效过滤恶意请求。

即使不配置规则,它自带的语义引擎,也会通过机器学习,自动识别和拦截恶意请求

本周,雷池 WAF 进行了重大升级,发布了语义引擎3.0版,加强了 AI 语义分析能力。只要2~8小时的自动训练,识别准确率就能达到99.99%,还能用自然语言解释,遇到了什么攻击。

如果你有线上服务器,不妨试试它的拦截效果。个人网站使用开源版就够了,企业可以考虑商业版,本次升级引入的 AI,主要就是强化商业版的企业级服务。

科技动态

1、从地图删除巴士线路

桂尔公园(下图)是巴塞罗纳的第二大景点,每天都挤满了世界各地的游客。

很多游客乘坐116路公交车去公园,周围居民意见很大。每趟车都挤满了游客,本地居民反而挤不上去。

居民们想了一个办法,让市议会出面,要求谷歌地图和苹果地图删除116路公交车。

这招非常有效,从此以后,就几乎没有外地人乘坐这辆车了,座位都空出来了。

这反映了一个现实,在如今这个年代,如果你不存在于数字世界,对于外人来说,你就是真的不存在。

2、陆空一体汽车

东南大学研发的"东大·鲲鹏1号",最近公开亮相。

这是一辆陆空一体汽车,既可以当作汽车四轮行驶,也可以用四轴螺旋桨飞行。

当作汽车时,它的最高时速是60公里。

当作飞行器时,它的最大起飞重量500公斤,最大飞行高度300米,最长飞行时间20分钟。

3、液态空气储能电站

河北石家庄的液态空气储能电站,近日并网运行成功,属于国内首个,一天可以储能发电4000度。

它采用空气液化储能,在需要储能时,把空气降温到零下170摄氏度,转化成液体,就储存在下图这个高12米、直径2.5米的罐子里。

需要用电时,再把液态空气升温变回气体,体积会膨胀600多倍,推动发电机的叶轮旋转发电。

它的最大优点是不受地理条件限制,如果证明了经济上可行,就可以大规模建设。

4、其他

(1)研究发现,那些每月新增50星以上的 GitHub 项目,15%都是买的假星星,整个 GitHub 共有450万的假星星。

(2)用户在微软浏览器 Edge 键入"google",会跳出一个很像谷歌、其实属于 Bing 的页面(下图)。

(3)北京天文台正在举办《问月》展览,展出月壤实物,还有月球基地的想象图。

文章

1、段永平浙大师生见面会问答实录(中文)

段永平1月5日重返母校浙江大学,与现场观众进行交流,这是2万字的现场实录。"我没有鼓励过(别人创业)。我觉得该创业的人根本就不需要你鼓励,你有个很强烈的想法,你就会去做。"(@851235550 投稿)

2、如果 GPU 那么好,为什么我们还用 CPU(英文)

本文通俗地介绍 GPU 和 CPU 的差异,解释为什么它们彼此不能替代,写得很好。

3、如果不断要求 AI 改进代码会怎样?(英文)

作者做了一个有趣的实验,他让 AI 生成一段代码,然后要求 AI 改进这段代码,这样连续做四次,看看会发生什么。

4、关于 SQLite 的各种趣事(英文)

SQLite 是世界使用最广泛的数据库,本文收集关于它的各种趣事。

5、搭建免费的企业邮箱(中文)

本文使用 Gmail + Resend + Cloudflare 搭建免费的企业邮箱,可以接收/发送企业域名邮件。(@javayhu 投稿)

6、旧台式电脑的10个用途(英文)

本文介绍怎么利用旧电脑,提供了一些有用的思路。

工具

1、Sourcebot

开源的代码搜索工具,可以快速对代码建立索引。

2、facad

一个查看目录的命令行工具,类似ls命令,但会显示彩色图标。

3、opfs-finder

在浏览器中实现 macOS Finder。(@hughfenghen 投稿)

4、Termora

开源的终端模拟器,可以当作 SSH 客户端使用,支持 Windows,macOS 和 Linux,采用 Kotlin/JVM 开发。(@hstyi 投稿)

5、Fake Mail

开源的一次性电子邮件服务,使用 Cloudflare worker + Astro 开发,收到的邮件存在 Cloudflare KV,2小时后自动删除。(@CH563 投稿)

6、AYA

开源的跨平台桌面应用,用来简化对安卓设备的操作控制,可以看作 ADB 的图形用户界面。(@surunzi 投稿)

7、简历生成工具

简历生成的开源 Web 应用,通过拖拽和配置,自定义简历布局和内容。(@Arman19941113 投稿)

8、在线剪贴板

作者用 AI 生成的一个简单项目,在线的文本分享网站,会生成分享链接,可设置密码,包括前端和后端。(@zxcv0221 投稿)

9、qrframe

一个定制二维码的网页工具,提供大量选项,代码开源

10、Pipet

一个从 HTML/JSON 提取数据的命令行工具,可以跟 curl 搭配使用。

AI 相关

1、Ollama OCR for web

基于视觉大模型的开源 OCR 文字识别工具,自带 Web 前端。(@dwqs 投稿)

另有一个类似的项目,基于 Gemini 的 OCR 识别。(@cokice 投稿)

2、DeepSeek AI 浏览器插件

开源的浏览器插件,直接在网页上与 DeepSeek 大模型互动,获取选中文本的总结或解答。(@DeepLifeStudio 投稿)

3、AI 生成涂色书

输入关键词,生成免费的涂色书。(@meetqy 投稿)

4、AI Minecraft

Minecraft 与 AI 相结合,打造实时响应、动态生成的开放世界游戏。(@boqiwen 投稿)

5、Smart Bookmark

Chrome 浏览器插件,收藏网页时,自动生成相关标签,无需手动归类。(@howoii 投稿)

6、AnyVoice

AI 声音克隆,只需3秒音频就可创建逼真的声音克隆。(@markliuyuxiang 投稿)

资源

1、如何像计算机科学家一样思考(英文)

一本在线的编程入门教材,以 Python 语言为例,适合用来学习编程。

2、FreePngZone

免费的 PNG 图片搜索,好像只支持英文。(@wangdachui332 投稿)

3、泡泡白噪音

一站式白噪音平台。(@nettsz 投稿)

4、Data Commons

谷歌发布的一个数据网站,提供许多公开的数据集,以及配套的工具,让你可以检索和处理这些数据。

图片

1、积雪乐高

一位瑞典艺术家自制塑料模具,将积雪做成乐高积木的形状。

小朋友用它们搭建雪屋,就像 MineCraft 里面的屋子。

2、AI 乐高模型

Instagram 的账户 @brick4world 专门发布 AI 生成的乐高积木模型。

AI 生成的模型,似乎比人类设计的更有想象力、更漂亮、更吸引人。

文摘

1、AI 的压力

我在谷歌的 AI 团队 DeepMind 工作,感到了 AI 带来的巨大压力。

几个月前,我参加了一个朋友举行的生日派对,很多来宾我认识,但也有很多人不认识。

当时,我的身体状态不太好,无意与其他人多交谈。但是,大家知道我在 DeepMind 工作,就在我的身边排起了小队,每个人都想跟我谈谈 AI。

这么多人对我的工作感兴趣,真是让我受宠若惊。银行家、律师、医生和管理顾问都想了解我对 ChatGPT 的看法,尽管很少有人声称大量使用它,但是所有人都认为他们应该多了解 AI。

我是一名研究人员,这种在社交场合无法关机的感觉,让我觉得压力很大。

后来,情况变得更糟了。我在自己家里,都觉得有压力。一打开新闻网站,里面都在谈 AI。

我就不看新闻了,因为害怕引发焦虑。但即使观看足球比赛或电视剧,广告也会提到 AI。

我想过收拾行李,去那些遥远的小城市,住在寺庙里,但如果那里也以某种方式被 AI 渗透了,我也不会感到惊讶。

事实上,行业里面的大公司都在竞争,看谁能开发最大、最好的大模型,只要你为这些公司工作,这本身就带来压力。

此刻做 AI 研究感觉像是参与了一场战争。模型性能的小小波动,可能就会带来股价几十亿美元的变化。

另外,AI 也为我们带来突然的财富,这也带来各种心理问题。

过去两年,我在 AI 世界的经历是混乱和疯狂的,内心充满焦虑。我想,这并不是个别现象。

言论

1、

根据人均寿命,2025年出生的婴儿将活着看到下个世纪。

-- 《新一代人类》

2、

摩尔定律预测,芯片性能大约每年会翻一番。但是,AI 芯片的发展速度比这快得多。

今天我们发布的 GB200 NVL72 芯片,运行 AI 推理的速度,比去年的上一代 H100 快了30倍,比10年前的芯片快了1000倍。

我们正在超越摩尔定律,AI 适用超级摩尔定律。

-- 黄仁勋,Nvidia CEO

3、

比亚迪正在走特斯拉没有走下去的道路:一面扩大电池和汽车产量,一面降低成本。

-- Hacker News 读者

4、

人类所有的问题,都源于人无法独自安静地坐在房间里。

-- 帕斯卡尔,法国哲学家

5、

正常的小说是自然的顺序,第一章介绍英雄,第二章是英雄开始行动。

但是,你可以交换这两章,现在第一章是英雄开始行动,小说可能以一把枪指着英雄的头部开始。就在紧张气氛达到顶峰时,然后是第二章介绍英雄。这样的话,读者就更有理由想了解这个角色。

同理,先演示幻灯片的第二部分,可能有同样的效果。

-- 《从第二张幻灯片开始演示》

往年回顾

蓝色指示灯的解决方案(#286)

中国的阳光地带(#236)

低纬度,高海拔,气候优势(#186)

利特伍德奇迹定律(#136)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月10日

科技爱好者周刊(第 332 期):西蒙·威利森的年终总结,梁文锋的访谈

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

世界最长的高速公路隧道"天山胜利隧道"本周贯通,长达22.13公里,汽车要在里面开20分钟。它连接了被天山隔断的南疆和北疆。(via

西蒙·威利森的年终总结,梁文锋的访谈

英国程序员西蒙·威利森(Simon Willison)最近两年非常出名,他的个人网站有很多文章,介绍 AI 的最新进展。

本周,他发表了很长一篇的2024年大模型回顾(非官方的中译),非常精彩。

他提到,AI 的发展速度快得难以想象。

一年前的2023年底,排名第一的 AI 模型是 OpenAI 公司的 GPT-4,没有其他模型能超过它。

一年过去了,大家猜猜,GPT-4 现在排名多少?

答案是第69位(上图),已经有18家公司的大模型超过了它。其中的一些模型,甚至可以在笔记本电脑运行。

短短一年,榜首模型就被大量竞争者轻松超过,家用硬件就能达到它的运行效果。AI 的进化速度就是这么惊人。

西蒙·威利森特别提到了来自中国的大模型 DeepSeek V3

DeepSeek V3 是2024年12月25日发布的,来自杭州的量化基金公司幻方量化。一经发布,它就引起了国际范围的轰动。

它在多个参数上,击败了 OpenAI 公司最新的 o1 模型。目前,它在大模型排行榜上排名第7,要知道前十名里面,只有它是开源模型,而且是最少限制的 MIT 许可证,其他都是大公司的专有模型。

而且,它的运行效率很高,训练成本估计只有 Meta 公司的 Llama 3.1 405B 模型的11分之一,而后者的效果还不如它。这就是说,DeepSeek 找到了高效使用硬件、提高模型效果的方法。

西蒙·威利斯说:"DeepSeek V3 的训练成本不足600万美元,是一个极好的迹象,表明 AI 模型的训练成本可以而且应该会继续下降。"

西方媒体就非常好奇,DeepSeek 是怎么做到的?

幻方量化创始人梁文锋,跟其他 AI 模型的研究者不同,没有海外经历,毕业于浙江大学电子工程系人工智能方向。

西方媒体对他充满了好奇,专门将他以前的访谈译成了英文

我觉得,原始的中文访谈( Part 1Part 2)很值得一读,我分享他说的几段话,展示了中国顶级研究者的视野和抱负。

(1)我们要做的不是生成式 AI,而是通用人工智能 AGI。前者只是后者的必经之路,AGI 会在我们有生之年实现。

(2)任何 AI 公司(短期内)都没有碾压对手的技术优势,因为有 OpenAI 指路,又都基于公开论文和代码,大厂和创业公司都会做出自己的大语言模型。

(3)在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

(4)我们不会闭源。我们认为先有一个强大的技术生态更重要。

(5)当前阶段是技术创新的爆发期,而不是应用的爆发期。大模型应用门槛会越来越低,创业公司在未来20年任何时候下场,也都有机会。

(6)过去很多年,很多的中国公司习惯了别人做技术创新,拿过来做应用变现,自己等着摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。中国也要逐步成为贡献者,而不是一直搭便车。

(7)大部分中国公司习惯 follow,而不是创新。中国创新缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才。我们没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

(8)我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

(9)我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

(10)我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

(11)中国产业结构的调整,会更依赖硬核技术的创新。很多人发现过去赚快钱很可能来自时代运气,现在赚不到了,就会更愿意俯身去做真正的创新。

(12)我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多,因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

科技动态

1、AirTag 充电盒

苹果公司的 AirTag 可以追踪物品,但如果没电,就无法追踪了。

一位国外程序员就遇到了这个问题。他的1万美元装备的相机包放在车后座被偷了,当他打开追踪时,才发现里面的 AirTag 忘了换电池,已经无法追踪了。

他痛定思痛,发明了一个 AirTag 充电盒,把两节五号电池跟 AirTag 封装在一起,为后者充电。

据他说,这个充电盒可以持续工作10年,完全不用担心没电。

只要把这个小盒子跟你要追踪的物品,放在一起,就不用管它了,一直可以追踪。

2、无护照过海关

从2024年9月30日开始,新加坡公民通过樟宜机场出入境,不再需要护照了。

机场会使用人脸识别和虹膜识别,来代替护照。这样更省时、成本更低。

纸制护照已经过时了,也许不久将来就会消失。

3、世界最大 3D 打印社区

美国得克萨斯州即将完工世界最大的 3D 打印社区,共有100幢住宅。

这些房子都是一个巨大的 3D 打印机生成的。

房屋的打印材料是混凝土粉末、水、沙子、添加剂的混合物,喷嘴将混合物像牙膏一样挤出,沿着预先编程的路径层层堆叠,形成墙壁。

建筑公司表示,3D 打印房屋更快、更便宜,现场只需要一个操作员,并且最大限度地减少了建筑材料浪费。

单层的三居室或四居室住宅,大约需要三周才能打印好所有墙壁,然后再用传统方式加固地基和安装屋顶。

4、其他

(1)网友发现,Spotify 歌单里面,有些音乐家根本不存在,他们的作品很可能是 AI 生成的,Spotify 以此减少付出的版权费。

(2)百度推出"Ai 搜",汇集了各种 AI 相关功能。

文章

1、2024年 Linux 发行版推荐(英文)

作者介绍他心目中,各种用途最佳的 Linux 发行版。

2、中美工作感想(中文)

"过去四年五个月,我随着工作从 SF 搬到北京,再搬到上海,后来搬回美国在洛杉矶住了一年半。"本文是国内做工程师和美国做工程师的对比。(@wukan 投稿)

3、开发者应该知道的10个终端命令(英文)

本文简单介绍10个终端命令,比如 grep、awk、sed、find 等。

4、Meta 四次面试经历(中文)

"这些年,我一共面试了四次 Facebook/Meta。虽然都未成功,但收获颇多。"(@DoctorLai 投稿)

5、算法面试心得(中文)

本文是作者对如何应付一般的算法面试的知识总结和心得。(@javayhu 投稿)

6、我们用 React 取代了 Next.js(英文)

作者难以忍受 Next.js 的庞杂和性能,改为直接使用 React,不再用基于它的框架了。

7、Windows 的增强剪贴板(英文)

我很少用 Windows,现在才知道它的剪贴板有同步功能,还能永久保存。

工具

1、Ghostty

一个终端模拟器,使用 GPU 渲染 UI,支持 mac 和 Linux。作者是 HashiCorp 公司创始人,参见介绍文章

2、Black Candy

一个自搭建的音乐流媒体服务器,自带手机和 Web 客户端,相当于自己的云音乐平台。

3、curl-impersonate

一个 curl 的改写版,使其发出的 HTTP 请求就像 Chrome/Firefox 发出的。

4、RSS.Beauty

将普通的 RSS/Atom 订阅源转换成美观的阅读界面,代码开源。(@ccbikai 投稿)

5、AI Shadcn 主题生成器

输入关键词,就可以免费生成 Shadcn 主题。(@meetqy 投稿)

6、懒猫书签

开源的 Chrome 插件,一键清理失效链接和空文件夹。(@Alanrk 投稿)

类似插件还有 Bookmark Pro。(@wincatcher 投稿)

7、Nping

Rust 语言开发的 Ping 工具,支持多个地址并发 Ping,并附带实时折线图展示。(@hanshuaikang 投稿)

8、peepDB

一个命令行工具,连接各种主流的关系型数据库,查看表内容。

9、File Pilot

非官方的 Windows 文件管理器,号称可以取代官方的资源管理器。

10、Doggo

一个易用的 DNS 命令行查询工具。

它的官网首页还提供 DNS 在线查询。

AI 相关

1、DeepSeek Coder

根据提示生成 App,基于 DeepSeek V3 模型。(@sing1ee 投稿)

2、GodView

语义化地图,用自然语言查询地图,比如输入"请展示上海的前10大图书馆"。

3、对话 CEO

与马斯克、张一鸣、任正非对话,效果还可以。(@5A59 投稿)

4、ithy

AI 模型聚合网站,输入关键词,同时返回 Lllma 3.1、o1-mini、Sonnet 3.5、Grok 2、Gemini 1.5 pro 的生成结果。

5、AutoMouser

开源的 Chrome 浏览器插件,将鼠标操作通过 AI 转为 Selenium Python 脚本,需要 OpenAI key。(@guoriyue 投稿)

资源

1、search the arXiv

arXiv 论文库的搜素引擎,使用自然语言搜索。

2、《算法(第4版)》的 C++ 实现

这个仓库包含《算法(第4版)》教科书介绍的算法的 C++ 语言实现,与原书的 Java 实现相对应,(@landerrosette 投稿)

3、EmojiClick

使用自然语言搜索 Emoji 符号。(@yijianbo 投稿)

4、独立开发者工具

该仓库收集独立开发者出海技术栈和工具。(@yaolifeng0629 投稿)

图片

1、世界最美钞票

2023年,国际钞票协会评选当年的"世界最美钞票"。得奖者是东加勒比中央银行发行的2元纸币。

这张钞票色彩缤纷,确实非常漂亮。正面是当地板球明星,以及银行标志、乌龟和鱼。

背面是鱼、珊瑚、海龟、蓝色岛屿地图。

2、行业圣诞树

上周圣诞节,美国媒体贴出了,各行各业搭建自己圣诞树的照片。

披萨店的外卖盒圣诞树。

家装店的玻璃圣诞树。

修路队的交通锥圣诞树。

书店的圣诞树。

电脑店的圣诞树

超市的香蕉圣诞树

文摘

1、亚马逊河为什么没有桥?

南美洲的亚马逊河是世界第二长的河流,仅次于非洲的尼罗河。

但是,这条河没有一座桥,是唯一一条没有任何桥梁的世界主要河流。这是为什么呢?

首先,每年的雨季,亚马逊河都会泛滥,河流的宽度会从旱季的5公里变成50公里,就像下图那样,很难造桥。

其次,亚马逊河沿岸人烟稀少,只有很少几个城镇。最大一个城市的人口只有50万,不存在前往河对岸的强烈需求。

最后,亚马逊河两岸都是原始森林,并没有现成道路。如果造桥就需要砍伐大量森林,修建引桥和公路,环境代价很大。近年来,环保意识逐渐高涨,反对造桥的呼声也就越来越大。

言论

1、

由于 AI 的出现,英语正在成为最热门的新编程语言。

-- Andrej Karpathy,著名的 AI 科学家

2、

除非手机可以当成电脑使用,否则我不打算再为性能升级手机了,不再为越来越快的 CPU 买单了。

-- Android Authority 专栏作家

3、

保护海底光缆不出事是不可能的,你唯一能做的就是建立大量冗余,在不同位置铺设数十根光缆可能比保护它们更便宜。

-- Hacker News 读者

4、

强大的工程师不在于速度快或产出高,而在于能够完成其他工程师无法完成的任务。弱小的工程师几乎任何任务都完成不了。

如果你和一个弱小的工程师一起工作,你可以帮他,但一定要保护好你的时间,防止他把你的时间都消耗光。

-- 《强大的工程师与弱小的工程师》

5、

人工智能并不是释放我们的想象力,而是外包它们。

-- 英国《卫报》

往年回顾

为什么 PPT 不如备忘录(#285)

青年失业率与选择创业(#235)

美国宪法拍卖,一个区块链案例(#185)

什么行业适合创业?(#135)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月 3日

科技爱好者周刊(第 331 期):你可能是一个 NPC

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

南京城北万象汇商场,与红山动物园合作,架设了一个38米高的长颈鹿。(via

你可能是一个 NPC

最近,美国发生了一起轰动的大案,一家医疗保险公司的 CEO 当街被人击杀

嫌疑人很快抓到了,是一个26岁的青年,名为路易吉·曼吉奥内(Luigi Mangione)。

媒体纷纷挖掘这个青年的背景,发现他是一个作家的粉丝。

就在几个月前,他向作家打赏200美元,并进行了多次视频通话。

媒体就去采访作家,询问两人在通话中说了什么。

作家详细地回忆了他们的通话内容。其中有一段,我觉得很有意思,分享给大家。

曼吉奥内对作家说,他很喜欢作家的一篇文章《你可能是一个 NPC》

NPC 指的是电子游戏的"非玩家角色",比如路人、门卫、警察等等,用来模拟现实环境,由程序控制,一举一动都是设计好的,没有自主意识。

作家的那篇文章提出,人类越来越像机器人,彷佛 NPC 那样,行为逻辑都是预设好的

曼吉奥内高度认同这个观点。他前不久去日本旅行,认为日本充满了 NPC。他说了一件亲身见闻。

一天早上,他在街上看到一名男子癫痫发作,倒在地上。他跑到最近的警察局求助,警察就跟着他去现场。

路上遇到了红灯,警察立刻就停下来,坚持要等绿灯再过马路,即使那时马路上根本没有汽车。

曼吉奥内很不理解,病人正在发病,神智不清,可能有生命危险,警察却坚持遵守交通规则。救人难道不是更重要的事情吗?

他由此认为,日本人"缺乏自由意志",规则怎么说就怎么做,不会自主行事,就是活着的 NPC

他还观察到,日本存在一种"隐蔽族"(hikikomori),他们不出门,一个人整天待在卧室里,用电子游戏、上网、视频来消磨时间。

曼吉奥内认为,这些人也是 NPC,他们失去了对生活的控制,无法参与社会生活,就选择放弃,等于丧失了生活的自主权。

他观察到,这种现象不仅存在于日本,正在向全世界蔓延,世界各地越来越多的人正在成为 NPC。他们要么无法自主的生活,要么无法选择自己的行为,而是根据规则和指令来行事,就像被程序控制一样。

科技公司推动和加剧了这种趋势,互联网使得人们越来越分心,把时间都花在网上肤浅的娱乐,不再集中注意力于自己的生活,把生活都交给程序,无法形成自主的意识和行为。

以上就是曼吉奥内的观点,我认为是很真实的观察。一方面,人工智能使得机器人越来越像人类,另一方面,人类的自主性在消退,越来越像机器人。现实与游戏、人类与机器人,越来越难以区分了。

AI 编程挑战赛,即将报名截止

这几期的周刊一直在介绍,正在举行的全国 AI 编程挑战赛。

它的报名马上就要截止了。

(1)应用赛道的作品提交,到1月5日截止。如果你有好的创意,能用 AI 做出可运行的作品,就可以报名参加。

(2)如果你善于刷题,可以报名参加算法赛道,但不能用 AI 来解算法题。

我是鼓励大家参加。大赛有丰厚奖品,设了20万的奖金池,获奖者还有机会拿到岗位 offer。就算没得奖,也是一个很好的锻炼,能够动手编程、熟悉 AI。

大赛由豆包 MarsCode 和稀土掘金技术社区共同主办。详细介绍和报名方法,请看前两期的周刊,或者点击这里

科技动态

1、观鸟神器

一个美国女子发明了一种观鸟神器,在网上引起了轰动。

她在墨镜上挂了一个托盘,上面洒了鸟食。小鸟就会停在上面,完全没有意识到,就停在她的鼻子前面。

这种观鸟神器,简单又体验独特,怎么以前没人想到。

2、自豪版本规范

一个开发者提出自豪版本规范(pride versioning),对软件版本进行编号。

如果你对新功能感到非常自豪,就发一个大版本(递增第一个版本号),否则就发一个小版本(递增第二个版本号)。

如果你对某个地方感到尴尬和羞耻,就发一个补丁版本进行改正(递增第三个版本号)。

3、能量收集电子贺卡

一位国外的程序员,制作了一张可以收集能量的电子贺卡。

这张贺卡就是信用卡大小,上面有电路,但是不带电池,通过收集周围环境的能量,LED 灯会闪烁。

最简单的方式,就是放在灯光下,它会收集光能。

你也可以用 USB 供电。

它甚至可以放在路由器或微波炉旁边,吸收 WIFI 和微波的能量。

4、糖打印机

你想过用糖来 3D 打印吗?有人就真的做出了一台糖打印机。

它用热风枪,将白砂糖吹塑成型,打印出各种形状。

下面是它打印的一颗钉子。

它可以打印出很复杂的形状。

这些东西都可以食用,因此这种机器在食品行业应该很有用,在夜市可能也会很轰动。

文章

1、我的几何人生(中文)

著名华人数学家丘成桐,回顾自己的成长道路。

2、编程十年的感悟(中文)

"代码写多了才意识到,程序员的竞争力并不是写代码,也并不是哪门语言或者框架, 其核心竞争力是通过技术解决问题的能力"。(@ramsayleung 投稿)

3、我给博客添加 dark mode(中文)

作者介绍他为博客添加 dark mode 的处理方法和注意事项。(@Spike-Leung 投稿)

4、七个最佳的生产力 Docker 镜像(英文)

本文介绍七个可以自己用 Docker 镜像架设的生产力服务。

5、不可变 Linux 发行版(英文)

越来越多的开发者开始使用不可变的 Linux 发行版(immutable Linux distro),即系统文件在运行期间不可更改。这样会让系统更稳定,也更容易迁移和回滚。

6、macOS 命令行内置的工具程序(英文)

本文介绍 macOS 内置的一些命令行工具程序,比如 security、open、pbcopy、pbpaste 等。

工具

1、YunoHost

一款虚拟机软件,内置了常见的云服务,可以一键启用,省去了安装云服务的麻烦,参见介绍文章

2、MarkItDown

微软官方推出的工具,将各种格式的文件(主要是 Office 文件)转成 Markdown 格式。标题是 GitHub 仓库链接,下面是线上体验

3、爱幕

在线字幕编辑器,支持音频提取和字幕翻译,免费使用,自己部署需付费。(@zhw2590582 投稿)

4、Beautify Screenshots

截图美化工具。(@cxhello 投稿)

5、单词收藏助手

Chrome 插件 + 微信小程序,在网页上收藏单词,建立自己的词库,然后通过小程序加强记忆。(@yuuk 投稿)

6、Free Open Graph Image Generator

根据模版制作"网页分享图"(open graph)的在线工具。(@javayhu 投稿)

7、Kyanos

一个命令行的网络流量采集和分析工具,具有较强的数据过滤和分析能力。(@hengyoush 投稿)

8、在线 Excel 协同编辑器

一个开源的类 Excel 电子表格网页应用,支持多人协同编辑。(@nusr 投稿)

9、红枫云盘(maple-file)

一个多协议云端文件存储的客户端,支持安卓和 macOS,基于 Flutter + Go 开发。(@honmaple 投稿)

10、GitHub Cards

将 GitHub 用户个人数据转换成卡片图。(@iAmCorey 投稿)

AI 相关

1、GCOP

基于 AI 的 Git 提交消息生成和工作流程优化工具。(@Undertone0809 投稿)

2、github-assistant

该网站可以对 GitHub 代码库提问,由 AI 来回答,比如"过去30天谁的提交次数最多"。

3、Liubai

开源的微信机器人,在微信里面同时调用三个 AI 模型,完成各种任务。(@yenche123 投稿)

4、AI OCR

在线免费 AI OCR(图片文字识别)工具,所使用的前端代码和 AI 提示词见这里,灵感来自 llama-ocr。(@ringcrl 投稿)

5、Smart Alt Text Generator Generator

上传图片,生成 SEO 友好的 alt 描述,支持多种语言。(@wang1309 投稿)

6、AI 调色盘生成器

该网站可以根据输入的关键词,生成对应的色彩组合。

资源

1、WebSpy.Site

网站流量分析平台,根据域名查询网站流量情况。(@wincatcher 投稿)

2、PNGFree.ai

免费的百万级 PNG 图片库。(@shawnlee000 投稿)

图片

1、无头鸡

1945年,一个美国科罗拉多州的农民杀鸡时,砍掉了一只五个半月大的鸡的大部分头部。

但是没有砍到颈静脉,并且一只耳朵和大部分脑干完好无损。因此,这只鸡虽然没有脑袋了,仍然可以保持平衡并笨拙地行走。

农民发现这只鸡没有死,就决定继续养它,用滴管给它喂食。

后来,这只鸡被巡回展出,门票是25美分,每月为主人带来4,500美元收入。

1947年3月,它死于巡回展出途中。

2、Windows 3.1 时钟

市场上出现了 Windows 3.1 时钟,钟面就是 Windows 3.1 的桌面,看上去很有怀旧感。

注意,上图的钟面不是液晶屏,而是印刷上去的。它是石英钟,使用一节五号电池。

文摘

1、长期软件开发

有些领域的软件会持续运行几十年,比如发电厂、起搏器、飞机、桥梁、重型机械的软件。它们可能几年都不会改动,然后推出一个新的大版本。

如果一个软件的开发周期长达几十年,需要长期维护,那么最好做到下面几点。

(1)尽量减少依赖。

软件的依赖项越多,长期越难以维护。依赖包括开发时依赖和运行时依赖,都是越少越好。

现在,很多软件在运行时会调用云服务,这也不利于长期维护。

(2)完备的测试用例。

测试对于重构、删除/添加功能,会提供极大的帮助。当你中断3年后,重新开始开发,测试也会让你快速了解系统。

(3)减少复杂性。

复杂性是软件开发的头号敌人,会让最好的程序员和团队都铩羽而归。

由于熵增定律和人类行为,除非你有意识地遏制,否则复杂性总是会增加。

因此,你需要养成严格的开发习惯:尽早和频繁地重构,删除不必要的或重复的代码,花时间简化。

(4)编写简单无趣的代码。

代码越简单越好,重点是代码的运行逻辑要显而易见。你永远不会后悔编写了简单的代码。

那些看上去很聪明、很高深的代码,会让后期的调试和理解变得复杂。特别注意那些高性能代码,只有当你正确理解它们时,它们才有效。

另外,那些眼下时髦、被热炒的明星技术,如果没有得到充分验证,也需要规避。

你最好只使用至少有10年历史的可靠技术。有一条规则是,某项技术的寿命与它们当前的年龄成正比,即存在越久的东西越可能继续存在。

(5)日志、遥测和文档

如果软件不是持续更新,开发者的注意力就会转到其他地方,不会立即跟进,所以需要有日志和遥测,能把运行过程记录下来。

文档则可以帮助我们理解几年前、甚至十几年前,编写原始代码时的想法。可能的话,记录所有事物,不仅仅是代码,还有理念、想法和为什么。

(6)团队

团队人员变化是很常见的。在许多地方,在一个团队呆三年,就已经很久了。虽然你可以用良好的文档和出色的测试,来抵消这种人员变化,但这很困难。

软件长寿的最简单办法之一,就是让开发成员长期稳定,保持工作十年。这意味着,你必须给你的程序员提供良好待遇,否则人们会离开。

在某些地方,软件是外包公司或咨询顾问写的,他们将代码丢到你的系统中后离开。对于长期运行的软件,这是非常糟糕的安排。

(7)开源

让你的代码暴露在外界的眼光,是保持代码可靠的好方法。一个有趣的事实是,只有质量良好的代码,人们才愿意对外分享,也就是说,如果不开源,人们会愿意在组织内部接受质量更差的代码。

开源代码有更高的标准、更多的测试,这是让代码不过时的绝佳机制。

言论

1、

银行的 API 特别难用,设计得也很奇怪。我在为银行工作时,发现了原因。

API 不是银行通信的方式,文件才是。银行执行的指令,不是通过我们习惯的 API 传送,而是通过文件接收。

-- 《为什么软件工程师与银行整合如此痛苦?》

2、

美国有很多问题,绝非理想的社会,但是第三世界国家的很多人,尤其是低收入人群,尽管对美国的真实情况一无所知,依然非常向往。

在他们心目中,美国有财富、空间、自由、人性化管理等等。这不是真实的美国,而是美国在他们心目中的投影,他们向往的其实是自己想象中的生活方式。

这是美国的一个很大的优势,尽管自身的诸多问题,依然能够对其他国家的人民产生吸引力。

-- 《美国比欧洲好吗?》

3、

产品经理的职责就是三件事:(1)了解用户需求;(2)提出解决方案;(3)安排任务执行。

-- 《产品经理的 AI》

4、

一个生物学家说过:"每个细菌的梦想都是变成两个。" 这是生活的基本真理:你经历的一切只是使自己更加重要的一种手段。

-- Sean Carroll,进化生物学家

5、

我喜欢科学的一点是,无论你喜不喜欢,它都会让你相信。

-- 肖恩·卡罗尔,物理学家

往年回顾

YouTube 有多少个视频?(2023 #284)

AI 聊天有多强?(2022 #234)

政府的存储需求有多大?(2021 #184)

未来的游戏业比现在大100倍(2020 #134)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月27日

科技爱好者周刊(第 330 期):李开复梳理人工智能

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上个月正式开放的杭州良渚玉湖公园,公园的设计象征良渚文化和运河文化的连接。(via

李开复梳理人工智能

前些日子,我读了李开复老师的两本书:《AI·未来》(浙江人民出版社,2018)和《AI·未来进行式》(浙江人民出版社,2022)。

这两本书都是面向社会大众解释 AI,不是技术类书籍,但是有一些段落,阐述 AI 概念。

李开复老师用通俗的语言来解释,人工智能、机器学习、神经网络、深度学习......这些词到底是什么意思?彼此有什么关系?

我觉得,这些介绍对理解 AI 的体系,挺有启发的。它们分散在各个章节,我将它们整理在一起。

为了行文连贯,我没有完全照搬原文,而是用自己的语言重新叙述,如果有错误,也归咎我。

(1)人工智能

1956年夏天,计算机科学家约翰·麦卡锡(John McCarthy)首次提出"人工智能"(AI)这个概念。

人工智能指的是,通过软件和硬件,来完成通常需要人类智能才能完成的任务。它的研究对象,就是在机器上模拟人类智能。

(2)机器学习

早期,人工智能研究分成两个阵营。

第一个阵营是规则式(rule-based)方法,又称专家系统(expert systems),指的是人类写好一系列逻辑规则,来教导计算机如何思考。

可想而知,对于复杂的、大规模的现实问题,很难写出完备的、明确的规则。所以,这种方法的进展一直很有限。

第二个阵营就是机器学习(machine learning),指的是没有预置的规则,只是把材料提供给计算机,让机器通过自我学习,自己发现规则,给出结果。

(3)神经网络

神经网络(neural network)是机器学习的一种主要形式。

神经网络就是在机器上模拟人脑的结构,构建类似生物神经元的计算网络来处理信息。

一个计算节点就是一个神经元,大量的计算节点组成网络,进行协同计算。

神经网络需要极大的算力,以及海量的训练材料。以前,这是难以做到的,所以20世纪70年代开始,就陷入了停滞,长期没有进展。

(4)深度学习

深度学习是神经网络的一种实现方法,在20世纪80年代由杰弗里·辛顿提出。它让神经网络研究重新复活。

深度学习是一种让多层神经元可以进行有效计算的方法,大大提高了神经网络的性能。"深度学习"这个名字,就是比喻多层神经元的自主学习过程。

多层神经元包括一个输入层和一个输出层,它们之间有很多中间层(又称隐藏层)。以前,计算机算力有限,只能支撑一两个中间层,深度学习使得我们可以构建成千上万个中间层的网络,具有极大的"深度"。

(5)Transformer

早些年,深度学习用到的方法是卷积神经网络(CNN)和循环神经网络(RNN)。

2017年,谷歌的研究人员发明了一种新的深度学习处理方法,叫做 Transformer(转换器)。

Transformer 不同于以前的方法,不再一个个处理输入的单词,而是一次性处理整个输入,对每个词分配不同的权重。

这种方法直接导致了2022年 ChatGPT 和后来无数生成式 AI 模型的诞生,是神经网络和深度学习目前的主流方法。

由于基于 Transformer 的模型需要一次性处理整个输入,所以都有"上下文大小"这个指标,指的是一次可以处理的最大输入。

比如,GPT-4 Turbo 的上下文是 128k 个 Token,相当于一次性读取超过300页的文本。上下文越大,模型能够考虑的信息就越多,生成的回答也就越相关和连贯,相应地,所需要的算力也就越多。

豆包 MarsCode 动手实验室(杭州站)

先提一下,上周说的全国 AI 编程挑战赛

应用赛道的作品提交,从12月16日已经开始了,大家可以上传自己用 AI 完成的作品了。

算法赛道目前还在报名中,只要你有信心,在 AI 的辅助下解出算法题,不妨报名试试,也是一种体验和锻炼。

比赛规则和报名链接,请访问这里,也可以看上周的周刊。

(此处有分隔线)

本周介绍的活动,是12月28日(星期六)下午两点,在杭州的字节工区举行的豆包 MarsCode 动手实验室

到时,大家可以现场深度体验豆包 MarsCode 的 AI 编程能力,并跟字节的同学当面交流。在动手环节,你可以用 AI 实现自己的创意。如果你的作品很优秀,还有机会直通 AI 编程挑战赛的决赛。

活动的详细介绍,以及报名链接,请访问这里

科技动态

1、硬盘打孔机

硬盘报废时,一般需要擦除数据。最保险的方法,莫过于物理破坏硬盘。

但是,这样很费事,你要找把锤子,把硬盘敲碎了。

为了解决这个问题,一家日本公司推出了"硬盘打孔机"。这种机器可以在硬盘上轻松打四个孔,保证彻底破坏数据。

它采用电动液压系统,产生12吨的压力,足以穿透任何硬盘。

它的尺寸为 410 x 289 x 187 毫米,跟台式电脑差不多大小,但是重达18公斤,适合那些有成千上万硬盘需要销毁的大公司。

2、沙子国际象棋

一位英国设计师用沙子作为材料,3D 打印了一套国际象棋。

他说,这样做只是为了追求一种奇特的感觉。沙子是一种无形且流动的材料,塑造成坚固耐用的东西,让人感到难以把握、随时可能变化。

而且,沙子表面是不光滑的,当你用沙子下棋时,会有真实的、与众不同的触觉。

3、玻璃砖

大家考虑过吗,房子为什么需要墙?难道不能建造一所没有墙、全部是窗户的房子吗?

回答是不能,因为建筑的重量由墙承受,窗户不承受重量。如果把墙全改成窗户,建筑物就会倒塌。

那么,能不能用玻璃来造墙呢?玻璃既可以承重,又可以透光。

麻省理工学院的科学家,最近就发明了这样一种全透明的玻璃砖(上图),根据测试具有跟普通砖相同的承重能力。

除了透光,玻璃砖还有一个好处,可以重新利用。只要高温加热,玻璃砖就会融化,能够塑造成其他形状,还能 3D 打印,但这也导致它不防火。

总的来说,玻璃砖比红砖更环保,在很多场合有推广潜力。

4、其他

(1)本周发生了一笔史上最大的风险投资,AI 公司 Databricks 一次性募集了100亿美元。

(2)GitHub 宣布,编程助手 GitHub Copilot 向所有用户免费开放。

(3)OpenAI 推出了免费电话 1-800-ChatGPT,北美用户可以拨打该电话,跟 AI 语音聊天,每月额度为15分钟。

(4)小米官方开始支持,小米物联网设备接入智能家居管理助手 Home Assistant。

文章

1、汇编语言的一点入门介绍(中文)

这篇短文通俗解释了汇编语言的基本概念。

2、CSS 网格区块详解(英文)

这篇长文详细介绍 CSS grid 布局的区块功能(template area)。

3、网页如何插入 JSON-LD 语义数据(中文)

本文详细介绍网页的 JSON-LD 数据块,用来插入机读的语义数据。

4、13个对前端开发有用的 Chrome 插件(英文)

本文介绍13个用于前端开发的 Chrome 插件。

5、谷歌不再是最好的搜索引擎(英文)

本文是一篇新闻分析,作者认为 Perplexity 的 AI 搜索体验已经优于谷歌了。

6、如何为 Windows 添加6个 macOS 最好的功能(英文)

一篇 Windows 使用技巧,教你怎么为 Windows 添加一些 macOS 功能,比如文件浏览器可以文档预览。

工具

1、Presenterm

将 Markdown 文件转成幻灯片,在命令行播放的开源工具。(@lengyijun 投稿)

2、Rslib

制作 JavaScript 软件包的工具,可以直接开发组件库和命令行工具。(@fi3ework 投稿)

3、Midscene.js

AI 驱动的网页 UI 自动化测试框架,通过文字描述,生成 UI 测试用例。(@yuyutaotao 投稿)

4、wechatDataBackup

Windows 桌面 PC 端的微信聊天记录一键导出。(@git-jiadong 投稿)

5、MoeMail

基于 Next.js + Cloudflare 技术栈构建的临时邮箱服务,在线体验。(@beilunyang 投稿)

6、my-github-2024

一个 Python 程序,生成你在2024年的 GitHub 代码提交统计。(@WCY-dt 投稿)

7、Vanilla

Canonical 公司的 CSS 框架,就是 Ubuntu 官网采用的样式。

8、OpenAuth

网页登录的第三方认证的集成库。

9、Schemio

基于 Web 的示意图可视化编辑器。

10、Buzee

一个桌面软件,提供本地文件的全文搜索(包括图片里面的文字),支持 Windows 和 Mac。

AI 相关

1、Hika AI

免费的 AI 搜索。(@atlas-comstock 投稿)

2、Slea.ai

免费的 AI Logo 生成器。(@aaamomo64 投稿)

3、AI 音效生成器

免费生成各种音效,比如雨声、风声。(@aurthur 投稿)

资源

1、SQL 风格指南

一份书写 SQL 语句的风格约定。

2、颜色代码表

在线配色设计工具集,做在一个网站。(@nettsz 投稿)

图片

1、机器蜻蜓

美国首都华盛顿的中央情报局博物馆,有一只上个世纪70年代制造的机器蜻蜓。

它其实是一架微型直升机,飞到目标对象附近,窃听对方的谈话。

这只蜻蜓可以飞200米,然后落下来,通过激光捕捉空气振动,来还原谈话声。

但是,它不防风,也难以控制,所以从来没有实际用过。

2、荷兰的邮资代码

荷兰寄信不用邮票,而是用一种9个字母和数字组成的代码。

你花钱买一个代码,以 3 x 3 的格式写在信封上,就能代替邮票,作为付款证明。

因为代码的有效期只有五天(以邮戳为准),需要购买后及时寄出,被猜到的可能性很小。

文摘

1、没有编程生产力这样的东西

正如马丁·福勒(Martin Fowler)所观察到的那样,程序员的编程生产力无法有效地衡量,因为它不存在。

软件开发并不是一项必然会产生任何东西的活动。

假设你有两个开发人员在同一个项目上工作,并且偶然地,他俩在同一天接受了相同的任务。

甲写了一个1000行的框架,完美地解决了这个问题。代码编写良好,并经过充分测试,每一步都有详细记录。

乙则是当天去了公园,一边喂鸽子一边思考问题,然后漫步回到办公室,删除了100行代码,部署了更改......问题就解决了。

请问谁的生产力更高?

回答是,这不重要。重要的是乙解决了问题,同时降低了团队的长期维护成本。甲也解决了这个问题,但是他通过增加代码,增加了维护成本,因此(在其他条件相同的情况下)他的解决方案较差。

我们能说,乙具有更高的生产力吗?显然,很难找到编程生产力的正确衡量指标。

我认为,优秀的软件开发者所做的就是解决问题。但是,生产力的衡量指标,比如代码、文档、数据等等,都只是解决问题的工具,并不是解决问题本身。

言论

1、

我写 SQLite 的时候,从来没人教过我 B 树的知识。我需要自己实现 B 树,我就从书架取下高德纳的《计算机编程艺术》,找到了 B 树的章节。他描述了算法,我就照着实现。

有趣的是,高德纳详细介绍了搜索 B 树和插入 B 树的算法,没有提供从 B 树删除数据的算法,这是放在本章末尾的练习。所以我在实现自己的 B 树之前,还必须先做完该章的练习。谢谢高德纳,我真的很感激。

-- 理查德·希普《SQLite 不为人知的故事》

2、

瑞典南部的马尔默市,洗一次10分钟的淋浴,电费高达2.65欧元(约20元人民币)。原因是该市接入的是德国电网,德国能源短缺,推高了电价。

-- 《瑞典能源危机》

3、

职业生涯最重要的一课是,你需要认识到,你工作的目的不在于使得公司的客户满意,而在于使得那些控制你的加薪、奖金和晋升的人满意。

-- Hacker News 读者

4、

正在开发的水下无人机技术,会使得以航空母舰为中心的海军战略过时,从而大幅削减军事开支。

举例来说,美国开发的水下无人机 Orca XLUUV,可以携带8吨的有效载荷,行驶数千英里,并且不需要长时间浮出水面。

-- Hacker News 读者

5、

我第一次尝试 MidJourney(文生图工具)和 Suno(文生音乐工具)时,我想知道未来是否每个人都会成为数字艺术家。

很快,我就意识到我没有"创作冲动",即使看过很多别人的创作,我也常常不清楚自己想要创作的东西。

因此,未来的 AI 即使具备无比强大的绘画和编曲能力,还是只有少数人能成为画家和音乐家。程序员也是如此,即使 AI 会编程,也无法人人成为程序员。

-- 《Cursor 深度体验》

往年回顾

没有目的地,向前走(2023 #283)

生活就像一个鱼缸(2022 #233)

腾讯的员工退休福利(2021 #183)

贵州变瑞士,有没有可能?(2020 #133)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月20日

科技爱好者周刊(第 329 期):示意图利器 D2

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

哈尔滨冰雪大世界即将开园,工人正在松花江上采冰,每天需要开采近万块大冰块。(via

示意图利器 D2

制作示意图的工具有很多。

我喜欢使用基于文本代码的作图工具,来绘制线框图,比如 Mermaid、Plantuml、Graphviz。

它们都能根据代码,生成图片,非常适合放入代码仓库,进行版本管理。

最近,我发现了一个更易用的同类工具 D2,简单直观,功能强大,下面介绍给大家。

D2 可以命令行使用,也可以浏览器使用。假定你有一个图片代码文件example.d2,那么生成图片的命令如下。

$ d2 example.d2

大部分时候,我都通过浏览器使用它。它有一个线上生成器 play.d2lang.com(下图),把代码贴进去,按下"compile"按钮,马上生成图片。

想要 A 节点(节点的名称为 A),直接输入 A 就可以了。

A

A 只是节点名称,如果要定制节点的内容,就像下面这样写。

A: 甲

接着,添加一个节点。

A: 甲
B: 乙

把它们连起来。

A: 甲
B: 乙
A -> B

连接可以用正箭头(->)、也可以用反箭头(<-),甚至双向箭头(<->)。如果不需要箭头,就直接连线(--)。

箭头上还能添加文字。

A: 甲
B: 乙
A -> B: 连接

节点之间可以有多根连线。

A: 甲
B: 乙
A -> B: 请求
A <- B: 响应

节点的连接也可以写在一行。

甲 -> 丙 <- 乙: 连接

阶段一 -> 阶段二 -> 阶段三 -> 阶段四
阶段四 -> 阶段一: 反馈

这些语法就够画出基本的线框图了,是不是挺简单。

D2 可以绘制非常复杂的图,更多语法参考文档

最后提一下,如果想修改节点形状,方框改成圆形,就像下面这样写。

A: 甲
A.shape: circle

形状甚至可以改成一朵云,表示云服务。

A: 甲
A.shape: cloud

线条颜色也可以改。

A: 甲
A.style.stroke: red

[活动] AI 编程挑战赛

程序员同学看过来,全国性的 AI 编程大赛来了。

只要你善用 AI 编程,在 AI 的帮助之下,做出创新应用,或者快速解出算法题,就能参赛。

参赛不仅锻炼 AI 编程能力,还能丰富自己的经历,如果得奖,就能在简历上写一笔,帮助就业。

(1)比赛总奖池20万,一等奖的奖金4万元。学生和非学生分开评奖,获奖者还有 offer 机会,可以直通终面(包含实习岗与正式岗)。

(2)比赛分为算法和应用两个赛道,可以提交自己的创新应用,也可以选择完成算法题。

(3)大赛现在已经开始报名。创新应用在12月16日开放作品提交,算法比赛现在可以参加线上常规赛,决赛是线下举行的黑客马拉松。

(4)两个赛道的决赛阶段,都要求使用豆包 MarsCode 的 AI 编程能力,作为辅助工具。

本次 AI 编程巅峰挑战赛,由豆包MarsCode 和稀土掘金社区共同发起,面向全国程序员。大赛规则和报名入口,详见活动官网,也可扫描上方海报二维码,祝愿大家得奖。

科技动态

1、深湖冷却

加拿大最大城市多伦多,就在安大略湖旁边。安大略湖是一个很深的湖,最深处达到244米。

多伦多市正在建设一个非常酷的项目,使用安大略湖底的冷水,为城市提供冷却系统。

安大略湖底部的水温是很低的,该项目从水底85米处取水,即使盛夏,水温也只有4摄氏度。

这些水经过40公里的管道,进入市中心的热交换站,为城市带来天然的冷气。

2、自走桌

一位国外工程师,制作了一张会自己行走的桌子。

这张木头桌子有12条腿,每次可以同时移动三条腿,每条腿都用电机驱动。

桌子内部有无线接收器,用来接收遥控信号。远端计算机发出遥控命令,并计算出移动哪几条腿,每条腿移动的角度和幅度。

3、瘫痪网络的机器狗

很多犯罪分子都在屋外装了摄像头,监控室外的风吹草动。

美国国土安全部研发了一款机器狗,它的唯一作用就是瘫痪无线摄像头的通信。

这个机器狗配备了一个天线阵列,接近目标后,会侦测周围无线信号的频率和信道,然后发送大量干扰信号,使得网络堵塞,无法通信。

所有无线通信的智能家居设备,都会因此失效,包括摄像头。所以,重要地点的摄像头必须是有线的。

4、无豆咖啡

一些西方公司最近推出"无豆咖啡",就是不使用咖啡豆制作的咖啡。

它采用废弃的枣子或果核,提取生物质,然后添加提取自茶叶的咖啡因,使其具有咖啡的味道。

因此,它比较环保,可以减少食物垃圾,也不必破坏森林种植咖啡树。

据说,它的味道非常接近优质咖啡,普通人喝不出差异。只是成本不便宜,略高于传统的优质咖啡豆。

文章

1、CSS 重置(2024版)(英文)

作者提出,最新的 CSS 重置(CSS reset,即更改浏览器默认样式)只需要9条规则,每一条都详细解释。

2、Monokai 的历史(英文)

本文介绍流行的代码编辑器配色方案 Monokai 的诞生历史。

3、并发运行(Concurrency)和并行运行(Parallelism):以 JavaScript 为例(英文)

本文解释并发和并行的区别,然后给出 JavaScript 的示例。

4、直接链接网页的某段文本(英文)

浏览器现在支持,URL 直接链接到网页的某个文本片段(text fragment)(上图的高亮部分),本文介绍如何使用。

5、了解多重 DNS(英文)

多重 DNS 就是同一个域名有多个 DNS 解析记录,可用来均衡负载。作者就测试了,均衡负载是否真能生效。

6、感知器是什么(英文)

本文解释神经网络的基础概念"感知器"(Perceptron)。

工具

1、EasyTransfer

开源的文件传输工具,匿名加密,只需访问网页,即可连接到其他设备,基于 webRTC 和 Vue.js,访问试用网址。(@ch3ny4ng 投稿)

2、Screen Sharing

从浏览器分享你的屏幕给其他人,适合用来演示。(@markliuyuxiang 投稿)

3、PMAtron

将 phpMyAdmin 用 Electron 封装成跨平台桌面软件。(@MaskerPRC 投稿)

4、FastExcel

基于 Java 语言的 Excel 文件解析工具,可以用来提取数据。(@JerryFan626 投稿)

5、Readest

一款开源电子书阅读器,跨平台桌面应用,基于 Next.js 15和 Tauri v2。(@chrox 投稿)

6、IMG2AVIF

一个网页工具,将各种格式的图片转成 AVIF 格式。(@malagebidi 投稿)

7、YT Pics

一个 Web 应用,输入 YouTube 网址和指定时间,它会自动截取该时间的截图。

8、Web2pdf

一个命令行工具,将网页保存成 PDF 文件,有很多增强功能(自定义样式、生成目录等)。

9、CheerpJ

浏览器里面的 JVM 编译器,让 Java 程序可以在浏览器运行。

10、fuzzy-search

一个前端的模糊搜索库,支持东亚语言。

AI 相关

1、BabelDuck

基于 AI 的口语对话练习应用。(@Orenoid 投稿)

2、AIGIF

GIF 动图搜索,可对图片人物进行换脸。(@markliuyuxiang 投稿)

3、Imagenie

跨平台的桌面应用,使用 AI 在本地处理图片,比如人像修复、超分辨率放大、背景移除。(@zhongweili 投稿)

资源

1、启动过程:Android 与 Linux

这篇文章记录了 Linux 和 Android 各自的系统启动顺序。

2、深入高可用系统原理与设计

开源的中文电子书,梳理网络、云、容器、集群等知识。(@isno 投稿)

3、English News in Levels

英语新闻分级阅读网站,实时更新新闻,分为三种难度,有重点词汇、理解测试和朗读音频。(@meterscao 投稿)

4、GitHub Weekly

这个网站将周刊讨论区的投稿,转成新闻卡片形式呈现。(@inshub 投稿)

图片

1、密室照片

2010年,美国互联网上流传一组密室照片,看上去非常空旷神秘。

它们没有任何说明,不知道是在哪里拍的,也不知道是谁拍的。

这样反而激起了网友的兴趣:昏黄的灯光,陈旧潮湿的地毯,黄色的荧光灯和墙壁,无限的空房间,没有任何窗户,你被困在里面。

经过不断转发,这些照片逐渐成为美国互联网经久不衰的一个神话,成为了很多电影和游戏的灵感,比如《命运规划局》、《黑暗城市》、《异次元杀阵》。

最近,通过互联网档案馆(archive.org)的努力,现在终于查明,这组照片是一家家具店的二楼,当时正在进行翻新,一间间的小房间正是家具的陈列室。

文摘

1、大众审美

人们眼中的美和丑,其实都是受到社会的影响,很少有人拥有自己独立的审美标准。

1990年代初期,两位俄罗斯艺术家委托一家美国市场研究公司,进行市场调查,向1001位美国人询问下面的问题。

  • 你最喜欢的颜色是什么?
  • 你喜欢锐利的曲线还是柔和的曲线?
  • 你喜欢光滑的笔触还是厚重的笔触?
  • 你喜欢裸体还是穿着衣服的人物?
  • 你喜欢休闲的人物还是工作的人物?
  • 你喜欢室内场景还是室外场景?
  • 你喜欢什么样的风景?

调查完成后,两位艺术家根据大多数人的偏好,绘制一幅画。理论上,这幅画应该受到最多社会大众的喜爱。

后来,他们又在其他国家做这个调查,得到一个惊人的结果:每个国家的调查结果(即大众偏好),几乎都是一致的。

"人们想要的都是风景画,周围有几个人物,前景是动物,主要色调是蓝色。"

他们根据11个不同国家的调查结果,画出来的11幅画看上去几乎一样。

这证明了,全世界的大众审美正在趋同。从电影到时尚,从建筑到广告,全世界的人们喜欢差不多的东西,各国审美越来越接近,独特性越来越少。

举例来说,AirBnB 上面的公寓,不管是哪个国家,装潢风格很多都是雷同的,可以称为 AirBnB 美学:白墙、原木、胶囊咖啡机、扶手椅、裸砖、木搁板、灯泡。

这种 AirBnB 美学既有工业主义的粗犷原始,又有古典主义的优雅极简。

这种风格还影响到了咖啡店。

世界各地的咖啡店(包括餐厅),也慢慢变得相似:粗糙的木桌、宽大的窗户、朴素的吊灯。

总之,随着互联网连接全球,全世界正在形成统一的大众审美。以后,无论去到哪个国家,旅馆和咖啡店可能都是一样的装修。

言论

1、

我生活中一切顺利的事情都遵循相同的过程:

(1)我关注自己喜欢的​​事情。

(2)我找到多做这些事情的方法。

(3)我让有趣的人很容易发现我在做这些事情。

(4)我和他们一起出去玩,一起做项目。

-- 亨里克·卡尔森

2、

伟大的科学家是想法大胆的人,但是对自己的想法同时持有高度批判的态度。接受自己的猜想之前,他们首先会严厉尝试反驳它。

只有发现很难反驳成功时,他们才相信自己的想法是对的。

-- 卡尔·波普尔,科学哲学家

3、

作为一个至少用过十几种语言进行过商业开发的程序员,我完全不同意有人说,一种语言的编程速度优于另一种语言。

语言的编程速度因人而异,符合程序员的个人经历和思维习惯的语言,写起来最快。

-- Hacker News 读者

4、

我长期以来一直认为地球是一个"水星球",存在着大量的水覆盖星球。

直到我做了数学计算,才意识到地球实际上是太空中的一块湿岩石,更像是用喷雾器喷了十几次的保龄球。

-- Hacker News 读者

往年回顾

电动皮卡 Cybertruck 的 48V 供电(2023 #282)

好用的平面设计软件(2022 #232)

新人优惠的风险(2021 #182)

快能力和慢能力(2020 #132)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月13日

科技爱好者周刊(第 328 期):AI 模型不是一门好生意

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上海南站正在改造,车站的北半部在施工,南半部正常运营,中间用巨大的帘布隔开。

AI 模型不是一门好生意

微软的 Microsoft 365 最近涨价了,涨幅最高的地区为41%。

微软解释,涨价原因是多了 AI 助手 Copilot 的成本。中国大陆因为没有 Copilot,所以不涨价。

无独有偶,OpenAI 也说要涨价,涨幅更夸张。新模型的订阅费可能从现在的每月20美元,涨到每月2000美元

(最新消息是,昨晚发布的 ChatGPT Pro 已经上涨到每月200美元。)

这两条新闻证明了一件事:AI 模型太烧钱,即使世界最有钱的公司都承受不起,只能大幅涨价。

不止微软和 OpenAI,所有经营 AI 模型的公司其实日子都不好过,目前都是亏本卖 AI 服务,争夺市场占有率。

这种运营压力恐怕将长期存在,因为以下的原因,注定了 AI 模型不是一门好生意。

(1)AI 模型需要投入大量资金

OpenAI 每年的运行经费据报道是70亿美元,Anthropic 今年预计支出27亿美元,Facebook 向 AI 部门最近增加了数十亿美元的投入。

这么高的投入,要有上亿的付费用户,才可能获利,谈何容易。

(2)模型成本没有规模经济

绝大多数行业,规模越大,单位成本越低。但是,AI 模型正好相反,模型越大,单位成本可能更贵。

因为随着模型变大,进一步改进可能更加困难,训练新模型所需的计算量也在增加。这就像攀登珠穆朗玛峰,到了8000米以后,每一步都越发艰难。2024年训练一个顶级模型,要比2023年训练顶级模型,计算量更大更贵。

偏偏 AI 模型的效果与规模有关,规模和计算量越大、模型效果越好。因此,大模型公司的运营费用无法下降,只会变大。

(3)AI 模型快速贬值

AI 模型公司为了市场份额和投资回报,必须不断推出更好、更快、更强的新模型。

如果行业不断推出新模型,那么旧模型就会快速贬值。当你可以使用 GPT-4 时,还会有人想使用 GPT-3 吗?如果竞争对手推出了更好的模型,还会有人用你的模型吗?

为了始终在市场占有一席之地,你必须始终是市场最好的 AI 模型之一。这意味着,你的投入始终无法减少。

即使由于接近了技术极限,AI 行业无法继续推出更强的新模型,旧模型依然会快速贬值。因为市场上存在开源模型,比如 Llama 和 Mistral,如果商业模型停止进步,开源模型就将迅速缩小差距,那么旧的商业模型也就不值钱了。

举例来说,Anthropic 公司历史上开发过十个模型,为此陷入严重亏损。其中八个模型现在已经毫无价值,第九个模型是开源的,第十个模型让它现在能保持微弱的技术优势和市场活力。

它只有继续开发第十一个模型,才有可能在未来生存下去。

(4)AI 模型公司无法保持垄断优势

OpenAI 是目前的市场领先者,它的优势建立在大量计算的基础上。这些计算所需的物理资源,都是租用云服务商的设备,而不是自家的。只要有足够的钱,任何人都可以使用相同的资源。不难想象一小群高级工程师离开 OpenAI,筹集大量资金,租用计算资源,在几个月内就能对 OpenAI 的核心业务构成威胁。

换句话说,云服务商花费数十亿美元建设的数据中心是一种护城河,OpenAI 花费数十亿美元构建的 GPT 早期版本(比如 GPT-2 和 GPT-3)不是护城河,因为现在有更好的模型已经在 Github 上免费提供。

大模型公司搭建自己的机房,也无济于事。因为对手可以租用云服务商的机房,投入更少,效果是一样的。

综上所述,AI 模型似乎是一个可怕的行业:每年必须不断地巨额投资,应对持续上升的模型成本,以及当前模型一两年后就会被淘汰的竞争压力。你也没有防止竞争对手的有效手段,你最好的员工可能会离开,你的技术专长很难成为持久的优势。

所以,那些还在考虑推出 AI 模型的商业公司,进入这个行业之前,需要三思。

至于已经走上这条路、现在正运营 AI 模型的公司,由于模型如此烧钱,筹集最多资金的公司会赢(活得最久),所以当务之急应该是尽可能多、尽可能快地筹集资金。

此外,应对之策还包括,让你的模型差异化,以便留住用户。比如,记住用户的个人数据,可能是一种对策。模型应该可以记住用户的问题,从而更好地了解用户。用户使用它越多,就越难切换,因为它知道所有你的历史、你提出的问题、你关心的事情。

豆包 MarsCode 系列活动

豆包 MarsCode 是专业的大模型编程助手,字节旗下的产品。

它与稀土掘金技术社区(juejin.cn)合作,本月14日在深圳,19日在上海,将举行两场系列活动,让更多同学一起参与进来,探索 AI 编程的潜力。

(1)12月14日,深圳将举办"豆包 MarsCode 动手实验室",让大家亲手参与 AI 编程。

参与者以"队"为单位(最多三人,也可单人成队),现场直接用 AI 编程,完成一个小游戏。豆包 MarsCode 的同学会当场指导,与大家深度交流,并评出优胜作品。

通过现场 AI 技术交流实践,大家可以看看创意怎样通过 AI 快速落地

点击这里,或者扫描上方海报二维码,了解详情并报名。

(2)12月19日,上海举行豆包 MarsCode 编程挑战赛。参赛者借助 AI,在规定时间内完成4道算法题。

这可以作为面试练习,如果获奖还可以当作个人资历。点击这里了解详情并报名参赛。

科技动态

1、树莓派掌上电脑

一支国外团队推出了"树莓派掌上电脑",看上去很酷。

它就是一个全功能的 Linux 系统,带有7小时续航。

它还有一个可组装版本,屏幕是单独分离的。

下面可以配上键盘,也可以配上手柄。

它是开源的,制作团队希望将成本控制在250美元。

2、超声波洗澡机

1970年的大阪世博会,三洋公司展出了一台超声波洗澡机。

人坐进去,头露在外面,机器里面是水。

按下按钮,机器就会释放出超声波,通过震动达到清洁的目的。

它与现在市场上的"超声波清洁机"的原理是一样的,只不过它用来给人洗澡。

这台机器从未投入生产。明年2025年,大阪将再次举办世博会,一家公司重新生产了这台机器,专门用于医疗保健领域。

3、升缩鞋

青少年的鞋子往往只能穿一年,然后就穿不下了。

一家美国公司设计了升缩鞋,鞋会跟着脚一起长。

它的做法就是把鞋底分成两块,中间使用弹性材料连接。

如果脚变大了,鞋也会随之被撑开。

为了穿着舒适,鞋面也采用升缩材料,编织成袜子状的网眼结构,穿进去也比较容易。

这种鞋的另一个好处,就是不用区分脚码,一双鞋适合多个脚码。

4、其他

(1)三星工程师做出了一个"拍照机器人",只要你告诉它想拍什么样的照片,它就会自动摆出最佳姿势,为你拍照。

文章

1、我们为什么转向 Astro(英文)

作者原来使用 Next.js 框架,因为受不了 React 和 Next.js 的种种问题(主要是复杂性),转向了 Astro 框架,本文是使用感受。

2、Phoenix LiveView 1.0.0 发布了(英文)

Phoenix LiveView 是 Elixir 语言的 Web 开发框架,(目标是)用更简单的模型,实现 React 框架的所有功能,同时还支持高并发。本文是它的介绍。

3、我如何用机上 WiFi 获知飞机方位(英文)

作者乘坐飞机时,利用航空公司的服务器,绘出了当前飞机的飞行路线。

4、如何用 Cloudflare 重定向 URL(英文)

作者的个人网站更换了域名,他就用 Cloudflare 将旧网址重定向到新网址,完全免费。

5、不要用 SQL 的 count(*) 语句与 0 比较(英文)

一篇 SQL 科普文章,不要用 count(*) 等于 0,来判断不存在符合条件的记录。

6、如何用手机远程解锁 Windows(英文)

Windows 11 有一项功能,允许你用手机的指纹识别或人脸识别,解锁 Windows。

7、如何用 Docker Compose 安装 phpMyAdmin(英文)

一篇初学者教程,关于怎么用 Docker Compose 在本机架设数据库应用。

工具

1、Bananas

一款跨平台的桌面应用,利用点对点连接与其他人共享您的屏幕,无需帐户或任何服务器(初始连接除外)。

2、jsontr.ee

一个 JS 网页库,将 JSON 数据转成可视化的树状图。

3、WatchAlert

开源的轻量级监控告警系统,基于 Go + React。(@Cairry 投稿)

4、Easy Resizer

一个在线工具,批量调整图片的大小。(@mywebtools 投稿)

5、IconEase

开源的跨平台桌面应用,用来管理本地的图标文件。(@JiuRanYa 投稿)

6、X.Ryder

一套网站后台的 UI 开发模板。(@pipijoe 投稿)

7、Peninsula

基于 macOS 刘海的窗口管理器和消息中心。(@Celve 投稿)

8、Summary Cat

用户提交一个 YouTube 视频网址,它会用文字总结出该视频的内容。

9、ubicloud

一个可以自己搭建的云环境,能够直接运行 GitHub Actions 脚本。

10、matcha.css

一个加强浏览器的网页默认样式的 CSS 库。

AI 相关

1、Bylo.ai

免费的 AI 图像生成网站。(@aaamomo64 投稿)

2、Color Diffusion

一个开源的 Python 程序,使用 Diffusion 模式对黑白照片上色。

3、AI 聚合搜索引擎

该网站聚合多个 AI 搜索引擎入口,可以切换不同的搜索引擎进行搜索。(@ovelv 投稿)

资源

1、Hi Speaking

一个英语跟读网站,你按照课本读一句,它会自动播放下一句,省去了手动点击。(@jiweiyuan 投稿)

2、In Pieces - 30 endangered Species

一个很有创意的网站,用30个碎片拼出30种濒危动物,只使用 CSS。

3、数据可视化目录

这个网站按照用途,将数据可视化分类,便于查找你需要的图表类型。

图片

1、乐高面板

乐高积木可以搭建各种机器和宇宙飞船,所以有很多控制台单元,使用了各种各样的设计。

从中可以学习,怎样的控制台设计才是好的。

下面是一些糟糕的设计,你根本分不清,什么操作用什么按钮。

如果将功能相近的按钮,分成几个区块,辨识度就会大幅提高。

上图中,最右边的设计辨识度最好。

下面三个控制台最简单干净,带有可视化元素,属于最好的设计。

2、为什么老照片的人们不微笑?

19世纪末和20世纪初的老照片,人们的表情往往很严肃,即使微笑,也非常轻微。

一个主要原因是,那时的照相机需要长时间曝光,人们必须静坐好几分钟才能拍照。

微笑是一种快速反应,而不是一种持续的表情状态。当你必须静止几分钟才能拍照时,你根本不可能保持微笑那么久。

文摘

1、10亿次心跳

哺乳动物随着体型变大,心跳逐渐放慢,这是为什么?

比如,仓鼠的心跳是每分钟450次,猫是150次,猪是70次,大象是30次,鲸是20次。

原因可以这样理解,假定猫的体积是仓鼠的10倍,那么猫的新陈代谢率(它燃烧能量的强度)也应该是仓鼠的10倍,毕竟猫有10倍的细胞在消耗能量。

但是这不可能,如果真的这样,猫就会因为体温过高而死亡。因为新陈代谢会产生热量,需要散热,但是猫的表面积并没有仓鼠的10倍,必定有一部分热量无法散发出去,导致体温过高。

为什么猫的表面积没有仓鼠的10倍?

中学数学告诉我们,表面积增长的速度,慢于体积增长的速度。举例来说,如果球体的体积增长一倍,变成原来的两倍,表面积只是原来的1.59倍。

既然无法散发所有的热量,所以大型动物的新陈代谢必然慢于小型动物。相应的表现就是心跳放慢,降低新陈代谢的强度。

这就是为什么体型越大,心跳越慢。

动物学家还发现一个有趣的现象,哺乳动物不管体型大小,一生的总心跳大概在10亿次左右。

仓鼠的寿命是3年,猫是15年,猪是25年,大象是70年,鲸是80年。

结合它们的心率,不难算出,仓鼠一生的总心跳是7.1亿次,猫是11.8亿次,猪是9.2亿次,大象是11亿次,鲸是8.4亿次。

这些动物的总心跳都在10亿次左右。

奇怪的是,人类不符合这条规律。人每分钟心跳60次,平均寿命70年,总心跳是22.1亿次。

言论

1、

萨尔瓦多政府将比特币作为国家储备,目前拥有5,940个比特币,价值5.82亿美元。

但是,他们怎么保管钱包的密钥呢?万一密钥泄漏,国家岂不是破产了。

-- Hacker News 读者

2、

19世纪的德国哲学家尼采,以前的写作风格是不断的长句,复杂的推理和解释。

后来,他用上了打字机,写作风格逐渐从长篇论证变成短篇的格言警句,变得像电报那样。

-- 《打字机如何改变尼采》

3、

内部平台效应(inner-platform effect)指的是,程序员倾向于创建一个可定制的内部系统,成为他们正在使用的外部软件的复制品,而且通常是一个糟糕的复制品。

-- 维基百科

4、

我爱那些渴望不可能的人。

---- 歌德

5、

我通常不愿意对技术做出预测,但我感到相当有信心的是,因为 AI 如此善于写文章,几十年后懂得如何写文章的人一定不会很多。

-- 保罗·格拉汉姆,硅谷创业导师

往年回顾

新基建的政策选择(2023 #281)

互联网公司需要多少员工?(2022 #231)

移动支付应该怎么设计?(2021 #181)

你的头脑是二值逻辑,还是三值逻辑?(2020 #131)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月 6日

AI 应用无代码开发教程:工作流模式详解

一、引言

一个月前,我写了一篇《AI 开发的捷径:工作流模式》,引起了很多读者的兴趣。

大家都认同,AI 应用是开发者的机会,而图形化、低代码/无代码、不需要编程基础的"工作流模式",正是 AI 应用开发的入门捷径。

但是,我的那篇文章只介绍概念,没有操作步骤。很多读者实际上手时,遇到了困难,有些地方不理解,做不下去。

今天就是后续,我详细演示,一步步图解,没有编程基础,如何搭建一个最简单的 AI 应用。只要你跟着做,就能做出来。

二、开发工具

这篇教程使用的开发工具是扣子(Coze),所有操作都在它的浏览器 IDE(集成开发环境)中完成,

选择扣子(Coze),主要原因有三个。

(1)它是国产的 AI 应用开发平台,字节跳动的产品,界面、文档、客服都是中文。

(2)它有无代码编辑器 Project IDE,包含组件拖拽的 UIBuilder,可以生成全功能的前端界面,上手门槛相对低。

同时,它也提供后端数据库,可以数据读写。

(3)它免费使用(只要不超过使用额度),发布上线也不收费,适合新手练习。

三、示例项目

我们的示例项目,是一个最简单的"AI 文言文生成器"。

大家先看成品,可以点进去试用。(建议 PC 访问,UI 还没有适配手机。)

输入一段汉语白话文,点击按钮,AI 就会自动生成文言文。

架构上,它非常简单:前端是一个网页表单,将用户的输入发送给后端的 AI 模型,并展示后端的返回结果。

它的开发只需要两步,第一步先让后端的 AI 模型跑起来,第二步做一个网页,连接后端即可。

扣子的方便之处在于,前后端的生成都是图形化操作:后端是编排工作流的节点,前端是 UIBuilder 的界面拖拽组件。

下面就是开发步骤。为了保证大家跟得上,我写得比较详细,看起来有点长,但是实际操作是很快的,熟练的话,10分钟就能完成。

四、创建项目

首先是开发的准备工作,先创建 AI 应用。

(1)访问扣子官网,点击右上角的"基础版登录"。(基础版只比专业版少一些企业级功能,普通用户完全够用。)

(2)登录后,自动跳转到个人主页,点击左侧菜单的"工作空间"。

工作空间里面,有"项目开发"和"资源库"两个页面。进入"项目开发",可以看到你所有的项目。

(3)点击右上角的"创建"按钮,跳出一个弹框。

上面有两个选项,"创建智能体"是创建一个传统的 AI 聊天,"创建应用"则是创建一个自定义界面的 AI 应用。

(4)选择"创建应用",这时会让你选择应用模版,点击"创建空白应用"。

接着,输入项目的名称,这里是"AI 文言生成器"。

至此,项目创建完毕,系统会自动进入"AI 文言生成器"的应用主页(下图),正式的开发工作就要开始了。

五、业务逻辑

应用主页的最上方,有"业务逻辑"和"用户界面"两个分页,默认是"业务逻辑"页面。

这一节就讲解如何创建业务逻辑,也就是后端的 AI 模型。

我们采用工作流模式,即将业务逻辑编排成一个个节点。

(1)点击左侧菜单的"工作流"后面的"+"号,选择"新建工作流"。

输入工作流的名称和描述。(注意,名称只能是英文字母、数字和下划线,本例是 classicalchinesecreator。)

(2)工作流创建成功后,名称会出现在左侧菜单的"工作流"标签下方。点击它,就进入该工作流的"节点编排"画布。

画布上,默认有"开始"和"结束"两个节点。

(3)点击下方的"添加节点",添加一个新节点,类型设为"大模型"。

然后,将这三个节点连起来(通过拖动边框上的控制点)。

(4)配置"开始"节点。双击该节点,在配置框增加一个 content 变量,表示用户的输入内容。

(5)配置"大模型"节点。

配置窗口的各个选项,填写如下。

模型:可以按自己的需要选择,这里保持默认值"豆包 Function call 模型"。

输入:将原来的 input 参数改名为 content,并跟"开始节点"的 content 变量连接起来。

系统提示词:输入以下内容,用来设定大模型的行为。

角色

你是一个专业的汉语文言文作者,能够准确地将用户输入的汉语白话文内容改写为文言文,不进行随意扩写。

技能

技能 1:文言文写作

  1. 当用户提供一段汉语白话文时,迅速将其改写成文言文。
  2. 确保改写后的文言文的准确性和完整性。

限制:

  • 只进行文言文改写,不回答与文言文改写无关的问题。
  • 严格按照用户提供的汉语白话文进行改写,不得擅自增加内容。

用户提示词:输入以下内容,作为给系统的直接命令。

将用户输入的汉语白话文{{content}}改写成文言文。

上面文本中的{{content}},表示此处系统将插入 content 变量的内容。

输出:将输出格式改为"文本"。

(6)配置"结束"节点。首先点击配置框上部的"返回文本"。

输出变量:将 output 参数关联"大模型"节点的 output 变量。

回答内容:输入{{output}}(表示插入 output 变量的内容),并打开"流式输出"(即打字机效果)。

至此,整个工作流的搭建全部完成,可以单击画布右上角绿色的"试运行"按钮,测试工作流是否正常运行。

在 content 输入框,输入测试内容,比如"今天天气很好"。

然后,点击下方的运行按钮,就可以得到运行结果(今日,天善)。

如果一切正常,就可以开始搭建用户界面。

六、用户界面的搭建:页面布局

(1)点击进入画布上方的"用户界面"分页。

(2)在左侧菜单的组件面板,找到布局组件 > 容器组件,将其拖入中间的画布,作为页面的标题区域。

系统自动将这个容器命名为 Div1,双击进行配置。

尺寸:宽度为100%,高度为 60px。

布局:排列方向为"横向"。

样式:去除背景色,将边框设为灰色(#E2E8F0)。

(3)在 Div1 下方,再拖入一个容器组件,系统自动命名为 Div2,用作功能区域。

配置基本一样:尺寸部分,宽度和高度都设为填充容器;布局部分,排列方向为横向;样式部分,去除背景色。

(4)在 Div2 内部的左侧部分,拖入一个容器组件 Div3,用作用户输入区域。

宽度设为50%,高度设为 550px,样式删除背景色。

(5)在 Div2 内部的右侧部分,拖入一个容器组件 Div4,用作展示结果区域。

宽度设为50%,高度设为 550px,样式删除背景色。

至此,页面布局如下图。

七、用户界面的搭建:页面细化

做好布局后,下一步完善页面细节。

(1)在 Div1 内部,拖入推荐组件 > 文本组件,作为标题文本。

标题内容设为"AI 文言文生成器",字号改成24,字重为粗体。

(2)在 Div3 中拖入一个表单组件,删除不需要的元素,只剩下文本输入框和按钮。

表单组件:宽度和高度都设为填充容器,并删除边框。

文本输入框:拉伸高度,宽度设为填充容器,标签和占位文案设为"输入汉语白话文"。

按钮:文本改为"生成文言文"。

完成后的表单效果如下图。

(3)在 Div4 中拖入一个展示组件 > Markdown 组件,作为展示文言文区域。

删除 Markdown 组件的已有内容,改成"###### 生成结果"。高度和宽度改为填充容器,圆角设为10,内边距设为20,边框设为灰色(#CBD5E1)。

至此,页面细化完成,单击属性面板上方的预览,查看效果。

八、用户界面的搭建:配置事件

页面外观做完后,要配置事件,将后端的业务逻辑与用户界面连接起来。

(1)点击"生成文言文"按钮,在配置面板切换到"事件",点击"新建"。

事件类型设为"点击时",执行动作设为"调用 Workflow",workflow 设为已经创建好的"classicalchinesecreator",并将工作流的入参content设为文本输入框的值 {{ Textarea1.value }}。

(2)配置生成结果区域,展示工作流的返回结果。

选中 Markdown 组件,点击"内容"栏的扩展按钮。

扩展面板中,在###### 生成结果后面添加一行,插入工作流的返回结果{{ classical_chinese_creator.data }}

完成所有配置后,单击右上角"预览"按钮,测试整体效果。

如果一切正常,这个 AI 应用就算开发完成了。

九、应用发布

开发完成后,就可以发布该应用,让其他人也可以使用。

点击右上角"发布"按钮,版本号设为 v0.0.1,发布平台设为发布到扣子商店。

至此大功告成,"AI 文言生成器"就登录扣子商店,向世界公开了。

十、总结

大家可以根据这个示例,改变输入 AI 模型的提示,让它做不同的任务,就能变化出很多不同功能的应用。

比如,官方的"AI 翻译"示例,就是让 AI 把用户输入的中文译成其他语言,跟"AI 文言文生成器"异曲同工。

除了文本生成,扣子还提供许多其他能力,比如抓取外部数据、数据库读写等,从而可以做出更强大的 AI 应用。

总之,"工作流模式"使用图形化界面搭建一个 AI 应用,简单而便捷,随时查看效果,一键发布,值得大家尝试。

(此处有分割线。)

最后是一个活动预告。

扣子邀请我,参加12月19日在上海举行的"扣子开发者日",也欢迎大家参加。

届时,字节的 AI 工程师会跟大家面对面交流,如何开发和推广 AI 应用。这是很好的学习交流、获取资源的机会,点击这里了解详情。

扫描下方海报二​维码,或者点击链接现在就可以线下报名参加,或者线上预约直播

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月 2日

科技爱好者周刊(第 327 期):没有链接的互联网

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

杭州钱江世纪城东部的一大片农田,号称"稻田 CBD",最近迎来了丰收。该农地被政府保留,让城市与田园融合。(via

没有链接的互联网

你能想象吗,没有链接的互联网是什么样?

不用想了,这正在变成现实。

2017年,脸书(Facebook)出台了一项政策:只要帖子里面有(外部)链接,就会减少这个帖子的曝光。

也就是说,只要你贴了链接,别人就(几乎)看不见你的帖子了。这样做是为了防止用户跳出脸书,也为了防止用户为其他网站引流。

所以,你现在访问脸书,就会看到一种奇特的做法:大家发帖都没有链接,有些帖子甚至只是一句话的图片(下图),真正的链接放在帖子的置顶评论里面。

后来,其他的互联网平台纷纷跟进,限制链接。

最典型的就是推特,它不断增加防止用户跳出的措施。先是推出"话题"功能(thread),后又解除字数限制,允许发布长文,尽量消除用户张贴链接的动机。最近,它将链接自动转成预览图时,甚至会隐藏页面标题,让用户察觉不到这是一个链接。

就连谷歌这种搜索引擎,也在防止用户跳出。搜索时,谷歌会直接显示一段 AI 生成的内容总结(下图),避免你去点击外部链接。

国内平台也是如此,有过之而无不及,比如微信、抖音,都严格限制外部链接。

总之,大型互联网平台都在排斥链接。它们的共识就是,必须把用户留在自己的花园,防止他们离开。

这种情况,将来恐怕愈演愈烈。因为 AI 可以实时生成内容,更没有必要让用户访问外部内容了。

没有链接可点击,这将彻底改变互联网生态。我看到一篇文章,列出这种趋势的七大后果,总结得很好。

(1)独立网站会消失,因为没有流量来源了。所有人都依赖大平台,只能在平台上发布内容,否则没人能看到。

(2)数字出版行业终结,因为不需要单独的出版环节了,直接发布到大平台就可以了。

(3)域名不再具有价值,因为小网站不管采用什么域名,都没有访客。大多数域名注册商会关门。

(4)网络托管业务将会收缩,因为网站数量将减少,个人架设网站的需求越来越少。

(5)独立的互联网广告业也会消失。所有的互联网广告,都将由平台控制,独立的广告联盟一钱不值。小网站也不可能通过互联网广告赚到钱。

(6)SEO 无用了。小网站没有流量了,优化搜索引擎的排名有何意义呢?

(7)信息表面化。因为用户不太可能在平台上贡献深层次的详细内容,所以平台提供的大多是表面信息,能够帮助用户的深层次的内容将难找到。

[本周软件] 扣子 Project IDE

如果你还不知道扣子(Coze),我简单说一下。它是字节旗下的 AI 应用开发平台,帮助用户开发各种基于 AI 模型的应用软件

要是你有 AI 相关的创意,但不知道怎么做成软件,就可以用它:图形化界面,低代码操作,没有编程经验的人也能使用。

昨天,它发了一个大更新,推出了全新的浏览器编程界面 Project IDE(下图)。

用户点击"创建"按钮后,选择"创建应用",就可以进入。页面上提供多个 UI 组件,只要拖拽就能生成前端界面(UBuilder),并且适配移动端。

同时,它还简化了后端数据库的读写 也就是说,你只需要在浏览器里面点击,就能生成完整的前端 + 后端的 AI 应用

完成后,可以立即上线运行,发布在扣子、微信、抖音等多种平台,也可以 API 调用。

想用 AI 模型开发的同学,不妨试试它,完全免费(不超出使用量额度)。

另外,"扣子开发者日"的线下活动,12月19日在上海举办,字节的 AI 工程师会跟大家面对面交流,如何开发 AI 应用。扫描下方海报二​维码,现在就线下报名参加/线上预约直播

科技动态

1、露西50周年

50年前的1974年,美国人类学家在埃塞俄比亚的偏远地区,发现了一具320万年前的南方古猿化石,取名为"露西"。

她的身形跟一个四岁女孩差不多,后来被确认为目前发现的最古老的人类祖先化石。有人称她为"人类的祖母"。

在发现她之前,科学家认为,人类是先进化出大脑,再直立行走。但是,露西的大脑很小,却是直立行走的,因此人类是先直立行走,再进化出大脑。

2、鲨鱼皮飞机膜

曾经有一种鲨鱼皮泳衣,模仿鲨鱼的皮肤特征,可以大大减少水的阻力,从而提高游泳速度。

因为这种泳衣的作用太明显,国际泳联不得不在2010年禁止在比赛中使用它。

现在,有人想到一个点子,如果把这种鲨鱼皮做成膜,贴在飞机表面,不就能大幅降低空气阻力了吗?

瑞士航空采纳了这个点子,在他们的12架波音777上,全部贴上鲨鱼皮飞机膜。上图的飞机表面反光处,就是贴了膜。

他们现在宣布,经过一年的尝试,取得了良好效果,去年节省了近2,200吨煤油。

这种鲨鱼皮的膜并不完全光滑,有特定的凹槽,符合流体力学特征,有利于减少表面与空气的摩擦。

以后,飞机可能跟手机一样,使用之前都要贴膜。

3、宽带的标准是多少?

现在上网,全部都是宽带。但是,宽带到底需要多宽,却有着不一样的说法。

以前的资料说,带宽 512kbps 以上就是宽带。这也未免太窄了,最高下载速度只有 64KB/s,下载一个 100MB 的文件,超过26分钟。这算什么宽带?

美国联邦通信委员会 FCC,今年提高了宽带的标准,下行速度从 25Mbps 提高到 100Mbps,上行速度从 3Mbps 提高 20Mbps。

也就是说,百兆是宽带的最低速度,低于100Mbps 就不叫宽带了。

4、其他

(1)微软的在线会议软件 Teams,允许用户克隆自己的声音,以便用另一种语言跟其他国家的人交谈。

(2)Starlink 宣布,明年推出手机卫星上网,但需要手机直连天空,也就是不能室内使用。

(3)新加坡为了节约淡水资源,推出用净化的污水生产的啤酒

文章

1、iTerm2 如何设置状态栏(英文)

iTerm2 是 Mac 电脑的终端模拟器,它有一个内置的状态栏,本文教你怎么设置。

2、我用投影仪当作显示器(英文)

作者的家庭办公室,使用投影仪当作显示器,如果你也想这么做,可以参考本文。

3、家庭机房的搭建感受(英文)

作者介绍搭建家庭机房的六点感受,其中一点是电费很贵。

4、浏览器的数据存储方法比较(英文)

本文介绍浏览器现在的几种数据存储方法: LocalStorage、IndexedDB、Cookies、OPFS、WASM-SQLite。

5、Bluesky 可以托管网站(英文)

Bluesky 是一个类似推特的微型博客服务,但使用开放协议。该协议允许上传和直接返回文件,因此可以用它托管网站。

6、Jest 与 Vitest(英文)

Jest 和 Vitest 是两个流行的 JS/TS 测试框架,本文对它们进行比较。

工具

1、Graphite

一款在线版的图像编辑器,代码开源。

2、Gimel Studio

平面图像编辑软件,最大特点是每一个编辑步骤都用一个节点表示,让你直观地编辑每个节点的参数。

3、Karpor

开源的 Kubernetes 可视化工具,提供搜索、洞察、AI 等能力。(@elliotxx 投稿)

4、dmMiniPlayer

开源的浏览器插件,在视频播放的画中画窗口里,配置进度条、音量等功能。(@apades 投稿)

5、四象限编辑器

开源的在线工具,在网页上编辑、生成四象限图,可用于插图、PPT 等。(@KwokKwok 投稿)

6、Git Stats

VS Code 插件,可视化查看团队成员的代码提交情况。(@lixianmin 投稿)

7、Bootstrap React Logic

基于 BootStrap 封装的 React 组件库。(@dafengzhen 投稿)

8、rmtrash

macOS 命令行工具 rm 的替代方案,用于将文件移动到废纸篓。(@TBXark 投稿)

9、mpv

一个命令行的视频播放器,跨平台。

10、Animate.css

一个网页动画的 CSS 库,指定 DOM 元素的类名,产生动画效果。

AI 相关

1、Lobe Chat

开源的 AI Chat 工具,支持几乎所有 AI 大模型。(@tcmonster 投稿)

2、AI git commit

一个 Jetbrains 插件,使用 AI 生成 git 的提交信息。(@HMYDK 投稿)

3、UICloner Extension

浏览器插件,一键克隆任意网页 UI 组件,生成代码。(@AndySpider 投稿)

4、MagicMirror

一个开源的桌面应用,一键 AI 换脸、换发型和穿搭。(@idootop 投稿)

资源

1、GitHub Insights Pro

GitHub 的数据分析与可视化平台,提供项目和用户的各种统计信息,以及排行榜和趋势榜。(@wincatcher 投稿)

另有一个同类项目 GitHub Persona。(@Ray-D-Song 投稿)

2、Visual Sorting

各种排序算法的可视化演示,代码开源。

3、看见概率论

一个中文的数学教育网站,通过交互式可视化演示,讲解概率论知识。(@wincatcher 投稿)

图片

1、比亚迪的厂房

下图是比亚迪的郑州工厂与特斯拉的得州工厂的大小对比。

左边的白色厂房群是比亚迪郑州工厂,宽度约为3.2公里。

右边是同样比例尺的特斯拉得州工厂。

2、发向 M13 星团的消息

1973年11月16日,美国科学家通过波多黎各的阿雷西博望远镜,向 M13 星团发出一条二进制消息。

这条二进制消息,解码后是一个长条的图形,包含了很多内容:人类长什么样、哪些化学元素和生物分子构成了人类的 DNA,太阳系的行星系统、1974年人口数量等等。

该消息将在大约25000年后,到达 M13 星团。

文摘

1、高效率时段

一天24小时,你无法每时每刻都保持专注。

一个人每天的高效率时段,只能持续一会,然后就会消失,无法再恢复。

所以,如果某个时候,你不能保持专注了,那就不要再反复尝试,接受这个事实,转而去做一些更简单、不需要那么专注的事情。

亚马逊创始人杰夫·贝佐斯,就曾经说过:"我喜欢上午10点举行重要会议。如果到了下午五点,我的脑子就什么也想不了,只能把事情推迟到第二天上午10点。"

所以,你最好的选择就是,每天尽早完成尽可能多的工作。这段时间要限制外界的干扰,多做困难的事情,直到你感到疲劳为止。

当你觉得疲劳、无法保持专注了,那就不要抵抗它,把还没做完的事情推迟到第二天,转向更简单的任务,或者干脆什么也不做了。

有些人为了专注工作,会每天早起。我的一个朋友则是习惯在晚上11点到凌晨4点,全力工作。

他们都会避开白天的高峰时段:炎热的天气,每个人都在忙,消息满天飞。即使你的能力再强,此时都无法逃脱外界的干扰。

请记住,每天你一醒来,时间就在一分一秒流逝,你不知道自己的精力能维持多久。你需要做的,就是问自己:在你无法保持专注之前,能做多少事情?

言论

1、

几年前,马斯克宣布 Starship 飞船的火星计划时,我开玩笑说,等到它把人类送上火星时,英国还没有开通前往曼彻斯特的高铁。

不幸一语成谶,英国首相今年早些时候宣布,取消曼彻斯特的高铁计划。

-- 彼得·黑格,英国天文学家

2、

SUSE 公司的 Linux 企业级发行版,在2019年推出时,承诺对这个版本提供支持直到2038年。

为什么支持期长达19年,而不是18年或20年?原因是 Unix 时间原点是1970年1月1日零点,32位系统会在2038年发生时间溢出。所以,他们就支持到2038年,时间溢出就不用管了。

-- 《SUSE 为什么有19年支持期》

3、

为什么法律的语言这么难懂?一种解释是,这类似于咒语,古代的咒语也非常难懂,跟日常语言截然不同,这样象征着一种特殊的权威。

-- 《为什么法律以难以理解的方式书写?》

4、

我非常不喜欢,电视播放交响音乐演奏会。交响音乐会本质上是声学体验,但是电视使得人们的注意力转移到画面,变成了视觉体验。

这对音乐不利,音乐的存在是为了听而不是为了看。

-- 《电视交响音乐毫无意义》

5、

斐波那契数列有一个有趣的特性,连续的两个数(比如,5和8,21和34)是英里和公里的关系,比如5英里约等于8公里。

-- 《斐波那契数转换英里与公里》

往年回顾

机器点餐与宅文化(2023 #280)

电子产品的用电量(2022 #230)

你想住在中国哪里?(2021 #180)

低龄化的互联网(2020 #130)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月29日

科技爱好者周刊(第 326 期):世界没有那么多财富

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

内蒙古库布其沙漠的光伏基地,一望无际的光伏发电板铺设在沙漠之中。(via

世界没有那么多财富

维基百科有一个页面"人均财富排名"。

它列出了不同国家/地区的人均财富,可以用来比较生活水平:人均财富越多,生活水平越高

需要注意的是,它比的是财富,不是收入。

财富的范围更广泛,除了收入,还包括其他资产(比如房产、股票、汽车等等)。财富的计算公式是,你的资产减去你的负债

财富 = 资产 - 负债

这个页面提供了很多统计数据,我分享其中一些。

(1)2022年底,全世界的总财富是454.3万亿美元。

我们常说"把蛋糕做大",这就是蛋糕目前的大小。它除以全世界53.6亿的成年人口,可以得到,每个成年人拥有财富8.47万美元(约60万人民币)。

所以,如果你的财富超过60万元人民币,就超过全世界至少一半人了

(2)美国的人均财富是55.1万美元,中国是7.57万美元,只是美国的七分之一。

因此,我认为,中国未来的增长空间巨大。理由是中国没可能停留在人均财富只有美国七分之一的水平,就增长不动了。

(3)中国人均财富7.57万美元,相当于55万人民币。乍一看,你可能觉得,一个成年人拥有55万人民币的财富,这并不少。

但是,实际上是很少的。

假定这55万都是现金,那么即使过得很节俭,房租+日常消费每月3000元,也只够生活15年。想靠这些钱退休还差得远,你还是必须工作赚钱。

假定这55万里面包括了不动产和固定资产(比如汽车),由于存在折旧和市场波动,它们可能会不断贬值。等到变现的时候,你的财富很可能大幅缩水。

结论就是,55万人民币的人均财富,实际价值比名义价值低很多,根本不够支撑长期生活。

(4)这就是世界的现状:现有的财富总量,不足以让每个人摆脱贫穷

对于普通人来说,即使能够达到平均值,你的财富也是不够的,这个世界就没有那么多财富。

一个社会想要致富,归根结底还是需要创造更多的财富。 真正的财富不是财富本身,而是创造财富的能力。如果你能够创造财富,那才是真正的财富,比那些静态的财产更有价值。

"创造财富"的方法,就是能够不断生产出人们需要的东西。这才是国家和个人最应该培养的能力。

[本周软件] Rspack 工具栈

现在有一个趋势,JS 工具纷纷使用 Rust 语言重写,速度可以提高至少一个数量级。

最近,我就在使用这样一个"新生代工具" Rspack,感觉很不错,介绍给大家。

Rspack 本身是 Rust 应用,用来取代老牌的 JS 构建打包工具 Webpack。

使用后的速度提升,非常明显,Rspack 的耗时大概是 Webpack 的十分之一。如果 Webpack 需要10秒,Rspack 就是1秒。

但是,它的最大优势还不是快,而是 Webpack 的无缝替换。你基本上不需要改动配置,直接把配置文件webpack.config.js改名为rspack.config.js即可。

Rspack 不仅兼容 Webpack 的语法,还兼容插件。根据官方文档,下载量最高的50个 Webpack 插件,80%以上可以直接使用,剩下的也有替代方案。

Rspack 团队为了保证兼容性,向 Webpack 官方仓库做了100多次提交。甚至 Webpack 的主要维护者之一的 Alexander Akait 亲自动手,让很多插件可以在 Rspack 正常运行。

另外,Rspack 的功能也更多。比如,Webpack 模块联邦(Module Federation)的作者 Zack Jackson 加入了 Rspack 团队,为 Rspack 实现了模块联邦 2.0。

它在社区已经得到很多好评,发布一年多以来, GitHub 仓库有9800颗星星,今年还获得了 GitNation 基金会的"年度突破开源项目"奖。

今年8月,它发布了 1.0 版,API 已经稳定了,可以放心用于生产环境。

不过,由于全盘继承 Webpack,Rspack 也同时继承了前者的体验问题:配置麻烦,上手不算容易。开发团队为了解决这个问题,在 Rspack 的基础上,封装了一系列更简单易用的衍生工具

  • Rsbuild: 专注于构建 Web 应用。
  • Rslib: 专注于构建 JS 软件包。
  • Rspress:专注于生成静态站点,比如文档和博客。
  • Rsdoctor:专注于构建分析。

以上这些工具,底层都是 Rspack,分别用于不同的用途,统称为"Rspack 工具栈"。

其中,Rsbuild 是更简单易用的构建打包工具,对标 ViteRsbuild 的底层是 Rspack,就像 Vite 的底层是 esbuild + Rollup 一样。构建项目时,你可以选择 Rspack,也可以选择 Rsbuild,后者的配置更简单一些,体验更好,针对性的功能更多。

对于国内开发者,Rspack 工具栈还有一个好处。虽然它来自一个国际化团队,但是属于字节开源出来的工具,字节内部大量项目已经采用,中文支持和中文文档都是优先的。

大家使用 RspackRsbuild 后,如果遇到问题,就去项目仓库提 issue,官方都会快速回应。

科技动态

1、风力发电飞艇

一家北京公司推出了风力发电飞艇。

这个飞艇长23米、直径15米,艇中央有一个直径5米的涵道,里面安装了风力发电机,叶片长2.4米。

飞艇飞到500米的高度,风力发电机进行发电,然后通过电缆将电力传回地面。

高空的风远大于地面,因此高空风力发电的效果更好。

这个飞艇的远期目标是飞到"风能密度为地面200倍、年发电时长为地面4倍以上的平流层(高度约1万米)",将风力发电成本降到现在的十分之一。

2、局域网游戏室

一个美国程序员出于怀旧,在家中地下室建造了一个局域网游戏室。

游戏室一共可以容纳12人对战,电脑台都是折叠的,可以收纳进墙壁。

下面就是电脑桌全部收起来的样子。

他设置了一个家庭服务器,游戏软件存在里面,电脑终端去读取游戏。

布线是一个大工程。

他还专门准备了一个储藏室,存放电脑的内存、CPU 和显卡等配件。

虽然建成后运作良好,但他有一个最大的烦恼:现在的游戏只支持互联网对战,很少支持局域网对战,大多数时候他只能玩老游戏。

3、金字塔的建材

埃及金字塔位于沙漠之中,科学家一直很困惑,建造金字塔的巨大石块如何运进沙漠?

那些石块每个有2.5吨重,古埃及人用了什么方法,长途运输几千块巨石。

最近的一项发现,可能揭示了答案。科学家使用卫星照片,发现尼罗河有一条已经干涸的支流。

几乎所有的金字塔都分布在这条支流的旁边,这说明古埃及人很可能通过水运,将巨石送到建筑地点。

上图中,深蓝色是现在的尼罗河,浅蓝色是那条已经干涸的支流,各种颜色的点是金字塔的位置。

4、其他

(1)一个国外程序员在自行车训练机的把手上,装了两个分离式键盘,可以一边骑车,一边打字。

(2)CSS 有了一个新的徽标

(3)卡西欧推出一款形似手表的戒指。

文章

1、排版引擎纵谈:程序员的视角(中文)

本文介绍并对比了几种排版引擎,重点是 CJK 文字处理: HTML + CSS、LaTeX、LaTeX.js、Typst 和 react-pdf。(@xiaohanyu 投稿)

2、AI 的视觉注入攻击(英文)

本文介绍如何在图片里面,进行"视觉注入"(visual prompt injections),从而欺骗 AI 模型。比如,上图男子拿着一张纸,上面写着"忽略我这个人"。

3、服务器端渲染简介(英文)

本文举例介绍网页应用的"服务器端渲染"是什么,也就是大家常说的 SSR(server side rendering)。

4、带有平铺式窗口管理器的 Linux 桌面(英文)

对于大量使用键盘的人,平铺式窗口管理器最好用。本文介绍了内置平铺式窗口管理器的 Linux 桌面环境。

5、12 个当代 CSS 的一行代码增强(英文)

本文介绍12种 CSS 的新写法,只要一行代码,就能增强网页样式。

6、如何正确使用 git worktree(英文)

git 有一个 worktree 功能,大多数人只把它当作分支功能的替代方案。作者提出,应该把 worktree 用来管理并发任务。

工具

1、Neat CSS

一个极简的 CSS 框架。

2、PG Back Web

一个带有 Web 界面的 PostgreSQL 备份工具。

3、Llama OCR

这个网站提供免费的图片 OCR,通过 AI 识别图片里面的文字,好像不能识别中文。

4、MySpeed

可以自己架设的网络测速工具。

5、dive

这个工具可以显示 Docker 镜像文件每一层的内容。

6、moffee

一个命令行工具,使用 Markdown 格式制作和展示幻灯片。

7、Google Backup

开源命令行工具,用来备份谷歌邮件、通讯录和日历。

8、lcl.host

一个为本地开发环境 localhost 提供 https 证书的工具。

9、Interactive Git Log

一个 VS Code 的插件,为 Git 提交日志提供一个可交互的图形界面。

10、Makeext

构建工具 Make 的一个扩展,让make命令可以输出项目的帮助信息。

资源

1、Sound Box

一个在线音效网站,提供多种自然环境音效以及白噪音。(@wincatcher 投稿)

2、I Don't Have Spotify

你输入 Spotify 的音乐链接,这个网站就会查找替代音源(比如 Youtube)。

3、DuckDuckGo AI Chat

DuckDuckGo 最近推出的免费 AI 聊天。

4、The Copenhagen Book

一组短文,介绍 Web 应用相关的用户认证知识。跟充满术语的加密学文章不一样,这组文章简明好懂。

图片

1、祖父的小提琴

前些日子,一位纽约程序员偶然得到了1912年拍摄的他祖父(下图拉小提琴者)的老照片。

他用 AI 模型为老照片上色。

他突然意识到,自己小时候见过照片里面的小提琴。

祖母去世时,家里人把祖母的东西都存放在阁楼。在他印象中,里面就包括一把小提琴。

他就跟妻子一起,回到老房子的阁楼找找看。

小提琴居然还在。

他请人修复了这把小提琴,把它交给自己的女儿。

他写道:看着女儿拿着100多年前她曾祖父的琴,不禁让人有一种时间穿越的感觉。

文摘

1、燃烧 NeXT

1990年,乔布斯决定推出新型号的 NeXT 电脑,外壳要用镁合金制作。

镁是一种相对昂贵的金属,非常坚固且重量轻。乔布斯认为,这样的外壳不仅美观,而且可以节省搬运和制造成本。

我当时是一名报道计算机行业的记者,但以前学的是化学。我对这个决定很感兴趣,我知道镁燃烧时会发出明亮的白色火焰,我不禁好奇地想,如果 NeXT 烧起来会是怎样。

1991年秋天,我采访了 NeXT 的硬件副总裁。采访结束后,我提出,能不能送给我一个 NeXT 的外壳,让我烧烧看。他笑着同意了。

第二天,我开车去工厂,拿到了电脑外壳。

我很快就发现了问题:镁合金需要高温才能点燃,普通火焰点不燃,但是我无法制造这样的高温。于是,我无可奈何,只能把电脑外壳寄放在朋友家里。

一年后,朋友告诉我,她厌倦了保留这个玩意。而且,NeXT 已经决定停产这个型号,于是我开始认真考虑怎么烧掉它了。我想,它燃烧的照片正好配合停产新闻,作为杂志封面。

设计燃烧方案时,我考虑到,镁燃烧时会发出明亮的白色火焰和大量的白烟,虽然烟雾无毒,但可能引起警察或消防部门的注意。于是,我给消防部门打电话,询问有没有燃烧许可证。但是,他们不清楚这些事情,没人烧过这么多的镁。我还被告知,必须获得空气污染的许可证。

最后,我沮丧地决定执行原来的计划:开车去沙漠深处,然后把它烧掉。

但是最后一刻,我想到了加州的劳伦斯·利弗莫尔实验室,这是一个隶属于能源部、由加州大学伯克利分校管理的实验室。很多武器在那里实验,我确信那里肯定有燃烧几公斤镁的设施,而且也有必要的许可证。

我打电话给他们,他们同意了借给我照明弹的实验室。这让我的摄影师特别高兴,因为室内燃烧更容易拍出好的效果,阳光直射下几乎不可能看到火焰。

正式燃烧的前一天,我又找了一台旧的 NeXT 电脑作为备用。

到了正式燃烧时,我们用气焊枪点燃了它。气焊枪的蓝色火焰,接触到了电脑外壳,半分钟后,它开始发出独特的橙色光芒,然后慢慢融化。突然间,一道耀眼的白光闪过,然后是稳定的白色火焰。

我知道镁燃烧得很明亮,但我不知道有多快。我想至少会持续一分钟,但事实证明,镁的燃烧速度非常缓慢。当火焰最终熄灭时,剩下的只是一些块状的奶白色灰烬----氧化镁。

下面我们那一天拍到的照片。

言论

1、

我不戴手表。原因很简单,因为现在是最重要的时刻。我不追求做更多的事,而是追求把当前的事做得更好。

-- 黄仁勋,Nvidia 的 CEO,解释为什么不戴手表

2、

15年前,一位巴西营养学家发现,尽管巴西家庭对糖和油的消费减少,但肥胖率却在上升。为什么人们吃得更健康,却变胖了?

他认为,这是因为精细加工食品的出现,促进了人们对食品的消化。他因此创造了"超加工食品"(ultra-processed foods)这个词。

从此,这成了科学界的共识:想要健康,应该吃一些粗粮,避免多吃精细加工的食品。

-- 《关于超加工食品的风险》

3、

AI 研究已经70年了,人们最近才发现,让 AI 成功的真正方法是大量的计算。

根本原因就是摩尔定律,它使得计算成本持续呈指数式下降。

-- 《马斯克的梦想和 AI 的教训》

4、

我遇到一个程序员,他完全不想使用 AI。因为他用过一次,发现错误很多,就不想再用了,也不想了解。

这件事令我很困惑。我理解 AI 被过度炒作了,可能对你正在做的事情没有用处。我不理解的是,在2024年,你怎么可能成为一名程序员,却对一项据说会从根本上改变我们未来编程方式的技术一点也不好奇。

-- 《他们都使用它》

往年回顾

网络社区的悲剧(2023 #279)

手机充电问题的解决(2022 #229)

AR 技术的打开方式(2021 #179)

创业的凸函数和凹函数(2020 #129)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月22日

科技爱好者周刊(第 325 期):VS Code 编辑器的下一站是 Zed?

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

温州江心屿是瓯江里面的一个小岛,最近完成了改造工程。(via

VS Code 编辑器的下一站是 Zed?

程序员离不开编辑器,眼下最流行的代码编辑器肯定是 VS Code。

VS Code 其他都好,但有一个很大的缺点:性能。

它运行在 Electron 的沙箱里面,资源占用多,速度慢。我现在调用某些插件,就有明显的延迟。

它还有点臃肿,安装包 100MB,需要磁盘空间 500MB。

所以,当我听说有一个新的编辑器 Zed,性能出众,功能强大,就立刻安装了,下面就是我的使用体会。

首先说一下,为什么 Zed 吸引我?

(1)它的作者是原来的 Atom 编辑器的作者,以及 Tree-sitter 解析库的作者。

(2)它基于 Rust 语言,充分利用多核 CPU 和 GPU,追求极致性能,速度极快。

(3)它内置了 VS Code 的很多插件功能,比如 LSP(语言服务器协议)、代码提示补全、多人实时编辑、AI 助手等。

(4)它的开发非常活跃,GitHub 仓库的星星已经达到了 49K。

安装后,我一打开就觉得非常清爽,极简主义的界面,布局跟 VS Code 类似,没有学习成本,可以直接上手。

它的速度真是快,不管什么操作,一点即开。用久之后,再用 VS Code 都不习惯了。

编程需要的功能,大部分开箱即用。如果没有的话,可以去插件市场找找。

有些功能,我觉得很实用。比如,它有一个大纲面板(下图左),列出当前脚本的所有函数,点击函数名可以跳转到函数实现。

它还可以添加参与人(必须有 GitHub 账号),让你跟多人实时协作、聊天。

参与者的头像显示在窗口右上角。

虽然它有上面这些优点,但也有一些难以忽视的问题。

(1)它不是真的跨平台,目前只有 Mac 版本最完善,Linux 版本我遇到了不少问题,Windows 版本官方暂未支持。

(2)很多地方还没来得及做,你经常会遇到一些小功能缺失,找不到解决方法。

(3)它的设置就是一个大的 JSON 文件,没有图形设置界面,动不动就要查文档。

(4)AI 助手只支持 OpenAI、Claude 和本地运行的 Ollama 模型。

我的结论是,它的表现非常出色,但没有完全准备好,只适合那些看重性能、愿意自己解决问题的程序员。

总的来说,Zed 是 VS Code 很好的替代品,奉行极简主义,不臃肿,内置功能完备。明年的这个时候,它也许会让 VS Code 不再那么流行。

[本周软件]302.AI

面对层出不穷的 AI 模型,你会不会有一种想法,如果存在一个统一的使用入口该多好?

事实上,真有这样的产品。周刊以前介绍过一个网站 302.AI,就是这种思路。

它的定位是"AI 应用超市",可以看作是一个适配层,适配了各种各样的 AI 模型,让你都能通过它来使用。

你可以直接使用各种模型,也可以使用"工具超市"预置的30多种 AI 应用,比如下图的"AI 学术论文搜索"。

它还提供 API 调用,通过它的服务器,调用各种模型的 API。

它有试用额度,此后按照使用量收费,一般是底层模型原始价格的五折。

最后,它本周开源了,各种官网工具的源码都放出来了,仓库地址 github.com/302ai。他们用 Next.js,你可以用来开发自己的 AI 应用。

科技动态

1、34阶魔方

普通的魔方是3阶的,即长宽高各3个色块,但也有其他阶的魔方。

上图是2阶、4阶、5阶的魔方。

最近,有人用 3D 打印机做了一个世界最高阶的魔方,达到34阶。

这么大的魔方,转动起来很不方便,已经不适合用来游戏,而是适合摆弄许多奇特的造型。

随着 3D 打印的普及,做出更高阶的魔方也不是难事,但是缺乏实际意义。目前,量产的最高阶魔方是17阶。

2、Ping 时钟

ping 是一个命令行工具,用来显示本机到服务器的信号传输时间。

一位国外程序员突发奇想,制作了一个 Ping 时钟,在钟面上显示 ping 的耗时。

它的钟面有两根指针,长指针是每次 ping 的毫秒数,短指针是最长耗时。

钟面下部是液晶显示屏,显示当前所在网络,以及目标服务器。

每次只要运行 ping 命令,就能很直观地看到,长指针不停地摆动,网速可视化了。

这个时钟的源码,已经开源了,使用 ESP32 芯片、一个微型电机和定制的 PCB 电路板。有电路基础的同学,完全可以自己动手制作。

3、麻雀的新用途

麻雀有什么用?澳大利亚科学家想出一个新用途。

澳大利亚是世界主要的铅生产国,有28个铅矿。铅会造成人体中毒,对儿童影响尤其大。

科学家一直寻找监控方法,能够测试环境的铅泄漏。他们想到了麻雀。

麻雀比人类,更早摄入环境中的化学物质。只要抓住麻雀,测一下它们的血铅,就能了解是否有铅泄漏,从而可以早期发出报警(下图)。

4、其他

(1)一位美国物理学家总结出猫的行为方程,已知猫的质量和疲劳系数,可以算出猫从 t0 到 t1 的位移,该公式的目的是"唤起非专业人士对经典力学的兴趣"。

(2)CDN 服务商 bunny.net,推出边缘函数功能,基于 Deno,可以备用。

文章

1、如何简化 PATH 环境变量(英文)

Linux 系统有一个环境变量 PATH,指定可执行文件的默认路径。本文告诉你,怎么简化这个变量,更容易管理。

2、AppData 目录的作用(英文)

一篇科普文章,Windows 11 有一个 AppData 目录,它有什么用。

3、蓝牙版本的变化(英文)

本文介绍蓝牙协议如何进化,每个版本的特点是什么。

4、业务逻辑不要放入数据库(英文)

本文提出,数据库最好只用来存放数据,不要加入业务逻辑,让应用程序处理业务逻辑。

5、SAML:技术入门(英文)

一篇长文,介绍企业用的登录协议 SAML。开头部分是 SAML 简介,写得挺好,后面是技术细节,可以不看。

6、质能公式与光速(英文)

一篇物理学科普长文,谈怎么理解质能公式 E=mc^2,为什么包含光速的平方。没有数学,我觉得很有启发。

工具

1、PasteBar

开源的桌面软件,用来管理剪贴板,可以搜索剪贴板历史,以及预设常用的粘贴项(比如地址),支持 Windows 和 Mac 系统。

2、FastHTML

一个 Python 的 Web 框架,Django 的替代品,用起来更简单。

3、Kagi 翻译

搜索引擎 Kagi 推出的翻译服务,类似于谷歌翻译。

4、Star

一个 Web 应用,在手机打开以后,它会利用手机的运动传感器,显示某一颗你指定的卫星相对你的方位。

5、kkTerminal

一个开源的网页终端,在网页上通过 SSH 连入远程主机。(@zyyzyykk 投稿)

6、ReactPress

一个基于 Next.js 的博客和 CMS 系统,查看 demo 站点。(@fecommunity 投稿)

7、PDFMathTranslate

开源的命令行工具,使用 AI 翻译 PDF 文件,完整保留排版。(@Byaidu 投稿)

8、dimmer

开源的 Chrome 浏览器插件,暗黑模式一键切换。(@slc3a2 投稿)

9、ThriveX

一个开源的博客系统,基于 Next14 + Spring Boot。链接是前端仓库,另有后端控制台。(@LiuYuYang01 投稿)

10、Trayce

这个工具拦截本地开发环境中 Docker 容器发送和接收的 HTTP(S) 请求。

11、ngtop

一个命令行工具,用来查询 nginx 日志。

12、InputShare

电脑连接安卓设备之后,这个工具可以把电脑的键鼠和剪贴板,共享给安卓设备,只支持 Windows。(@BHznJNs 投稿)

资源

1、逆向工程教程(Reverse Engineering For Everyone)

面向初学者的逆向工程英文电子书,涵盖了 x86 和 ARM 架构。

2、一站式 iframe 生成器

HTML 的 iframe 元素有很多属性,这个工具网站可以查看所有属性值,并生成最终代码。(@wincatcher 投稿)

3、Chromium 的命令行开关

这个网页收集 Chromium(Chrome)浏览器的命令行开关,居然有1600多个。

4、Typst 介绍(英文)

Typst 是一种排版工具,可以生成论文、小册子、表格等,功能类似于 LaTeX,但是写法类似于 Markdown,用起来相对简单。

图片

1、犰狳化石

一个阿根廷农民发现,路边有四个奇怪的大土块。

后来经过生物学家辨认,这居然是四个巨型犰狳的化石,这种动物已经在一万年前灭绝了。

犰狳是一种看上去很像穿山甲的动物,外面披着一身铠甲。下面就是现代小型犰狳的照片。

巨型犰狳的灭绝原因,有一种说法是跟人类有关,古人想要它们的铠甲。

2、因纽特人的雪镜

雪地和冰面会强烈反射阳光,导致视力受损,这叫做"雪盲症"。因此,雪地活动都需要佩戴墨镜或保护镜。

因纽特人是美洲北极圈的原住民,已经在那里定居了几百年。他们在原始条件下,怎么防止雪盲症呢?

原来他们使用各种材料(骨头、木头、鲸须)制作雪镜,戴在眼睛前,只留出一条窄缝观察外界。

这种眼镜限制了进光量,保护了佩戴者的眼睛,也有助于提高视力。它就像针眼相机一样,狭缝聚焦光线,使得远处的物体看起来更清晰。

文摘

1、语音 UI(大多数情况下)很糟糕

AI 的发展,使得语音可以成为用户界面,这称为"语音 UI"。

有人认为,语音 UI 将是终极 UI,因为当你可以直接说出命令,为什么还要费心使用键盘和鼠标呢?

我不相信语音会成为通用界面,原因有很多。

(1)声音本质上无法表达抽象思想。很多时候,我们的大脑里面只有零碎的意识,很难找到正确的词语,将它们表达出来。

(2)语音让很多事情变得更难而不是更容易。理论上,说出"叫一辆网约车去机场"似乎是完成任务的最简单方法,但是如果你还有其他要求,比如指定车型和限价,口头表达就会很麻烦。

(3)语音侵犯隐私。你说出指令的时候,愿意被别人听到吗?

(4)视觉 UI 可以展示软件的局限性,语音 UI 就不行。很多事情,软件无法做到,视觉 UI 可以帮助我们了解软件的功能。如果没有视觉 UI,你很难发现软件不能做什么事。

(5)用户不喜欢一直说话。使用语音完成简单的任务是可以的,但要完成所有事情很快就会变得烦人,难道你要一直说个不停吗?

(6)语音无法解决现实世界中的歧义。语言表达可能存在大量歧义,无法通过纯语音界面轻松解决。人工智能可能无法正确理解你想要完成什么。

当然,视觉 UI 也有歧义,但是这会更困难,因为你的操作有视觉反馈。

言论

1、

美国的在线教育公司 Chegg,业务是帮助完成家庭作业。学生输入题目后,它会分发给印度的数千名承包商,让他们提供答案。

ChatGPT 诞生后,学生不再使用这个服务了,而是直接问 ChatGPT。Chegg 的股价已经下降了99%。

-- 《ChatGPT 如何击垮在线教育巨头》

2、

大多数哲学的目的,都是强化你的身心,让你学会,对于那些自己无法控制的事情要漠不关心、

-- 《禁欲主义》

3、

作为一个德国人,我每月支付的医保费用是1000欧元左右,另外还要支付差不多金额的个人所得税。但是,如果我停止工作,结婚并生1-2个孩子,我拿到的失业救济金 + 生育补助,比我现在的税后收入还要多。这完全是不可持续的,但政治家们没人谈论这些。

-- Hacker News 读者

4、

经常有人问我,为什么2019年决定将 Keras 库合并到 TensorFlow。

这不是我的决定,而是 TensorFlow 团队主管的决定。当时我是谷歌 L5 级员工,而他是 L8。如果我不同意这个决定,就需要从谷歌离职。

-- 弗朗索瓦·乔莱(Francois Chollet),神经网络库 Keras 的作者,本周宣布从谷歌离职

5、

创业公司的最大风险不是失败,而是一种不敢尝试的文化。

-- 《容忍失败的领导者》

往年回顾

棘手的 AI 版权(2023 #278)

人类和人生的意义(2022 #228)

家庭太阳能发电的春天(2021 #178)

这个社会是否正在变成"赛博朋克"?(2020 #128)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月15日
❌