普通视图

发现新文章,点击刷新页面。
昨天以前阮一峰的网络日志

科技爱好者周刊(第 330 期):李开复梳理人工智能

作者 阮一峰
2024年12月20日 08:17

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上个月正式开放的杭州良渚玉湖公园,公园的设计象征良渚文化和运河文化的连接。(via

李开复梳理人工智能

前些日子,我读了李开复老师的两本书:《AI·未来》(浙江人民出版社,2018)和《AI·未来进行式》(浙江人民出版社,2022)。

这两本书都是面向社会大众解释 AI,不是技术类书籍,但是有一些段落,阐述 AI 概念。

李开复老师用通俗的语言来解释,人工智能、机器学习、神经网络、深度学习......这些词到底是什么意思?彼此有什么关系?

我觉得,这些介绍对理解 AI 的体系,挺有启发的。它们分散在各个章节,我将它们整理在一起。

为了行文连贯,我没有完全照搬原文,而是用自己的语言重新叙述,如果有错误,也归咎我。

(1)人工智能

1956年夏天,计算机科学家约翰·麦卡锡(John McCarthy)首次提出"人工智能"(AI)这个概念。

人工智能指的是,通过软件和硬件,来完成通常需要人类智能才能完成的任务。它的研究对象,就是在机器上模拟人类智能。

(2)机器学习

早期,人工智能研究分成两个阵营。

第一个阵营是规则式(rule-based)方法,又称专家系统(expert systems),指的是人类写好一系列逻辑规则,来教导计算机如何思考。

可想而知,对于复杂的、大规模的现实问题,很难写出完备的、明确的规则。所以,这种方法的进展一直很有限。

第二个阵营就是机器学习(machine learning),指的是没有预置的规则,只是把材料提供给计算机,让机器通过自我学习,自己发现规则,给出结果。

(3)神经网络

神经网络(neural network)是机器学习的一种主要形式。

神经网络就是在机器上模拟人脑的结构,构建类似生物神经元的计算网络来处理信息。

一个计算节点就是一个神经元,大量的计算节点组成网络,进行协同计算。

神经网络需要极大的算力,以及海量的训练材料。以前,这是难以做到的,所以20世纪70年代开始,就陷入了停滞,长期没有进展。

(4)深度学习

深度学习是神经网络的一种实现方法,在20世纪80年代由杰弗里·辛顿提出。它让神经网络研究重新复活。

深度学习是一种让多层神经元可以进行有效计算的方法,大大提高了神经网络的性能。"深度学习"这个名字,就是比喻多层神经元的自主学习过程。

多层神经元包括一个输入层和一个输出层,它们之间有很多中间层(又称隐藏层)。以前,计算机算力有限,只能支撑一两个中间层,深度学习使得我们可以构建成千上万个中间层的网络,具有极大的"深度"。

(5)Transformer

早些年,深度学习用到的方法是卷积神经网络(CNN)和循环神经网络(RNN)。

2017年,谷歌的研究人员发明了一种新的深度学习处理方法,叫做 Transformer(转换器)。

Transformer 不同于以前的方法,不再一个个处理输入的单词,而是一次性处理整个输入,对每个词分配不同的权重。

这种方法直接导致了2022年 ChatGPT 和后来无数生成式 AI 模型的诞生,是神经网络和深度学习目前的主流方法。

由于基于 Transformer 的模型需要一次性处理整个输入,所以都有"上下文大小"这个指标,指的是一次可以处理的最大输入。

比如,GPT-4 Turbo 的上下文是 128k 个 Token,相当于一次性读取超过300页的文本。上下文越大,模型能够考虑的信息就越多,生成的回答也就越相关和连贯,相应地,所需要的算力也就越多。

豆包 MarsCode 动手实验室(杭州站)

先提一下,上周说的全国 AI 编程挑战赛

应用赛道的作品提交,从12月16日已经开始了,大家可以上传自己用 AI 完成的作品了。

算法赛道目前还在报名中,只要你有信心,在 AI 的辅助下解出算法题,不妨报名试试,也是一种体验和锻炼。

比赛规则和报名链接,请访问这里,也可以看上周的周刊。

(此处有分隔线)

本周介绍的活动,是12月28日(星期六)下午两点,在杭州的字节工区举行的豆包 MarsCode 动手实验室

到时,大家可以现场深度体验豆包 MarsCode 的 AI 编程能力,并跟字节的同学当面交流。在动手环节,你可以用 AI 实现自己的创意。如果你的作品很优秀,还有机会直通 AI 编程挑战赛的决赛。

活动的详细介绍,以及报名链接,请访问这里

科技动态

1、硬盘打孔机

硬盘报废时,一般需要擦除数据。最保险的方法,莫过于物理破坏硬盘。

但是,这样很费事,你要找把锤子,把硬盘敲碎了。

为了解决这个问题,一家日本公司推出了"硬盘打孔机"。这种机器可以在硬盘上轻松打四个孔,保证彻底破坏数据。

它采用电动液压系统,产生12吨的压力,足以穿透任何硬盘。

它的尺寸为 410 x 289 x 187 毫米,跟台式电脑差不多大小,但是重达18公斤,适合那些有成千上万硬盘需要销毁的大公司。

2、沙子国际象棋

一位英国设计师用沙子作为材料,3D 打印了一套国际象棋。

他说,这样做只是为了追求一种奇特的感觉。沙子是一种无形且流动的材料,塑造成坚固耐用的东西,让人感到难以把握、随时可能变化。

而且,沙子表面是不光滑的,当你用沙子下棋时,会有真实的、与众不同的触觉。

3、玻璃砖

大家考虑过吗,房子为什么需要墙?难道不能建造一所没有墙、全部是窗户的房子吗?

回答是不能,因为建筑的重量由墙承受,窗户不承受重量。如果把墙全改成窗户,建筑物就会倒塌。

那么,能不能用玻璃来造墙呢?玻璃既可以承重,又可以透光。

麻省理工学院的科学家,最近就发明了这样一种全透明的玻璃砖(上图),根据测试具有跟普通砖相同的承重能力。

除了透光,玻璃砖还有一个好处,可以重新利用。只要高温加热,玻璃砖就会融化,能够塑造成其他形状,还能 3D 打印,但这也导致它不防火。

总的来说,玻璃砖比红砖更环保,在很多场合有推广潜力。

4、其他

(1)本周发生了一笔史上最大的风险投资,AI 公司 Databricks 一次性募集了100亿美元。

(2)GitHub 宣布,编程助手 GitHub Copilot 向所有用户免费开放。

(3)OpenAI 推出了免费电话 1-800-ChatGPT,北美用户可以拨打该电话,跟 AI 语音聊天,每月额度为15分钟。

(4)小米官方开始支持,小米物联网设备接入智能家居管理助手 Home Assistant。

文章

1、汇编语言的一点入门介绍(中文)

这篇短文通俗解释了汇编语言的基本概念。

2、CSS 网格区块详解(英文)

这篇长文详细介绍 CSS grid 布局的区块功能(template area)。

3、网页如何插入 JSON-LD 语义数据(中文)

本文详细介绍网页的 JSON-LD 数据块,用来插入机读的语义数据。

4、13个对前端开发有用的 Chrome 插件(英文)

本文介绍13个用于前端开发的 Chrome 插件。

5、谷歌不再是最好的搜索引擎(英文)

本文是一篇新闻分析,作者认为 Perplexity 的 AI 搜索体验已经优于谷歌了。

6、如何为 Windows 添加6个 macOS 最好的功能(英文)

一篇 Windows 使用技巧,教你怎么为 Windows 添加一些 macOS 功能,比如文件浏览器可以文档预览。

工具

1、Presenterm

将 Markdown 文件转成幻灯片,在命令行播放的开源工具。(@lengyijun 投稿)

2、Rslib

制作 JavaScript 软件包的工具,可以直接开发组件库和命令行工具。(@fi3ework 投稿)

3、Midscene.js

AI 驱动的网页 UI 自动化测试框架,通过文字描述,生成 UI 测试用例。(@yuyutaotao 投稿)

4、wechatDataBackup

Windows 桌面 PC 端的微信聊天记录一键导出。(@git-jiadong 投稿)

5、MoeMail

基于 Next.js + Cloudflare 技术栈构建的临时邮箱服务,在线体验。(@beilunyang 投稿)

6、my-github-2024

一个 Python 程序,生成你在2024年的 GitHub 代码提交统计。(@WCY-dt 投稿)

7、Vanilla

Canonical 公司的 CSS 框架,就是 Ubuntu 官网采用的样式。

8、OpenAuth

网页登录的第三方认证的集成库。

9、Schemio

基于 Web 的示意图可视化编辑器。

10、Buzee

一个桌面软件,提供本地文件的全文搜索(包括图片里面的文字),支持 Windows 和 Mac。

AI 相关

1、Hika AI

免费的 AI 搜索。(@atlas-comstock 投稿)

2、Slea.ai

免费的 AI Logo 生成器。(@aaamomo64 投稿)

3、AI 音效生成器

免费生成各种音效,比如雨声、风声。(@aurthur 投稿)

资源

1、SQL 风格指南

一份书写 SQL 语句的风格约定。

2、颜色代码表

在线配色设计工具集,做在一个网站。(@nettsz 投稿)

图片

1、机器蜻蜓

美国首都华盛顿的中央情报局博物馆,有一只上个世纪70年代制造的机器蜻蜓。

它其实是一架微型直升机,飞到目标对象附近,窃听对方的谈话。

这只蜻蜓可以飞200米,然后落下来,通过激光捕捉空气振动,来还原谈话声。

但是,它不防风,也难以控制,所以从来没有实际用过。

2、荷兰的邮资代码

荷兰寄信不用邮票,而是用一种9个字母和数字组成的代码。

你花钱买一个代码,以 3 x 3 的格式写在信封上,就能代替邮票,作为付款证明。

因为代码的有效期只有五天(以邮戳为准),需要购买后及时寄出,被猜到的可能性很小。

文摘

1、没有编程生产力这样的东西

正如马丁·福勒(Martin Fowler)所观察到的那样,程序员的编程生产力无法有效地衡量,因为它不存在。

软件开发并不是一项必然会产生任何东西的活动。

假设你有两个开发人员在同一个项目上工作,并且偶然地,他俩在同一天接受了相同的任务。

甲写了一个1000行的框架,完美地解决了这个问题。代码编写良好,并经过充分测试,每一步都有详细记录。

乙则是当天去了公园,一边喂鸽子一边思考问题,然后漫步回到办公室,删除了100行代码,部署了更改......问题就解决了。

请问谁的生产力更高?

回答是,这不重要。重要的是乙解决了问题,同时降低了团队的长期维护成本。甲也解决了这个问题,但是他通过增加代码,增加了维护成本,因此(在其他条件相同的情况下)他的解决方案较差。

我们能说,乙具有更高的生产力吗?显然,很难找到编程生产力的正确衡量指标。

我认为,优秀的软件开发者所做的就是解决问题。但是,生产力的衡量指标,比如代码、文档、数据等等,都只是解决问题的工具,并不是解决问题本身。

言论

1、

我写 SQLite 的时候,从来没人教过我 B 树的知识。我需要自己实现 B 树,我就从书架取下高德纳的《计算机编程艺术》,找到了 B 树的章节。他描述了算法,我就照着实现。

有趣的是,高德纳详细介绍了搜索 B 树和插入 B 树的算法,没有提供从 B 树删除数据的算法,这是放在本章末尾的练习。所以我在实现自己的 B 树之前,还必须先做完该章的练习。谢谢高德纳,我真的很感激。

-- 理查德·希普《SQLite 不为人知的故事》

2、

瑞典南部的马尔默市,洗一次10分钟的淋浴,电费高达2.65欧元(约20元人民币)。原因是该市接入的是德国电网,德国能源短缺,推高了电价。

-- 《瑞典能源危机》

3、

职业生涯最重要的一课是,你需要认识到,你工作的目的不在于使得公司的客户满意,而在于使得那些控制你的加薪、奖金和晋升的人满意。

-- Hacker News 读者

4、

正在开发的水下无人机技术,会使得以航空母舰为中心的海军战略过时,从而大幅削减军事开支。

举例来说,美国开发的水下无人机 Orca XLUUV,可以携带8吨的有效载荷,行驶数千英里,并且不需要长时间浮出水面。

-- Hacker News 读者

5、

我第一次尝试 MidJourney(文生图工具)和 Suno(文生音乐工具)时,我想知道未来是否每个人都会成为数字艺术家。

很快,我就意识到我没有"创作冲动",即使看过很多别人的创作,我也常常不清楚自己想要创作的东西。

因此,未来的 AI 即使具备无比强大的绘画和编曲能力,还是只有少数人能成为画家和音乐家。程序员也是如此,即使 AI 会编程,也无法人人成为程序员。

-- 《Cursor 深度体验》

往年回顾

没有目的地,向前走(2023 #283)

生活就像一个鱼缸(2022 #233)

腾讯的员工退休福利(2021 #183)

贵州变瑞士,有没有可能?(2020 #133)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月20日

科技爱好者周刊(第 329 期):示意图利器 D2

作者 阮一峰
2024年12月13日 08:06

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

哈尔滨冰雪大世界即将开园,工人正在松花江上采冰,每天需要开采近万块大冰块。(via

示意图利器 D2

制作示意图的工具有很多。

我喜欢使用基于文本代码的作图工具,来绘制线框图,比如 Mermaid、Plantuml、Graphviz。

它们都能根据代码,生成图片,非常适合放入代码仓库,进行版本管理。

最近,我发现了一个更易用的同类工具 D2,简单直观,功能强大,下面介绍给大家。

D2 可以命令行使用,也可以浏览器使用。假定你有一个图片代码文件example.d2,那么生成图片的命令如下。

$ d2 example.d2

大部分时候,我都通过浏览器使用它。它有一个线上生成器 play.d2lang.com(下图),把代码贴进去,按下"compile"按钮,马上生成图片。

想要 A 节点(节点的名称为 A),直接输入 A 就可以了。

A

A 只是节点名称,如果要定制节点的内容,就像下面这样写。

A: 甲

接着,添加一个节点。

A: 甲
B: 乙

把它们连起来。

A: 甲
B: 乙
A -> B

连接可以用正箭头(->)、也可以用反箭头(<-),甚至双向箭头(<->)。如果不需要箭头,就直接连线(--)。

箭头上还能添加文字。

A: 甲
B: 乙
A -> B: 连接

节点之间可以有多根连线。

A: 甲
B: 乙
A -> B: 请求
A <- B: 响应

节点的连接也可以写在一行。

甲 -> 丙 <- 乙: 连接

阶段一 -> 阶段二 -> 阶段三 -> 阶段四
阶段四 -> 阶段一: 反馈

这些语法就够画出基本的线框图了,是不是挺简单。

D2 可以绘制非常复杂的图,更多语法参考文档

最后提一下,如果想修改节点形状,方框改成圆形,就像下面这样写。

A: 甲
A.shape: circle

形状甚至可以改成一朵云,表示云服务。

A: 甲
A.shape: cloud

线条颜色也可以改。

A: 甲
A.style.stroke: red

[活动] AI 编程挑战赛

程序员同学看过来,全国性的 AI 编程大赛来了。

只要你善用 AI 编程,在 AI 的帮助之下,做出创新应用,或者快速解出算法题,就能参赛。

参赛不仅锻炼 AI 编程能力,还能丰富自己的经历,如果得奖,就能在简历上写一笔,帮助就业。

(1)比赛总奖池20万,一等奖的奖金4万元。学生和非学生分开评奖,获奖者还有 offer 机会,可以直通终面(包含实习岗与正式岗)。

(2)比赛分为算法和应用两个赛道,可以提交自己的创新应用,也可以选择完成算法题。

(3)大赛现在已经开始报名。创新应用在12月16日开放作品提交,算法比赛现在可以参加线上常规赛,决赛是线下举行的黑客马拉松。

(4)两个赛道的决赛阶段,都要求使用豆包 MarsCode 的 AI 编程能力,作为辅助工具。

本次 AI 编程巅峰挑战赛,由豆包MarsCode 和稀土掘金社区共同发起,面向全国程序员。大赛规则和报名入口,详见活动官网,也可扫描上方海报二维码,祝愿大家得奖。

科技动态

1、深湖冷却

加拿大最大城市多伦多,就在安大略湖旁边。安大略湖是一个很深的湖,最深处达到244米。

多伦多市正在建设一个非常酷的项目,使用安大略湖底的冷水,为城市提供冷却系统。

安大略湖底部的水温是很低的,该项目从水底85米处取水,即使盛夏,水温也只有4摄氏度。

这些水经过40公里的管道,进入市中心的热交换站,为城市带来天然的冷气。

2、自走桌

一位国外工程师,制作了一张会自己行走的桌子。

这张木头桌子有12条腿,每次可以同时移动三条腿,每条腿都用电机驱动。

桌子内部有无线接收器,用来接收遥控信号。远端计算机发出遥控命令,并计算出移动哪几条腿,每条腿移动的角度和幅度。

3、瘫痪网络的机器狗

很多犯罪分子都在屋外装了摄像头,监控室外的风吹草动。

美国国土安全部研发了一款机器狗,它的唯一作用就是瘫痪无线摄像头的通信。

这个机器狗配备了一个天线阵列,接近目标后,会侦测周围无线信号的频率和信道,然后发送大量干扰信号,使得网络堵塞,无法通信。

所有无线通信的智能家居设备,都会因此失效,包括摄像头。所以,重要地点的摄像头必须是有线的。

4、无豆咖啡

一些西方公司最近推出"无豆咖啡",就是不使用咖啡豆制作的咖啡。

它采用废弃的枣子或果核,提取生物质,然后添加提取自茶叶的咖啡因,使其具有咖啡的味道。

因此,它比较环保,可以减少食物垃圾,也不必破坏森林种植咖啡树。

据说,它的味道非常接近优质咖啡,普通人喝不出差异。只是成本不便宜,略高于传统的优质咖啡豆。

文章

1、CSS 重置(2024版)(英文)

作者提出,最新的 CSS 重置(CSS reset,即更改浏览器默认样式)只需要9条规则,每一条都详细解释。

2、Monokai 的历史(英文)

本文介绍流行的代码编辑器配色方案 Monokai 的诞生历史。

3、并发运行(Concurrency)和并行运行(Parallelism):以 JavaScript 为例(英文)

本文解释并发和并行的区别,然后给出 JavaScript 的示例。

4、直接链接网页的某段文本(英文)

浏览器现在支持,URL 直接链接到网页的某个文本片段(text fragment)(上图的高亮部分),本文介绍如何使用。

5、了解多重 DNS(英文)

多重 DNS 就是同一个域名有多个 DNS 解析记录,可用来均衡负载。作者就测试了,均衡负载是否真能生效。

6、感知器是什么(英文)

本文解释神经网络的基础概念"感知器"(Perceptron)。

工具

1、EasyTransfer

开源的文件传输工具,匿名加密,只需访问网页,即可连接到其他设备,基于 webRTC 和 Vue.js,访问试用网址。(@ch3ny4ng 投稿)

2、Screen Sharing

从浏览器分享你的屏幕给其他人,适合用来演示。(@markliuyuxiang 投稿)

3、PMAtron

将 phpMyAdmin 用 Electron 封装成跨平台桌面软件。(@MaskerPRC 投稿)

4、FastExcel

基于 Java 语言的 Excel 文件解析工具,可以用来提取数据。(@JerryFan626 投稿)

5、Readest

一款开源电子书阅读器,跨平台桌面应用,基于 Next.js 15和 Tauri v2。(@chrox 投稿)

6、IMG2AVIF

一个网页工具,将各种格式的图片转成 AVIF 格式。(@malagebidi 投稿)

7、YT Pics

一个 Web 应用,输入 YouTube 网址和指定时间,它会自动截取该时间的截图。

8、Web2pdf

一个命令行工具,将网页保存成 PDF 文件,有很多增强功能(自定义样式、生成目录等)。

9、CheerpJ

浏览器里面的 JVM 编译器,让 Java 程序可以在浏览器运行。

10、fuzzy-search

一个前端的模糊搜索库,支持东亚语言。

AI 相关

1、BabelDuck

基于 AI 的口语对话练习应用。(@Orenoid 投稿)

2、AIGIF

GIF 动图搜索,可对图片人物进行换脸。(@markliuyuxiang 投稿)

3、Imagenie

跨平台的桌面应用,使用 AI 在本地处理图片,比如人像修复、超分辨率放大、背景移除。(@zhongweili 投稿)

资源

1、启动过程:Android 与 Linux

这篇文章记录了 Linux 和 Android 各自的系统启动顺序。

2、深入高可用系统原理与设计

开源的中文电子书,梳理网络、云、容器、集群等知识。(@isno 投稿)

3、English News in Levels

英语新闻分级阅读网站,实时更新新闻,分为三种难度,有重点词汇、理解测试和朗读音频。(@meterscao 投稿)

4、GitHub Weekly

这个网站将周刊讨论区的投稿,转成新闻卡片形式呈现。(@inshub 投稿)

图片

1、密室照片

2010年,美国互联网上流传一组密室照片,看上去非常空旷神秘。

它们没有任何说明,不知道是在哪里拍的,也不知道是谁拍的。

这样反而激起了网友的兴趣:昏黄的灯光,陈旧潮湿的地毯,黄色的荧光灯和墙壁,无限的空房间,没有任何窗户,你被困在里面。

经过不断转发,这些照片逐渐成为美国互联网经久不衰的一个神话,成为了很多电影和游戏的灵感,比如《命运规划局》、《黑暗城市》、《异次元杀阵》。

最近,通过互联网档案馆(archive.org)的努力,现在终于查明,这组照片是一家家具店的二楼,当时正在进行翻新,一间间的小房间正是家具的陈列室。

文摘

1、大众审美

人们眼中的美和丑,其实都是受到社会的影响,很少有人拥有自己独立的审美标准。

1990年代初期,两位俄罗斯艺术家委托一家美国市场研究公司,进行市场调查,向1001位美国人询问下面的问题。

  • 你最喜欢的颜色是什么?
  • 你喜欢锐利的曲线还是柔和的曲线?
  • 你喜欢光滑的笔触还是厚重的笔触?
  • 你喜欢裸体还是穿着衣服的人物?
  • 你喜欢休闲的人物还是工作的人物?
  • 你喜欢室内场景还是室外场景?
  • 你喜欢什么样的风景?

调查完成后,两位艺术家根据大多数人的偏好,绘制一幅画。理论上,这幅画应该受到最多社会大众的喜爱。

后来,他们又在其他国家做这个调查,得到一个惊人的结果:每个国家的调查结果(即大众偏好),几乎都是一致的。

"人们想要的都是风景画,周围有几个人物,前景是动物,主要色调是蓝色。"

他们根据11个不同国家的调查结果,画出来的11幅画看上去几乎一样。

这证明了,全世界的大众审美正在趋同。从电影到时尚,从建筑到广告,全世界的人们喜欢差不多的东西,各国审美越来越接近,独特性越来越少。

举例来说,AirBnB 上面的公寓,不管是哪个国家,装潢风格很多都是雷同的,可以称为 AirBnB 美学:白墙、原木、胶囊咖啡机、扶手椅、裸砖、木搁板、灯泡。

这种 AirBnB 美学既有工业主义的粗犷原始,又有古典主义的优雅极简。

这种风格还影响到了咖啡店。

世界各地的咖啡店(包括餐厅),也慢慢变得相似:粗糙的木桌、宽大的窗户、朴素的吊灯。

总之,随着互联网连接全球,全世界正在形成统一的大众审美。以后,无论去到哪个国家,旅馆和咖啡店可能都是一样的装修。

言论

1、

我生活中一切顺利的事情都遵循相同的过程:

(1)我关注自己喜欢的​​事情。

(2)我找到多做这些事情的方法。

(3)我让有趣的人很容易发现我在做这些事情。

(4)我和他们一起出去玩,一起做项目。

-- 亨里克·卡尔森

2、

伟大的科学家是想法大胆的人,但是对自己的想法同时持有高度批判的态度。接受自己的猜想之前,他们首先会严厉尝试反驳它。

只有发现很难反驳成功时,他们才相信自己的想法是对的。

-- 卡尔·波普尔,科学哲学家

3、

作为一个至少用过十几种语言进行过商业开发的程序员,我完全不同意有人说,一种语言的编程速度优于另一种语言。

语言的编程速度因人而异,符合程序员的个人经历和思维习惯的语言,写起来最快。

-- Hacker News 读者

4、

我长期以来一直认为地球是一个"水星球",存在着大量的水覆盖星球。

直到我做了数学计算,才意识到地球实际上是太空中的一块湿岩石,更像是用喷雾器喷了十几次的保龄球。

-- Hacker News 读者

往年回顾

电动皮卡 Cybertruck 的 48V 供电(2023 #282)

好用的平面设计软件(2022 #232)

新人优惠的风险(2021 #182)

快能力和慢能力(2020 #132)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月13日

科技爱好者周刊(第 328 期):AI 模型不是一门好生意

作者 阮一峰
2024年12月6日 08:18

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上海南站正在改造,车站的北半部在施工,南半部正常运营,中间用巨大的帘布隔开。

AI 模型不是一门好生意

微软的 Microsoft 365 最近涨价了,涨幅最高的地区为41%。

微软解释,涨价原因是多了 AI 助手 Copilot 的成本。中国大陆因为没有 Copilot,所以不涨价。

无独有偶,OpenAI 也说要涨价,涨幅更夸张。新模型的订阅费可能从现在的每月20美元,涨到每月2000美元

(最新消息是,昨晚发布的 ChatGPT Pro 已经上涨到每月200美元。)

这两条新闻证明了一件事:AI 模型太烧钱,即使世界最有钱的公司都承受不起,只能大幅涨价。

不止微软和 OpenAI,所有经营 AI 模型的公司其实日子都不好过,目前都是亏本卖 AI 服务,争夺市场占有率。

这种运营压力恐怕将长期存在,因为以下的原因,注定了 AI 模型不是一门好生意。

(1)AI 模型需要投入大量资金

OpenAI 每年的运行经费据报道是70亿美元,Anthropic 今年预计支出27亿美元,Facebook 向 AI 部门最近增加了数十亿美元的投入。

这么高的投入,要有上亿的付费用户,才可能获利,谈何容易。

(2)模型成本没有规模经济

绝大多数行业,规模越大,单位成本越低。但是,AI 模型正好相反,模型越大,单位成本可能更贵。

因为随着模型变大,进一步改进可能更加困难,训练新模型所需的计算量也在增加。这就像攀登珠穆朗玛峰,到了8000米以后,每一步都越发艰难。2024年训练一个顶级模型,要比2023年训练顶级模型,计算量更大更贵。

偏偏 AI 模型的效果与规模有关,规模和计算量越大、模型效果越好。因此,大模型公司的运营费用无法下降,只会变大。

(3)AI 模型快速贬值

AI 模型公司为了市场份额和投资回报,必须不断推出更好、更快、更强的新模型。

如果行业不断推出新模型,那么旧模型就会快速贬值。当你可以使用 GPT-4 时,还会有人想使用 GPT-3 吗?如果竞争对手推出了更好的模型,还会有人用你的模型吗?

为了始终在市场占有一席之地,你必须始终是市场最好的 AI 模型之一。这意味着,你的投入始终无法减少。

即使由于接近了技术极限,AI 行业无法继续推出更强的新模型,旧模型依然会快速贬值。因为市场上存在开源模型,比如 Llama 和 Mistral,如果商业模型停止进步,开源模型就将迅速缩小差距,那么旧的商业模型也就不值钱了。

举例来说,Anthropic 公司历史上开发过十个模型,为此陷入严重亏损。其中八个模型现在已经毫无价值,第九个模型是开源的,第十个模型让它现在能保持微弱的技术优势和市场活力。

它只有继续开发第十一个模型,才有可能在未来生存下去。

(4)AI 模型公司无法保持垄断优势

OpenAI 是目前的市场领先者,它的优势建立在大量计算的基础上。这些计算所需的物理资源,都是租用云服务商的设备,而不是自家的。只要有足够的钱,任何人都可以使用相同的资源。不难想象一小群高级工程师离开 OpenAI,筹集大量资金,租用计算资源,在几个月内就能对 OpenAI 的核心业务构成威胁。

换句话说,云服务商花费数十亿美元建设的数据中心是一种护城河,OpenAI 花费数十亿美元构建的 GPT 早期版本(比如 GPT-2 和 GPT-3)不是护城河,因为现在有更好的模型已经在 Github 上免费提供。

大模型公司搭建自己的机房,也无济于事。因为对手可以租用云服务商的机房,投入更少,效果是一样的。

综上所述,AI 模型似乎是一个可怕的行业:每年必须不断地巨额投资,应对持续上升的模型成本,以及当前模型一两年后就会被淘汰的竞争压力。你也没有防止竞争对手的有效手段,你最好的员工可能会离开,你的技术专长很难成为持久的优势。

所以,那些还在考虑推出 AI 模型的商业公司,进入这个行业之前,需要三思。

至于已经走上这条路、现在正运营 AI 模型的公司,由于模型如此烧钱,筹集最多资金的公司会赢(活得最久),所以当务之急应该是尽可能多、尽可能快地筹集资金。

此外,应对之策还包括,让你的模型差异化,以便留住用户。比如,记住用户的个人数据,可能是一种对策。模型应该可以记住用户的问题,从而更好地了解用户。用户使用它越多,就越难切换,因为它知道所有你的历史、你提出的问题、你关心的事情。

豆包 MarsCode 系列活动

豆包 MarsCode 是专业的大模型编程助手,字节旗下的产品。

它与稀土掘金技术社区(juejin.cn)合作,本月14日在深圳,19日在上海,将举行两场系列活动,让更多同学一起参与进来,探索 AI 编程的潜力。

(1)12月14日,深圳将举办"豆包 MarsCode 动手实验室",让大家亲手参与 AI 编程。

参与者以"队"为单位(最多三人,也可单人成队),现场直接用 AI 编程,完成一个小游戏。豆包 MarsCode 的同学会当场指导,与大家深度交流,并评出优胜作品。

通过现场 AI 技术交流实践,大家可以看看创意怎样通过 AI 快速落地

点击这里,或者扫描上方海报二维码,了解详情并报名。

(2)12月19日,上海举行豆包 MarsCode 编程挑战赛。参赛者借助 AI,在规定时间内完成4道算法题。

这可以作为面试练习,如果获奖还可以当作个人资历。点击这里了解详情并报名参赛。

科技动态

1、树莓派掌上电脑

一支国外团队推出了"树莓派掌上电脑",看上去很酷。

它就是一个全功能的 Linux 系统,带有7小时续航。

它还有一个可组装版本,屏幕是单独分离的。

下面可以配上键盘,也可以配上手柄。

它是开源的,制作团队希望将成本控制在250美元。

2、超声波洗澡机

1970年的大阪世博会,三洋公司展出了一台超声波洗澡机。

人坐进去,头露在外面,机器里面是水。

按下按钮,机器就会释放出超声波,通过震动达到清洁的目的。

它与现在市场上的"超声波清洁机"的原理是一样的,只不过它用来给人洗澡。

这台机器从未投入生产。明年2025年,大阪将再次举办世博会,一家公司重新生产了这台机器,专门用于医疗保健领域。

3、升缩鞋

青少年的鞋子往往只能穿一年,然后就穿不下了。

一家美国公司设计了升缩鞋,鞋会跟着脚一起长。

它的做法就是把鞋底分成两块,中间使用弹性材料连接。

如果脚变大了,鞋也会随之被撑开。

为了穿着舒适,鞋面也采用升缩材料,编织成袜子状的网眼结构,穿进去也比较容易。

这种鞋的另一个好处,就是不用区分脚码,一双鞋适合多个脚码。

4、其他

(1)三星工程师做出了一个"拍照机器人",只要你告诉它想拍什么样的照片,它就会自动摆出最佳姿势,为你拍照。

文章

1、我们为什么转向 Astro(英文)

作者原来使用 Next.js 框架,因为受不了 React 和 Next.js 的种种问题(主要是复杂性),转向了 Astro 框架,本文是使用感受。

2、Phoenix LiveView 1.0.0 发布了(英文)

Phoenix LiveView 是 Elixir 语言的 Web 开发框架,(目标是)用更简单的模型,实现 React 框架的所有功能,同时还支持高并发。本文是它的介绍。

3、我如何用机上 WiFi 获知飞机方位(英文)

作者乘坐飞机时,利用航空公司的服务器,绘出了当前飞机的飞行路线。

4、如何用 Cloudflare 重定向 URL(英文)

作者的个人网站更换了域名,他就用 Cloudflare 将旧网址重定向到新网址,完全免费。

5、不要用 SQL 的 count(*) 语句与 0 比较(英文)

一篇 SQL 科普文章,不要用 count(*) 等于 0,来判断不存在符合条件的记录。

6、如何用手机远程解锁 Windows(英文)

Windows 11 有一项功能,允许你用手机的指纹识别或人脸识别,解锁 Windows。

7、如何用 Docker Compose 安装 phpMyAdmin(英文)

一篇初学者教程,关于怎么用 Docker Compose 在本机架设数据库应用。

工具

1、Bananas

一款跨平台的桌面应用,利用点对点连接与其他人共享您的屏幕,无需帐户或任何服务器(初始连接除外)。

2、jsontr.ee

一个 JS 网页库,将 JSON 数据转成可视化的树状图。

3、WatchAlert

开源的轻量级监控告警系统,基于 Go + React。(@Cairry 投稿)

4、Easy Resizer

一个在线工具,批量调整图片的大小。(@mywebtools 投稿)

5、IconEase

开源的跨平台桌面应用,用来管理本地的图标文件。(@JiuRanYa 投稿)

6、X.Ryder

一套网站后台的 UI 开发模板。(@pipijoe 投稿)

7、Peninsula

基于 macOS 刘海的窗口管理器和消息中心。(@Celve 投稿)

8、Summary Cat

用户提交一个 YouTube 视频网址,它会用文字总结出该视频的内容。

9、ubicloud

一个可以自己搭建的云环境,能够直接运行 GitHub Actions 脚本。

10、matcha.css

一个加强浏览器的网页默认样式的 CSS 库。

AI 相关

1、Bylo.ai

免费的 AI 图像生成网站。(@aaamomo64 投稿)

2、Color Diffusion

一个开源的 Python 程序,使用 Diffusion 模式对黑白照片上色。

3、AI 聚合搜索引擎

该网站聚合多个 AI 搜索引擎入口,可以切换不同的搜索引擎进行搜索。(@ovelv 投稿)

资源

1、Hi Speaking

一个英语跟读网站,你按照课本读一句,它会自动播放下一句,省去了手动点击。(@jiweiyuan 投稿)

2、In Pieces - 30 endangered Species

一个很有创意的网站,用30个碎片拼出30种濒危动物,只使用 CSS。

3、数据可视化目录

这个网站按照用途,将数据可视化分类,便于查找你需要的图表类型。

图片

1、乐高面板

乐高积木可以搭建各种机器和宇宙飞船,所以有很多控制台单元,使用了各种各样的设计。

从中可以学习,怎样的控制台设计才是好的。

下面是一些糟糕的设计,你根本分不清,什么操作用什么按钮。

如果将功能相近的按钮,分成几个区块,辨识度就会大幅提高。

上图中,最右边的设计辨识度最好。

下面三个控制台最简单干净,带有可视化元素,属于最好的设计。

2、为什么老照片的人们不微笑?

19世纪末和20世纪初的老照片,人们的表情往往很严肃,即使微笑,也非常轻微。

一个主要原因是,那时的照相机需要长时间曝光,人们必须静坐好几分钟才能拍照。

微笑是一种快速反应,而不是一种持续的表情状态。当你必须静止几分钟才能拍照时,你根本不可能保持微笑那么久。

文摘

1、10亿次心跳

哺乳动物随着体型变大,心跳逐渐放慢,这是为什么?

比如,仓鼠的心跳是每分钟450次,猫是150次,猪是70次,大象是30次,鲸是20次。

原因可以这样理解,假定猫的体积是仓鼠的10倍,那么猫的新陈代谢率(它燃烧能量的强度)也应该是仓鼠的10倍,毕竟猫有10倍的细胞在消耗能量。

但是这不可能,如果真的这样,猫就会因为体温过高而死亡。因为新陈代谢会产生热量,需要散热,但是猫的表面积并没有仓鼠的10倍,必定有一部分热量无法散发出去,导致体温过高。

为什么猫的表面积没有仓鼠的10倍?

中学数学告诉我们,表面积增长的速度,慢于体积增长的速度。举例来说,如果球体的体积增长一倍,变成原来的两倍,表面积只是原来的1.59倍。

既然无法散发所有的热量,所以大型动物的新陈代谢必然慢于小型动物。相应的表现就是心跳放慢,降低新陈代谢的强度。

这就是为什么体型越大,心跳越慢。

动物学家还发现一个有趣的现象,哺乳动物不管体型大小,一生的总心跳大概在10亿次左右。

仓鼠的寿命是3年,猫是15年,猪是25年,大象是70年,鲸是80年。

结合它们的心率,不难算出,仓鼠一生的总心跳是7.1亿次,猫是11.8亿次,猪是9.2亿次,大象是11亿次,鲸是8.4亿次。

这些动物的总心跳都在10亿次左右。

奇怪的是,人类不符合这条规律。人每分钟心跳60次,平均寿命70年,总心跳是22.1亿次。

言论

1、

萨尔瓦多政府将比特币作为国家储备,目前拥有5,940个比特币,价值5.82亿美元。

但是,他们怎么保管钱包的密钥呢?万一密钥泄漏,国家岂不是破产了。

-- Hacker News 读者

2、

19世纪的德国哲学家尼采,以前的写作风格是不断的长句,复杂的推理和解释。

后来,他用上了打字机,写作风格逐渐从长篇论证变成短篇的格言警句,变得像电报那样。

-- 《打字机如何改变尼采》

3、

内部平台效应(inner-platform effect)指的是,程序员倾向于创建一个可定制的内部系统,成为他们正在使用的外部软件的复制品,而且通常是一个糟糕的复制品。

-- 维基百科

4、

我爱那些渴望不可能的人。

---- 歌德

5、

我通常不愿意对技术做出预测,但我感到相当有信心的是,因为 AI 如此善于写文章,几十年后懂得如何写文章的人一定不会很多。

-- 保罗·格拉汉姆,硅谷创业导师

往年回顾

新基建的政策选择(2023 #281)

互联网公司需要多少员工?(2022 #231)

移动支付应该怎么设计?(2021 #181)

你的头脑是二值逻辑,还是三值逻辑?(2020 #131)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月 6日

AI 应用无代码开发教程:工作流模式详解

作者 阮一峰
2024年12月2日 18:39

一、引言

一个月前,我写了一篇《AI 开发的捷径:工作流模式》,引起了很多读者的兴趣。

大家都认同,AI 应用是开发者的机会,而图形化、低代码/无代码、不需要编程基础的"工作流模式",正是 AI 应用开发的入门捷径。

但是,我的那篇文章只介绍概念,没有操作步骤。很多读者实际上手时,遇到了困难,有些地方不理解,做不下去。

今天就是后续,我详细演示,一步步图解,没有编程基础,如何搭建一个最简单的 AI 应用。只要你跟着做,就能做出来。

二、开发工具

这篇教程使用的开发工具是扣子(Coze),所有操作都在它的浏览器 IDE(集成开发环境)中完成,

选择扣子(Coze),主要原因有三个。

(1)它是国产的 AI 应用开发平台,字节跳动的产品,界面、文档、客服都是中文。

(2)它有无代码编辑器 Project IDE,包含组件拖拽的 UIBuilder,可以生成全功能的前端界面,上手门槛相对低。

同时,它也提供后端数据库,可以数据读写。

(3)它免费使用(只要不超过使用额度),发布上线也不收费,适合新手练习。

三、示例项目

我们的示例项目,是一个最简单的"AI 文言文生成器"。

大家先看成品,可以点进去试用。(建议 PC 访问,UI 还没有适配手机。)

输入一段汉语白话文,点击按钮,AI 就会自动生成文言文。

架构上,它非常简单:前端是一个网页表单,将用户的输入发送给后端的 AI 模型,并展示后端的返回结果。

它的开发只需要两步,第一步先让后端的 AI 模型跑起来,第二步做一个网页,连接后端即可。

扣子的方便之处在于,前后端的生成都是图形化操作:后端是编排工作流的节点,前端是 UIBuilder 的界面拖拽组件。

下面就是开发步骤。为了保证大家跟得上,我写得比较详细,看起来有点长,但是实际操作是很快的,熟练的话,10分钟就能完成。

四、创建项目

首先是开发的准备工作,先创建 AI 应用。

(1)访问扣子官网,点击右上角的"基础版登录"。(基础版只比专业版少一些企业级功能,普通用户完全够用。)

(2)登录后,自动跳转到个人主页,点击左侧菜单的"工作空间"。

工作空间里面,有"项目开发"和"资源库"两个页面。进入"项目开发",可以看到你所有的项目。

(3)点击右上角的"创建"按钮,跳出一个弹框。

上面有两个选项,"创建智能体"是创建一个传统的 AI 聊天,"创建应用"则是创建一个自定义界面的 AI 应用。

(4)选择"创建应用",这时会让你选择应用模版,点击"创建空白应用"。

接着,输入项目的名称,这里是"AI 文言生成器"。

至此,项目创建完毕,系统会自动进入"AI 文言生成器"的应用主页(下图),正式的开发工作就要开始了。

五、业务逻辑

应用主页的最上方,有"业务逻辑"和"用户界面"两个分页,默认是"业务逻辑"页面。

这一节就讲解如何创建业务逻辑,也就是后端的 AI 模型。

我们采用工作流模式,即将业务逻辑编排成一个个节点。

(1)点击左侧菜单的"工作流"后面的"+"号,选择"新建工作流"。

输入工作流的名称和描述。(注意,名称只能是英文字母、数字和下划线,本例是 classicalchinesecreator。)

(2)工作流创建成功后,名称会出现在左侧菜单的"工作流"标签下方。点击它,就进入该工作流的"节点编排"画布。

画布上,默认有"开始"和"结束"两个节点。

(3)点击下方的"添加节点",添加一个新节点,类型设为"大模型"。

然后,将这三个节点连起来(通过拖动边框上的控制点)。

(4)配置"开始"节点。双击该节点,在配置框增加一个 content 变量,表示用户的输入内容。

(5)配置"大模型"节点。

配置窗口的各个选项,填写如下。

模型:可以按自己的需要选择,这里保持默认值"豆包 Function call 模型"。

输入:将原来的 input 参数改名为 content,并跟"开始节点"的 content 变量连接起来。

系统提示词:输入以下内容,用来设定大模型的行为。

角色

你是一个专业的汉语文言文作者,能够准确地将用户输入的汉语白话文内容改写为文言文,不进行随意扩写。

技能

技能 1:文言文写作

  1. 当用户提供一段汉语白话文时,迅速将其改写成文言文。
  2. 确保改写后的文言文的准确性和完整性。

限制:

  • 只进行文言文改写,不回答与文言文改写无关的问题。
  • 严格按照用户提供的汉语白话文进行改写,不得擅自增加内容。

用户提示词:输入以下内容,作为给系统的直接命令。

将用户输入的汉语白话文{{content}}改写成文言文。

上面文本中的{{content}},表示此处系统将插入 content 变量的内容。

输出:将输出格式改为"文本"。

(6)配置"结束"节点。首先点击配置框上部的"返回文本"。

输出变量:将 output 参数关联"大模型"节点的 output 变量。

回答内容:输入{{output}}(表示插入 output 变量的内容),并打开"流式输出"(即打字机效果)。

至此,整个工作流的搭建全部完成,可以单击画布右上角绿色的"试运行"按钮,测试工作流是否正常运行。

在 content 输入框,输入测试内容,比如"今天天气很好"。

然后,点击下方的运行按钮,就可以得到运行结果(今日,天善)。

如果一切正常,就可以开始搭建用户界面。

六、用户界面的搭建:页面布局

(1)点击进入画布上方的"用户界面"分页。

(2)在左侧菜单的组件面板,找到布局组件 > 容器组件,将其拖入中间的画布,作为页面的标题区域。

系统自动将这个容器命名为 Div1,双击进行配置。

尺寸:宽度为100%,高度为 60px。

布局:排列方向为"横向"。

样式:去除背景色,将边框设为灰色(#E2E8F0)。

(3)在 Div1 下方,再拖入一个容器组件,系统自动命名为 Div2,用作功能区域。

配置基本一样:尺寸部分,宽度和高度都设为填充容器;布局部分,排列方向为横向;样式部分,去除背景色。

(4)在 Div2 内部的左侧部分,拖入一个容器组件 Div3,用作用户输入区域。

宽度设为50%,高度设为 550px,样式删除背景色。

(5)在 Div2 内部的右侧部分,拖入一个容器组件 Div4,用作展示结果区域。

宽度设为50%,高度设为 550px,样式删除背景色。

至此,页面布局如下图。

七、用户界面的搭建:页面细化

做好布局后,下一步完善页面细节。

(1)在 Div1 内部,拖入推荐组件 > 文本组件,作为标题文本。

标题内容设为"AI 文言文生成器",字号改成24,字重为粗体。

(2)在 Div3 中拖入一个表单组件,删除不需要的元素,只剩下文本输入框和按钮。

表单组件:宽度和高度都设为填充容器,并删除边框。

文本输入框:拉伸高度,宽度设为填充容器,标签和占位文案设为"输入汉语白话文"。

按钮:文本改为"生成文言文"。

完成后的表单效果如下图。

(3)在 Div4 中拖入一个展示组件 > Markdown 组件,作为展示文言文区域。

删除 Markdown 组件的已有内容,改成"###### 生成结果"。高度和宽度改为填充容器,圆角设为10,内边距设为20,边框设为灰色(#CBD5E1)。

至此,页面细化完成,单击属性面板上方的预览,查看效果。

八、用户界面的搭建:配置事件

页面外观做完后,要配置事件,将后端的业务逻辑与用户界面连接起来。

(1)点击"生成文言文"按钮,在配置面板切换到"事件",点击"新建"。

事件类型设为"点击时",执行动作设为"调用 Workflow",workflow 设为已经创建好的"classicalchinesecreator",并将工作流的入参content设为文本输入框的值 {{ Textarea1.value }}。

(2)配置生成结果区域,展示工作流的返回结果。

选中 Markdown 组件,点击"内容"栏的扩展按钮。

扩展面板中,在###### 生成结果后面添加一行,插入工作流的返回结果{{ classical_chinese_creator.data }}

完成所有配置后,单击右上角"预览"按钮,测试整体效果。

如果一切正常,这个 AI 应用就算开发完成了。

九、应用发布

开发完成后,就可以发布该应用,让其他人也可以使用。

点击右上角"发布"按钮,版本号设为 v0.0.1,发布平台设为发布到扣子商店。

至此大功告成,"AI 文言生成器"就登录扣子商店,向世界公开了。

十、总结

大家可以根据这个示例,改变输入 AI 模型的提示,让它做不同的任务,就能变化出很多不同功能的应用。

比如,官方的"AI 翻译"示例,就是让 AI 把用户输入的中文译成其他语言,跟"AI 文言文生成器"异曲同工。

除了文本生成,扣子还提供许多其他能力,比如抓取外部数据、数据库读写等,从而可以做出更强大的 AI 应用。

总之,"工作流模式"使用图形化界面搭建一个 AI 应用,简单而便捷,随时查看效果,一键发布,值得大家尝试。

(此处有分割线。)

最后是一个活动预告。

扣子邀请我,参加12月19日在上海举行的"扣子开发者日",也欢迎大家参加。

届时,字节的 AI 工程师会跟大家面对面交流,如何开发和推广 AI 应用。这是很好的学习交流、获取资源的机会,点击这里了解详情。

扫描下方海报二​维码,或者点击链接现在就可以线下报名参加,或者线上预约直播

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月 2日

科技爱好者周刊(第 327 期):没有链接的互联网

作者 阮一峰
2024年11月29日 08:17

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

杭州钱江世纪城东部的一大片农田,号称"稻田 CBD",最近迎来了丰收。该农地被政府保留,让城市与田园融合。(via

没有链接的互联网

你能想象吗,没有链接的互联网是什么样?

不用想了,这正在变成现实。

2017年,脸书(Facebook)出台了一项政策:只要帖子里面有(外部)链接,就会减少这个帖子的曝光。

也就是说,只要你贴了链接,别人就(几乎)看不见你的帖子了。这样做是为了防止用户跳出脸书,也为了防止用户为其他网站引流。

所以,你现在访问脸书,就会看到一种奇特的做法:大家发帖都没有链接,有些帖子甚至只是一句话的图片(下图),真正的链接放在帖子的置顶评论里面。

后来,其他的互联网平台纷纷跟进,限制链接。

最典型的就是推特,它不断增加防止用户跳出的措施。先是推出"话题"功能(thread),后又解除字数限制,允许发布长文,尽量消除用户张贴链接的动机。最近,它将链接自动转成预览图时,甚至会隐藏页面标题,让用户察觉不到这是一个链接。

就连谷歌这种搜索引擎,也在防止用户跳出。搜索时,谷歌会直接显示一段 AI 生成的内容总结(下图),避免你去点击外部链接。

国内平台也是如此,有过之而无不及,比如微信、抖音,都严格限制外部链接。

总之,大型互联网平台都在排斥链接。它们的共识就是,必须把用户留在自己的花园,防止他们离开。

这种情况,将来恐怕愈演愈烈。因为 AI 可以实时生成内容,更没有必要让用户访问外部内容了。

没有链接可点击,这将彻底改变互联网生态。我看到一篇文章,列出这种趋势的七大后果,总结得很好。

(1)独立网站会消失,因为没有流量来源了。所有人都依赖大平台,只能在平台上发布内容,否则没人能看到。

(2)数字出版行业终结,因为不需要单独的出版环节了,直接发布到大平台就可以了。

(3)域名不再具有价值,因为小网站不管采用什么域名,都没有访客。大多数域名注册商会关门。

(4)网络托管业务将会收缩,因为网站数量将减少,个人架设网站的需求越来越少。

(5)独立的互联网广告业也会消失。所有的互联网广告,都将由平台控制,独立的广告联盟一钱不值。小网站也不可能通过互联网广告赚到钱。

(6)SEO 无用了。小网站没有流量了,优化搜索引擎的排名有何意义呢?

(7)信息表面化。因为用户不太可能在平台上贡献深层次的详细内容,所以平台提供的大多是表面信息,能够帮助用户的深层次的内容将难找到。

[本周软件] 扣子 Project IDE

如果你还不知道扣子(Coze),我简单说一下。它是字节旗下的 AI 应用开发平台,帮助用户开发各种基于 AI 模型的应用软件

要是你有 AI 相关的创意,但不知道怎么做成软件,就可以用它:图形化界面,低代码操作,没有编程经验的人也能使用。

昨天,它发了一个大更新,推出了全新的浏览器编程界面 Project IDE(下图)。

用户点击"创建"按钮后,选择"创建应用",就可以进入。页面上提供多个 UI 组件,只要拖拽就能生成前端界面(UBuilder),并且适配移动端。

同时,它还简化了后端数据库的读写 也就是说,你只需要在浏览器里面点击,就能生成完整的前端 + 后端的 AI 应用

完成后,可以立即上线运行,发布在扣子、微信、抖音等多种平台,也可以 API 调用。

想用 AI 模型开发的同学,不妨试试它,完全免费(不超出使用量额度)。

另外,"扣子开发者日"的线下活动,12月19日在上海举办,字节的 AI 工程师会跟大家面对面交流,如何开发 AI 应用。扫描下方海报二​维码,现在就线下报名参加/线上预约直播

科技动态

1、露西50周年

50年前的1974年,美国人类学家在埃塞俄比亚的偏远地区,发现了一具320万年前的南方古猿化石,取名为"露西"。

她的身形跟一个四岁女孩差不多,后来被确认为目前发现的最古老的人类祖先化石。有人称她为"人类的祖母"。

在发现她之前,科学家认为,人类是先进化出大脑,再直立行走。但是,露西的大脑很小,却是直立行走的,因此人类是先直立行走,再进化出大脑。

2、鲨鱼皮飞机膜

曾经有一种鲨鱼皮泳衣,模仿鲨鱼的皮肤特征,可以大大减少水的阻力,从而提高游泳速度。

因为这种泳衣的作用太明显,国际泳联不得不在2010年禁止在比赛中使用它。

现在,有人想到一个点子,如果把这种鲨鱼皮做成膜,贴在飞机表面,不就能大幅降低空气阻力了吗?

瑞士航空采纳了这个点子,在他们的12架波音777上,全部贴上鲨鱼皮飞机膜。上图的飞机表面反光处,就是贴了膜。

他们现在宣布,经过一年的尝试,取得了良好效果,去年节省了近2,200吨煤油。

这种鲨鱼皮的膜并不完全光滑,有特定的凹槽,符合流体力学特征,有利于减少表面与空气的摩擦。

以后,飞机可能跟手机一样,使用之前都要贴膜。

3、宽带的标准是多少?

现在上网,全部都是宽带。但是,宽带到底需要多宽,却有着不一样的说法。

以前的资料说,带宽 512kbps 以上就是宽带。这也未免太窄了,最高下载速度只有 64KB/s,下载一个 100MB 的文件,超过26分钟。这算什么宽带?

美国联邦通信委员会 FCC,今年提高了宽带的标准,下行速度从 25Mbps 提高到 100Mbps,上行速度从 3Mbps 提高 20Mbps。

也就是说,百兆是宽带的最低速度,低于100Mbps 就不叫宽带了。

4、其他

(1)微软的在线会议软件 Teams,允许用户克隆自己的声音,以便用另一种语言跟其他国家的人交谈。

(2)Starlink 宣布,明年推出手机卫星上网,但需要手机直连天空,也就是不能室内使用。

(3)新加坡为了节约淡水资源,推出用净化的污水生产的啤酒

文章

1、iTerm2 如何设置状态栏(英文)

iTerm2 是 Mac 电脑的终端模拟器,它有一个内置的状态栏,本文教你怎么设置。

2、我用投影仪当作显示器(英文)

作者的家庭办公室,使用投影仪当作显示器,如果你也想这么做,可以参考本文。

3、家庭机房的搭建感受(英文)

作者介绍搭建家庭机房的六点感受,其中一点是电费很贵。

4、浏览器的数据存储方法比较(英文)

本文介绍浏览器现在的几种数据存储方法: LocalStorage、IndexedDB、Cookies、OPFS、WASM-SQLite。

5、Bluesky 可以托管网站(英文)

Bluesky 是一个类似推特的微型博客服务,但使用开放协议。该协议允许上传和直接返回文件,因此可以用它托管网站。

6、Jest 与 Vitest(英文)

Jest 和 Vitest 是两个流行的 JS/TS 测试框架,本文对它们进行比较。

工具

1、Graphite

一款在线版的图像编辑器,代码开源。

2、Gimel Studio

平面图像编辑软件,最大特点是每一个编辑步骤都用一个节点表示,让你直观地编辑每个节点的参数。

3、Karpor

开源的 Kubernetes 可视化工具,提供搜索、洞察、AI 等能力。(@elliotxx 投稿)

4、dmMiniPlayer

开源的浏览器插件,在视频播放的画中画窗口里,配置进度条、音量等功能。(@apades 投稿)

5、四象限编辑器

开源的在线工具,在网页上编辑、生成四象限图,可用于插图、PPT 等。(@KwokKwok 投稿)

6、Git Stats

VS Code 插件,可视化查看团队成员的代码提交情况。(@lixianmin 投稿)

7、Bootstrap React Logic

基于 BootStrap 封装的 React 组件库。(@dafengzhen 投稿)

8、rmtrash

macOS 命令行工具 rm 的替代方案,用于将文件移动到废纸篓。(@TBXark 投稿)

9、mpv

一个命令行的视频播放器,跨平台。

10、Animate.css

一个网页动画的 CSS 库,指定 DOM 元素的类名,产生动画效果。

AI 相关

1、Lobe Chat

开源的 AI Chat 工具,支持几乎所有 AI 大模型。(@tcmonster 投稿)

2、AI git commit

一个 Jetbrains 插件,使用 AI 生成 git 的提交信息。(@HMYDK 投稿)

3、UICloner Extension

浏览器插件,一键克隆任意网页 UI 组件,生成代码。(@AndySpider 投稿)

4、MagicMirror

一个开源的桌面应用,一键 AI 换脸、换发型和穿搭。(@idootop 投稿)

资源

1、GitHub Insights Pro

GitHub 的数据分析与可视化平台,提供项目和用户的各种统计信息,以及排行榜和趋势榜。(@wincatcher 投稿)

另有一个同类项目 GitHub Persona。(@Ray-D-Song 投稿)

2、Visual Sorting

各种排序算法的可视化演示,代码开源。

3、看见概率论

一个中文的数学教育网站,通过交互式可视化演示,讲解概率论知识。(@wincatcher 投稿)

图片

1、比亚迪的厂房

下图是比亚迪的郑州工厂与特斯拉的得州工厂的大小对比。

左边的白色厂房群是比亚迪郑州工厂,宽度约为3.2公里。

右边是同样比例尺的特斯拉得州工厂。

2、发向 M13 星团的消息

1973年11月16日,美国科学家通过波多黎各的阿雷西博望远镜,向 M13 星团发出一条二进制消息。

这条二进制消息,解码后是一个长条的图形,包含了很多内容:人类长什么样、哪些化学元素和生物分子构成了人类的 DNA,太阳系的行星系统、1974年人口数量等等。

该消息将在大约25000年后,到达 M13 星团。

文摘

1、高效率时段

一天24小时,你无法每时每刻都保持专注。

一个人每天的高效率时段,只能持续一会,然后就会消失,无法再恢复。

所以,如果某个时候,你不能保持专注了,那就不要再反复尝试,接受这个事实,转而去做一些更简单、不需要那么专注的事情。

亚马逊创始人杰夫·贝佐斯,就曾经说过:"我喜欢上午10点举行重要会议。如果到了下午五点,我的脑子就什么也想不了,只能把事情推迟到第二天上午10点。"

所以,你最好的选择就是,每天尽早完成尽可能多的工作。这段时间要限制外界的干扰,多做困难的事情,直到你感到疲劳为止。

当你觉得疲劳、无法保持专注了,那就不要抵抗它,把还没做完的事情推迟到第二天,转向更简单的任务,或者干脆什么也不做了。

有些人为了专注工作,会每天早起。我的一个朋友则是习惯在晚上11点到凌晨4点,全力工作。

他们都会避开白天的高峰时段:炎热的天气,每个人都在忙,消息满天飞。即使你的能力再强,此时都无法逃脱外界的干扰。

请记住,每天你一醒来,时间就在一分一秒流逝,你不知道自己的精力能维持多久。你需要做的,就是问自己:在你无法保持专注之前,能做多少事情?

言论

1、

几年前,马斯克宣布 Starship 飞船的火星计划时,我开玩笑说,等到它把人类送上火星时,英国还没有开通前往曼彻斯特的高铁。

不幸一语成谶,英国首相今年早些时候宣布,取消曼彻斯特的高铁计划。

-- 彼得·黑格,英国天文学家

2、

SUSE 公司的 Linux 企业级发行版,在2019年推出时,承诺对这个版本提供支持直到2038年。

为什么支持期长达19年,而不是18年或20年?原因是 Unix 时间原点是1970年1月1日零点,32位系统会在2038年发生时间溢出。所以,他们就支持到2038年,时间溢出就不用管了。

-- 《SUSE 为什么有19年支持期》

3、

为什么法律的语言这么难懂?一种解释是,这类似于咒语,古代的咒语也非常难懂,跟日常语言截然不同,这样象征着一种特殊的权威。

-- 《为什么法律以难以理解的方式书写?》

4、

我非常不喜欢,电视播放交响音乐演奏会。交响音乐会本质上是声学体验,但是电视使得人们的注意力转移到画面,变成了视觉体验。

这对音乐不利,音乐的存在是为了听而不是为了看。

-- 《电视交响音乐毫无意义》

5、

斐波那契数列有一个有趣的特性,连续的两个数(比如,5和8,21和34)是英里和公里的关系,比如5英里约等于8公里。

-- 《斐波那契数转换英里与公里》

往年回顾

机器点餐与宅文化(2023 #280)

电子产品的用电量(2022 #230)

你想住在中国哪里?(2021 #180)

低龄化的互联网(2020 #130)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月29日

科技爱好者周刊(第 326 期):世界没有那么多财富

作者 阮一峰
2024年11月22日 08:00

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

内蒙古库布其沙漠的光伏基地,一望无际的光伏发电板铺设在沙漠之中。(via

世界没有那么多财富

维基百科有一个页面"人均财富排名"。

它列出了不同国家/地区的人均财富,可以用来比较生活水平:人均财富越多,生活水平越高

需要注意的是,它比的是财富,不是收入。

财富的范围更广泛,除了收入,还包括其他资产(比如房产、股票、汽车等等)。财富的计算公式是,你的资产减去你的负债

财富 = 资产 - 负债

这个页面提供了很多统计数据,我分享其中一些。

(1)2022年底,全世界的总财富是454.3万亿美元。

我们常说"把蛋糕做大",这就是蛋糕目前的大小。它除以全世界53.6亿的成年人口,可以得到,每个成年人拥有财富8.47万美元(约60万人民币)。

所以,如果你的财富超过60万元人民币,就超过全世界至少一半人了

(2)美国的人均财富是55.1万美元,中国是7.57万美元,只是美国的七分之一。

因此,我认为,中国未来的增长空间巨大。理由是中国没可能停留在人均财富只有美国七分之一的水平,就增长不动了。

(3)中国人均财富7.57万美元,相当于55万人民币。乍一看,你可能觉得,一个成年人拥有55万人民币的财富,这并不少。

但是,实际上是很少的。

假定这55万都是现金,那么即使过得很节俭,房租+日常消费每月3000元,也只够生活15年。想靠这些钱退休还差得远,你还是必须工作赚钱。

假定这55万里面包括了不动产和固定资产(比如汽车),由于存在折旧和市场波动,它们可能会不断贬值。等到变现的时候,你的财富很可能大幅缩水。

结论就是,55万人民币的人均财富,实际价值比名义价值低很多,根本不够支撑长期生活。

(4)这就是世界的现状:现有的财富总量,不足以让每个人摆脱贫穷

对于普通人来说,即使能够达到平均值,你的财富也是不够的,这个世界就没有那么多财富。

一个社会想要致富,归根结底还是需要创造更多的财富。 真正的财富不是财富本身,而是创造财富的能力。如果你能够创造财富,那才是真正的财富,比那些静态的财产更有价值。

"创造财富"的方法,就是能够不断生产出人们需要的东西。这才是国家和个人最应该培养的能力。

[本周软件] Rspack 工具栈

现在有一个趋势,JS 工具纷纷使用 Rust 语言重写,速度可以提高至少一个数量级。

最近,我就在使用这样一个"新生代工具" Rspack,感觉很不错,介绍给大家。

Rspack 本身是 Rust 应用,用来取代老牌的 JS 构建打包工具 Webpack。

使用后的速度提升,非常明显,Rspack 的耗时大概是 Webpack 的十分之一。如果 Webpack 需要10秒,Rspack 就是1秒。

但是,它的最大优势还不是快,而是 Webpack 的无缝替换。你基本上不需要改动配置,直接把配置文件webpack.config.js改名为rspack.config.js即可。

Rspack 不仅兼容 Webpack 的语法,还兼容插件。根据官方文档,下载量最高的50个 Webpack 插件,80%以上可以直接使用,剩下的也有替代方案。

Rspack 团队为了保证兼容性,向 Webpack 官方仓库做了100多次提交。甚至 Webpack 的主要维护者之一的 Alexander Akait 亲自动手,让很多插件可以在 Rspack 正常运行。

另外,Rspack 的功能也更多。比如,Webpack 模块联邦(Module Federation)的作者 Zack Jackson 加入了 Rspack 团队,为 Rspack 实现了模块联邦 2.0。

它在社区已经得到很多好评,发布一年多以来, GitHub 仓库有9800颗星星,今年还获得了 GitNation 基金会的"年度突破开源项目"奖。

今年8月,它发布了 1.0 版,API 已经稳定了,可以放心用于生产环境。

不过,由于全盘继承 Webpack,Rspack 也同时继承了前者的体验问题:配置麻烦,上手不算容易。开发团队为了解决这个问题,在 Rspack 的基础上,封装了一系列更简单易用的衍生工具

  • Rsbuild: 专注于构建 Web 应用。
  • Rslib: 专注于构建 JS 软件包。
  • Rspress:专注于生成静态站点,比如文档和博客。
  • Rsdoctor:专注于构建分析。

以上这些工具,底层都是 Rspack,分别用于不同的用途,统称为"Rspack 工具栈"。

其中,Rsbuild 是更简单易用的构建打包工具,对标 ViteRsbuild 的底层是 Rspack,就像 Vite 的底层是 esbuild + Rollup 一样。构建项目时,你可以选择 Rspack,也可以选择 Rsbuild,后者的配置更简单一些,体验更好,针对性的功能更多。

对于国内开发者,Rspack 工具栈还有一个好处。虽然它来自一个国际化团队,但是属于字节开源出来的工具,字节内部大量项目已经采用,中文支持和中文文档都是优先的。

大家使用 RspackRsbuild 后,如果遇到问题,就去项目仓库提 issue,官方都会快速回应。

科技动态

1、风力发电飞艇

一家北京公司推出了风力发电飞艇。

这个飞艇长23米、直径15米,艇中央有一个直径5米的涵道,里面安装了风力发电机,叶片长2.4米。

飞艇飞到500米的高度,风力发电机进行发电,然后通过电缆将电力传回地面。

高空的风远大于地面,因此高空风力发电的效果更好。

这个飞艇的远期目标是飞到"风能密度为地面200倍、年发电时长为地面4倍以上的平流层(高度约1万米)",将风力发电成本降到现在的十分之一。

2、局域网游戏室

一个美国程序员出于怀旧,在家中地下室建造了一个局域网游戏室。

游戏室一共可以容纳12人对战,电脑台都是折叠的,可以收纳进墙壁。

下面就是电脑桌全部收起来的样子。

他设置了一个家庭服务器,游戏软件存在里面,电脑终端去读取游戏。

布线是一个大工程。

他还专门准备了一个储藏室,存放电脑的内存、CPU 和显卡等配件。

虽然建成后运作良好,但他有一个最大的烦恼:现在的游戏只支持互联网对战,很少支持局域网对战,大多数时候他只能玩老游戏。

3、金字塔的建材

埃及金字塔位于沙漠之中,科学家一直很困惑,建造金字塔的巨大石块如何运进沙漠?

那些石块每个有2.5吨重,古埃及人用了什么方法,长途运输几千块巨石。

最近的一项发现,可能揭示了答案。科学家使用卫星照片,发现尼罗河有一条已经干涸的支流。

几乎所有的金字塔都分布在这条支流的旁边,这说明古埃及人很可能通过水运,将巨石送到建筑地点。

上图中,深蓝色是现在的尼罗河,浅蓝色是那条已经干涸的支流,各种颜色的点是金字塔的位置。

4、其他

(1)一个国外程序员在自行车训练机的把手上,装了两个分离式键盘,可以一边骑车,一边打字。

(2)CSS 有了一个新的徽标

(3)卡西欧推出一款形似手表的戒指。

文章

1、排版引擎纵谈:程序员的视角(中文)

本文介绍并对比了几种排版引擎,重点是 CJK 文字处理: HTML + CSS、LaTeX、LaTeX.js、Typst 和 react-pdf。(@xiaohanyu 投稿)

2、AI 的视觉注入攻击(英文)

本文介绍如何在图片里面,进行"视觉注入"(visual prompt injections),从而欺骗 AI 模型。比如,上图男子拿着一张纸,上面写着"忽略我这个人"。

3、服务器端渲染简介(英文)

本文举例介绍网页应用的"服务器端渲染"是什么,也就是大家常说的 SSR(server side rendering)。

4、带有平铺式窗口管理器的 Linux 桌面(英文)

对于大量使用键盘的人,平铺式窗口管理器最好用。本文介绍了内置平铺式窗口管理器的 Linux 桌面环境。

5、12 个当代 CSS 的一行代码增强(英文)

本文介绍12种 CSS 的新写法,只要一行代码,就能增强网页样式。

6、如何正确使用 git worktree(英文)

git 有一个 worktree 功能,大多数人只把它当作分支功能的替代方案。作者提出,应该把 worktree 用来管理并发任务。

工具

1、Neat CSS

一个极简的 CSS 框架。

2、PG Back Web

一个带有 Web 界面的 PostgreSQL 备份工具。

3、Llama OCR

这个网站提供免费的图片 OCR,通过 AI 识别图片里面的文字,好像不能识别中文。

4、MySpeed

可以自己架设的网络测速工具。

5、dive

这个工具可以显示 Docker 镜像文件每一层的内容。

6、moffee

一个命令行工具,使用 Markdown 格式制作和展示幻灯片。

7、Google Backup

开源命令行工具,用来备份谷歌邮件、通讯录和日历。

8、lcl.host

一个为本地开发环境 localhost 提供 https 证书的工具。

9、Interactive Git Log

一个 VS Code 的插件,为 Git 提交日志提供一个可交互的图形界面。

10、Makeext

构建工具 Make 的一个扩展,让make命令可以输出项目的帮助信息。

资源

1、Sound Box

一个在线音效网站,提供多种自然环境音效以及白噪音。(@wincatcher 投稿)

2、I Don't Have Spotify

你输入 Spotify 的音乐链接,这个网站就会查找替代音源(比如 Youtube)。

3、DuckDuckGo AI Chat

DuckDuckGo 最近推出的免费 AI 聊天。

4、The Copenhagen Book

一组短文,介绍 Web 应用相关的用户认证知识。跟充满术语的加密学文章不一样,这组文章简明好懂。

图片

1、祖父的小提琴

前些日子,一位纽约程序员偶然得到了1912年拍摄的他祖父(下图拉小提琴者)的老照片。

他用 AI 模型为老照片上色。

他突然意识到,自己小时候见过照片里面的小提琴。

祖母去世时,家里人把祖母的东西都存放在阁楼。在他印象中,里面就包括一把小提琴。

他就跟妻子一起,回到老房子的阁楼找找看。

小提琴居然还在。

他请人修复了这把小提琴,把它交给自己的女儿。

他写道:看着女儿拿着100多年前她曾祖父的琴,不禁让人有一种时间穿越的感觉。

文摘

1、燃烧 NeXT

1990年,乔布斯决定推出新型号的 NeXT 电脑,外壳要用镁合金制作。

镁是一种相对昂贵的金属,非常坚固且重量轻。乔布斯认为,这样的外壳不仅美观,而且可以节省搬运和制造成本。

我当时是一名报道计算机行业的记者,但以前学的是化学。我对这个决定很感兴趣,我知道镁燃烧时会发出明亮的白色火焰,我不禁好奇地想,如果 NeXT 烧起来会是怎样。

1991年秋天,我采访了 NeXT 的硬件副总裁。采访结束后,我提出,能不能送给我一个 NeXT 的外壳,让我烧烧看。他笑着同意了。

第二天,我开车去工厂,拿到了电脑外壳。

我很快就发现了问题:镁合金需要高温才能点燃,普通火焰点不燃,但是我无法制造这样的高温。于是,我无可奈何,只能把电脑外壳寄放在朋友家里。

一年后,朋友告诉我,她厌倦了保留这个玩意。而且,NeXT 已经决定停产这个型号,于是我开始认真考虑怎么烧掉它了。我想,它燃烧的照片正好配合停产新闻,作为杂志封面。

设计燃烧方案时,我考虑到,镁燃烧时会发出明亮的白色火焰和大量的白烟,虽然烟雾无毒,但可能引起警察或消防部门的注意。于是,我给消防部门打电话,询问有没有燃烧许可证。但是,他们不清楚这些事情,没人烧过这么多的镁。我还被告知,必须获得空气污染的许可证。

最后,我沮丧地决定执行原来的计划:开车去沙漠深处,然后把它烧掉。

但是最后一刻,我想到了加州的劳伦斯·利弗莫尔实验室,这是一个隶属于能源部、由加州大学伯克利分校管理的实验室。很多武器在那里实验,我确信那里肯定有燃烧几公斤镁的设施,而且也有必要的许可证。

我打电话给他们,他们同意了借给我照明弹的实验室。这让我的摄影师特别高兴,因为室内燃烧更容易拍出好的效果,阳光直射下几乎不可能看到火焰。

正式燃烧的前一天,我又找了一台旧的 NeXT 电脑作为备用。

到了正式燃烧时,我们用气焊枪点燃了它。气焊枪的蓝色火焰,接触到了电脑外壳,半分钟后,它开始发出独特的橙色光芒,然后慢慢融化。突然间,一道耀眼的白光闪过,然后是稳定的白色火焰。

我知道镁燃烧得很明亮,但我不知道有多快。我想至少会持续一分钟,但事实证明,镁的燃烧速度非常缓慢。当火焰最终熄灭时,剩下的只是一些块状的奶白色灰烬----氧化镁。

下面我们那一天拍到的照片。

言论

1、

我不戴手表。原因很简单,因为现在是最重要的时刻。我不追求做更多的事,而是追求把当前的事做得更好。

-- 黄仁勋,Nvidia 的 CEO,解释为什么不戴手表

2、

15年前,一位巴西营养学家发现,尽管巴西家庭对糖和油的消费减少,但肥胖率却在上升。为什么人们吃得更健康,却变胖了?

他认为,这是因为精细加工食品的出现,促进了人们对食品的消化。他因此创造了"超加工食品"(ultra-processed foods)这个词。

从此,这成了科学界的共识:想要健康,应该吃一些粗粮,避免多吃精细加工的食品。

-- 《关于超加工食品的风险》

3、

AI 研究已经70年了,人们最近才发现,让 AI 成功的真正方法是大量的计算。

根本原因就是摩尔定律,它使得计算成本持续呈指数式下降。

-- 《马斯克的梦想和 AI 的教训》

4、

我遇到一个程序员,他完全不想使用 AI。因为他用过一次,发现错误很多,就不想再用了,也不想了解。

这件事令我很困惑。我理解 AI 被过度炒作了,可能对你正在做的事情没有用处。我不理解的是,在2024年,你怎么可能成为一名程序员,却对一项据说会从根本上改变我们未来编程方式的技术一点也不好奇。

-- 《他们都使用它》

往年回顾

网络社区的悲剧(2023 #279)

手机充电问题的解决(2022 #229)

AR 技术的打开方式(2021 #179)

创业的凸函数和凹函数(2020 #129)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月22日

科技爱好者周刊(第 325 期):VS Code 编辑器的下一站是 Zed?

作者 阮一峰
2024年11月15日 08:05

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

温州江心屿是瓯江里面的一个小岛,最近完成了改造工程。(via

VS Code 编辑器的下一站是 Zed?

程序员离不开编辑器,眼下最流行的代码编辑器肯定是 VS Code。

VS Code 其他都好,但有一个很大的缺点:性能。

它运行在 Electron 的沙箱里面,资源占用多,速度慢。我现在调用某些插件,就有明显的延迟。

它还有点臃肿,安装包 100MB,需要磁盘空间 500MB。

所以,当我听说有一个新的编辑器 Zed,性能出众,功能强大,就立刻安装了,下面就是我的使用体会。

首先说一下,为什么 Zed 吸引我?

(1)它的作者是原来的 Atom 编辑器的作者,以及 Tree-sitter 解析库的作者。

(2)它基于 Rust 语言,充分利用多核 CPU 和 GPU,追求极致性能,速度极快。

(3)它内置了 VS Code 的很多插件功能,比如 LSP(语言服务器协议)、代码提示补全、多人实时编辑、AI 助手等。

(4)它的开发非常活跃,GitHub 仓库的星星已经达到了 49K。

安装后,我一打开就觉得非常清爽,极简主义的界面,布局跟 VS Code 类似,没有学习成本,可以直接上手。

它的速度真是快,不管什么操作,一点即开。用久之后,再用 VS Code 都不习惯了。

编程需要的功能,大部分开箱即用。如果没有的话,可以去插件市场找找。

有些功能,我觉得很实用。比如,它有一个大纲面板(下图左),列出当前脚本的所有函数,点击函数名可以跳转到函数实现。

它还可以添加参与人(必须有 GitHub 账号),让你跟多人实时协作、聊天。

参与者的头像显示在窗口右上角。

虽然它有上面这些优点,但也有一些难以忽视的问题。

(1)它不是真的跨平台,目前只有 Mac 版本最完善,Linux 版本我遇到了不少问题,Windows 版本官方暂未支持。

(2)很多地方还没来得及做,你经常会遇到一些小功能缺失,找不到解决方法。

(3)它的设置就是一个大的 JSON 文件,没有图形设置界面,动不动就要查文档。

(4)AI 助手只支持 OpenAI、Claude 和本地运行的 Ollama 模型。

我的结论是,它的表现非常出色,但没有完全准备好,只适合那些看重性能、愿意自己解决问题的程序员。

总的来说,Zed 是 VS Code 很好的替代品,奉行极简主义,不臃肿,内置功能完备。明年的这个时候,它也许会让 VS Code 不再那么流行。

[本周软件]302.AI

面对层出不穷的 AI 模型,你会不会有一种想法,如果存在一个统一的使用入口该多好?

事实上,真有这样的产品。周刊以前介绍过一个网站 302.AI,就是这种思路。

它的定位是"AI 应用超市",可以看作是一个适配层,适配了各种各样的 AI 模型,让你都能通过它来使用。

你可以直接使用各种模型,也可以使用"工具超市"预置的30多种 AI 应用,比如下图的"AI 学术论文搜索"。

它还提供 API 调用,通过它的服务器,调用各种模型的 API。

它有试用额度,此后按照使用量收费,一般是底层模型原始价格的五折。

最后,它本周开源了,各种官网工具的源码都放出来了,仓库地址 github.com/302ai。他们用 Next.js,你可以用来开发自己的 AI 应用。

科技动态

1、34阶魔方

普通的魔方是3阶的,即长宽高各3个色块,但也有其他阶的魔方。

上图是2阶、4阶、5阶的魔方。

最近,有人用 3D 打印机做了一个世界最高阶的魔方,达到34阶。

这么大的魔方,转动起来很不方便,已经不适合用来游戏,而是适合摆弄许多奇特的造型。

随着 3D 打印的普及,做出更高阶的魔方也不是难事,但是缺乏实际意义。目前,量产的最高阶魔方是17阶。

2、Ping 时钟

ping 是一个命令行工具,用来显示本机到服务器的信号传输时间。

一位国外程序员突发奇想,制作了一个 Ping 时钟,在钟面上显示 ping 的耗时。

它的钟面有两根指针,长指针是每次 ping 的毫秒数,短指针是最长耗时。

钟面下部是液晶显示屏,显示当前所在网络,以及目标服务器。

每次只要运行 ping 命令,就能很直观地看到,长指针不停地摆动,网速可视化了。

这个时钟的源码,已经开源了,使用 ESP32 芯片、一个微型电机和定制的 PCB 电路板。有电路基础的同学,完全可以自己动手制作。

3、麻雀的新用途

麻雀有什么用?澳大利亚科学家想出一个新用途。

澳大利亚是世界主要的铅生产国,有28个铅矿。铅会造成人体中毒,对儿童影响尤其大。

科学家一直寻找监控方法,能够测试环境的铅泄漏。他们想到了麻雀。

麻雀比人类,更早摄入环境中的化学物质。只要抓住麻雀,测一下它们的血铅,就能了解是否有铅泄漏,从而可以早期发出报警(下图)。

4、其他

(1)一位美国物理学家总结出猫的行为方程,已知猫的质量和疲劳系数,可以算出猫从 t0 到 t1 的位移,该公式的目的是"唤起非专业人士对经典力学的兴趣"。

(2)CDN 服务商 bunny.net,推出边缘函数功能,基于 Deno,可以备用。

文章

1、如何简化 PATH 环境变量(英文)

Linux 系统有一个环境变量 PATH,指定可执行文件的默认路径。本文告诉你,怎么简化这个变量,更容易管理。

2、AppData 目录的作用(英文)

一篇科普文章,Windows 11 有一个 AppData 目录,它有什么用。

3、蓝牙版本的变化(英文)

本文介绍蓝牙协议如何进化,每个版本的特点是什么。

4、业务逻辑不要放入数据库(英文)

本文提出,数据库最好只用来存放数据,不要加入业务逻辑,让应用程序处理业务逻辑。

5、SAML:技术入门(英文)

一篇长文,介绍企业用的登录协议 SAML。开头部分是 SAML 简介,写得挺好,后面是技术细节,可以不看。

6、质能公式与光速(英文)

一篇物理学科普长文,谈怎么理解质能公式 E=mc^2,为什么包含光速的平方。没有数学,我觉得很有启发。

工具

1、PasteBar

开源的桌面软件,用来管理剪贴板,可以搜索剪贴板历史,以及预设常用的粘贴项(比如地址),支持 Windows 和 Mac 系统。

2、FastHTML

一个 Python 的 Web 框架,Django 的替代品,用起来更简单。

3、Kagi 翻译

搜索引擎 Kagi 推出的翻译服务,类似于谷歌翻译。

4、Star

一个 Web 应用,在手机打开以后,它会利用手机的运动传感器,显示某一颗你指定的卫星相对你的方位。

5、kkTerminal

一个开源的网页终端,在网页上通过 SSH 连入远程主机。(@zyyzyykk 投稿)

6、ReactPress

一个基于 Next.js 的博客和 CMS 系统,查看 demo 站点。(@fecommunity 投稿)

7、PDFMathTranslate

开源的命令行工具,使用 AI 翻译 PDF 文件,完整保留排版。(@Byaidu 投稿)

8、dimmer

开源的 Chrome 浏览器插件,暗黑模式一键切换。(@slc3a2 投稿)

9、ThriveX

一个开源的博客系统,基于 Next14 + Spring Boot。链接是前端仓库,另有后端控制台。(@LiuYuYang01 投稿)

10、Trayce

这个工具拦截本地开发环境中 Docker 容器发送和接收的 HTTP(S) 请求。

11、ngtop

一个命令行工具,用来查询 nginx 日志。

12、InputShare

电脑连接安卓设备之后,这个工具可以把电脑的键鼠和剪贴板,共享给安卓设备,只支持 Windows。(@BHznJNs 投稿)

资源

1、逆向工程教程(Reverse Engineering For Everyone)

面向初学者的逆向工程英文电子书,涵盖了 x86 和 ARM 架构。

2、一站式 iframe 生成器

HTML 的 iframe 元素有很多属性,这个工具网站可以查看所有属性值,并生成最终代码。(@wincatcher 投稿)

3、Chromium 的命令行开关

这个网页收集 Chromium(Chrome)浏览器的命令行开关,居然有1600多个。

4、Typst 介绍(英文)

Typst 是一种排版工具,可以生成论文、小册子、表格等,功能类似于 LaTeX,但是写法类似于 Markdown,用起来相对简单。

图片

1、犰狳化石

一个阿根廷农民发现,路边有四个奇怪的大土块。

后来经过生物学家辨认,这居然是四个巨型犰狳的化石,这种动物已经在一万年前灭绝了。

犰狳是一种看上去很像穿山甲的动物,外面披着一身铠甲。下面就是现代小型犰狳的照片。

巨型犰狳的灭绝原因,有一种说法是跟人类有关,古人想要它们的铠甲。

2、因纽特人的雪镜

雪地和冰面会强烈反射阳光,导致视力受损,这叫做"雪盲症"。因此,雪地活动都需要佩戴墨镜或保护镜。

因纽特人是美洲北极圈的原住民,已经在那里定居了几百年。他们在原始条件下,怎么防止雪盲症呢?

原来他们使用各种材料(骨头、木头、鲸须)制作雪镜,戴在眼睛前,只留出一条窄缝观察外界。

这种眼镜限制了进光量,保护了佩戴者的眼睛,也有助于提高视力。它就像针眼相机一样,狭缝聚焦光线,使得远处的物体看起来更清晰。

文摘

1、语音 UI(大多数情况下)很糟糕

AI 的发展,使得语音可以成为用户界面,这称为"语音 UI"。

有人认为,语音 UI 将是终极 UI,因为当你可以直接说出命令,为什么还要费心使用键盘和鼠标呢?

我不相信语音会成为通用界面,原因有很多。

(1)声音本质上无法表达抽象思想。很多时候,我们的大脑里面只有零碎的意识,很难找到正确的词语,将它们表达出来。

(2)语音让很多事情变得更难而不是更容易。理论上,说出"叫一辆网约车去机场"似乎是完成任务的最简单方法,但是如果你还有其他要求,比如指定车型和限价,口头表达就会很麻烦。

(3)语音侵犯隐私。你说出指令的时候,愿意被别人听到吗?

(4)视觉 UI 可以展示软件的局限性,语音 UI 就不行。很多事情,软件无法做到,视觉 UI 可以帮助我们了解软件的功能。如果没有视觉 UI,你很难发现软件不能做什么事。

(5)用户不喜欢一直说话。使用语音完成简单的任务是可以的,但要完成所有事情很快就会变得烦人,难道你要一直说个不停吗?

(6)语音无法解决现实世界中的歧义。语言表达可能存在大量歧义,无法通过纯语音界面轻松解决。人工智能可能无法正确理解你想要完成什么。

当然,视觉 UI 也有歧义,但是这会更困难,因为你的操作有视觉反馈。

言论

1、

美国的在线教育公司 Chegg,业务是帮助完成家庭作业。学生输入题目后,它会分发给印度的数千名承包商,让他们提供答案。

ChatGPT 诞生后,学生不再使用这个服务了,而是直接问 ChatGPT。Chegg 的股价已经下降了99%。

-- 《ChatGPT 如何击垮在线教育巨头》

2、

大多数哲学的目的,都是强化你的身心,让你学会,对于那些自己无法控制的事情要漠不关心、

-- 《禁欲主义》

3、

作为一个德国人,我每月支付的医保费用是1000欧元左右,另外还要支付差不多金额的个人所得税。但是,如果我停止工作,结婚并生1-2个孩子,我拿到的失业救济金 + 生育补助,比我现在的税后收入还要多。这完全是不可持续的,但政治家们没人谈论这些。

-- Hacker News 读者

4、

经常有人问我,为什么2019年决定将 Keras 库合并到 TensorFlow。

这不是我的决定,而是 TensorFlow 团队主管的决定。当时我是谷歌 L5 级员工,而他是 L8。如果我不同意这个决定,就需要从谷歌离职。

-- 弗朗索瓦·乔莱(Francois Chollet),神经网络库 Keras 的作者,本周宣布从谷歌离职

5、

创业公司的最大风险不是失败,而是一种不敢尝试的文化。

-- 《容忍失败的领导者》

往年回顾

棘手的 AI 版权(2023 #278)

人类和人生的意义(2022 #228)

家庭太阳能发电的春天(2021 #178)

这个社会是否正在变成"赛博朋克"?(2020 #128)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月15日

科技爱好者周刊(第 324 期):人类已知的最大质数

作者 阮一峰
2024年11月8日 08:15

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

世界最大博物馆之一的卢浮宫,在阿联酋的阿布扎比有一个分馆。这个分馆建在一个海岛上,游客可以划着皮划艇进入参观。(via

人类已知的最大质数

上个月,有一个不太引人注目的科学发现:人类已知的最大质数诞生了。

除了数学家,大概没人会对这个消息感兴趣,它离日常生活太远了。

但是,本周《华盛顿邮报》的一篇报道,却把这个发现跟普通人拉近了距离。

大家恐怕想不到,发现这个数字的人不是数学家,而是程序员。《华盛顿邮报》就是讲述背后的精彩故事,我看得津津有味,科学报道就该这么写,下面分享给大家。

====================

2024年10月10日,美国程序员卢克·杜兰特 (Luke Durant) 发现了人类已知的最大质数。

那天晚上,他收拾衣物,准备从加州返回阿拉巴马州的老家。出门之前,他决定远程登录服务器,看一下正在运行的脚本。

他原以为,就像过去一年的每次远程登录一样,脚本要么没有结果,要么报错。但是,那天晚上不一样,脚本给出了运行结果。

杜兰特意识到,他刚刚发现了世界上新的最大质数。他立刻告诉同伴这个消息,然后顾不上回老家了,开始仔细检查脚本的结果。

他发现的这个质数,后来被命名为 M136279841。它大得离谱,足足有41,024,320个十进制位。如果你每秒读一位,需要475天才能读完。这个数字等于2的136,279,841 次方减一。

为了算出这个数字,杜兰特花了差不多一年,自掏腰包大约200万美元,去购买 GPU 计算时间,用来运行脚本。

今年36岁的杜兰特,曾经在 Nvidia 公司担任程序员。公司的股价上涨,让他赚到了足够的钱,于2021年离职,开始投入自己的项目。

他选择的项目,就是计算梅森质数。他在 Nvidia 的经历,让他能够熟练使用 GPU 编程,去完成高速计算。

17世纪,法国传道士马林·梅森(Marin Mersenne)提出,存在无数个质数,可以表示成 2n - 1 的形式,比如3等于22 - 1,7等于23 - 1。

目前,人类已知的梅森质数有52个(包括杜兰特发现的那个)。寻找新的梅森质数,早就成了数学迷的一种爱好。

上个世纪90年代,互联网出现后,一个美国程序员乔治·沃尔特曼(George Woltman)组织了"互联网梅森质数搜索计划"(Great Internet Mersenne Prime Search,简称 GIMPS 计划)。

GIMPS 计划的目的,就是使用计算机程序,寻找梅森质数。它的官网提供程序下载,你可以在自己的电脑上运行这个程序,它会在计算机的空闲时间进行计算,寻找下一个梅森质数。

目前,全世界大约有3,000~5,000名志愿者在运行这个程序。梅森质数实在太难算了,在过去的28年里,GIMPS 计划一共发现了18个梅森质数。

上一个数字发现于2018年,比杜兰特发现的第52个梅森质数短了1600万个十进制位。

杜兰特的不同之处在于,在他以前,所有人都使用 CPU 进行计算,只有他使用 GPU。CPU 一两周的计算量,GPU 大约只需要一两天的时间。

杜兰特为了找到这个数字,动用了17个国家/地区24个机房和两家云服务商的服务器,进行协同计算。

他说:"如今个人的能力比历史上任何时候都强得多,你能调用的云计算,规模令人难以置信。我们拥有这样神奇的强大系统,所以最好弄清楚如何利用它们。"

梅森质数没有任何实际用途,科学家寻找它只是为了乐趣和探索人类知识的边界。

杜兰特由于这个发现,得到了3000美元奖金。他把这些钱捐给了阿拉巴马州的公立寄宿学校,那是他去加州理工学院读大学前的母校。

他发现的最大质数已经到了4100万位,GIMPS 计划依然在悬赏第一个找到十亿位质数的人。

活动

本周有两个很不错的活动,大家看看。

豆包 MarsCode 校园发布会

大学生怎么学 AI,提升竞争力?学习中遇到困难,怎么解决?毕业后怎样加入该行业?

这都是同学们非常关心的问题。

现在,豆包大模型旗下的豆包 MarsCode 正式进入校园,推出一系列活动,为同学们服务,举办课程、活动、mvp 评选等,帮助大家找到自己的未来。

下周六(11月16日)下午是发布会直播,当天除了介绍各种 AI 相关的校园活动,还有来自全国各高校的学长学姐分享学习成长之路,与豆包 MarsCode 专家对话 AI 职业发展等。

从今天开始,就可以报名。为了鼓励参与,每天都有接力奖、惊喜开奖、微信群福利,直播当天还有抽奖。奖品非常多,都是同学们想要的。

现在扫描上方海报二维码,或者点击这个链接,了解详情和报名。

[竞赛] 扣子 AI 挑战赛

字节旗下的"扣子 Coze"正在举办模板挑战赛。我介绍一下这个比赛。

11月22日前,你只要用它创建一个 AI 应用,提交到官网的智能体商店,就能参加比赛。

扫描上方海报二维码,或点击这里,了解详情。

大家不要觉得这比赛很难,扣子是"工作流模式"(参考我的介绍文章官方文档),全图形界面,通过编排节点,自动生成 AI 应用,没有编程基础也能上手。

而且,扣子本周还开通了付费模板。你可以为自己的应用模板设置价格,实现变现。别人基于你的应用进行修改,必须付费购买模板,从而为你带来收入。

本次比赛会根据模板复制的数量,给予1000元~10000元的奖金。搭建 AI 应用不收费,大家不妨从模板商店寻找灵感,试试用低代码编程,完成 AI 开发。

科技动态

1、旧金山胶囊旅馆

旧金山市中心有一家月租的胶囊旅馆,由于太受欢迎,想入住的人必须网上申请,然后进行抽签。

结果,17个床位有300个人申请。

一个上下铺的床位,月租价格是700美元(约人民币5000元),包含水电费、上网费、公共淋浴、厕所、一个储藏柜和共用厨房的使用权。

这么贵的铺位,还如此抢手,原因是你在旧金山再也找不到如此便宜的住宿了。

由于有硅谷,旧金山是美国房价最高的地区。公寓里面的一个合租单间,月租要3000美元~3500美元,普通美国人也租不起。

2、伯明翰的 Oracle 灾难

2022年,英国伯明翰市政府更换 ERP 系统,使用 Oracle 替换已经运行20多年的 SAP 公司产品。

上线后才发现,Oracle 无法生成现金审计报告,市政府迫不得已改用人工审计。

Oracle 系统的更换成本,已经最初估计的1900万英镑(约1.75亿人民币)增加到1.31亿英镑(约12亿人民币)。

该问题何时解决,还不得而知,成本将进一步上升。这件事情反应了,更换大型的线上系统的风险有多高。

3、AI 虚构的万圣节晚会

上月底是万圣节,两个巴基斯坦青年做了一个网站,上面是全世界各地的活动信息。

但是,他们没有披露,为了节省数据搜集的成本,这些活动都是 AI 生成的,实际上不存在。

结果,一个不知情的爱尔兰访问者转发了活动信息,更多的人看到后,又转发到 Tiktok 和 Instagram。

结果,万圣节那天晚上,爱尔兰首都都柏林的某条大街上,聚集了上千人,都等着参加活动。

大家在街上站了几个小时,发现上当了,根本没有活动。为了避免更多人聚集,警方不得不发出通告。

第二天,这个事件就上了国际媒体,那两个巴基斯坦青年不得不道歉。它凸显了,内容注明"AI 生成"的必要性。

4、其他

(1)中国开始向民众征集月球车名称,并披露了两种月球车设计方案。

(2)Etched 公司宣布了世界第一款实时 AI 游戏《绿洲》,基于 MineCraft 进行训练,游戏画面都是 AI 实时生成,参见网友介绍网站

(3)OpenAI 公司启用域名 chat.com,跳转到 chatgpt.com 。

文章

1、ChatGPT 搜索 vs 谷歌搜索(英文)

上周,OpenAI 公司推出了 ChatGPT 搜索,跟谷歌发生正面竞争。

网络媒体就去对比了两者的搜索结果,结果就是一句话:谷歌有麻烦了。

2、为 Git 命令设置别名(英文)

作者介绍怎么为 git 命令设置方便的别名,比如git add -A可以设为git a

3、如何生成简历网页(英文)

作者用静态站点生成器 Eleventy(基于 JS 语言),为自己做了一张简历网页(上图),还可以本地打印为 PDF 文件。

4、我为 VS Code 贡献了代码(中文)

VS Code 内置的 TypeScript 语言服务器,有一个 bug,作者修复了这一问题。(@imbant 投稿)

5、如何将 makefile 用于 Node.js 项目(英文)

本文详细教你怎么用 makefile 管理 Node.js 项目的各种内部操作。

6、Lit 框架开发 Web Components 入门教程(英文)

一篇不错的 Lit 框架入门教程,教你怎么写一个 Web component。

7、Ruby 如何加载模块(英文)

一篇初学者教程,介绍 Ruby 程序的模块加载方法的历史演变。

工具

1、flyscrape

一个网页抓取的跨平台命令行工具,使用 Go 语言编写,但是它的操作脚本是用 JS 写的,方便用户提取网页内容。

2、uv

Rust 语言写的 Python 包安装器,可以替代 pip,运行速度更快,参见介绍文章

3、ChatTCP

一款 Mac 的 TCP 数据包分析工具,致力于简化 TCP 分析,核心功能免费。(@wujiuye 投稿)

4、typing-practice

开源的英文打字练习工具。(@wincatcher 投稿)

5、云搭

开源的低代码平台,用来搭建小程序、H5、问卷、图文文章等多种应用,试用 Demo。(@wangyuan389 投稿)

6、NextTalk

一个基于 Next.js 的网页版实时聊天工具,使用说明详见它的桌面版,可以作为开发参考。(@Mebius1916 投稿)

7、dazhengTools

开源的纯前端在线加/解密工具箱,可以离线使用。(@dazhengs 投稿)

8、TempMail

临时邮箱服务,支持 iOS 和网页端。(@houzhongjian 投稿)

9、自动化巡检系统

一个开源的网址状态定时巡检工具,防止指定网址出现白屏、服务无响应等问题,有异常会发送钉钉、企业微信、飞书警报,体验 Demo。(@zdx0122 投稿)

10、Magika

一个命令行工具,可以检测某个文件是什么类型(比如图片文件还是文本文件),有网页的 JS 版。它是谷歌的产品,谷歌内部也在用它检测文件类型。

AI 相关

1、AI Hear

一款离线运行的桌面软件,实时语音转文字、实时翻译、字幕导出,支持 Mac、Windows。(@phonechan 投稿)

2、5ire

开源的大模型桌面客户端,支持 Windows、Mac。(@nanbingxyz 投稿)

3、CR-Mentor

一个开源应用,自己搭建 AI 服务,自动对 GitHub 的代码提交进行 code review。(@Gijela 投稿)

4、APIPark

开源的一站式 AI 网关,搭建企业自己的 AI 开放平台,方便同时接入多种模型,进行 API 调用。(@Frey2024 投稿)

5、Srcbook

一个开源编程平台,给出文字描述,然后通过 AI 生成 JS 的全栈应用。

6、Claude Artifacts

Claude 模型的 Artifacts 功能,与上一条的作用相同,可以生成一个单页应用,但是不开源,本文介绍该功能。

7、Browser-Use

一个 Python 库,可以通过 AI 模型,完成浏览器自动化。

资源

1、Unfaked

一个免费图片库,收集可以乱真的 AI 生成图片。

2、系统设计面试:内幕指南(中译)

《System Design Interview: An Insider's Guide》一书的中文翻译,介绍如何设计不同目的的软件系统,可以用来准备面试。(@Admol 投稿)

3、Auth Wiki

一个维基网站,收录各种与身份验证、授权和身份管理相关的条目,解释很详细。

4、3D 卫星图

这个网站可以实时查看所有运行中的地球卫星,选择一个地点,可以看到该地上空现在是什么卫星。

图片

1、太阳能板

太阳能板的价格,正在快速下降,已经接近或低于普通的挡板。

以后,我们看到的建筑物,很可能都会采用太阳能板作为外墙。

文摘

1、为什么美国医院还在使用寻呼机?

寻呼机是上个世纪的通讯工具,现在已经淘汰了。

但是,近80%的美国医院还在使用寻呼机,这是为什么?

这有几个原因。

(1)信号问题。

寻呼机使用的是类似调频广播的信号,不是手机的 3G/4G/5G 信号,穿透性更好,覆盖范围更广。医院的某些死角,收不到手机信号和 Wi-Fi,但是寻呼机依然有信号。

这使得寻呼机比手机更可靠,如果发生灾难,寻呼机比手机更不容易断网。

(2)续航。

寻呼机的电池寿命很长,可以两周充电一次,而手机一般是每天一充。

(3)简单性。

寻呼机比较简单,不易被攻击或破解。即使落在别人手里,泄漏的信息也很有限。

言论

1、

一项美国的调查发现,81%的公司发布过虚假的招聘广告,目的有几个:(1)在招聘网站持续亮相,(2)建立人才库,(3)让现有员工感到自己是可替代的,从而不敢松懈。

-- 《幽灵工作对科技从业者的破坏》

2、

现代硬件的速度快得难以置信,苹果的 M1 Max 芯片运行频率为 3.2GHz,即每秒32亿个时钟周期。

然而,我用它打开微软的 Teams 需要3秒,我不相信这需要花费96亿个时钟周期。我知道这样说过于简化,我的意思是:硬件变得如此之快,我们使用的应用程序却变慢了,这究竟是怎么回事?

-- preyneyv.dev

3、

一项调查发现,科学论文中 might 和 probably 这种表示不确定的修饰词的出现频率,过去20年中下降了40%。

这表明科学论文的不可靠、夸大其词的论断,正在令人担忧地增多了。

-- Science 官网

4、

"中产阶级"这个词在美国的含义,正在改变。以前的中产阶级,是指有足够资金进行投资的人,他们有稳定的工作,有房子、汽车、家庭和退休金。

现在的中产阶级,更像不稳定阶层。你有一份工作,但随时可能失去它。你买不起房子,无力为退休储蓄,平时仅仅支付账单就手头紧张。

这是美国的新常态。我的一个银行朋友说,他的大多数客户,支付租金后的账户余额最多只有几百美元。

-- Hacker News 读者

5、

美国心理学会的一项研究表明,消耗脑力的思考,会导致烦躁、沮丧或其他负面情绪,所以"思考不利于健康"这个观点是对的。

-- 合众社报道

往年回顾

工作台副屏的最佳选择(2023 #277)

脸书的公司入职教育(2022 #227)

iPad 的真正用途(2021 #177)

未来人人开发软件,几乎没人编码(2020 #127)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月 8日

科技爱好者周刊(第 323 期):技术公司的口号比拼

作者 阮一峰
2024年11月1日 08:08

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

去年建成的乌鲁木齐文化中心,包含图书馆、博物馆、大剧院等的六栋大楼。它们组成一个环形,中间是象征花蕊的文化塔(上图),里面有餐厅和观光平台。(via

技术公司的口号比拼

技术公司一般有一个口号(slogan),用来介绍自己。

全世界最有名的公司口号,大概就是下面这个。

我最近读到一篇老外的文章,提出两个指标,判断口号的优劣。

  • 清晰度(clarity):口号是否准确传达了公司的特点。
  • 影响力(impact):市场是否接受该口号,即口号是否广为人知。

根据上面两个指标,公司口号可以分成四类。

  1. 高清晰度、高影响力
  2. 低清晰度,高影响力
  3. 高清晰度、低影响力
  4. 低清晰度、低影响力

第一类"高清晰度、高影响力"是最佳情况,口号清晰传达公司目标,并且深入人心。比如,GitHub 的口号"世界构建软件的地方"。

再比如,Notion 的口号"写作、计划、组织"。

第二类"低清晰度,高影响力"是市场记住了口号,但是口号过于笼统含糊,无法让人联想到公司。比如,Snowflake 的口号"AI 数据的云"(AI data cloud)。

第三类"高清晰度、低影响力"是口号很符合公司特点,但是市场记不住,消费者没感知。比如,Stripe 的口号"你的收入增长的金融基础设施"(Financial infrastructure to grow your revenue)。

第四类"低清晰度、低影响力"是最糟糕的情况,口号含糊不清,消费者视若无睹。比如,Dell 的口号"做得更多的力量"(The power to do more)。

再比如,Dropbox 的口号"简化你的生活"(Simplify your Life)。

我套用这个标准,对国内公司的口号进行分类。以下都为个人看法,纯属娱乐。

"高清晰度、高影响力"。

  • 阿里巴巴:让天下没有难做的生意
  • 百度:百度一下,你就知道
  • 抖音:记录美好生活

"低清晰度,高影响力"。

  • 网易:网聚人的力量
  • 快手:拥抱每一种生活

"高清晰度、低影响力"。

  • 华为:构建万物互联的智能世界
  • 美团:帮大家吃得更好,生活更好

"低清晰度、低影响力"。

  • 支付宝:生活好,支付宝
  • 小米:永远相信美好的事情即将发生
  • 荣耀:活出我的荣耀
  • DJI:The Future of Possible(未来无所不能)

科技动态

1、猩猩的工具

一位游客在捷克的布拉格动物园,拍到了一张神奇的照片。

一只猩猩使用布条,去捞取漂浮在水面的篮子。

这证明猩猩是有智能的,会使用工具。

这件事最神奇之处,还不是这个,而是布条原本挂在树上,是干的。这只猩猩先从树上扯下布条。

然后,它把干布条甩进水里,使得布条变重。

接着,它把变重的湿布条,去勾取篮子。

2、二维码门铃

一位外国程序员没有门铃,朋友要求他装一个。

他突发奇想,能不能用二维码代替门铃?

他就开发一个手机 App,里面的二维码(上图)可以打印出来,贴在门上。

访客用手机扫描这个二维码,它会打开 App 的官网。该网站调用手机摄像头,让你跟屋主人实时通话(下图)。

二维码的好处是除了实时通话,还可以在网页预留信息。门牌旁边贴个二维码,可能是一个不错的主意。

3、威尼斯青铜狮子

威尼斯圣马可广场有一只标志性的青铜狮子,是这个城市的标志。

但是,谁也不知道它从哪里来,为什么会放在广场上。人们只知道,最早在1293年就有它的记录。下图是1870年代的照片。

最近,科学家对狮子的成份做了化验,根据铜的同位素比对,震惊地发现,这些铜来自中国。

这只狮子很可能是在中国铸造的,因为它很像唐代的镇墓兽,来到威尼斯后,才被加上了翅膀。

现在的问题是,古代的人们为什么大费周章,将这只庞然大物从中国运到威尼斯呢?

文章

1、OpenAI 如何发送数据(英文)

OpenAI 的 AI 使用"服务器发送事件"(sse),向浏览器主动发送数据,本文演示它的数据格式。

2、谷歌的三次面试记录(中文)

作者记录了在2016年、2020年、2024年三次面试谷歌软件工程师的经过。(@DoctorLai 投稿)

3、画布与文档(英文)

本文认为,网页设计已经从文档演变成画布,更有设计感。他给出了很多例子,可以当作首页设计的参考。

4、纯 Web 视频剪辑(中文)

本文介绍使用 WebCodecs API,构建一个基于网页的视频剪辑产品的原理。(@hughfenghen 投稿)

5、BGP 协议简介(英文)

BGP(边界网关协议)是互联网各个子网之间的路由协议,本文是一篇简单介绍。虽然写得不太清楚,但可以看看。

6、机器学习的嵌入(embedding)是什么(英文)

嵌入(embedding)是机器学习的重要技术,本文解释它是什么,写得不错。

7、提升 Shell 脚本用户体验(英文)

Shell 脚本难读难写,本文给出6个小技巧,可以提升用户体验。

工具

1、Garage

一个开源分布式对象存储工具,AWS S3 的替代品,兼容 S3 的客户端,可以建立自己的网络存储系统。类似工具还有 SeaweedFS

2、Transcribro

安卓的语音输入法,底层使用 whisper 模型。

3、StarLocator

一个开源的天文学网页应用,上传星空的照片,就可以识别拍摄位置。

但是,限制条件比较多,需要照片清晰,并且包含至少5个天体,以及给出拍摄时间和多条铅垂线。(@cheanus 投稿)

4、iCraft Editor

绘制 3D 架构图的网页应用,免费使用。(@yuanguandong 投稿)

5、HotHub

开源的热点话题查看和搜索网站,展示话题的热度趋势,基于 Next.js。(@w4n9hu1 投稿)

6、Web Archive

网页收藏备份的 Web 应用,基于 Cloudflare Worker,数据保存在 Cloudflare。(@Ray-D-Song 投稿)

7、RSS Impact

一个开源的 RSS 在线订阅工具,支持各种机制的 Hook(网络钩子),可以用来触发各种操作。(@CaoMeiYouRen 投稿)

8、codess

快速生成和在线管理 VS Code 代码片段。(@yayaluoya 投稿)

9、Bookmarks Artist

开源的 Chrome 浏览器插件,提供一个查看浏览器书签的全新界面。(@liujuntao123 投稿)

10、PgManage

一个跨平台的 Postgres 数据库的桌面客户端,提供图形界面。

AI 相关

1、Skyvern

一个开源项目,将 AI 模型与计算机视觉结合起来,用自然语言完成浏览器自动化。

2、URL Parser Online

这个网站将 URL 转换成大模型可以输入的格式(Markdown、TXT、HTML)。(@jiangwei909 投稿)

3、电子元件分类器(Electronic Component Classifier)

一个本机的 AI 工具,用摄像头识别电子元件。

4、爱享写作

Windows 桌面软件,无需 GPU,离线生成万字长文。(@taotaow 投稿)

资源

1、地震地图

这个网站是地震地图,标识出了1980年后大于5.2级的地震(共10万多次),可以清晰地看到地震带,也可以查看某个地区发生过的地震。

2、自己动手写 Git(中译版)

本教程使用 Python 从头实现简化版 Git,帮助读者理解 Git 的核心原理。(@hanyujie2002 投稿)

3、Kill the Newsletter!

这个免费服务可以将邮件列表,转为 RSS Feed。

4、了解电池

一本免费的英文书籍,向普通读者介绍电池的基本知识。

图片

1、钥匙圈的窍门

如果你还在使用钥匙圈,那么提高使用效率的一个窍门是,所有钥匙的牙齿朝向同一个方向。

这样的话,使用钥匙时,就不用切换方向。

另外,大多数人是顺时针切换钥匙,钥匙的排列顺序可以跟开门顺序对应起来。

最后,钥匙圈上面可以挂一个饰物,位置在第一把钥匙与最后一把钥匙之间。只要摸到饰物,根据顺时针,马上就能确定第一把钥匙和最后一把钥匙。

文摘

1、为什么自由职业不是人们想象的那样

很多人听到"自由职业",想到的就是自己当老板,穿着睡衣工作,在咖啡馆喝拿铁咖啡,在海滩散步,同时赚大钱。

根本不是这样,自由职业压力巨大。

(1)你的每个月都是一场赌博。这个月,你拿到高薪;下个月,客户就不来联系了,你不停刷新收件箱,什么也收不到。

自由职业是不可预测的。客户随时会消失,你可能尽了最大努力,还是连续几周没有一个项目。

除非你有很厚的家底(大多数人没有),否则,没有客户会让你晚上难以入眠,不知道怎么偿付房租和账单。

(2)自由职业不会带来财务保障。全职工作所拥有的健康保险、退休储蓄、带薪休假,甚至可能还有休息室里的一些免费零食,自由职业全都没有。

作为一名自由职业者,你赚到的每一分钱都不容易。你不仅要设法赚钱,还要搞清楚你自己的税务、健康保险、退休计划。你只要请假就意味着没有收入。

你某一次的报酬可能看起来不错,但一旦考虑到税收、保险和费用,你很快就会意识到,自由职业并不具备传统工作所具有的财务缓冲。

(3)自由职业不具有扩展性。你一个人就是整个公司,销售、会计、客服都要管,这意味着你能承受的工作量很有限。

你想多做几个项目,很可能会精疲力尽。你也很难提高收费。

到了某个时候,你会意识到,无论你多么努力工作,多么忙碌,一天的时间就只有这么多。自由职业者稍微忙碌,就会达到自己的上限,如果没有资源来雇人,你会感觉自己就是一只困在轮子上的仓鼠----不断地奔跑,但永远不会真正到达任何地方。

(4)自由职业听起来像是自由,但它可能会变得非常孤独。在家工作意味着没有同事可以交流,没有办公室文化,也没有饮水机八卦,只有你和你的电脑。

这种孤独会比你想象的更快地导致倦怠。你很容易感觉自己一直在工作,因为没有下午5点的下班时间,你可能午夜还在回复电子邮件,周末还在接听电话,不断感受到必须更加努力工作的压力,因为如果不这样做,可能会没有收入。这让人筋疲力尽,从长远来看是不可持续的。

(5)结论:自由职业并不适合所有人。如果你能够承受不稳定的收入和心理压力,并且能够像专业人士一样管理自己的财务,那么你可能可以尝试自由职业。但是,你必须时时刻刻准备好,事情一旦出现问题,你有可靠的后备计划。

言论

1、

我热爱消费者市场,讨厌企业市场。我们推出了一种产品,告诉每个人,大家自己决定要不要买,这很简单。但是,企业市场不是这样,使用产品的人自己做不了主,而做主的人不使用产品。

-- 乔布斯

2、

我非常支持某些名校的录取条件,他们面试的前两项就是"你是否照顾过孤儿,是否照顾过孤寡老人",如果没有,你就没有履行社会责任。

这些名牌大学,培养的都是企业领袖、国家领袖、社会领袖......如果你不爱社会,只是为了多赚钱,你就是社会价值观的破坏者,而并不是社会的建设者。

-- 任正非,《与 ICPC(国际大学生程序设计竞赛)成员的座谈》(2024年10月14日)

3、

两百多年来,美国从一个非常落后的国家变成一个非常发达的国家,在于其开放性、包容性,全球人才都到美国去创新,带来文化多元化、社会多元化、以及科学技术的多元化,创造了伟大的美国。

美国给全世界的所有国家、所有公司树立了榜样,那就是必须开放,如果封闭起来就要落后。华为要向美国学习开放性、包容性。

-- 任正非,同上

4、

人们不断为 JavaScript 语言发布新的捆绑器、压缩器、转译器、包管理器。这是一个警告,表明这门语言有些地方出了问题。

显然经过一次次重写,问题还没有得到解决。对我来说,这表明存在根本问题:我们没有在正确的层次上解决问题,或者可能根本无法解决。

-- Hacker News 读者

5、

我的生活态度是,早上起床想一想,我有可能活不到今天晚上,晚上上床想一想,我有可能活不到明天早上。

-- 德图里子爵(1776-1854),法国贵族

往年回顾

内容行业的衰落(2023 #276)

谷歌出了什么问题?(2022 #226)

中国法院承认 GPL 吗?(2021 #176)

内卷化是什么?(2020 #126)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年11月 1日

AI 开发的捷径:工作流模式

作者 阮一峰
2024年10月31日 03:24

一、引言

大部分人使用 AI,大概都跟我一样,停留在初级阶段。

平时,就是向 AI 提问(又称聊天),偶尔也用一些现成的服务:生成图片、生成代码、翻译文章等等。但是,时间久了,就觉得不够用,很多个性化需求,根本找不到工具,需要自己想办法。

我想,这是很多人面临的问题:如果深入使用 AI,就必须自己做开发

今天,我就介绍一种 AI 开发的简单方法,没有那么高的门槛,普通人也可以上手。

二、AI 开发的三种模式

按照从难到易,我把 AI 开发分成三种模式。

(1)自建模型:自己搭建 AI 模型,并寻找数据进行训练。

这种模式难度高,成本大,必须是 AI 专业人士或大公司,才会使用。

(2)API 调用:自己编写脚本,去调用他人运行的模型 API。

这种模式要求使用者必须会编程,优点是适应性强,什么需求都能编程解决,缺点是编写和调试脚本要花不少时间,还要自己部署服务端。

(3)工作流模式采用 AI 服务商提供的工作流(workflow),编排每个步骤,形成自动化操作。

这种模式最简单,不懂编程的人也能上手,可以不编写脚本,有现成的服务端,省时省事。缺点是受限于 AI 服务商提供的能力,对方不提供,就做不了。

我是 AI 新手,就选择了最后这种模式,尝试 AI 开发。

三、GPT 商店和 Copilot 模板

很多 AI 大厂都提供"工作流模式",允许开发者在他们的模型上,定制自己的应用。

最有名的大概就是 OpenAI 公司的 GPT 商店

它开放 ChatGPT 的底层能力,让开发者定制某个领域的专用 GPT,比如学术论文的 GPT、处理 Excel 文件的 GPT 等等。

微软的 Copilot 也有类似的功能,叫做"模板"(template)。

不过,这些都是国外的服务,需要收费,服务器在境外。好在国内有免费的替代品,我就选择了国内产品。

四、工作流演示

我先演示一下,工作流的操作界面。大家就能明白,它是怎么回事了。

工作流其实就是把一个 AI 应用,分成若干个步骤。每个步骤是一个节点,你在上面设置这一步的操作,然后所有节点按照流程,完成任务。

上图是扣子 AI(coze.cn)的工作流编排界面,包含四个节点。

扣子是字节跳动旗下、免费的 AI 应用开发平台。使用过程非常直观,就是在网页画布上,通过图形化操作,一步步创建 AI 应用。我就用它来演示。

它的开发页面左侧是不同类型的节点,下图是其中一部分。

新建节点时,点击对应类型就可以了。一般来说,第一步总是新建"模型节点"或"插件节点"。

新建模型节点后,如果你想用自己的数据训练模型,可以在项目管理页面上,新建一个知识库,上传数据文件。然后在工作流里面,创建一个"知识库节点"。

如果你想启用持久记忆能力,记住用户的历史对话,那么可以新建数据库,保存用户数据,然后在工作流创建"数据库节点"。

所有节点设置完毕,这个 AI 应用就可以运行了。最后一步,就是发布该应用。

扣子会让你选择发布渠道(上图),目前支持发布到商店(在扣子平台使用)、第三方平台(在飞书、抖音、微信使用),以及 API 和 SDK(在用户自己的软件使用)。

以上就是工作流模式的使用界面,只是一个简单介绍,大家有一个大概的理解就可以了,具体操作可以看文档

它还是很容易上手的,熟练以后,开发一个 AI 应用,一两个小时就可以搞定。

五、工作流开发的例子

为了加深理解,我举一个实际开发的例子。某餐饮企业想要搭建一个 AI 应用,用来分析用户的点评。

为此新建一个工作流,基本功能只需要三个节点----输入节点、分析用户点评的 AI 模型节点、输出节点。

然后,把这个工作流发布成 API。用户的点评传入这个 API,它就会返回一段 JSON 数据,里面有 AI 模型识别出的用户评价(正面、负面、中性),以及点评关键词(环境/服务/菜品)。

上图是这个工作流的预览调试界面,输入了一段真实的点评,运行结果以 JSON 格式返回。

可以看到,AI 识别出该用户对产品是中评,对环境是差评,对上菜速度是好评。

六、模板功能

工作流除了自己使用,还可以保存成模板(template),发布到模板商店,让别人使用和借鉴。

在模板商店,你可以看到官方和其他用户搭建好的工作流,目前已经有上千个,还在快速增长。

这些工作流可以直接使用,也可以作为模板复制。用户复制模板后,对它们进行学习和修改,将其改造为适合自己的应用。

对于模板作者来说,可以对模板设置价格,实现变现。

很多模板提供非常有意思的功能,值得一看。比如,"抖音转小红书"的模板。

你输入一个抖音的短视频链接,AI 自动生成10个可用标题和一段文案,你可以把它们连同视频一起发到小红书。

七、教程:情感故事爆文专家

网上已经有不少工作流模板的开发教程,大家可以去搜一下。

我看到一篇"情感故事爆文专家"的模板教程,非常有趣。情感类的网文现在流量很好,作者就开发了一个 AI 应用,专门生成这类文章。

先看成品,点击这个模板链接,体验一下它的效果。你输入一个文章主题,比如

一对情侣在大学里认识,毕业后分手,10年后再次相遇。

这个 AI 应用会输出文章的大纲和正文。

还带有配图,可以直接发布。

它背后的工作流,大致分成六个节点。

  1. 开始节点:接收用户输入的文章主题
  2. AI 模型节点:通过 AI 模型,根据文章主题,生成文章的大纲。
  3. 扩写节点:根据文章大纲,进行内容扩写,生成正文。
  4. 内容总结节点:根据正文,生成文章的内容总结。
  5. 文生图节点:根据内容总结,生成文章配图。
  6. 结束节点:汇总所有内容,输出结果。

设置完成后,点击"发布"按钮,这个 AI 应用就可以直接使用了。

八、结束语

工作流模式相比自己从头写,容易和快捷很多,服务端也一起解决了。如果你有 AI 开发的需求,可以试试这种模式。

下一步不妨就从文档开始,做出你的第一个工作流节点,发布到模板商店。

任何开发问题(估计肯定会遇到),可以加入官方咨询群去问,下面是微信群二维码。

我遇到问题,就咨询扣子的同学。他们告诉我,现在正好有两个活动,有大量的奖品,建议我参加。

我看了觉得很不错,下面把活动信息转发出来。如果你正好做了模板,就不要错过。

(1)模板比赛

工作流开发完成后,上架到模板商店,现在可以获取奖励

你可以对模板设置价格(官方审核通过后),实现模板变现,他人复制模板需要付费。在活动期间,官方根据模板复制的数量,会发放1000元到10000元的奖金,以及随机抽取的50个无线充电器的纪念奖。

(2)万圣节抽奖

官方现在有一个万圣节抽奖,在那里上传你的照片,会得到一张万圣节主题照,以及一次抽奖机会。

抽奖的奖品有 iPhone 16 Pro Max、Switch、咖啡机。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月31日

科技爱好者周刊(第 322 期):内容行业的内幕

作者 阮一峰
2024年10月25日 08:06

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

浙江上虞的曹娥江人行桥,是一座景观桥。每天晚上,一边放音乐一边喷水。(via

内容行业的内幕

有一个行业,这些年蒸蒸日上,快速增长,加入的人越来越多。

它就是内容行业,生产各种各样的内容:文字、图片、音乐、影视、短视频、直播......

为什么内容行业这么兴旺?

因为现代人的时间,都花在网上。网上有什么?就是有内容啊。人们越是投入互联网,内容行业就越兴旺。

很多人被这个行业吸引,一门心思为互联网炮制内容,因为生产成本低,需求多,市场大,获利快......但是他们未必知道,它也有吃人的一面。

今天,我想分享一个老外程序员的文章。他是前端程序员跳槽到内容行业,干了8年,不想干了,写了自己的体会,披露这个行业的内幕。

2015年的时候,流行"知识付费"。他受到了影响,就写了一本 React + D3 的教程,放到网上卖,作为付费内容。

结果,反响不错,真的有不少人掏钱。

他受到了鼓舞,觉得内容行业可以干,赚钱容易,后来索性全职来做。

他加大力度,在网上宣传自己的内容,不断更新,推出系列课程,还拍视频。生意这样做大了,他忙不过来,就雇了兼职员工,组建了团队。

几年下来,他算了一下,单单 React + D3 这一门课,就赚了近50万美元。

他总结出来,内容行业的商业模式是:免费内容用于建立受众,然后再通过广告或收费内容获利

内容创作者遵循这样一个公式。

  1. 你的大部分时间用来扩大受众。
  2. 你不断培养这些受众,作为销售内容的市场。
  3. 你创造可以获利的内容产品,投向这个市场。
  4. 重复第一步。

这个公式能够运作起来的关键是,你必须定期推出一些真正有意思或者真正有用的内容,才能培养出受众,激起他们的兴趣,愿意关注你,等待接下来的内容。这是在内容行业长期生存的唯一方法。

但是这样做,意味着你不能停下来,会非常累。如果你停止生产新内容,就无法找到新的受众,老的受众也会流失。

那个老外程序员就遇到了这个问题。到了2023年,他实在干不动了,对自己写的内容充满倦怠,想要休息一下。他说:"每一天,我都在想接下来要写什么?太累了,这些事情不再像以前那样带来快乐了。"

他就停下来了,想歇一段时间,恢复精力了再回来干。

但是,他马上发现,一旦停止工作,不更新也不宣传自己的内容,他的课程销售立刻就慢了下来。再过一两个月,几乎就停止盈利了。

这就是内容创造者面临的最大问题:你不能停止工作,也不能重复使用以前的内容,必须保持更新和宣传,紧跟市场的热点,这样才有人来消费你的内容,否则一切就会回到起点。

这个问题的根本原因是,内容行业是快餐文化,热点随时切换,人们只对新的内容感兴趣,快速抛弃旧内容。而且,热点切换速度正在加快,这一周的互联网热点,下周就被遗忘了,你只有加快生产速度,才跟得上。

这就是内容行业的缺点:生产出来的内容只被消费一次,以前的内容一旦被消费过,未来就不构成新的刺激了。你必须生产新的内容,带给受众新的刺激,才会有新的消费。

这注定了,内容创作者不能停下来,必须挖空心思,不断想出以前没有写过/拍过的新内容,否则你以前的投入就没用了。最终,你就陷入了一种周而复始、停不出来、把自己消耗光的怪圈。

那个老外程序员得出结论:自己是这个行业的一次性消耗品,等到被消耗光,再也写不出新东西,就是市场抛弃你的时候。

想明白这一点,他就知道自己回不到以前了,厌倦了那种炮制内容的生活,于是下定决心,放弃现在的付费课程,退出内容行业。这篇文章就是他临走的告别心声。

我希望,加入内容行业的人,都能了解这个行业的快餐本质,这里没有积累,只会掏空你。加入的时候,最好就有思想准备自己被消耗光。

===此处有分隔线===

最后,我还想提一下"知识付费"。

知识付费也有同样的问题。你生产的付费课程,并不是真正的积累,一旦停止推广和更新,就会无人问津。

此外,它还受到 AI 的威胁。针对初学者的课程,以前还能赚到一些钱。现在有了 ChatGPT,初学者课程这门生意可能已经死掉了,因为 AI 可以回答所有的新手问题,而且回答得比你好。

AI 不能提供的,大概只有那些来之不易的深刻见解和体悟,但是它们很难包装成可以销售的课程,只能在实践中通过高手指点和自己摸索获得。

所以,知识付费在 AI 时代,前景很难说,它的最高峰可能已经过去了。

科技动态

1、垂直峡谷

马岩松在美国丹佛市设计的"垂直峡谷"大楼(One River North),本月正式竣工开业。

这栋楼非常奇特,仿佛从中间裂开,分成了三块。

这是为了体现丹佛市的特色。这栋楼正对着落基山脉,那里有美国著名的自然景观----科罗拉多大峡谷。

马岩松别出心裁地在大楼内部,设计了一个类似峡谷的裂缝,将自然景观与住宅融合在一起。

裂缝内部是一个楼内的开放空间,布满了绿植,住户可以活动、登高、远眺,就像在山上一样。

2、状态钟(Busy Status Bar)

一家美国公司模仿软件的状态栏(status bar),发明了状态钟。

钟的屏幕上,可以设置你的当前状态,以及一个倒计时,表示何时结束这种状态。

你把这个钟,放在办公桌上,别人就可以看到你的状态了。

钟的另一面也有一个显示屏,用来提示自己。

这个钟的另一个特点是,带有多个实体按钮,用起来很方便,只要用手点一下,就开始倒计时。

3、太空船票

江苏民营航天公司"深蓝航天",开始发售太空旅行船票。

本次飞行预定在2027年,一共有两个座位,每个的价格是150万元人民币,飞行时间约为12分钟。

乘客将坐在一个高约4米、直径3.5米的载人舱内,舱内配置6扇全景舷窗,可以观看太空风景。

飞船将穿越100公里高的卡门线(大气层与外太空的分界线),乘客将至少体验5分钟的失重状态,随后飞船返回地球。

4、其他

(1)中国推动2027年底淘汰一维的商品条形码,升级成二维码。

(2)宇树科技的机器狗,在泰山测试运垃圾,最高负重120公斤。

(3)曼哈顿出现"加密货币游泳池",通过服务器运行的热量加热水温。

文章

1、require() 支持 ES6 模块了(英文)

最新的 Node.js 23 支持 require() 加载 ES6 模块。本文介绍这个功能,但也质疑这是否明智。

2、从 Vite 迁移到 Rspack(中文)

作者介绍他们公司,为什么将前端打包工具从 Vite 改成了 Rspack。(@bamboofive 投稿)

3、如何使用 Tailscale 架设内网 VS Code 服务器(英文)

本文介绍使用 Tailscale,在内网架设一个 VS Code 服务器,从而可以在各种设备(包括 iPad)使用远程 VS Code 编程。

4、如何自动备份 Obsidian 笔记(英文)

Obsidian 是一个很优秀的笔记工具,但是它的自动同步(备份)功能是要收费的,本文介绍一种免费的自动备份方案。

5、纯 CSS 实现网格背景(中文)

作者介绍几种方法,使用纯 CSS,实现网页背景的网格效果(上图)。(@fantingsheng 投稿)

6、Nginx 日志详解(英文)

本文详细介绍如何配置 Nginx 的访问日志功能。

7、如何用 Git Bisect 命令找出错误(英文)

git bisect 是一个很有用的命令,但是很多人不知道怎么用,本文是一个简单的示例。

工具

1、whodb

一个基于浏览器的数据库管理工具,支持 Postgres、MySQL、SQLite、MongoDB、 Redis。

2、Docmost

一个基于浏览器的维基和文档工具,Confluence 和 Notion 替代品。

3、notifier

一个 Cloudflare Worker 应用,监听 GitHub 仓库的各种事件,自动发送信息到 Telegram。(@byodian 投稿)

4、wechat-article-exporter

开源的微信公众号文章在线导出工具,可用来批量下载某个公众号的文章。(@jooooock 投稿)

5、NewsNow

开源的新闻热榜网站。(@ourongxing 投稿)

6、Image to Excel

表格图片转成 Excel 文件的在线服务。(@showwaychen 投稿)

7、加水印

图片加水印的网页工具,纯前端应用,不需要服务器,代码开源。(@pdmaker 投稿)

8、Theia

Eclipse 推出的代码编辑器,VS Code 的替代品。

9、JSBEN

一个在线页面,用来比较不同 JS 代码的性能。网站上有很多现成的例子

AI 相关

1、Agent.exe

开源的 Windows 应用,使用自然语言操作你的电脑,上图是用它自动点披萨,底层是 Claude 模型。

2、llmc

一个开源的命令行工具,输入自然语言,执行需要的 shell 操作。(@guoriyue 投稿)

3、ai-commit

一个开源的命令行工具,使用 AI 生成代码的 Git 提交信息。(@guanguans 投稿)

资源

1、crt.sh 证书查询

这个网站可以查询颁发给某个域名(含二级域名)的所有加密证书。

2、Pastebin

一个新的 Pastebin 网站,除了文本,还可以分享二进制文件(不超过 50MB),不需要注册。

3、数据结构可视化(Visual Data Structures Cheat-Sheet)

这篇长文收集了数据结构相关的各种可视化解释。

4、useHooks

这个网站收集 React 框架的各种有用的 Hooks。

图片

1、恐龙看彗星

上期周刊介绍了,最近光临地球的紫金山-阿特拉斯彗星。外国网友借着这颗彗星,摆拍了一张《恐龙看彗星》的照片。

最绝的是,下面配了一行说明,模拟恐龙的内心活动:"难道又来了?"。令人联想到,引发恐龙灭绝的小行星撞击地球。

2、五万年前的牛肉

1979年,阿拉斯加的金矿工人在开采金矿时发现,冻土里面埋葬着一头五万年前的野牛。

这头野牛完整地保存了下来,就好像昨天还活着一样。

它的皮肤、骨骼、脂肪、肌肉,都完好无损,仿佛放在冷库冻了五万年。

工人们将这头牛送到博物馆,后者着手将它做成标本。

制作标本时,野牛的内脏和肌肉都必须去除,否则将来会腐烂。

标本师觉得,牛肉就这样扔了,未免太可惜。他跟领导商量了一下,决定在自己家里组织一个晚宴,大家一起吃掉这些牛肉。

那天晚上,一共来了8个人,都是博物馆工作人员。他们先将牛肉解冻,然后跟大蒜、洋葱、胡萝卜、土豆一起煮。上桌后,再配上酒,就成了一顿丰盛的晚餐。

在场的八个人,就成了世界仅有的吃过五万年前牛肉的人。

其中一人后来回忆说:"它跟普通牛肉没什么区别,不难吃,带有一点泥土的味道。"

今天,如果你去阿拉斯加大学博物馆,就能看到这头五万年前的野牛标本。

言论

1、

2022年10月,有一只鸟创造了世界记录,不停顿地飞行了13500公里,不着陆、不进食、不喝水,以每小时48公里的平均速度,飞行了11天。

完成这一壮举有很多原因,其中很重要的一点就是羽毛。羽毛能够保持一整夜的温暖,还能挡雨,并且构成了翅膀的表面。羽毛是生物进化的神奇发明。

-- 《羽毛是生物进化的神奇发明》

2、

互联网每个 IPv4 地址,背后平均有7个设备。

-- 《向 IPv6 过渡》

3、

除了数学之外,对母语的出色掌握是一个有能力的程序员最重要的资产。

-- Edsger W. Dijkstra,著名计算机科学家

4、

简单的东西很难卖出去,因为简单的东西看起来很容易,谁愿意为容易买单呢?

商人们早已明白这个秘密,容易的东西往往被包装成复杂的东西,让用户觉得它很特别,从而为这种特别性付出高价。

-- 《贩卖复杂性》

5、

创业者的工作重点始终是优化业务,而不是优化代码库,除非代码库就是你的业务。

-- 《使用 HTMX 构建 SaaS 产品》

往年回顾

彼得·蒂尔的实验(2023 #275)

NPC 演员也是一种职业(2022 #225)

知识广度 vs 知识深度(2021 #175)

数字人民币要取代谁(2020 #125)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月25日

科技爱好者周刊(第 321 期):傅盛回忆录

作者 阮一峰
2024年10月18日 07:50

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上海新开张的耀雪冰雪世界,号称世界最大室内滑雪场,内部不仅有雪道,还搭建了一个北欧小镇。(via

傅盛回忆录

傅盛是谁?百度百科是这样写的。

1978年生于江西景德镇,2003年加入3721公司(后为奇虎360)。

2010年出任金山网络 CEO,2014年金山网络改名为猎豹移动,担任 CEO 至今。

最近,我读了一本他跟别人合著的书《创业就是要细分垄断》(文化发展出版社,2017),以及他在2018年的一篇演讲

他在里面回忆了,自己这一路的创业经历,反反复复用了几万字,就在回答一个问题:

"一个杀毒软件公司,为什么现在还活着,而且活得不错?"

他的故事很精彩,下面分享给大家。我看了很佩服,在这个急速变化的时代,一个互联网企业如何求生,可以参考这个故事。

一、金山毒霸时期

2010年,雷军有一次对金山的董事会说:​"我们的杀毒业务不行了,我要从外面找一个年轻人过来,这个人30岁,没管过大团队,他叫傅盛。​"

当时,360推出了免费的 PC 杀毒软件,让收费杀毒的瑞星和金山极为受伤,市场崩盘,收入飞速下滑。

傅盛上任后立即决定,金山毒霸也免费,收入改为依靠流量广告。就这样稳住了局面,收入停止下滑,在杀毒软件市场活了下来。

傅盛说:"这件事让我们明白了,快速奔跑是多么重要,公司的名字也变成了'猎豹'。"

二、打不过360

自从360成了市场老大,傅盛想了很多办法苦苦追赶,金山毒霸的市场份额最高追到360的三分之一,就再也追不上去了。

傅盛想了一个大招----"敢赔"模式。只要用户打开该模式,如果发生钓鱼网站、网购木马造成的财产损失,金山毒霸承诺赔付,单笔最高6000元。

这个措施引发了市场轰动,但是两周之后,360就推出了一模一样的服务,并且将赔付金额提高到36000元。

傅盛说:"我曾寄希望于360的执行不如我们快,所以不停地创新。可是,我们推出新服务两周后,360就出了一样的服务,我实际上成了360的产品经理。"

"那个时候我想明白了,我做的所有创新,360都可以做,而且做得比我们还好。在它视野之内的 PC 安全领域的任何创新,我都打不过,只不过它的迭代周期比我晚两周而已。"

你做出什么功能,大公司直接找一群产品经理按照这个思路做就行了。一个大公司的战略动员能力远远超出你的想象。

三、移动互联网的机会

在360的步步紧逼之下,金山毒霸的市场份额不断下滑。傅盛意识到,小公司不可能在大公司的正面战场上战胜大公司,要想活下去,必须跳出 PC 杀毒软件,寻找其他战场

幸运的是,移动互联网革命此时来临了,一个比 PC 市场更大的移动市场开始出现了。

智能手机的安全领域,成了新的战场。傅盛说:"当时我每天都在焦虑和思索,怎么才能拿到移动互联网的这张船票?"

更幸运的是,360因为自身的战略原因,无法全力投入移动市场。当时,360正忙于与腾讯进行"3Q 大战",除了 PC 杀毒软件,还在做搜索引擎和安全浏览器。

傅盛判断,360的主要市场在国内的 PC 端,不会在海外市场和移动端投入重兵。他因此决定,金山毒霸要专门针对海外市场,做一款移动安全工具。

四、手机清理大师 Clean Master

"当时我们看谷歌的安卓应用排行榜,发现 Utility(工具应用)排行榜的第三名叫 Advanced Task Killer,是哈尔滨的一个程序员做的。我们又发现图片应用排行榜里一个叫 Photo Grid 的程序不错,是杭州的一个程序员做的。这两人都没出过国。"

"我就想,现象即规律嘛,和一个中国没有出过国的程序员相比,我不仅出过国,还有2000人,可以动用的战略资源是上亿人民币。他们的应用能够上榜,我全力以赴打这场仗,难道不能排到第一去吗?想了半天我觉得这件事一定可以做到,后来就开始全力以赴了。"

为了尽量避开杀毒软件的老对手,傅盛没有做手机的杀毒软件,而是选择做清理工具。

"大家都在做安全软件,没有本质的差异化,不如在安全软件旁边再开一条线,叫清理。360的大部分团队都扑在安全软件、搜索、浏览器上,就算要在海外市场做手机清理,也只能抽出边缘团队了。"

猎豹的海外工具团队一开始只有四个人,做了一款手机清理大师 Clean Master,发现很受欢迎。

傅盛于是下定决心,集中几乎所有的力量,都投在这个产品上面。

"我从珠海把二三十位骨干从 PC 团队直接调到北京,立刻投入海外移动市场的清理领域,由这二三十人做骨架,迅速形成100人的规模。我们把 PC 端的盈利全部用来支持海外市场,保证了我们在这个战场的胜利。"

五、公司上市

Clean Master 只用了两年时间,就实现了日活过亿。傅盛抓住这个拳头产品,一口气推出了衍生的工具矩阵。

猎豹就这样成了 Google Play 全球下载榜排名前三的公司,月度活跃用户超过6亿,其中80%的用户来自海外。

2014年,借助这样辉煌的成绩,猎豹在纽约上市,实现了从 PC 安全软件到移动工具开发商的跨越。

在这期间,为了减少国内同行的关注,傅盛从来不在国内宣传自己在做海外市场,Clean Master 甚至都没有国内版,奉行"哈巴狗"战略,坚决不咬人。

六、工具软件的瓶颈

傅盛曾经认为,安全工具可以一直做下去,需求始终存在。这个领域可以作为公司长期发展的根据地。

但是,他错了。

随后几年,手机系统快速变化,谷歌和苹果不断收紧控制权,开放的系统权限急剧变少,许多工具都内置了。

第三方的手机安全工具的生存空间越来越小,手机杀毒这个行业几乎完全消失。

清理大师 Clean Master 想要保持高速增长,已经不现实了。傅盛面临再一次转型。

七、多元化投资

猎豹上市时,共募集资金1.6亿美元。傅盛决定将这笔钱投向其他领域,多元化投资,分散安全工具的风险。

他发现移动广告是一个巨大的风口,就收购了几家广告公司,建成自己的移动广告平台,一方面利用自家工具软件的流量,另一方面分销 Facebook 广告,还因此拥有了很强的大数据分析能力。

据傅盛说,只用了两年时间,猎豹就成为了 Facebook 广告平台全球最大的流量贡献方。

另一个重大举措是,猎豹在2014年投资了对口型的唱歌应用 Musical.ly,是后者的主要天使投资人。

Musical.ly 推出后很受欢迎,引起了今日头条公司的注意,后者就做了一个模仿品,起名为"抖音"(国外名 TikTok)。

2017年,傅盛同意今日头条以10亿美元收购 Musical.ly,随即今日头条就将 Musical.ly 合并进抖音。

最近,有人问傅盛,是否后悔卖掉了 Musical.ly。傅盛说不后悔,如果留在手里,做不到今天这么好,何况当时也拿到了满意的财务回报。

八、新方向

多元化投资并不能弥补,猎豹主营业务的放缓。由于没有达到收入增长目标,猎豹的股价在2016年出现了重挫。

傅盛说:"稳定了情绪之后,我意识到一个可怕的事实:随着内容等优质流量的崛起,工具类流量的重要性已经显著下降。系统工具产品作为一个品类,已经不在移动互联网的主赛道上了。"

他因此做出一个重大决定,公司将逐步淡出系统工具行业,再一次转型,全力投入两个新领域。

首先,全面转型移动内容平台,做了海外直播平台 LiveMe,在海外模仿头条的模式,同时加强轻游戏投入,用直播和游戏这样的内容流量,代替工具流量。

其次,成立子公司"猎豹星空",做 AI 和机器人产品,目前的主要产品是接待服务机器人"豹小秘"。

机器人"豹小秘"早期的交互功能很弱,只能用来查询、送菜、做咖啡、红外测体温等等。

2022年生成式 AI 诞生后,傅盛又看到了希望,猎豹星空的定位已经变为大模型解决方案公司,"豹小秘"将尝试内置本地的 AI 模型,变成真正的智能机器人。

九、小结

猎豹的转型还在进行,它能成功变成一个内容平台和 AI 大模型的方案公司吗?让我们拭目以待。

有一点可以肯定,如果发展得不好,傅盛未来还会再一次转型。

他用自己的创业经历,证明了只要有强烈的求生求变意志,一家公司的发展可能性是无法被定义的。

即使你的行业,如同杀毒软件那样消失了,你依然可以继续发展,并且发展得很好,你的发展可能性也是无法被定义的。我想这就是他的故事对普通人的意义。

[活动] 码上奇妙夜

我很少给读者送福利,但这次不一样,真的很多礼品,甚至有万元大奖

下周四是一个特别的日子,10月24日代表1024,一年一度的"程序员节"。

当天晚上7点,字节旗下的豆包 MarsCode 和稀土掘金技术社区(juejin.cn),将联合举办技术嘉年华"1024码上奇妙夜"

内容很丰富,有前沿的技术展示,有精彩的互动环节,有行业大咖在线交流,还有动手实操环节,通过 AI 将创意落地。

届时将在豆包 MarsCode 官网直播间直播,并通过抖音、视频号两大平台同步转播。

本次活动是全国性的,准备了超级丰厚的奖品。

(1)现在进入官网直播间,进行抽奖预热,奖品有智能耳机、拍立得、京东卡、吹风机、水杯等。

(2)在官网直播间点击"分享海报",邀请朋友参加。根据邀请人数,赢得奖品,最高可得小米14手机。

(3)10月24日晚上,三大直播间超多轮万元大奖:4天3晚泰国跟团游(两个大人一个小孩)、山西年票旅游券(黑悟空路线+周边)、iPhone 16 pro、苹果手表 10、智能耳机、宠物食品等等。

祝愿大家都拿大奖,现在就去官网直播间报名吧!扫描上面海报,或者点击这个链接

科技动态

1、紫金山-阿特拉斯彗星

紫金山-阿特拉斯彗星(国际编号C/2023 A3)10月9日进入近地点,直到26日离开。这段时间内,肉眼可以清晰看到。

这几天,世界各地的天文爱好者拍下了许多照片。

城市、海洋、沙漠、雪山......都留下了这颗彗星的踪迹。

该彗星在2023年被紫金山天文台发现,所以由中国天文台命名。

发现之初,曾预测该彗星的最大亮度可达0等(北斗星的亮度是2等),但是目前实际亮度只有4等,即使如此,它也是近期难得的亮彗星。

它的轨道周期是6万多年,上次光临地球的时候,人类还是石器时代。

2、特斯拉有没有抄袭

上周,特斯拉在美国举行新产品发布会,一口气展示了 Cybercab(无人驾驶出租车)、Cybervan(无人驾驶小货车)和 Optimus(人形机器人)。

这件事引起了2004年科幻电影《我,机器人》(I, robot)导演的愤怒。

导演震惊地发现,特斯拉的新产品与电影很相似,于是指控特斯拉抄袭。

上图左侧是电影,右侧是特斯拉的新产品。说实话,确实有点像。

3、其他

(1)有人在电源插排植入窃听器,然后在网上出售,现已被抓。

(2)一所葡萄牙高校,创下了现场人数最多的编程课的世界记录,共有1668名学生到场参加。

上课内容是《零基础 Python 入门》,从零开始解一个数独游戏。老师在课后领取了吉尼斯世界纪录证书。

文章

1、SpaceX 的"筷子"式回收强在哪?(中文)

SpaceX 公司使用机械臂,夹住返回地面的火箭助推器。本文分析这种打破脑洞的回收方法的优点。

2、AI 假图在美国泛滥(英文)

美国最近遭遇了飓风,社交媒体出现了一张灾民的照片(上图),进行政治宣传,实际却是 AI 假图。这种事情在美国越来越多。

3、我们如何在五个月内推出 Threads(英文)

Threads 是 Meta 公司推出的替代品,从立项到发布,只用了五个月。

这是 Threads 工程师的一个演讲稿,介绍了该项目的开发内幕。

最有意思的一段话是,这个项目基于 Instagram 的代码库,内部人开玩笑,两者只是布局不同:Instagram 是图片在上,文字在下,Threads 正好反过来。

4、JavaScript 信号简介(英文)

"信号"(signal)是 JavaScript 引入的一个新概念,本文简单解释它是什么。

5、微软的远程桌面应用(英文)

微软推出了一个叫做 Windows App 的应用,支持苹果设备和安卓,甚至可以浏览器使用,用来打开 Windows 系统远程桌面,本文是这个 App 的介绍。

6、为什么单线程 Redis 这么快(英文)

本文解释 Redis 的单线程架构,为什么可以这么快,以及什么情况下,使用 Redis 的多线程。

7、为什么葡萄干在汽水中"跳舞"(英文)

一篇科普文章。将葡萄干放入汽水,葡萄干会上下跳动,本文解释这是为什么。

工具

1、Chisel

一个 Linux 命令行软件,在 HTTP 通信上建立 TCP/UDP 隧道,由服务端和客户端两部分组成。

2、faces.js

一个生成随机卡通头像的 JS 库。

3、NotesHub

一个 Markdown 笔记软件,具有插入图表、曲谱、公式等多种功能,有 Web/桌面/手机客户端,支持 Git 仓库同步。

4、Faker Server

一个基于 Faker.js 的 mock 服务器,用来模拟 API 的返回结果,自带一个前端的接口管理页面。(@Ray-D-Song 投稿)

5、Logcat in devtools

在 Chrome 开发者工具中查看安卓设备的 adb 日志。(@nieheyong 投稿)

6、Astro AntfuStyle Theme

一个 Astro 框架的博客网站皮肤,使用该框架时可作为参考。(@lin-stephanie 投稿)

7、vitepress-demo-plugin

Vitepress 插件,支持在文档页面中插入 Vue/React/HTML 组件。(@zh-lx 投稿)

8、BroadcastChannel

将你的 Telegram Channel 转为微博客。(@ccbikai 投稿)

9、DNS.Surf

检查域名在全球不同地区的 DNS 解析结果,代码开源。(@ccbikai 投稿)

10、notion2md

一个示例项目,将 Notion 作为数据源,通过 GitHub Action 转成 Markdown 文件,生成网站。(@thinkerchan 投稿)

AI 相关

1、Bolt.new

StackBlitz 公司推出的一个全栈应用的 AI 生成器。

只要输入需求,它就会生成你要的全栈应用,前端代码和后端代码同时生成。你可以在它的页面上运行、编辑和部署该应用。

2、文字转语音

免费的在线文字转语音工具,支持74种语言318种声音。(@bingal 投稿)

3、Chat100.ai

免费使用 GPT-4o 和 Claude 3.5 Sonnet 的 AI 在线聊天。(@aaamomo64 投稿)

资源

1、Font sensei

谷歌字体选择器,按照标签选择字体,包含中日韩字体。(@mrbirddev 投稿)

2、Signature

一个生成英语艺术签名的网站。(@nansshan 投稿)

3、今天的上网感受

这个网站模拟,一个普通用户从搜索引擎点进网站,所遇到的各种打扰。

图片

1、韩国地铁的电梯标识

韩国首尔的地铁站里,有这样一个标识。

瘦人的图案指向楼梯,胖人的图案指向电梯。

这可能是为了激励胖人去走楼梯,运动减肥。但是,有人觉得这是公然的歧视。

2、中世纪城堡

欧洲中世纪城堡的表面,经常有一个个突起的小房间,而且向下开口。

你知道它是干什么的?

言论

1、

只要能够获得自然光,人们就可以生活在地下或土堆下,那么我们就可以拥有一个看起来像公园的城市!

-- Hacker News 读者

2、

想法并不那么重要,执行和营销才是成功的决定因素。

-- Hacker News 读者

3、

2014年,时任百度首席科学家、斯坦福大学副教授吴恩达表示,有些人担心 AI 会取代人类,这就好像担心火星出现人口过剩和环境污染一样。这种担心大致相当于在1850年撰写 iPhone 用户指南。

-- 《超级智能,10年后》

4、

工程团队可以分为防守和进攻两种角色。进攻角色负责开发新产品和增加功能,防守角色负责维护产品。

这两个角色都很重要,但是公司往往更重视进攻角色。

-- 《将工程团队分为防守和进攻》

往年回顾

加密通信的最后一块拼图(2023 #274)

Figma 为什么赢了 Sketch(2022 #224)

全能程序员 vs 特长程序员(2021 #174)

华为如何考核员工(2020 #124)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月18日

科技爱好者周刊(第 320 期):乒乓仓

作者 阮一峰
2024年10月11日 08:11

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

甘肃省瓜州县的戈壁滩上,有一座6000多根白色钢管搭建的雕塑作品《无界》,象征唐代的边关。(via

乒乓仓

如果有人给你一笔钱,让你准备一个商业计划,你会选择什么项目?

很大可能,你根本想不出干什么。现在的商业计划太难了,所有领域的商业竞争空前激烈,几乎找不到高增长的领域。

但是前些日子,我看到一篇报道,关于一家美国创业公司的故事,觉得他们的点子非常聪明,可以照搬到国内,不需要很大投资,盈利的可能性很高。

他们选择了一个别人想不到的创业方向:乒乓球。

创始人是一个纽约的股票分析师。他有一个烦恼。每天晚上结束加班,想打一会乒乓球,但是周围根本找不到球馆,就算找到了,也已经关门了。

他后来发现,很多人都有这个需求,想打球但是找不到球场。

终于有一天,他下定决心,既然没有人做这件事,那么我来做。

他租下闲置的店面,改造成乒乓球室,起名为"乒乓仓"(PingPod)。

每个仓室放一张乒乓球桌,全天24小时营业,无人管理,通过手机 App 预订,App 会告诉你开门密码。

可以几个朋友一起来打球,也可以一个人来玩。他们提供发球机。

你就跟机器对打,还能调节机器发球的力度和难度。

每个乒乓仓都配有多个摄像头,除了监控,还能将比分显示在屏幕。

屏幕下方有一个粉红色的 REPLAY 按钮,点击后,会回放刚才那一分的录像。

你还可以在手机 App,查看整场比赛的录像,精彩片段可以分享到社交网站。

这个服务一推出,就大受欢迎。每天打球的人络绎不绝。短短几年,乒乓仓已经发展到了70多个,运动项目也从乒乓球,扩展到了台球、棒球击球、匹克球、高尔夫模拟器等。

为了更快的增长,他们现在改成了加盟制,你可以购买 PingPod 品牌经营权,使用他们的 PodPlay 系统,开设自己的乒乓仓。这样一来,他们就从经营体育场地变成科技公司,利润更高。

我觉得,这个项目在国内可行。现在各地有很多空置的商业空间,就可以改成这种付费的"乒乓仓",全天开放、价格实惠、使用方便、还有配套的数字化服务。

这样大大增加了体育活动的场所,降低了参与门槛,同时使用数字科技提升体验,一定会有很大的需求。

[活动] 叠纸技术周

游戏开发感兴趣的同学看过来。

国内著名的手游公司"叠纸游戏",马上要举办技术周,游戏开发团队跟大家面对面

简单介绍一下叠纸游戏。它成立于2013年,打造出《奇迹暖暖》《恋与制作人》《闪耀暖暖》《恋与深空》等超人气作品,还有多款在研游戏。

截止今年上半年,全球累计注册用户数近4亿,其中《恋与深空》的流水已达15.9亿元,是流水最多的乙女游戏。

他们的技术周是下下周 10月23日-10月26日,地点在上海杨浦区的叠纸大厦,活动内容如下。

  • 技术大咖面对面:CTO 和在研游戏技术负责人,跟大家现场对话。
  • 技术负责人分享:不同开发岗位背后的技术挑战。
  • 在研游戏试玩:现场实机体验《无限暖暖》、《万物契约》、《恋与深空》VR 试玩版。
  • 叠纸一日生活:感受公司企业文化和生活日常。
  • 面试/Offer 直通:有机会速通面试拿Offer.

活动面向25届、26届在读学生,现场感受第一线的游戏开发,同时跟招聘相结合,提供实习/工作机会

如果你有志于游戏开发,不要错过这个机会,现在扫描下方二维码报名。

科技动态

1、披萨盒

外卖披萨都装在盒子里,很少有人想过,怎么利用这个盒子。

披萨连锁品牌"必胜客",最近在纽约推出了一种全新的做法。

他们发现,75%的求职简历从未被认真读过,那么如果把简历印在披萨盒子上,是不是可以让更多的人看到?上图就是一个叫做 John Dough 的人的简历。

求职者可以向披萨公司付费,将自己的简历印到盒子上,并且指定希望送到哪些区域。

当该区域的公司订购披萨时,这些盒子就会送过去。高管们吃披萨时,就会看到盒子上的简历。

2、小五机器人

腾讯 Robotics X 实验室,发布"小五"机器人(The Five),用于家居环境,适合养老、医疗等场景。

该机器人有四条腿,轮足复合设计,在平地、斜坡、鹅卵石地面都可以行走,还可以爬梯。

它的两只手可以搀扶老人,也可以搬运物品。

不需要的时候,它还能折叠起来,便于收纳和运输。

3、太空旅行的食物

地球到火星的旅程,单程最少需要6个月,如果去更远的星球,则需要更长的时间。宇航员的食物如何解决?

目前的飞船无法携带大量食物,长期任务的食物只能在飞船上生产。

为了解决这个问题,美国国防部正在开展一项实验,使用小行星的碎片生产食物。

上图是一颗叫做"贝努"的小行星碎片,主要成分是碳氢化合物。科学家将这些碎片喂给细菌,产出有机物,作为人类食品的原料。

据估计,重达8550万吨的小行星"贝努"可以让一名宇航员吃上约600年,最理想的情况下,可以吃17,000年。

但是,这是不是意味着在航行途中,飞船必须去捕获小行星,然后带着它一起飞?

4、中国天眼阵列

"中国天眼"是世界最大的射电望远镜之一,直径500米。

为了提高分辨率,天文台决定在周边的山头上,再建设24台直径40米的射电望远镜。

这样的话,一共25台射电望远镜,组成一个阵列,可以大大提高太空图像的清晰度。

上个月,第一台试验机已经开始建设。

5、其他

(1)中国公开登月服,宇航员将穿着它登陆月球表面。

(2)佛罗里达即将遭遇米尔顿飓风,房主使用绷带固定屋顶,防止被吹走。

文章

1、垫紫草的诱惑(中文)

作者是中科院植物所的研究员,讲述在云南白马雪山4800米海拔处,发现垫紫草的故事。

2、如何使用 CSS flexbox 制作时间线(英文)

一篇简单教程,教你使用 flex 布局,制作出上图的时间线(timeline)样式。

3、服务器的基本设置(英文)

本文介绍,如果自己搭建一台公开访问的服务器,怎么进行设置。

4、我如何构建自己的博客(英文)

这篇文章详细介绍作者的博客技术方案,这个方案比较复杂,基于 Next.js + MDX。

5、LLM 书签收藏方案(中文)

作者介绍了自己的书签收藏工作流:收藏书签后,自动抓取全文,并用 AI 生成页面摘要,以备未来查找和回顾。(@jerrylususu 投稿)

6、btop 使用介绍(中文)

Linux 系统一般使用 top 命令,查看系统运行情况,本文介绍更好用的 btop 命令。(@xiaobox 投稿)

工具

1、MiKaPo

一个纯前端的二次元动作捕捉方案,在网页上,从视频/图片/摄像头提取动作、表情来控制动画角色。(@AmyangXYZ 投稿)

2、LockPass

作者模仿 1password,做了一个开源的密码管理器。(@ftyszyx 投稿)

3、Copi

macOS 系统的剪贴板替代工具,防止第三方应用程序访问剪贴板。(@s1ntoneli 投稿)

4、词悦(Ciyue)

mdict 词典的安卓 App,使用 Flutter 开发,代码开源。(@mumu-lhl 投稿)

另有一个命令行的 mdict 词典。 (@lengyijun 投稿)

5、独白

一个练习口语的 iOS App,你不断朗读句子,进行录音,支持多种语言。(@sniperboy0829 投稿)

6、 photo4you.win

免费在线证件照制作。(@huangzhuo492008824 投稿)

另外,有一个类似的开源项目 HivisionIDPhoto

7、OneIMG

一个开源的、纯前端的文字转图片的网页应用。(@byodian 投稿)

8、WebChat

开源的浏览器插件,基于 WebRTC,为同一个页面的访问者建立去中心化、无服务器的匿名聊天,可用于任意网站。(@molvqingtai 投稿)

9、TvT.js

一个基于 ThreeJS + Vue + TresJS 封装的框架,用 Vue 组件的方式写 3D 可视化项目。(@hawk86104 投稿)

10、Hexo Theme Sea

一款开源的 Hexo 博客主题,支持国际化和暗黑模式。(@hai-zou 投稿)

11、联网麻将游戏

麻将游戏的一个开源实现,分成服务端和客户端。(@liumengniu 投稿)

12、X Guard

一个 X(Twitter)内容过滤的浏览器插件。(@zmzimpl 投稿)

AI 相关

1、NotebookLM

谷歌推出的一个新服务,可以将一篇文章转成学习笔记或者播客。

也就是说,你上传文章后,它可以将文章转成一个英文的广播节目,内容是两个 AI 主持人一问一答介绍这篇文章,参见官方的介绍。它甚至能将 Youtube 的视频转成播客。

下面是一篇使用感受,作者用它将一篇地质学论文,转成几分钟的播客节目,放给8岁的儿子听。

2、Silo

纯前端的多模型对话、文生图工具,可以在网页同时使用多个 AI 模型,进行比较,代码开源。(@KwokKwok 投稿)

3、Praises

跨平台的文本转语音的桌面工具,支持调用多个 API,免费使用。(@ElmTran 投稿)

4、AI PPT Maker

免费的 PPT 生成服务,有模板和多语言支持。(@icaohongyuan 投稿)

资源

1、Trieve HN Discovery

第三方的"黑客新闻"搜索引擎,使用体验很不错。

2、Zeli

这个网站实时给"黑客新闻"每个链接生成摘要。(@mazzzystar 投稿)

3、TypeRoom 类型小屋

TypeScript 题库 Type Challenge 的网页版。(@vortesnail 投稿)

4、开源许可证选择器

回答几个问题,帮你选择一个开源许可证。(@wincatcher 投稿)

图片

1、黑洞光束

哈勃望远镜拍到了一张令人惊叹的照片。

银河系中心的 M87 星系,向外喷出一根巨大的光束,长度足足有3000光年。

据美国宇航局的解释,M87 星系的中心是一个黑洞。黑洞本身不发光,但是周围物质会围绕它快速旋转。有时,吸入黑洞的物质会"改变路线"成两股喷流,向相反的方向发射。

2、拉格朗日标准模型

拉格朗日标准模型是一个描述粒子行为的统一方程,非常复杂。

这个方程有几十行,分成5个部分。尽管如此,它依然是描述粒子行为最简单、最紧凑的形式。

文摘

1、巨型光学望远镜的衰落

巨型光学望远镜,指的是透镜直径超过10米的望远镜。

为了建造下一代巨型望远镜,美国政府准备拨款不超过16亿美元。这是很大一笔钱,但可能还不够,这样的望远镜预计将耗资30亿美元或更多。

但是,我有不同想法。我认为,巨型光学望远镜不值得建造,应该用小型光学望远镜(直径 0.5米~1米)的组合取代它

巨型光学望远镜的建造,需要削平整个山头,建立牢固的地基和同样巨大的配套设置。为了运送建筑材料,要先在山上开辟公路。一条两车道的公路只有5米宽,怎么运输这面10米直径的透镜都成了大问题。

我们这个时代,技术设备正变得越来越小,计算机从房间大小变成了口袋设备,摄像头可以做到微米级的像素产品,为什么望远镜要越做越大呢?

(1)小型望远镜成本更低。在美国购买一台0.5米直径的光学望远镜,价格是56,000美元;一台性能优秀的直径1米的光学望远镜,价格现在是57万美元。即使购买100台这样的望远镜,也不过几千万美元,而一台巨型望远镜需要投入30亿美元。

(2)天文学图像的重点,已经从光学照片转移到了软件处理。完全可以在多个夜晚对天空的同一区域进行多次曝光,然后用软件将它们组合成一张图像,而不需要更大更清晰的镜头。

以上两点,使得我们完全可以将许多小型望远镜组合在一起,而不是建造单个巨大的望远镜。我们可以让望远镜组合扫描整个天空,再拼成一张巨型照片。

这种向小型望远镜的转变,将从根本上改变望远镜工程。天文望远镜将从结构和机械工程,变成一种软件开发。

这种转变很有吸引力,因为软件可以渐进式改进,天文学家还可以轻松利用各种软件工具,处理大量数据。

此外,小型望远镜的组合也更灵活。使用巨型望远镜,你只能指向一个方向,但使用许多小型望远镜,你可以将视野分开,还可以每个镜头使用不同的滤光片。

最后,如果某个零件发生故障,巨型望远镜需要整个停机,而小型望远镜的组合只需要停掉那一台,其他还能正常工作,这样更方便系统维修。

言论

1、

技术繁荣本身不一定能让人们幸福,但它会明显改善世界各地人们的生活。

-- 奥特曼,OpenAI 公司 CEO

2、

城市并不吵闹,汽车才吵闹。电动汽车没有发动机噪音,会让城市重新回归安静。

-- 《电动汽车的声音应该是什么样?》

3、

JavaScript 世界的"一代"有多长:六个月、一年、还是三个月?JS 工具之间的竞争之激烈令人震惊。

-- Lobste.rs 读者

4、

每天花8个小时以上的时间,开发和维护你不关心的东西,会导致你的不快乐。

-- Hacker News 读者

往年回顾

任正非的三篇最新谈话(2023 #273)

程序员需要担心裁员吗?(2022 #223)

网络收音机的设计(2021 #173)

互联网公司与湘军的军制(2020 #123)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月11日

后面试时代与 AI 刷题

作者 阮一峰
2024年10月10日 08:15

一、引言

七月的时候,我写了一篇文章《AI 编程助手测评:GitHub Copilot vs 豆包 MarsCode》,推荐了后者。

豆包 MarsCode 团队最近就邀请我,试用他们的新功能"代码练习",它专门用来准备面试和刷题。

试用以后,我有很多想法。

我觉得,AI 会改变程序员的面试,以后是 AI 刷题的后面试时代

二、面试的 LeetCode 刷题

现在的程序员面试,一般都有算法解题。

为了准备面试,大家都会去刷算法题,最常见的就是使用 LeetCode 题库。

LeetCode 是世界最流行的算法题库。它源自美国,专门收集各种面试算法题,目前已经超过了3000道,不少是互联网大厂的真题。

很多同学坚持不懈,每天投入几个小时,做里面的题目,训练自己的算法能力。一般来说,至少要刷200题,面试才较有把握。

(图片说明:上图是某个老外的刷题统计面板,他一年365天,每天都在刷题,一共刷了1500题。)

三、AI 颠覆 LeetCode

生成式 AI 出现后,越来越多的人发现,有了 AI,人肉刷题似乎不那么必要了。

今年(2024)8月份,一位美国网友在 Reddit 论坛发了这样一个帖子。

他说,自己写了一个脚本,让 AI 自动求解 LeetCode 算法题,一天之内做了633道题目,正确率达到了86%,成本只要9美元。

这个帖子引起了巨大反响。

既然 AI 可以提示正确答案,为什么不参考 AI 来准备面试呢? 何必坚持苦思冥想、徒手 LeetCode 刷题。

四、AI 助手的解题能力

我们完全可以跟着 AI 刷题,做到事半功倍。

我选一道 LeetCode 题目,展示一下这是多么简单的事情。


你是一个 JavaScript 程序员,请补充完成下面的函数。

要求是输入一个代表罗马数字的字符串(比如"IX"),该函数会返回对应的阿拉伯数字(比如9)。

 /**
  * @param {string} s 
  * @return {number} 
  */ 

var romanToInt = function(s) {


};

选择上面这道题,主要是因为它很短,便于展示。而且,这道题的难度不大,但需要考虑多种情况,很适合用在初级面试。

我选择的 AI 工具,就是 VS Code 编辑器的豆包 MarsCode 插件,它是免费的。

在 VS Code 代码编辑器里,从左边栏打开该插件(如果未安装,可以在插件市场搜索"MarsCode")。然后,在对话框输入题目。

稍等片刻,AI 就会给出答案以及代码解释。

哪个地方看不懂,就向 AI 询问。

这节省多少时间啊,大大加快了刷题速度。

五、后面试时代

可以看到,AI 能够快速解决面试算法问题,那么,基于算法解题的面试模式,是不是应该有所改变了?

现在的互联网大厂,都允许工作中使用 AI 模型,面试再要求"徒手解题",已经有点过时了。

AI 将越来越普及,如果未来的面试不使用 AI,就好像不使用 IDE 编辑器一样不合理,应该允许程序员在面试中使用日常工具。

我的想法是,面试的考察重点可能会改变,从让面试者解题,变成让面试者解释和审查 AI 生成的代码。

面试时,给你一段 AI 生成的解题代码,让你解释这段代码,并且修正里面的错误和没有考虑到的地方。

这样做有很多好处:(1)更贴近程序员的实际工作模式;(2)能看出程序员的代码阅读和理解能力;(3)难以事前准备或作弊;(4)更能反映一个人的协作能力;(5)也适用于偏向阅读代码而不是编写代码的岗位,比如项目经理、架构师等等。

这可以称为"基于 AI 的后面试时代",即面试从考察编码解题能力,演变到考察代码的审查理解能力。

六、AI 陪练功能

现在已经有很多工具,为面试提供 AI 辅助训练。

豆包 MarsCode 的"代码练习"就是一个最新的尝试。我用了以后,觉得对准备面试、有效刷题真的有帮助,可以训练自己与 AI 协同编程。

它是一个基于云 IDE 的专门页面,内置了上百道字节跳动的面试真题

所有相关操作都集中在这个页面上,只要有浏览器就可以使用,刷题全过程不必切换页面,大大方便了使用:选题、解题、调试、AI 对话......

而且,它是免费的,大家现在就可以试试看:进入豆包 MarsCode 官网,点击顶部菜单的"代码练习",就可以进入。

这个页面是云 IDE,不需要任何安装,打开后直接在浏览器使用。

默认状态下,页面分成四栏。左侧是面试真题的目录,目前有100道,以后还会不断增加。选中一道题目,点击后可以看到具体内容。

页面右侧是代码框和 AI 框。

在代码框,需要首先选择你的编程语言,共有8种可选(Python、JavaScript、Go、C++、C、Java、Rust、TypeScript),上图是 JavaScript。然后,输入解题代码,再点击顶部的运行按钮,就可以看到运行结果。

在 AI 框,则是三个预设选项,点击后就可以让 AI 提示思路、代码、检查代码。下方还有对话框,用来跟 AI 对话。

一般来说,拿到题目后,(1)先点击"需要一点思路提示",让 AI 帮助你理解题目。(2)再点击"给我一些代码提示吧",让 AI 给出初步代码。(3)你修改和完善代码,再点击"帮我检查一下代码",看看会不会报错。

此外,这个页面还集成了 IDE 功能,比如语法检查和代码调试。随着代码键入,会自动给出用法提示(下图)。

这样的"代码练习",堪称面试刷题的利器,我觉得,面试指导书籍和辅导班可能都不需要了,以后都会被淘汰。

七、总结

AI 改变软件行业,也必然改变程序员的面试求职。

AI 刷题是未来的趋势,善用者将更容易通过面试,拿到心仪的 offer。

但是,需要提醒的是,AI 只是工具,生成的代码不一定正确和安全,而且项目之中也不应该有黑箱。

正确的做法是,使用 AI 但不依赖,思路比答案更重要,只有理解了每一行代码,才能接受它的结果。我们使用 AI 的首要目的,永远是提升自己的能力,而不是让 AI 替代我们,代码的最后责任人的不是 AI,而是你。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月10日

科技爱好者周刊(第 319 期):如何拍出爆款视频

作者 阮一峰
2024年9月27日 08:13

这里记录每周值得分享的科技内容,周五发布。([通知] 下周十一假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

杭州古荡地铁站的出口处,出现了一只巨型"瑜伽熊猫",它高6米,主要由海棠、景天、佛甲草、绿草四种植物打造而成。(via

如何拍出爆款视频

MrBeast 是美国第一网红,可能也是世界第一网红。他是 Youtube 订阅者最多的频道,2024年9月拥有3.17亿粉丝。

他每个视频的拍摄成本至少100万美元,制作团队有250人,可想而知,他的视频收益多么可观。

他们公司的员工培训手册(下载地址12),最近流出了(下图)。

这是一个36页的 PDF 文件,是他本人写的,主要内容是告诉员工,如何在他的公司工作。

在第一页,MrBeast 要求员工熟读这本手册的每一句话,读完以后还要考试,通过者可以得到1000美元。

里面有很多 MrBeast 拍出爆款视频的经验总结,我觉得视频从业者必读,下面摘录几条。

(1)点击率 是最重要的指标,计算公式是点击视频封面缩略图的用户数量,除以看到缩略图的用户数量。

视频的标题(包括缩略图)决定了点击率,视频必须有一个吸引人的标题。

《我在家50个小时》是一个很蹩脚的标题,不会有人点击,改成《我吃了50个小时的番茄酱》,就会有点击。

然后,缩略图是一个人坐在满满一浴缸的番茄酱里面,就比一个人坐在前院,点击效果好得多。

一般来说,标题越极端越好,《我不喜欢香蕉》不如《香蕉是地球上最糟糕的食物》。

(2)观看时长 也很重要。Youtube 后台有详细图表,展示每个视频的观看时长百分比。

上图下方的曲线,就是视频在每个时点留存的观众百分比。可以看到,第一分钟最关键,留存的观众从100%快速下降到66%。

这就是说,三分之一的观众在第一分钟就放弃观看。上图的这个视频一共有6000万人次观看,但是在第一分钟我们就失去了2100万观众。

如果我们可以改善第一分钟,呈现更有趣的内容,可能就会少流失几百万人。第一分钟是每个视频最重要的一分钟。

(3)重新参与。视频的第1分钟告诉观众,他们会看到什么,然后从第1分钟到第3分钟开始疯狂推进故事。

假设有一个10分钟的视频,讲述一个人在树林里生存了几周。那么,前3分钟不要按部就班展示他每一天怎么过,而要让观众知道他已经生存了多日,唤起用户的情感和好奇心,想看看他能走多远。

这称为第三分钟重新参与,激发用户的兴趣,期待真正印象深刻的内容。

(4)视频的中段 是第3分钟到第6分钟,在这里可以规划所有最令人兴奋和有趣的内容,目标是让观众爱上这个故事、人物以及视频本身。

如果我们能让观众看完视频中段,他们就很有可能看到最后。通常在第六分钟,需要加入另一个非常有趣但需要更多解释的内容,让用户重新参与一次,将故事推动到后半部分。

(5)视频的后半段。一旦有人花了6分钟看这个视频,就表示对故事投入了极大的精力,很可能会坚持看到最后。

通常,不太有趣的内容会出现在视频的后半段,但是永远不要发出视频结束的信号,这样观众就不会关掉视频。

让观众坚持到最后的一个方法,就是保留悬念,比如看看谁能最后赢得10万美元,获胜者直到视频结束才揭晓。所以只要我们不让视频变得无聊得要死,人们很可能会坚持到最后。

另一个方法是阶梯式展示,比如《我买了世界上最大的烟花》这个视频一开始就展示了所有的烟花,然后点燃1美元的烟花,接着点燃10美元、50美元、75美元、1,000美元、10,000美元、40,000美元、100,000美元,最后点燃一个破世界纪录的烟花。

(6)总结。人们观看的时间越长,视频的效果就越好,这就是为什么我对每一秒都如此执着。

在视频开始时吸引观众,将内容变成一个令人惊叹的故事,让观众投入其中,没有沉闷的时刻,然后在视频结束时以突然的结局获得令人满意的回报。

科技动态

1、iPhone 16 的可拆卸电池

拆过手机的同学都知道,手机电池是用胶水固定的,非常难拆。

新推出的 iPhone 16 系列,采用一种新的电池拆卸机制,使得拆电池变得很容易。

拆开手机后,电池板下面有两个电极,用充电宝或电池(9V 或 12V)给它们通电。

大概一分钟后,电流就会使得胶水融化,从而顺利取下电池。

清除底板上残留的胶水,也变得容易,然后可以重新涂上胶水,把新电池换上去。

这种新的电池拆卸机制,以后应该会得到推广,提升智能手机的可维修性。

2、iPhone 时钟

苹果的很多产品设计,都受到德国博朗(Braun)电器的启发。博朗曾经推出过一款时钟,苹果至今还未借鉴。

一位国外程序员突发奇想,能不能把 iPhone 改造成这样的时钟。

他用 3D 打印制作了一个支架。

然后,把 iPhone 放在里面,就成了一款漂亮的时钟。

3、5G 玻璃天线

传统的 5G 基站是下图这样,白色的外壳部分是天线。

这样的基站很引人注目,在市区也不容易找场地。

为了解决这个问题,一家日本公司最近宣布,开发了玻璃天线。

这种天线把导电材料与透明树脂混合,然后夹在两片玻璃之间,看上去就是普通的窗玻璃(注意顶部的导线)。

信号通过玻璃,传给基站。这种方法将建筑物的外墙玻璃,变成 5G 天线,从而大大方便了 5G 基站的部署。

4、其他

(1)安卓的平板电脑版本,将支持窗口功能,用户可以缩放和移动窗口。

文章

1、线性代数入门(英文)

一篇简短的文章,介绍矩阵的基本概念。

2、flex 布局的表单的一个问题(英文)

作者使用 flex 布局,放置表单的 input 控件时遇到的一个小问题。

3、关于 GNU Readline(英文)

很多人不了解,在 Linux 命令行输入命令时,有很多快捷键,比如 ctrl-a(回到行首)。它们都来自行编辑库 readline。

4、TCP 什么情况下不需要三次握手?(中文)

本文介绍 TFO 机制,可以在 TCP 第一个握手请求 SYN 时就发送数据。(@duanbiaowu 投稿)

5、使用 @layer 自制一个 CSS 框架(英文)

一篇 CSS 高级教程,介绍使用 @layer 指令,自己写一个 CSS 框架。

6、演唱会发光腕带的原理(英文)

作者拆了一个演唱会的发光腕带,解释它的工作原理。

7、我用 AdGuard Home 自托管 DNS(英文)

作者详细介绍,怎么使用开源软件 AdGuard Home,搭建自己的 DNS 服务器,彻底定制 DNS 规则。

工具

1、LosslessCut

一个开源的跨平台视频剪切软件,目标是成为 FFmpeg 的图形前端。

2、Weather as Landscape

一个很有创意的项目,将天气预报变成一幅画,

3、Container Desktop

跨平台的桌面应用,用来管理容器,类似于 Docker Desktop。

4、玉竹(Yuzhu)

一个简洁的博客、微博客系统,基于 PHP,自带安卓客户端。(@hefengbao 投稿)

5、IPFS telegra.ph

一个在 ipfs 上写文章的极简发布工具,从网页输入文章发布到 ipfs。(@chenjia404 投稿)

6、UptimeFlare

一个开源的服务,监控网站是否正常在线,基于 Cloudflare Worker。

7、Zerox OCR

一个 JS/Python 库,使用 OpenAI 对 PDF 文件进行文字识别。

8、Monocart Coverage Reports

一个 JS 工具库,生成 V8 格式和 Istanbul 格式的测试覆盖报告。(@cenfun 投稿)

9、五子棋人机对战

开源的小游戏,网页五子棋人机对战。(@mumuy 投稿)

10、JSON For You

开源的 JSON 数据的在线可视化、处理工具。(@loggerhead 投稿)

11、Compress JPG

一个基于谷歌的 squoosh 算法、一次性压缩多张图片的网站。(@ethansunray 投稿)

12、git cliff

一个自动总结提交信息,生成 changelog 文件的命令行工具。

资源

1、今日三句半

一份每日更新的免费邮件列表,外网的热点科技新闻总结。(@tx2126 投稿)

2、MingCute Icon

一个开源的图标库,收录3000个图标,可以定制颜色、大小和格式。

3、APPLORE

这个网站收集了5000多个应用程序的图标,可以分类搜索。(@ViggoZ 投稿)

4、OpenAPI 使用手册(英文)

OpenAPI 是描述 API 的一种文件格式,这里有一本非官方的使用手册,详细记录了各个字段的用法。

图片

1、美国为什么不采用公制度量衡

美国采用的是英制度量衡,而不是公制度量衡。其中的原因有一个传说。

1794年,法国通过了公制度量衡,确定了"米"作为长度单位,"克"作为重量单位。当时,一共制造了六件"米"原器和六件"千克"原器。

法国就派出一名使者,随身携带一件"米"原器和一件"千克"原器,准备交给美国国会。

但是,这位使者在路上遇到了海盗,连人带货都被抢走了,最后死在加勒比海的一个岛屿上面,原器也不知下落。

美国国会没有拿到新的度量衡,不得不继续采用英制度量衡,等到后来再想改,就为时已晚。

目前,美国 NIST 博物馆有一件"千克"原器,1952年由他人捐赠,捐赠人也不知道祖先从何得来,传说这就是被海盗抢走的那一件。

2、画廊涂鸦

香港巴塞尔艺术展展出了一位英国涂鸦艺术家的作品。

有意思的地方是,这位艺术家参观展厅以后,一时手痒,将布展地板和墙壁也一起画了。

文摘

1、第一个计算分子大小的人

英国科学家约翰·斯特拉特(1842--1919,又称瑞利男爵)是第一个计算分子大小的人。

人们很早就发现,油会在水面上形成一层油膜,让水面光滑如境。

1890年,瑞利男爵取了少量橄榄油,准确地说是0.81毫克,滴在水面上。橄榄油很快扩散开来,形成了一层极薄的油膜,他精确测量了油膜的面积。

他假设,油膜的厚度就是一个油分子,那么已知油膜的体积和面积,将体积除以面积,就可以算出油分子的大小。

计算结果是1.63纳米,这比其他测量分子大小的方法早了许多年,而且非常简单。

这个故事告诉我们,最简单的科学实验,不需要复杂的材料和仪器,只需要一滴油和科学头脑,有时候就可以得到深刻的科学见解。

瑞利男爵最出名的,并不是这个实验。他是第一个光的散射模型的发明者,解释了天空为什么是蓝色的,他还发现了惰性气体氩,并因此于 1904年获得诺贝尔奖。

言论

1、

OpenAI 的估值高达1500亿美元,很多人认为它不值这么多。(1)市场上有很多规模更小、价格更便宜的模型可供选择,部分是开源的。(2)随时可能有更突破的模型出现,取代它的位置。(3)OpenAI 很多员工离职,流动到其他公司。

-- 《经济学家》

2、

谷歌云宣布,将于2025年关闭 Google ContainerRegistry 服务,由一个名为 ArtifactRegistry 的新服务取代。

为什么谷歌云要关闭运行很好的老服务?我想不出理由,可能是因为新服务的价格比老服务贵10倍。

-- 《无法推荐谷歌云》

3、

Uber 打车的算法是,如果你的手机快没电了,它就会显示更高的价格。

-- 《Uber 发现手机快没电时乘客愿付高价》

4、

电影《侏罗纪公园》比任何学术论文都更能激发人们进入生物技术领域,《黑客帝国》激励了更多人进入计算机科学领域,《火星救援》激励了更多人进入航空航天工程领域。

科幻作品并不能预测未来,而是讲述令人信服的技术故事,让人们毕生致力于推进前沿技术。

-- Eliot Peper,美国小说家

5、

债务定义了你的未来,当你的未来被债务定义时,希望就开始破灭。

这就是债务的最大问题,它限制了你的人生选择和灵活性。

-- 肯特·纳伯恩(Kent Nerburn),美国作家

往年回顾

Unity 的安装费,游戏业的缩影(2023 #272)

四十年编程感想(2022 #222)

我们会死于气候灾难吗?(2021 #172)

谈谈互联网公司的高估值(2020 #122)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年9月27日

科技爱好者周刊(第 318 期):创业咖啡馆的记忆

作者 阮一峰
2024年9月20日 08:04

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

张大千最大的一幅画作《巨荷》,正在香港展出。巨大的荷花,随风招展,恣意生长,表现出蓬勃旺盛的生命力。(via

创业咖啡馆的记忆

上周末,媒体在谈论中国风险投资的现状。我不禁想起,它曾经多么火爆。

大家还记得创业咖啡馆吗?

我搜到了一组照片,拍摄于2015年1月6日的北京中关村"车库咖啡"。

(1)咖啡馆内部非常拥挤,创业者都忙于自己的项目,正常喝咖啡的人反而没有。

(2)点一杯20元的咖啡,就可以坐一天,很多人把电脑搬进咖啡馆,把这里当成工作室。

(3)咖啡馆24小时营业,不少人会在里面过夜,要是半夜醒了,就继续干活。

(4)咖啡馆的墙上贴满了商业计划书,以及找合伙人的布告,更新速度非常快。

(5)人们用手机扫描布告的二维码,了解详情。

(6)每天中午都会有创业者自愿上台分享自己的项目和经历,希望拿到风投。台下的人见多不怪,继续低着头,专注手头的工作。

(7)随便找一个陌生人,他都愿意跟你侃侃而谈,介绍他的创业项目。

这就是十年前的创业氛围。

这样的创业咖啡馆,现在已经消失了。即使还有人在咖啡馆里做创业项目,也只是把它当作一个工作空间,而不是寻找风投的地方。

如果你问我,是不是怀念创业咖啡馆?老实说,我还挺怀念的。虽然它更多是泡沫,大部分的项目先天不足,甚至不乏欺诈,但是我怀念那时的人们充满干劲,相信自己可能是下一个马云马化腾,市场热火朝天,每天都有新东西出来。

今天的风险投资,氛围已经全变了。不仅申请的难度大大上升,而且风险投资家处处在规避风险。他即使投给你,也往往要求加入回购条款。

所谓"回购条款",就是规定如果创业公司无法在指定日期前上市或被收购,创业者必须"回购"拿到的投资,即把钱还给风投公司。

更有甚者,风投为了保证"回购条款"的执行,还要求创业者用个人财产做担保。就是说,如果创业失败了,公司的钱都亏光了,你还必须用个人的钱偿还风险投资。

这还叫"风险投资"吗?风险都转嫁给了创业者,投资变成了借款。难怪大家现在不敢拿风投,害怕创业失败,背了一身债。

我觉得,国家应该出一个司法解释,明确如果存在"回购条款",就不是投资合同,而是借款合同,出资者获取的股权无效。只有这样,才能不把创业者吓跑。

技术创新需要风险投资,我衷心希望中国的风险投资和创业热潮,有重新高涨的那一天。

好消息是,《黑神话:悟空》最近的成功对游戏开发者是一个巨大的鼓舞,风险投资的信心有所恢复。但愿游戏业会带动风投,要是能结合元宇宙就更好了。

科技动态

1、自动对焦眼镜

一家日本公司推出了"自动对焦眼镜",可以自动对焦。

这意味着,不需要配眼镜了,也不需要验光了。不管你的近视度数(或者远视度数),直接戴上这幅眼镜,它会自动调节镜片,直到你看清为止。

它相当于一台迷你验光机,内置电池,一次充电可以使用10个小时。如果要用一天,就需要准备两副眼镜。

它的售价是4000元人民币(555美元),重量是50克,比普通眼镜重,但可以接受。

2、何同学的头盔

上一期周刊提到,何同学在苹果发表会上,使用自制的头盔拍摄装置,引起了轰动。

本周,他专门发了视频,介绍这个装置。下图是他最早购买的头戴式单反支架。

苹果不允许带入发布会现场,他只好自己重新设计制作,用 iPhone 取代单反相机,虽然牺牲了画质,但确保可以带入场。

他选择 AR 眼镜,连接头上的手机,这样就可以看到实时影像。为了避免看不到路,他拿掉了一块镜片(下图)。

装置左边还有一根伸缩的自拍棒,这样就能拍到自己,提供另一个视角。

此外,支架上还能放置遮阳伞、补光灯,甚至饮料瓶,满足外出拍摄的各种需求。

3、AI 游戏合成

谷歌和特拉维夫大学的研究人员,发表了一篇论文,提出可以用 AI 实时生成游戏画面。

举例来说,当你举枪向敌人射击,现在的游戏是按照预置的代码生成下一步的画面,研究人员提出,可以让 AI 想象出下一步的画面。

这是一个革命性的想法,游戏画面可以让 AI 生成,而不是人工编写。"当 AI 可以为你思考每个像素时,为什么要手动为软件编写规则呢?"

不过,它有一个限制,就是必须基于现有的游戏进行训练,还做不到"发明"全新的游戏。

4、电动螺旋桨

一家瑞典公司推出了一种新型的船用螺旋桨,在一个圆盘上面装了很多垂直的叶片。

圆盘本身在转动,每一个叶片也可以独立转动,并且可以精确控制转动方向和转速。这样的设计据说可以节省推进的能量。

而且,它是电动螺旋桨,结构较简单,建造和维护成本相对较低。如果被证明可行,它就为电动轮船的发展铺平了道路。

5、其他

(1)中国启动22000米高空热气球载人实验,目标是创造载人热气球飞行高度的世界纪录。

文章

1、怎么写 CSS 的打印样式(英文)

本文是一篇教程,介绍网页打印样式的 CSS 写法。

2、使用 Caddy 部署 Web 应用程序(英文)

一篇长文,介绍 Caddy 如何当作 Web 服务器的初学者教程。

3、哨兵值是什么(英文)

这篇短文通过牙膏的例子,解释什么是编程使用的哨兵值(sentinel value)。

4、Stripe 公司如何招聘工程师(英文)

Stripe 公司的创始人,分享自己招聘工程师的方式,有参考价值。

5、好的重构 vs 坏的重构(英文)

有些时候,重构之后的代码比之前还难懂。本文逐一举例,分析怎样的重构是好的,怎样是坏的。

6、Node.js 的 AbortController 指南(英文)

使用 Node.js 时,取消异步草走(比如网络请求和文件系统读取)一直很棘手。本文教你怎么用 AbortController 做到这一点。

工具

1、SuperHTML

一个 HTML 的 LSP 实现(语言服务器协议),可以在代码编辑器(比如 VS Code 和 Vim)实时检测 HTML 代码是否正确,参见教程

2、GlazeWM

一个专门用于 Windows 的平铺式窗口管理器,类似于 i3,自动实现新窗口的平铺。

3、Xnapper

一个截图美化的在线工具,可以为截图加各种边框。

4、sisi

命令行的图像语义搜索工具,让你用自然语言搜索本地图像。

5、Certimate

一个自搭建的开源平台,可以为自己的域名申请、部署、续期 SSL 证书,支持阿里云、腾讯云、七牛云等。(@usual2970 投稿)

6、Dawn Launcher

一个开源的 Windows 快捷启动工具,分门别类管理桌面快捷方式。(@fanchenio 投稿)

7、common-intellisense

VS Code 插件,为多种常用的前端 UI 库提供注释和类型提示。(@Simon-He95 投稿)

8、PopTranslate

一个 Chrome 浏览器插件,选中文字后,直接将翻译显示在右上角的弹窗,不需要点击按钮。(@wa008 投稿)

9、RTranslator

一个开源的安卓 App,可以实现语音对话的实时离线翻译。

10、Gladys Assistant

智能家居的一个控制系统,类似于 Home Assistant,但用起来更简单,面向普通用户。

11、Omnivore

一个开源应用,用于收藏稍后阅读的文章。

12、cvbee.ai

免费生成或修改简历。(@dddm25896 投稿)

13、libcimbar

一种特殊的二维码格式,可以把小于 33MB 的文件压缩成一个二维码,用他们提供的 App 扫码解压即可得到文件。(@joyc 投稿)

资源

1、退休年龄计算器

用户输入出生年月和性别,该网站根据新政策,计算对应的退休年龄。(@wincatcher 投稿)

2、Franzelio

一个有意思的网页小游戏,在网页上画线,反弹小球,发出的声音组成旋律。

3、插头 + 插座组合

全世界共有15种"插头 + 插座"组合,这个网页把它们全列出来。

4、计算机科学自学课程(英文)

这个仓库按照学习顺序,列出对应的欧美大学的计算机科学开放课程。全部学完,就等于上完计算机学位课程了。

图片

1、曼哈顿岛的历史

纽约的主要部分就是曼哈顿岛,今年是该岛建市400周年。

1624年,荷兰人选中这个地方,作为荷兰殖民地。因为这个岛位于两块陆地之间,可以作为避风港,并且有水路通往内陆。

下面就是当时荷兰人看到的曼哈顿岛。

事后证明,这个地方是一个世界级良港,这里的海水很宽,很深,很少结冰,适合停靠大量的大型船舶。

19世纪末,纽约港已经成为世界第一大港。

下面是21世纪的曼哈顿岛。

2、世界最古老的裤子

上个世纪70年代初期,中国考古学家在塔里木盆地的洋海古墓,发现了约500具木乃伊。

2014年,中国和德国的考古专家最终确实,其中一具木乃伊穿着的裤子,距今有3200年,是现存最古老的裤子。

这条裤子的基本设计与今天大多数人穿的很相似,它采用斜纹布,还有花纹。

文摘

1、为什么没有更多的人使用 Linux?

下面是著名程序员、Rails 框架的作者 DHH 的最新文章。

几周前,我看到一条推文问道:"如果 Linux 这么好,为什么没有更多的人使用它?"

这个问题听上去很有道理。你们都说 Linux 好,它甚至是免费的,那为什么没有大规模采用呢?

但是,如果你仔细想一想,就会发现生活中到处是这样的情况。

如果锻炼如此有益健康,为什么没有更多的人去做呢?

如果阅读如此有教育意义,为什么没有更多的人这样做呢?

如果垃圾食品对你如此有害,为什么还有那么多人吃它?

......

世界上充满了值得尝试的事情和事物,但大多数时候却被大多数人忽视。现实世界的真实情况是,变得肥胖和无知要比保持健康和学习更容易。

大多数人总是选择最容易、最不需要努力的事情。

Linux 就不容易,比微软和苹果的商业产品对使用者的要求更高。为了用好它,你需要学习一些东西,还要自己尝试解决问题。

我完全理解为什么大多数计算机用户对 Linux 不感兴趣,因为他们只想浏览网页或使用应用程序,并不希望成为计算机的高级用户。

但是,程序员不一样,对于他们,深入了解计算机是工作必需。这就是为什么程序员往往使用 Linux,也应该使用 Linux 的原因。

Linux 就跟生活中很多其他事情一样,选择它不是因为容易,而是因为它值得

言论

1、

2023年中国电影总票房是人民币550亿元,你猜游戏业规模如何?单单腾讯的游戏部门年收入就达1799亿,一个部门的业绩就三倍于整个电影业。

-- 周若鹏

(补充一下,2023年中国国内的游戏收入是3030亿元,彩票收入是5800亿元。)

2、

我们的软件产品,总是有客户要求我们编写自定义模块,我们的回答一律是:

"我们不会为个别公司编写自定义模块,因为无法在代码中维护如此多的分支,后面根本顾不过来。"

-- codingrequired.com

3、

一位教育专家建议,要允许孩子们感到无聊,这会鼓励他们想象、观察、探索周围的世界,从而激发想象力和独立思考。

-- BBC

4、

如果没有月球,地球就是一颗非常孤独的星球,最近的天体将是金星和火星,距离为3800万到 5600万公里,是地月距离的一百倍甚至更多。地球与它们的往返通信需要几分钟而不是几秒钟,单程旅行需要几个月而不是几天,往返旅程至少需要一年而不是一周左右。

正是月球,让我们感到地球在宇宙中不是那么孤独。

-- 《月球消失会给地球带来7大变化》

5、

即使身处最冷的寒冬,我知道自己的内心深处,有一个不可战胜的夏天。

-- 加缪,著名法国小说家

往年回顾

非线性的世界,线性的你(2023 #271)

全世界最繁荣的行业(2022 #221)

云服务流量有多贵?(2021 #171)

为什么人类没有越来越闲?(2020 #121)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年9月20日

科技爱好者周刊(第 317 期):驴子、老虎和狮子的寓言

作者 阮一峰
2024年9月13日 07:35

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

中国国家博物馆正在举办"巴黎圣母院展览",来了四件雕塑原件。巴黎原址现在放的是,维修过程中替换的复制品。(via

驴子、老虎和狮子的寓言

本周看到一个很有趣的寓言,分享给大家。

有一天,驴子和老虎发生了争论。

驴子说:"草是蓝色的。"

老虎回答:"不对,草是绿色的。"

他们各执己见,互不相让,争论越来越激烈。

最后,两人决定将这个问题提交给狮子法官。

他们来到狮子面前,驴子大叫大嚷:"法官大人,草难道不是蓝色的吗?"

狮子回答:"如果你真的这么认为,草就是蓝色的。"

驴子不依不饶:"老虎不同意这一点,还出言不逊,请惩罚他。"

狮子随后宣布:"老虎将受到三天面壁思过的惩罚。"

驴子非常高兴,心满意足地离开了,嘴里不停地念叨着:"草是蓝的,草是蓝的......"

老虎十分气愤:"法官大人,草难道不是绿色的吗?"

狮子回答:"草确实是绿色的。"

老虎困惑不解:"那你为什么要惩罚我呢?"

狮子回答:"惩罚你与草是蓝的还是绿的这个问题无关,而是因为像你这样的高级生物,竟然浪费时间和驴子争论这样简单的问题。最重要的是,你还用这个问题来烦我,只是为了验证你已经知道是真的事情。"

这个寓言就结束了,讲的其实是,应该如何处理争论。

它的观点很简单,就是不要争论。一来,有些人根本无法说服,他们不关心真相或现实,只关心自己的信念和观点获得胜利。

他们会竭尽全力,捍卫自己是正确的,与这样的人争论,就是浪费时间。

二来,一旦开始争论,难免情绪压倒理智。当你胜负心高涨,一心想赢过对方,你的智力就会急剧下降。

我一直对自己、对这个周刊有一个想法,也希望让大家知道:不说教,尽量提供事实,如果要说出观点,必须是那些根据事实显而易见的观点。与他人讨论时,主要是澄清事实,尽量不辩论对错,如果对方无法说服,那就算了,让他赢。

科技动态

1、头戴式拍摄装置

本周,苹果公司举办新品发布会,邀请了很多自媒体作者来到现场。

来自中国的"老师好我叫何同学",以奇特的装备引起了国外媒体的注意。

据他说,现场不允许携带三脚架,如果一只手拿手机拍摄,另一只手试用新手机,就很不方便。

他就做了一个头戴支架,把拍摄用的 iPhone 固定在上面,并且佩戴了一个单目 AR 眼镜,用来接收 iPhone 的画面。这样就能把双手空出来了,可以边看边拍。

其实,很多人都想要头戴式拍摄装置,既能看到取景框,又能解放双手,但是市场上没有这类产品。

智能眼镜是最接近的设备,可是拍出来的画质太差。哪家公司如果率先推出可用的产品,一定会大卖。

2、游轮加长手术

游轮在国外非常受欢迎,船体十分庞大,可以容纳上万人。

但是,巨大的游轮并不是一次建成的。为了减少风险,游轮公司通常会先建造一艘较小的游轮,等到确认市场需求后,再将小游轮改建成大游轮。

改建的方法是将小游轮一切为二,然后在中间加长,再把两半连接起来。

这种加长方法最经济快速,只需要几个月的时间,平均花费8000万美元,船体加长30~40米,全部为高级舱室,可以在几年内收回成本。

加长的这段时间,正好还可以进行设备大修,以及员工培训。

目前,加长后最大的游轮长458米,相比之下,美国最大的航空母舰"福特号"只有333米。

3、泡面计时器

网友甄大大本甄制作的泡面计时器,加水后,把泡面放在这个装置上面,就会开始3分钟计时。

时间到后,它会发出铃声,提醒你可以食用了。

这个装置的奇特之处在于,不需要电池,完全依靠泡面的重力势能,转换为计时的动能。

全部材料除了螺丝和磁铁,都是 3D 打印,而且模型源文件已经公开,可以下载。

4、其他

(1)苹果公司正式宣布,AirPods Pro 2 耳机可以用作助听器。

(2)SpaceX 完成第一次私人公司的太空行走,以后太空旅游就不止于舱内观光了。

文章

1、余弦相似度如何计算(英文)

一篇入门的科普文章,详细解释余弦相似度的计算方法,写得不错。

2、Cursor 一个真正让程序员产生危机感的 AI 编程工具(中文)

作者对 AI 编程助手 Cursor 的使用感受和评价。(@xiaobox 投稿)

3、Accept-Language 头有什么用(英文)

HTTP 请求的数据头,有一个Accept-Language字段,作者解释网站可以用这个字段,决定向用户提供哪种语言的网页。

4、Postgres 和 Elasticsearch 全文搜索比较(英文)

全文搜索一般使用 Elasticsearch,但是 Postgres 数据库自带全文搜索,本文比较两者的优缺点。

5、什么是企业级 Linux?(英文)

有些 Linux 发行版属于"企业级"(Enterprise),本文介绍需要满足哪些特点,一个发行版才能称为"企业级"。

6、如何优化 JavaScript 代码(英文)

本文是一篇中级教程,介绍10个优化 JavaScript 代码,提高运行速度的技巧。

7、Bash 脚本高级技巧(英文)

本文介绍一些写好 Bash 脚本的技巧。

工具

1、Applite

MacOS 的第三方应用管理器,可以一键下载、更新、卸载应用。

2、deno_python

这个模块为 Deno 集成了 Python 支持,使得开发者可以在 JS 代码里面,加入并执行 Python 代码。

3、文颜

一个 Mac 桌面软件,可以将 Markdown 文档转换成公众号、知乎、今日头条等格式。(@caol64 投稿)

4、Cozy Reader

开源的 Epub 电子书的桌面阅读软件,跨平台,基于 Rust + tauri + Vue3。(@srsng 投稿)

5、SimpleMockServer

一个简单的 Mock 服务器,可以将静态文件作为 API 接口的 JSON 数据返回。(@couriourc 投稿)

6、up-mode-extension

一个 Chrome 浏览器插件,可以在截屏或录制视屏时,隐藏地址栏的浏览器插件图标。(@cunzaizhuyi 投稿)

7、File Browser

一个开源工具,提供一个 Web 界面,浏览和操作本地文件。(@xiaobaidadada 投稿)

8、Notion Avatar Maker

免费的 Notion 风格头像在线制作器。(@hwlvipone 投稿)

9、k-colors.js

一个从图片提取主要颜色的 JS 库,底层是作者自己实现的 K-means 算法库。(@ppzreboot 投稿)

10、Peter Cat

根据代码仓库的地址,一键创建答疑机器人,快速集成到项目中。(@xingwanying 投稿)

11、XDeck

macOS 系统的一个 Twitter 桌面客户端,代码开源。

12、AeroSpace

macOS 系统的平铺式窗口管理器,类似于 Linux 平台的 i3

13、XPipe

一个跨平台桌面应用,通过 SSH 在图形界面上管理远程服务器。

资源

1、你想学习物理学

一位美国物理学家为本科生开的物理学入门书单,介绍物理学各个方面的基本知识。

2、数据科学家的 SQL 教程

一份简要的初学者 SQL 教程。

3、Hugeicons React Icons

一个 React 图标库,提供3600多个 React 图标组件。

图片

1、日本银行广岛分行

1936年,日本银行广岛分行搬进了新建的办公大楼。

这座建筑采用欧洲式风格,使用钢筋混凝土建造,窗户上都装有铁栅栏。

1945年8月6日的早上,原子弹落在广岛。

楼内当时有20名工作人员,全部死亡。三楼的窗是打开的,导致整个顶层都被摧毁。一楼和二楼的窗是关着的,使得内部没有完全毁坏。

广岛的所有建筑中,这座楼在核爆后的状况是最好的。

当天,它就被用作伤员的避难所。爆炸发生两天后,该银行重新开放提款,并一直营业到1946年春季,才进行大修。

大修后,它继续作为银行运作,直到1992年3月银行搬走。现在,这栋楼是广岛的一个公共活动空间,作为文化和艺术活动的场所。

文摘

1、谷歌的工程师等级

谷歌的工程师有明确的等级制。

1级是 IT 支持人员,2级是刚从大学毕业的学生,3级通常拥有硕士学位。

4级需要你工作几年时间,或者需要博士学位。大多数工程师停止在5级。

6级工程师非常有能力,属于所有工程师的前 10%,是项目成功的主要原因。7级是资深的6级。

8级是首席工程师,一般会负责主要产品或基础设施。

9级是杰出工程师,受到业界景仰。

10级是谷歌研究员(Google Fellow),属于终身荣誉,通常是各自领域的世界领先专家。

11级是资深研究员(Google Senior Fellow),目前为止只有两个人:桑杰·格马瓦特(Sanjay Ghemawat)和杰夫·迪恩(Jeff Dean)。他们都是谷歌的创始员工,参与架设了谷歌的搜索服务。

2、当软件添加了越来越多的功能

商业公司的软件,最终都会患上一种叫做"功能蔓延"的疾病。

有人曾经说过的:"新功能是软件开发和营销的货币。"意思是,只有添加新功能,商业公司才能让客户和投资人为软件掏钱。

这种说法是有道理的。最根本的原因是,没有用过某种软件的人,会根据功能数量来判断软件的价值。

因此,为了最大限度地提高初始销售量,公司倾向于打造多功能的产品,将新功能源源不断地添加到软件之中,直到它们把整个产品淹没。

问题是太多的软件功能,会带来沉重的负担。拥有的功能越多,维护成本就越高。

这有几点原因。

首先,因为不断添加新功能,软件就不可避免地需要重新设计,软件设计就一直在变,永远无法完成。

其次,每一项推出的新功能,都需要错误修复、客户支持,以及验证是否兼容以前的功能。这些都是巨大的成本。

再次,新功能往往意味着,产品团队将短期价值置于长期价值之上。因为新功能通常会给开发者带来荣誉、晋升和影响力,而维护旧功能是没有奖赏的。产品的长期发展,并没有得到充分考虑。

另外,太多功能会带来软件的易用性问题,让软件的口碑变差。

由于上面这些原因,越来越多的软件功能不可避免地会阻碍公司未来的发展。公司陷入了自己造成的功能困境,无法快速满足新客户和市场需求。

言论

1、

如果你一生只看过两部电影,那么你很可能会认为这两部电影都相当不错。

但如果你看过一千部电影,你就会真正知道如何分辨优秀电影。这就是为什么多看可以提高辨别力。

-- 《提升品味以打造更好的产品》

2、

一家媒体公司发现,上个世纪90年代它用来存档的上万个硬盘驱动器,已经有五分之一无法读取,上面的资料可能全部遗失。

人类生活已经"数字化"了,除非定期维护和备份数字介质,否则几十年后,上面的资料就可能不存在,根本无法像纸张那样,无人维护也能流传几百上千年。

-- 《是时候讨论硬盘了》

3、

一位心理学家提出,色盲不太可能挑食,原因是缺少色彩可以减轻对新食物的抵触。

-- Conversation.com

4、

我认为,讨论互联网安全时,有两点需要明确。

首先,安全是无限的。你总是可以花更多的金钱和努力,让事情变得更安全。

其次,安全与用户体验和易用性是对立的。提高产品的安全性,产品通常会变得更难用。

-- 《"安全是我们的首要任务"是废话》

5、

一个人千万不能习惯于舒适,因为久而久之,一点点的不适都会变得难以忍受。

-- gabe.rocks

往年回顾

"精益开发"的精益是什么?(2023 #270)

人工智能的机会在哪里(2022 #220)

软件订阅制的胜利(2021 #170)

只有开放才能打败封锁(2020 #120)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年9月13日

白话多集群:工具和应用助手

作者 阮一峰
2024年9月11日 20:52

一、引言

上周,我参加了腾讯全球数字生态大会

今天,就跟大家分享,我的一点收获,就是理解了多集群工具。

软件开发的同学,应该都听说过 Kubernetes 吧。它是一个容器管理工具,本身很复杂。

可想而知,同时管理多个 Kubernetes 集群的工具,一定更复杂。但是,我这次发现,多集群其实很好理解。

当时,大会有一个演讲,关于腾讯的一个新服务,跟多集群管理有关,叫做 TKE AppFabric,讲得很浅显,我一下就听懂了。

下面,我尽量用最简单的语言,解释什么是 Kubernetes,什么是多集群工具,什么是最简单的使用方法

二、从 Docker 讲起

为了理解 Kubernetes,需要从 Docker 讲起。

2013年,Docker 诞生,创造性地将软件应用的运行环境与源代码打包在一起,做成一个容器镜像(image)。

容器镜像本身是一个二进制文件,可以直接发布。其他机器只要安装了 Docker,就能运行这个文件。它能让软件运行在一个虚拟环境(称为"容器")里面,从而保证运行环境和开发环境一致,避免了环境配置、启动报错等等麻烦事。

更重要的是,容器镜像是一个标准化文件,不管软件使用什么语言开发,最后做成容器,都是一个格式。因此,就可以用一个工具去处理所有容器项目的发布,完全忽略开发语言的差异。

正是因为 Docker 提供了标准化、一站式的软件运行流程,才为后来通用的"容器应用管理工具"铺平了道路。

现在,Docker 已经成为软件部署的标准。不管软件是以源码发布,还是以容器镜像发布,最后都部署运行在 Docker 里面。

三、微服务架构

Docker 出现后,大大简化了软件部署,变成只需运行容器镜像。很自然地,开发者就开始考虑,能不能把单体的巨型软件,拆分成为多个组件(即多个容器)部署?

早期的企业级大型应用,通常都是一个巨大的单体软件(monolithic),包含不同功能的多个组件。哪怕只修改一个组件,也需要把整个软件重新部署一次。

现在的实践则是,把较大的功能组件拆分出来,每一个组件都是一个独立的服务,作为一个 Docker 容器单独发布和部署。

于是,单体软件就变成了多个 Docker 容器组成的软件系统,这就是现在流行的"微服务架构"(microservices)。软件包含多个微服务,每个微服务对应一个 Docker 容器。

四、容器管理工具 Kubernetes

微服务意味着,每次发布都涉及大量不同的容器,管理它们就成了一种挑战。容器管理工具就应运而生。

各种容器管理工具之中,名气最大的非 Kubernetes 莫属。

它是谷歌开发的一款开源软件,因为词首K和词尾s之间有8个字符,所以常常写成 K8s。它已经成为事实上的容器管理标准。

具体来说,它主要有以下功能。

(1)统一的硬件接口。开发者不必关注底层的硬件细节,不管底层服务器有什么差异,都被抽象成统一的操作接口。

(2)自动扩展。它可以根据软件负载情况,快速完成水平扩展。

(3)高可用。当某个容器失败时,它会自动重启或替换掉该容器,保证流量流向可用的节点。如果软件发布出现问题,还能自动回滚。

(4)其他功能。它还具有服务发现、负载均衡、资源监控等大量相关功能,同时带有庞大的插件和扩展,以及活跃的社区。

五、多集群是什么?

Kubernetes 的底层就是一组服务器,上面运行着许多容器。每个 Kubernetes 实例,就被称为一个集群(cluster)

普通的软件应用,只要一个集群就够了。但是,出于下面提到的原因,企业级应用往往需要部署在多个集群。

多集群(multi cluster)可以在同一个机房,也可以在不同机房。实际应用中往往是后者,即分布在不同机房,这时如果集群来自不同的云服务商,或者是不同性质的云,就称为"多云"(multicloud)。

多集群的主要考虑如下。

(1)容灾。如果一个集群出问题,那么还有另一个集群,可以保证可用。

(2)隔离。集群之间可以做到非常强的物理隔离,从而实现上层用户(租户)的隔离。

(3)灵活性。多云有助于减少供应商锁定,可以根据需求选择最合适的基础设施和服务。

(4)合规性。不同地区可能有不同的监管要求,多集群可以为每个集群实施更精细的安全策略和访问控制。

六、多集群的挑战

多集群虽然有上一节的好处,但是复杂性也随之加倍,为使用者带来了许多挑战。

(1)配置和管理复杂性。所有集群需要一致的配置和部署,尽量消除差异。

(2)网络连接和延迟。如何保证不同地理位置的集群,有安全可靠的连接,同时最大限度地减少延迟。

(3)服务发现和负载均衡。某个服务如何发现不同集群中的其他服务,以及如何让不同集群负载均衡。

(4)监控。所有集群的指标和日志,最好汇集在一起,便于集中式监控。

(5)安全和访问控制。多集群的安全策略、访问控制、凭证管理都变得更加复杂,需要仔细规则和逐一设置。

七、多集群工具及其问题

为了解决上面的挑战,就诞生了专门的多集群管理工具,比如 Argo CD、Rancher Fleet、Karmada 等。

它们可以看作是开发者与 Kubernetes 之间的中间层,解决集群管理的复杂性。

问题是,要使用它们,必须先学会 Kubernetes,再去学习这些工具本身。这是巨大的学习成本,所以多集群工具不是针对应用开发者,而是针对集群管理员

现实中,多集群是高度专业的领域,其他领域的开发者根本看不懂。开发者完成软件开发后,会把应用交给集群管理员,让后者去部署。

这对双方都很麻烦。一方面,开发者不能决定部署策略,也不了解底层资源,许多情况下可能不得不接触容器管理。另一方面,集群管理员会被迫介入应用层,一旦发生底层资源的调整,还需要通知开发者,让其参与进来保证应用的运行。

八、面向应用的多集群助手 TKE AppFabric

怎样才能让开发者更简单地使用多集群呢?

腾讯云的解决方案,就是增加一个面向应用的中间层,把多集群工具这一层隐藏,降低使用门槛,这种服务就起名为 TKE AppFabric。

它的名字中,TKE 指的是"腾讯云容器服务"(Tencent Kubernetes Engine),AppFabric 指的是把应用容器像织物一样编织在一起。

它面向应用开发者,定位就是"向上服务好应用,向下管理好集群",可以看作是应用的多集群助手。

由于封装了多集群工具这一层,所以它没有复杂的专业术语,特别好懂,开发者能够快速理解和上手,不用关心底层资源,甚至不需要知道"集群"这个概念。

它的简单性,体现在下面几个方面。

首先,它使用开发者更容易理解的"可用区"(availability zone)。应用部署时,你只需要指定在哪几个区(比如广州1区、上海1区),也就是部署位置,就可以了。

整个过程都面向应用,跟 Kubernetes 解耦。这一方面,有利于开发者将更多精力放在业务上面,另一方面使得云服务商可以充分调配资源,提高资源利用率。同时,集群的升级和维护,上层用户也是无感的。

其次,它简化了设置,采用声明式设置,只需要写好声明文件即可,进一步降低了学习成本。

再次,它封装了 Kubernetes 跟应用运行相关的一些功能,让其更易用,各种监控指标和日志也汇集在一个地方,更容易发现。

九、多集群案例:腾讯健康

腾讯健康就架设在 TKE AppFabric 之上,我们通过它,来看看怎么使用多集群架设大型服务。

下图就是腾讯健康的后台架构。

上图中,网关(gateway)是访问入口,下面同时部署了三个可用区:zone1,zone2 和 zone3。它们部署在不同的机房。

这三个可用区是一模一样的,每个区都部署一个系统实例。每个系统实例包含三个层层依赖的应用:app1 依赖于 app2,app2 依赖 app3。这三个应用本身,每一个都是容器组(app pods)。

这样的架构有三个好处,可以保证高可用和负载均衡。

(1)容灾部署。如果一个可用区出现故障,可以切换到另一个可用区(比如 zone1 的 app2 出现故障,可以切换到 zone2 的 app2),保证可用。

(2)路由控制。自动为用户分配就近的可用区,提高访问速度。

(3)灰度发布。新功能可以先在单个可用区进行灰度验证,完成之后再全可用区发布,降低发布风险。

根据现场演讲,所有腾讯内部资源上云的业务,比如 QQ、腾讯会议、音视频业务都会部署在 TKE AppFabric 上面。今年第四季度,它就会对外试运行,明年一季度正式对外开放。

十、总结

对于采用"微服务架构"的企业级应用,如果业务比较重要,需要高可用,那么多个 Kubernetes 集群几乎是必然的选择。

如果公司有专门的团队,你可以选择自己来做多集群管理,否则可以考虑云服务商的工具。

我相信,越来越多的云服务商,以后可能会同时提供两套工具:一套是原始的多集群工具,专门供高级用户使用,另一套就是 TKE AppFabric 那样的面向应用、隐藏多集群细节的助手工具,供普通开发者使用。

对多集群或者 TKE AppFabric 感兴趣的同学,可以微信扫描下面的二维码,查看产品手册。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年9月11日

科技爱好者周刊(第 316 期):你一生的故事

作者 阮一峰
2024年9月6日 08:14

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

龙珠岛是香港的一个孤岛,大小约为四个足球场,以前是荒岛,后来建了楼盘。目前,岛上没有任何商店,只有两台自动售货机。(via

你一生的故事

几年前,我读过一篇科幻小说,名字叫做《你一生的故事》(Story of your Life),有中译本。

这篇小说得过很多奖,还被好莱坞改编成电影《降临》(Arrival)。

它的作者是美国华裔小说家 Ted Chiang(中文名为姜峰楠)。

它讲了一个什么故事呢?

有一天,外星人的飞船来到地球,就停在地球轨道上面。它们向地面发送了很多半圆形的通信站,希望与人类建立接触。

人类只要来到这些通信站,通过某种类似"可视电话"的机制,就能跟外星人面对面交流。

问题是,这些外星人都是七只脚的怪物,人类听不懂它们的语言。美国军方就派出一个语言学家,试图学会它们的语言。

语言学家在学习过程中,慢慢领悟了,预见到了自己的未来。

她看到,自己会结婚,会有一个女儿,然后女儿25岁时将在一场意外事故中去世。

于是,当她听到未来的丈夫问自己:"你想要个孩子吗?",不禁陷入了沉思,要不要让这样的命运发生呢?

这就是小说的内容,它的名字《你一生的故事》,就是指语言学家在讲述她的女儿一生的故事。

我读完后,对这个故事本身没有特别的感觉,倒是对这个书名念念不忘。

每个人的一生都是一个故事,关于走过的旅程,经历的战斗,感受的苦恼和困惑。但是,大多数人的故事没有记录下来,随着日子湮没了。他们自己不会写,也不会有人帮他们写。

如果存在一种服务,可以把每个人的一生写成故事,保存下来,那该多好?

前几天,我发现有人抱有一样的想法,而且居然已经动手做出来了。

他的实现思路很简单,就是随身佩戴一个摄像头,每隔一段时间,自动或手动对着周围环境,拍一张照片。

然后将这张照片发送到 OpenAI,让 AI 根据预先设置的提示词,用传记的作者的口吻,为照片生成一段描述。

他用树莓派 + 摄像头 + 打印的外壳,做出了一个这样的装置,只要佩戴在身上,就会定时把周围环境的照片发送到 OpenAI。

他用的提示词如下,我译成了中文,里面的人名、城市、年龄都是随便改的。

你是一部关于张三的电影的叙述者。张三的年龄为20岁,所在城市为上海。当你看到附件的场景照片时,应该从张三的角度描述这张照片,所有人物都使用第三人称。

我就从网上找了一张上海街景的照片。

然后,把照片和提示词一起发给 OpenAI,下面就是返回的描述。

在这张照片中,张三站在熙熙攘攘的上海街头,他的眼光落在了"杨氏煎饺"的招牌上。街道上人群络绎不绝,从周围匆匆走过的行人到排队等待的食客们,每个人都沉浸在自己的小世界里。队伍前的人们耐心地等待着品尝这家声名远扬的小吃,而张三对这一幕并不陌生。这不仅仅是一条普通的街道,对他来说,这里充满了家的味道和温暖的回忆。

街道两侧的建筑展示了上海的传统与现代的融合,老旧的石库门建筑与现代的招牌交相辉映。电线杆上纵横交错的电线像是城市生活的复杂脉络。尽管张三已经习惯了这种忙碌的城市生活,但每次路过这样的街景,心中总会涌起一丝慰藉。

在这繁忙的一天里,张三像往常一样穿梭在这座大都市的心脏地带,尽管他只是其中的一员,但这座城市的每一个角落都承载着他的故事和梦想。

这像不像一段传记?

这些照片和描述都按照时间顺序保存,只要将它们连起来,就是一部图文并茂的你的传记。以后,你自己或者其他人,就可以查看你的每一年是怎么度过的。你还可以手动添加自己的补充。

就这么简单,实现了 AI 为你写传记。它使用的都是很普通的技术,完全可以集成在市售的智能眼镜里面。

我希望,很快就会有公司推出这样的服务,让 AI 为你写每天的传记。以后,每个人都会有成文的"你一生的故事",流传下去。

[数码荔枝活动] JetBrains 全家福折扣

数码荔枝是国内知名的正版软件销售商店,拥有众多正版软件的代理权。

现在是开学季,他们推出了 JetBrains 系列软件折扣,来周刊发布活动消息。

大家知道,JetBrains 是世界排名第一的 IDE 开发商,著名的 IntelliJ IDEA 和 WebStrom 都是它的产品,尤其前者堪称 Java 必备工具。另外,谷歌官方推荐的安卓开发语言 Kotlin,也是它发明的。

大家想要购买正版,这是挺好的机会。现在到9月底,可以点击领取50元 JetBrains 优惠券,或者扫描下图二维码:官方优惠售价打98折,再减50元。

科技动态

1、宇航员的尾巴

动物的尾巴,一个重要作用就是在运动中,保持身体的平衡。

英国皇家设计学院的一个学生,根据这个原理,为宇航员设计了一条尾巴,便于在失重环境下保持平衡。

这个尾巴还可以有其他功能。比如,作为第三只手,抓住支撑物。

它的问题是,无法用意识控制这个尾巴,而是要手动拉扯控制绳,有点像百叶窗的操作方式。

2、假西瓜

美国媒体报道了一桩令人啼笑皆非的新闻。

犯罪分子将毒品伪装成西瓜,装在卡车上,企图从墨西哥混进美国。

有些假西瓜,与真西瓜混在一起。更多的则是,整箱整箱全部假西瓜。

问题是,这些西瓜实在太假了,就是外面包了一层西瓜皮的塑料纸,再用胶纸粘合在一起。

海关人员一眼就看出"西瓜"有问题,把这些人全抓了起来。

3、超声波咖啡

我们一般都用热水冲泡咖啡,但是有些人喜欢冷水冲泡的咖啡,也就是冷萃咖啡。

据说,冷萃咖啡更顺滑、酸度更低、苦味更少。但问题是,它需要冷水完全浸泡咖啡粉12到24小时,这样才能提取风味。

你想拿起水壶,立刻冲一杯冷萃咖啡,那是不可能的。

澳大利亚科学家最近发明了一种新方法,可以在三分钟之内就制作一杯冷萃咖啡。

他们使用 38.8 kHz 的超声波,去冲击咖啡的过滤篮,让咖啡因快速释放出来。

以前12小时的萃取过程,现在只要三分钟。这个发明可能会改变咖啡店和咖啡爱好者的冲泡方法。

文章

1、使用 GitLab 托管静态内容(英文)

一篇简明教程,演示如何在 GitLab 通过持续构建,部署静态网页。

2、AI 代码编辑器 Cursor 上手指南(英文)

Cursor 是最近走红的 AI 代码编辑器,底层模型是 Claude 3.5 Sonnet,代码生成要比 GPT-4 更出色。作者介绍怎么使用这个编辑器。

3、JS 垃圾收集机制的一个案例(英文)

作者发现自己的 JS 代码,出现了意想不到的内存泄漏。本文就讨论这个案例,为什么垃圾回收机制在这里失灵。

4、被低估的硬件小配件(英文)

一个老外发现淘宝/1688上面,有很多实用的硬件小配件,比如转角的 USB 接头(上图)。本文介绍他发现的这些配件。

5、云开发环境的好处(英文)

CodeSandbox 官方博客文章,介绍云开发环境(开发都在云端完成)的好处。

6、React 的混乱(英文)

本文是发在 Reddit 的一个帖子,作者写了自己的亲身感觉,总结 React 开发前端应用时存在的问题。

工具

1、ASCII Silhouettify

一个网页应用,将图片转成彩色的 ASCII 字符图(上图)。

2、Unforget

一个开源的 Web 笔记应用,后端数据放在 Google Keep。

3、Revideo

一个 React 的视频编辑组件,可以实时编辑内容,在网页上生成视频。

4、Unsplash Wanderer

一个 Chrome 浏览器插件,打开新的 Tab 页时,随机展示一幅 unsplash 图片库的高清照片。(@zerosoul 投稿)

5、clouddnsexporter

这个开源工具从 DNS 提供商,自动获取域名的解析列表,用来检查所有域名(含二级域名)的证书是否过期,目前支持腾讯云、阿里云和 Godaddy。(@eryajf 投稿)

6、BoardOS

一个支持实时协同的白板软件,有免费版。(@superliwei 投稿)

7、ThinNav

作者在 ChatGPT 的帮助下,完成的一个极简的网址导航站,自带后台管理系统,可以用作学习参考。(@DemoJ 投稿)

8、JSON Generator

一个在线工具,用来生成符合指定格式的 JSON 伪数据。

9、LangSync

一个命令行工具,使用 AI 一键翻译出软件的语言包。

10、ttyd

这个命令行工具可以在浏览器里面,打开本机的终端窗口,让用户在浏览器执行终端命令。

11、AstroNvim

neovim 编辑器的一个配置,直接帮你定制好了。

照片管理软件

如果你不想再用云服务(比如 iCloud Photos 或 Google Photos)管理照片和视频,而想自己架设照片管理服务,那么目前比较流行的是下面三款开源软件。

它们都带有 Web 端,后面两款还有手机端。

1、PhotoPrism

2、Immich

3、Ente

资源

1、PostgreSQL 在线游乐场

这个网站提供免费的 PostgreSQL 实例,让你在网页进行各种数据库测试。

2、Is my blue your blue?

一个很有趣的网站,给你一系列颜色,问你这是蓝色,还是绿色,最后确定你的蓝绿边界在哪里。

3、轻松游牧

一个远程工作聚合网站,每天从网上收集支持国内远程的岗位。(@jiangsong216 投稿)

4、RawWeb.org

一个收录独立网站的搜索引擎。(@0x2E 投稿)

5、初学者的微积分教程(Calculus for Beginners)

一本英文的微积分教材,从最简单的概念讲起,免费阅读。

图片

1、PhotoShop 的第一张照片

PhotoShop 是世界排名第一的图像处理软件。它最早是由美国的两兄弟,托马斯·诺尔和约翰·诺尔,在1987年开发的。

软件完成后,需要对客户演示。但是,当时很难找数码照片,因为照相机都是胶片相机,不是数码相机。只能对相片进行数字扫描,获得数码照片。

约翰·诺尔就选了一张在南太平洋玻利尼西亞度假时,他为女朋友在海滩上拍的照片,进行扫描。

这就是 PhotoShop 处理的第一张照片。

2、最小的英文字体

世界最小的英文字体是一个瑞典设计师的作品。他在 3x3 像素的面积里面,实现了26个字母。

也就是说,9个像素的空间里,要展示出 abc 每个字母的形状,长和宽最多只能用3个像素。

文摘

1、鲍尔莫的面试题

微软的前 CEO 鲍尔莫曾经在采访中透露,他会问面试微软的候选人一个问题。

我要跟你玩一个游戏。

我在心里选择一个1到100之间的整数,你来猜这个数字。每次猜完,我会告诉你,答案比你猜的大还是小。如果猜错,你可以接着猜,直到猜中为止。

如果你只用一次就猜中,我给你5美元,用两次猜中我给你4美元,三次3美元,四次2美元,五次1美元,六次0美元。

你还是没猜中的话,就要倒贴钱了。七次猜中,你给我1美元,八次2美元,九次3美元。

请问你应该玩这个游戏吗?

回答这个问题,需要算出游戏结果的期望值,以确定哪一方获利的可能性更高。计算过程和结果可以看链接。

2、安灯线

安灯线(Andon Cord)是丰田公司在流水线引入的一种质量控制方法。

丰田公司的装配线上方,有一根长绳。任何一个员工发现产品缺陷时,就拉一下这根绳子。警报器就会响起来,整个装配线都会停下来。

生产经理听到警报以后,就会跑过来,了解产品缺陷并解决问题,然后生产线才会重新开动。

这种制度的目的是,谁发现问题,谁拉绳子,直到解决为止,不要把问题留给下一个环节。

言论

1、

截至去年底,英特尔的员工人数为124,800人,台积电为76,478人,AMD 为26,000人。

后两家公司加起来,还比英特尔的人数少,却造出更强的芯片。英特尔现在宣布裁员15,000人,还是不够,后面可能会进一步裁员。

-- 《英特尔的问题》

2、

在英国,汽车靠左行驶。据说,这沿袭自罗马时代,当时罗马人在道路左边骑马。

罗马人之所以选择左边,是因为他们习惯在身体左侧佩剑。这样右手拔剑时,就可以对付道路中央的敌人。

-- 《英国人为什么靠左行驶?》

3、

我对元宇宙的定义是,一个大型多人在线宇宙,具有空间感,所有用户都以相同的方式感知围绕着该空间的体验。你可以从一个地方移动到另一个地方,并与不在场的其他用户互动。它不受任何一个实体的控制,许多大大小小的创作者都在那里建造东西。

-- 尼尔·斯蒂芬森(Neal Stephenson),"元宇宙"这个词的发明者

4、

我的职业建议是,任何工作要么让你学习(learn),要么让你赚钱(earn)。如果既学不到新东西,又赚不到钱,你就应该走了。

-- Garry Tan,硅谷风险投资家

往年回顾

为什么英雄不使用炸药(2023 #269)

如何防止帐号被黑(2022 #219)

五菱汽车的产品设计(2021 #169)

降雨量和保险博弈(2020 #119)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年9月 6日
❌
❌