越改越糟糕

作者 xrspook

2025年6月26日 10:20

当年今日

前段时间工作群里说国粮局新系统上线了，在新系统里也可以到旧系统里去。当我用旧系统的账号密码去登录的时候，说我密码错误。第1次我觉得是不是幻觉，第2次，我再试了一遍，发现不行。我已经不敢试第3次了，因为如果第3次失败，账号就锁定了。集团公司的人宣布国粮局的新直报系统上线的时候，他们自己已经试过了，他们的账号可以登录，但是他们不知道，我们这些不是报账单位的子账号可能根本就信息不全。我试了不行，集团公司说她可以，所以我又找了一个朋友试一下，她也是子账号，她也不行。我不知道她为什么也试了两次，然后我就马上把她叫住，不能第3次了。我们不能尝试第3次，我们只能等通知。

这周三我们终于等来了通知，宣布的是6月份的报表要在新系统里做，之前说过新系统可以去旧系统。但我不知道他们有没有尝试过。新系统登录的时候会给你一个默认的密码，进去以后会马上让你修改。但是当我在新系统里面摸索一番，发现我要去旧系统里面确认老的导出模板的某个细节的时候，发现在旧系统里，无论我用新密码还是旧密码都无法登录。你好歹告诉我用的是什么密码。当我在新系统完成了登录以后，你给我一个旧系统的链接，那个界面转了好多转才终于过去了，而实际上他们做的就只是把我们引导去旧系统的那个登录网址。为什么要转那么多手呢？我不知道，开发这个国粮局新系统的到底是哪一家？他们可以去死了！按照正常人的理解，既然我已经用这个账号的密码登录进去了，为什么我去这个账号的那个旧系统还得登录一遍呢？之前我就尝试过用旧系统的账号跟密码在新系统里登录不了，后来被告知新系统我们这些子账号的密码是被重置过的。所以现在我们旧系统的密码到底是什么呢？虽然可能在新系统里面也能查到旧系统的数据，但如果既然这样，你就不应该把旧系统的入口给我摆出来，因为摆出来你也只是引诱我三次密码错误，没有任何意义。

我觉得极端无语的是新系统的使用说明之类的东西要登录了以后才能看到，但是登录之前你怎么知道你的密码被重置了呢？当然，他们之所以这样做，是因为这个直报系统是挂在互联网的，如果被人知道了账号，然后又知道了你的默认密码，后果很严重，但如果他们觉得这个会很严重，直报系统居然没有做https？之前那个旧系统是浪潮做的，新系统是不是浪潮做的我不知道，从网页的配色来说，有区别，但就功能来说，我感觉没什么两样，使用起来更复杂了，给你的选项更多了，但这只会引导人犯更多错误。比如说在导出的界面有很多选项。我敢肯定，80%的小白根本不知道那在说什么。在报表填报的页面也出现了一些莫名其妙禁止，比如填完这个单元格，你不可以通过键盘的左右键去左边或者右边的单元格填写，单元格的定位必须使用鼠标。还有就是，以前填写完毕保存才自动生成计算数据，现在居然在填写的时候就马上生成。这样的坏处显而易见，如果突然某个时段有很多人同时使用，这个填报的网页肯定会卡死，而且会卡得非常严重。让我觉得很无语的还有明明只是填报告报表，但是要打开那个填报的报表页面却要点击好几轮，为什么要制造这种人为的麻烦呢？我点击那几轮的东西，除了拖延时间，没有其它了。

旧的那个系统大概是在2015年开发出来的，2016年开始使用，10年之后做一个新系统无可口非，但是新系统做出来比旧系统还要烂。这到底是什么人的什么逻辑？

在这系统里，我们最希望他们改进的是导出的那些表格，要完全符合打印标准，直接打印就好了，但是一直以来旧系统都没有做这个改进。现在新系统上线了，同样是完全不考虑导出之后直接打印的这个功能。如果你觉得没必要设置这个导出后打印的功能，那么你在填报的那个界面给我打印按钮和靠谱的打印格式也可以啊，但实际上并没有。

国粮局的直报系统挂在华为云上。之所以知道，是因为我拿那个网址去搜索了。这个网址是从国粮局的网站里直接公布出来的。当国字号遇上华为和浪潮，出来的东西我只能呵呵呵。

小赖子的英国生活和资讯
深入理解ROS中的Topics, Services和Actions(含示例)JustYY.com 小赖子的英国生活和资讯
2025年6月5日 04:43

深入理解ROS中的Topics, Services和Actions(含示例)

小赖子的英国生活和资讯

作者 JustYY.com 小赖子的英国生活和资讯

2025年6月5日 04:43

不知道听谁说的：之后的人工智能会和机器人强烈结合，是下一个十年的技术趋势。

“ROS – 机器人操作系统机器人操作系统 (ROS) 是一套软件库和工具，可帮助您构建机器人应用程序。从驱动程序到先进的算法，以及强大的开发者工具，ROS 可满足您下一个机器人项目的所有需求。而且它完全开源。”

ROS 和 ROS 2 简介

ros-robot-operating-system 深入理解ROS中的Topics, Services和Actions(含示例) 学习笔记机器人 ROS

ROS: Robot Operating System 机器人操作系统

ROS（机器人操作系统） 是一个灵活的机器人软件开发框架。它提供工具、库和约定，用于简化在各种机器人平台上构建复杂且可靠的行为。
ROS 2 是 ROS 的下一代版本，解决了实时性能、安全性和多平台支持等问题。其底层使用 DDS（数据分发服务）实现可扩展且可靠的通信。

可以到官网学习：ros.org

ROS 中的核心通信概念

Topics（主题） – 用于节点间异步传输流式数据。
Services（服务） – 用于同步的请求/响应通信。
Actions（动作） – 用于带反馈和可取消的长时间运行任务。

1. Topics（主题）

什么是 Topics？

Topics 提供发布/订阅通信模式。
一个节点发布数据，其他节点订阅。
非常适合用于持续流数据（如传感器数据）。

主要特点

通信模式	发布 / 订阅
方向	单向
同步性	异步
典型用途	图像、激光、IMU、状态信息

示例代码

# 发布者（Publisher）
pub = rospy.Publisher('/chatter', String, queue_size=10)
pub.publish("你好，世界！")

# 订阅者（Subscriber）
def callback(msg):
    rospy.loginfo(msg.data)
sub = rospy.Subscriber('/chatter', String, callback)

2. Services（服务）

什么是 Services？

提供一种同步、请求-响应的通信方式。
适用于执行一次性任务，并获得返回值。
客户端请求，服务器响应。

主要特点

通信模式	请求 / 响应
方向	双向
同步性	同步（阻塞）
典型用途	获取传感器快照、配置设置、参数查询

示例代码

# 服务端（Server）
def handle_add(req):
    return req.a + req.b

service = rospy.Service('add_two_ints', AddTwoInts, handle_add)

# 客户端（Client）
rospy.wait_for_service('add_two_ints')
add = rospy.ServiceProxy('add_two_ints', AddTwoInts)
resp = add(1, 2)

3. Actions（动作）

什么是 Actions？

适合需要反馈、持续时间较长并可中断的任务。
如导航、机械臂运动等。
由客户端发送“目标”，服务器处理并定期反馈进度。

主要特点

通信模式	目标 / 状态 / 反馈
方向	双向
同步性	异步 + 反馈机制
典型用途	导航、移动、长任务控制

示例代码

# 发送目标
client = actionlib.SimpleActionClient('move_base', MoveBaseAction)
client.wait_for_server()
goal = MoveBaseGoal()
goal.target_pose.header.frame_id = "map"
goal.target_pose.pose.position.x = 1.0
client.send_goal(goal)
client.wait_for_result()

# 服务器
def execute_cb(goal):  
    # 执行任务
    feedback = MoveBaseFeedback()  
    result = MoveBaseResult()  
    server.set_succeeded(result)  

server = actionlib.SimpleActionServer('move_base', MoveBaseAction, execute_cb, False)  
server.start()

ROS 中 Action 和 Service 的区别

特性	Service（服务）	Action（动作）
通信模式	请求 / 响应	目标 / 反馈 / 结果
是否同步	是（阻塞）	否（非阻塞）
任务持续时间	短	长时间运行
支持反馈	否	是
可取消	否	是
适用场景	快速查询或配置	需要进度反馈的长任务，如导航

类比

Service 类似于调用函数并等待返回结果
Action 类似于在后台启动任务并持续检查进度

结语

Topics、Services 和 Actions 是 ROS 中进行节点间通信的三大机制。
合理选择通信方式将帮助构建更加稳定、高效的机器人系统。

ROS (Robot Operating System) 机器人操作系统

深入理解ROS中的Topics, Services和Actions(含示例)

英文：ROS Topics, Services and Actions Explained with Clear Examples

本文一共 830 个汉字, 你数一下对不对.

深入理解ROS中的Topics, Services和Actions(含示例). (AMP 移动加速版本)

赞赏我的几个理由.

¥ 打赏支持

扫描二维码，分享本文到微信朋友圈

75a5a60b9cac61e5c8c71a96e17f2d9c 深入理解ROS中的Topics, Services和Actions(含示例) 学习笔记机器人 ROS

The post 深入理解ROS中的Topics, Services和Actions(含示例) first appeared on 小赖子的英国生活和资讯.

糟糕的汇总功能

我的天

作者 xrspook

2025年6月1日 08:17

当年今日

智能化这个东西，我感觉是一个深渊、无底洞。理想很丰满，现实很骨感。几乎可以这么说，现在单位的所谓智能化，无论是单位的作业系统，还是集团公司的OA系统，都是一个四不像的东西。也不是说它们不能把某些数据呈现出来，关键是明明那些明细数据都已经收集齐全了，但是最终那些如何汇总可以这么说，两边都是一团糟。为什么都这么糟糕呢？为什么就不能把数据整合到一个让人舒服的模样呢？最基础的东西不断地让我填，填了一遍又一遍，但最后明明这个汇总结果根据已有的基础数据是完全可以组合生成出来的，但出来的东西就是非常的糟糕。比如说把不应该拼接的东西拼接在一起，结果那个结果就是还不如直接没有，因为放在那里只是碍眼而已，没有任何实质效果。两边的系统都存在这种问题。这是技术上实现不了的吗？显然不是。

因为浪潮现成的那些导出让我们的活没法干，所以我们单位的人也就只能写数据库查询，把我们想要的那些明细数据整合出来，然后通过Excel查询数据库，最终输出。我自己也在做同样的事情，我通过的是Excel的VBA，查询的是多个我自己的原始数据，有些数据只是一个复制粘贴，但有些数据需要日积月累手动录入，之所以不能直接使用系统的数据，因为某些数据是需要进行拆分微调的，某些则需要人肉添加某些必要的字段。为什么浪潮那里就不能把那些字段直接带入呢？还有那些微调，本来是不应该存在的，之所以存在，就是因为发生了一些非常规的业务。某些人觉得这么干没有问题，但实际上他根本没有考虑到我们的系统不支持你这么脑洞大开。再深一层的考虑，为什么会不支持？因为那的确不是一个白纸黑字明码标价说明可以这么操作的事情。难听一点，可以称之为违规，因为规范里根本没说过可以这么干，但如果人情一点，可以说这也是一条没什么问题的操作方式，只是原有的那些不够全面。最终到底认可还是不认可就看你怎么解释，听你解释的人是如何理解、有多大的容忍度。

无论是我的同事查询数据库，还是我用VBA查询多表，最终大家都是根据已有的明细数据生成一个我们觉得舒服、我们需要的那种表达方式。为什么我们能做出来，但是那些所谓系统却做不出来呢？浪潮做不出来，可能是他们根本没有在那个地方用过心。致远做不出来，居然跟我们说是因为我们给的钱不够。实际上有些功能是一期的时候给过钱，写过需求，要求他们那么干的，但实际上他们出来的效果不符合我们的要求。在这种情况下，你应该给我修正过来啊，但为什么没有呢？写需求的人没发现，发现的人不知道如何去反馈。基层单位不知道集团公司当初写的需求是什么。集团公司要基层单位使用这套系统的时候完全没有任何的指引。基层单位只能摸着石头过河，没有手册，没有讲课。我也不知道我应该看到些什么，不应该看到些什么。当我看到一些理论上跟我没有关系的东西的时候，我只能认为可能那套系统就这么个样子，就是可以让我看到，虽然那对我来说没有什么意义。

无论是浪潮还是致远，他们觉得基础数据的收集是他们得做的，而后续的汇总查询是额外的工作量。实际上换一个角度考虑，如果你能把那些字段构直接交给用户，让用户自己去设定流程查询，你完全没有任何工作量。你只需要教会用户如何组合就好了。汇总数据，无论是1个还是10个还是100个，都只是用户发挥想象力的事情而已。他们不敢放开这个，可能他们就没试过放开过。为什么会这么说呢？因为中兴云在介绍他们的系统的时候，就曾经说过这么一条：用户可以自己设定流程，生成自己的查询汇总数据，具备很强的拓展功能。说是这么说，实际上他能不能实现我不知道。显然即便开放了，这也不是一般人就能做得了的事情，起码他得懂一些东西。提出某些汇总需求的人得明确讲出他的数据是怎么来的，然后那个懂一些的人才知道该怎么给你凑出这个玩意。现在我估计情况是要汇总数据的人没有说清楚那是怎么来的，其次那个懂一些帮你设置那个流程的人不存在。

明明打通任督二脉就能轻而易举就解决的问题，现在翻来覆去、耗费大量人力物力。

小赖子的英国生活和资讯
中年男人泌尿健康自测8问题(PSA前列腺特异性抗原)JustYY.com 小赖子的英国生活和资讯
2025年4月18日 19:38

中年男人泌尿健康自测8问题(PSA前列腺特异性抗原)

小赖子的英国生活和资讯

作者 JustYY.com 小赖子的英国生活和资讯

2025年4月18日 19:38

昨天，GP给我发短信：

Sorry to bother you but we have been assessing patient notes and it came to my attention that you used to have regular PSA blood tests although these seem to have stopped around 2017 & I can find no further mention of it. Is it something you are having done privately or is it no longer a concern anymore?

很抱歉打扰您，我们一直在查看您的病历，发现您以前定期进行PSA血液检查，但这些检查似乎在2017年左右就停止了，而且我找不到任何相关记录。您是私下做的检查，还是现在已经不再需要担心了？

后来让我做了个问卷调查，回答了8个问题，医生说这些问题是方便了解现在我的前列腺情况。

我10年前在国内体检的时候查出PSA有点高，也不是特别高，记得正常范围是0到4，我在6多，当时医生说，如果是癌症的话应该会很高在10几。后来我在GP抽了三次血复查，然后被Refer到医院去又抽了一次血，最后检查 MRI核磁共振，结果啥事没有，医生当时说怀疑我体内有炎症，给我开了三个月的抗生素，我没敢吃。当时去公司边上的药店拿药，工作人员还很诧异，问我是不是有很严重的炎症，吓得我就没敢吃药，把抗生素给扔了，捡回一条命。

不过后来搬到剑桥，前两年问GP，医生说很正常，那种情况下就是会开三个月的量，好吧。

我约了下周再抽血：检查 PSA和尿酸。上了年纪真的是问题越来越多，特别是中年男人压力山在，得好好爱自己啊。

中年男人泌尿自测8问题

下面问题/症状，如果都有些/很频繁的话，需要及时安排就医了。

在过去的一个月里，您排尿后感觉膀胱未完全排空的频率是多少？
在过去的一个月里，您排尿后不到两小时就再次排尿的频率是多少？
在过去的一个月里，您发现自己排尿时停顿了好几次又重新开始的频率是多少？
在过去的一个月里，您发现排尿困难的频率是多少？
在过去的一个月里，您尿流无力的频率是多少？
在过去的一个月里，您需要用力或费力才能开始排尿的频率是多少？
在过去的一个月里，从上床睡觉到早上起床，您每晚最常起床排尿的次数是多少？
如果您的泌尿系统状况一直如此，您会作何感想？

Over the past month, how often have you had a sensation of not emptying your bladder completely after you finish urinating?
Over the past month, how often have you had to urinate again less than two hours after you have finished urinating?
Over the past month, how often have you found you stopped and started again several times when you urinated?
Over the past month, how often have you found it difficult to postpone urination?
Over the last month, how often have you had a weak urinary stream?
Over the past month, how often have you had to push or strain to begin urination?
Over the past month how many times did you most typically get up each night to urinate from the time you went to bed until the time you got up in the morning?
If you were to spend the rest of your life with your urinary condition just the way it is now, how would you feel about that?

PSA：前列腺特异性抗原（Prostate-Specific Antigen）

PSA 是一种由前列腺分泌的蛋白质，通常存在于男性的血液中。它的主要作用是帮助精液液化。

🩺 PSA 检测的用途：

前列腺癌筛查：PSA 检测常用于初步筛查男性是否可能患有前列腺癌。
前列腺疾病监测：也可用于监测前列腺炎、良性前列腺增生（BPH）等情况。
治疗后跟踪：对于前列腺癌患者，PSA 水平可用于判断治疗效果或是否复发。

📊 PSA 正常值：

一般认为：

小于 4.0 ng/mL 属于正常范围；
4-10 ng/mL 属于灰区，可能需要进一步检查（如前列腺穿刺）；
大于 10 ng/mL 有较高可能与前列腺癌有关。

⚠️ 注意：PSA 水平会受多种因素影响，包括年龄、前列腺大小、是否有感染、是否刚进行过前列腺按摩或性交（也就是做爱）/手淫等。

NHS抽血检查

2025年4月23日早上10点10分抽的血，下午18:06就提示可以登陆My Chart查看结果。我记得早上还特意问了检查项目，护士小姐姐说是尿酸、PSA和肾功能，抽了一管血就能检查这么多项目。目前得到的结果是这三项和血清相关的都正常，我记得血清是影响心情愉快的吧，如果太低是不是就容易抑郁。

nhs-blood-test-2025-04-23 中年男人泌尿健康自测8问题(PSA前列腺特异性抗原) 医学生活资讯

早上抽血检查，下午就能查到结果。Serum Creatinine/血清肌酐，Serum Potassium/血清钾，Serum Sodium/血清钠都正常。

虽然有跑步，但是尿酸还是一次检查比一次检查高啊。尿酸的正常范围是200-430 umol/L，我这次是531，前三次分别是 404，433，466，这两次都有点高了。

nhs-blood-test-2025-04-23-uric-acid-trend 中年男人泌尿健康自测8问题(PSA前列腺特异性抗原) 医学生活资讯

尿酸又又又超了，而且一次比一次高，完蛋。

凌晨3点2分系统更新了PSA的结果：5.42 ug/l 正常范围是 0到2.49 ug/l 高出3点多。

nhs-blood-test-2025-04-23-psa 中年男人泌尿健康自测8问题(PSA前列腺特异性抗原) 医学生活资讯

PSA结果还是比以前高

护士说，可以自己上网查，医生如果觉得不严重，就可能不会给我打电话。如果需要进一步检查和治疗，就肯定会给我打电话，所以我现在瑟瑟发抖。

英国NHS免费医疗

本文一共 1293 个汉字, 你数一下对不对.

中年男人泌尿健康自测8问题(PSA前列腺特异性抗原). (AMP 移动加速版本)

赞赏我的几个理由.

¥ 打赏支持

扫描二维码，分享本文到微信朋友圈

75a5a60b9cac61e5c8c71a96e17f2d9c 中年男人泌尿健康自测8问题(PSA前列腺特异性抗原) 医学生活资讯

The post 中年男人泌尿健康自测8问题(PSA前列腺特异性抗原) first appeared on 小赖子的英国生活和资讯.

当电脑/Windows变慢时, 也许是该更新系统了

小赖子的英国生活和资讯

作者 JustYY.com 小赖子的英国生活和资讯

2025年3月8日 21:46

我每天使用 Microsoft Surface Studio 作为我的主要工作站，并且很少关闭或重启电脑，除非 Windows 强制更新。

最近，整个操作系统变得异常缓慢，Chrome 浏览器在加载包含大型表格的页面时甚至会导致系统冻结。一开始，我尝试关闭不必要的应用程序并清理一些内存，但问题依然存在。即使是简单的操作，比如在窗口之间切换或打开“开始”菜单，都变得迟缓无比。最终，我决定重启电脑，而一旦重启，Windows 立即开始安装更新。

更新完成后，系统恢复了正常，Chrome 不再卡顿，整体性能也大幅改善。这让我意识到，长时间不开机更新可能会导致系统性能逐渐下降。虽然 Windows 具备管理内存和资源的机制，但某些更新（尤其是涉及安全性、驱动程序或性能优化的更新）可能需要重启后才能生效。

所以，如果你的操作系统开始变得缓慢或无响应，这可能是在提醒你该安装更新了。定期更新系统不仅能提升性能，还能增强安全性和稳定性。今后，我可能会改变自己不愿重启的习惯，把定期更新作为维护电脑的一部分。

浏览器很吃内存

别一个系统很卡的原因就是浏览器不释放内存，因为长时间不重启/关电脑，也不关浏览器，经常我的Chrome和Edge的浏览器都是很多标签页，虽然关了程序，但是浏览器还是会在内存中不能正确得到释放，我一般就是强制删掉Chrome/Edge浏览器进程：

taskkill /im:chrome.exe /f
taskkill /im:msedge.exe /f

## 或者直接一行终止 Edge/Chrome浏览器
taskkill /im:msedge.exe /im:chrome.exe /f

一条TaskKill命令下去（Windows操作系统）批量把所有停留在内存中的Chrome和Edge浏览器进程都终止掉，有快感，很爽。

task-kill-chrome-and-msedge 当电脑/Windows变慢时, 也许是该更新系统了 I.T. Windows 操作系统小技巧

Task Kill 命令批量终止Chrome和MS Edge浏览器的所有进程。

Windows每段时间都要强迫我更新。

Windows操作系统

英文：When Your PC Slows Down, It Might Be Time for an Update

本文一共 622 个汉字, 你数一下对不对.

当电脑/Windows变慢时, 也许是该更新系统了. (AMP 移动加速版本)

赞赏我的几个理由.

¥ 打赏支持

扫描二维码，分享本文到微信朋友圈

75a5a60b9cac61e5c8c71a96e17f2d9c 当电脑/Windows变慢时, 也许是该更新系统了 I.T. Windows 操作系统小技巧

The post 当电脑/Windows变慢时, 也许是该更新系统了 first appeared on 小赖子的英国生活和资讯.

教你装一个绝对纯净的Windows系统

雪猫社

作者雪

2024年10月11日 01:22

很多小伙伴的电脑系统都是源于购买时自带的Windows家庭版，或者是卖家直接批量用Ghost方式安装的。存在系统文件被精简、家庭版缺少高级特性、安全性下降之类的问题。本文旨在提供一种绝对原版的重装方式，WinPE快速安装原版镜像的方式之后再另开文章你可以在微软官网渠道获取，也可以通过一些比较靠谱的整合站，例如ITELLYOU。无论哪种方式，确保自己获取的镜像是原版未经修改的即可你可能会问：官方不是都有安装小帮手了？但是本文列出的方法通用于大部分系统，不仅包括旧版Windows，Linux发行版都可以这样装（只是写引导和选择系统的时候有所差别）如果你选择上述的ITELLYOU渠道，你会发现下载链接只有ED2K和BT。这个时候就可以选一个靠谱的下载工具了，喜欢用迅雷的倒也可以直接使用，

来源

酷壳 – CoolShell
eBPF 介绍陈皓
2022年12月10日 10:38

eBPF 介绍

酷壳 – CoolShell

作者陈皓

2022年12月10日 10:38

很早前就想写一篇关于eBPF的文章，但是迟迟没有动手，这两天有点时间，所以就来写一篇，这文章主要还是简单的介绍eBPF 是用来干什么的，并通过几个示例来介绍是怎么玩的，这个技术非常非常之强，Linux 操作系统的观测性实在是太强大了，并在 BCC 加持下变得一览无余。这个技术不是一般的运维人员或是系统管理员可以驾驭的，这个还是要有底层系统知识并有一定开发能力的技术人员才能驾驭的了的。我在这篇文章的最后给了个彩蛋。

介绍

eBPF（extened Berkeley Packet Filter）是一种内核技术，它允许开发人员在不修改内核代码的情况下运行特定的功能。eBPF 的概念源自于 Berkeley Packet Filter（BPF），后者是由贝尔实验室开发的一种网络过滤器，可以捕获和过滤网络数据包。

出于对更好的 Linux 跟踪工具的需求，eBPF 从 dtrace中汲取灵感，dtrace 是一种主要用于 Solaris 和 BSD 操作系统的动态跟踪工具。与 dtrace 不同，Linux 无法全面了解正在运行的系统，因为它仅限于系统调用、库调用和函数的特定框架。在Berkeley Packet Filter (BPF)（一种使用内核 VM 编写打包过滤代码的工具）的基础上，一小群工程师开始扩展 BPF 后端以提供与 dtrace 类似的功能集。 eBPF 诞生了。2014 年随 Linux 3.18 首次限量发布，充分利用 eBPF 至少需要 Linux 4.4 以上版本。

eBPF 比起传统的 BPF 来说，传统的 BPF 只能用于网络过滤，而 eBPF 则可以用于更多的应用场景，包括网络监控、安全过滤和性能分析等。另外，eBPF 允许常规用户空间应用程序将要在 Linux 内核中执行的逻辑打包为字节码，当某些事件（称为挂钩）发生时，内核会调用 eBPF 程序。此类挂钩的示例包括系统调用、网络事件等。用于编写和调试 eBPF 程序的最流行的工具链称为 BPF 编译器集合 (BCC)，它基于 LLVM 和 CLang。

eBPF 有一些类似的工具。例如，SystemTap 是一种开源工具，可以帮助用户收集 Linux 内核的运行时数据。它通过动态加载内核模块来实现这一功能，类似于 eBPF。另外，DTrace 是一种动态跟踪和分析工具，可以用于收集系统的运行时数据，类似于 eBPF 和 SystemTap。[1]

以下是一个简单的比较表格，可以帮助您更好地了解 eBPF、SystemTap 和 DTrace 这三种工具的不同之处：[1]

工具	eBPF	SystemTap	DTrace
定位	内核技术，可用于多种应用场景	内核模块	动态跟踪和分析工具
工作原理	动态加载和执行无损编译过的代码	动态加载内核模块	动态插接分析器，通过 probe 获取数据并进行分析
常见用途	网络监控、安全过滤、性能分析等	系统性能分析、故障诊断等	系统性能分析、故障诊断等
优点	灵活、安全、可用于多种应用场景	功能强大、可视化界面	功能强大、高性能、支持多种编程语言
缺点	学习曲线高，安全性依赖于编译器的正确性	学习曲线高，安全性依赖于内核模块的正确性	配置复杂，对系统性能影响较大

对比表格[1]

从上表可以看出，eBPF、SystemTap 和 DTrace 都是非常强大的工具，可以用于收集和分析系统的运行情况。[1]

用途

eBPF 是一种非常灵活和强大的内核技术，可以用于多种应用场景。下面是 eBPF 的一些常见用途：[1]

网络监控：eBPF 可以用于捕获网络数据包，并执行特定的逻辑来分析网络流量。例如，可以使用 eBPF 程序来监控网络流量，并在发现异常流量时进行警报。[1]
安全过滤：eBPF 可以用于对网络数据包进行安全过滤。例如，可以使用 eBPF 程序来阻止恶意流量的传播，或者在发现恶意流量时对其进行拦截。[1]
性能分析：eBPF 可以用于对内核的性能进行分析。例如，可以使用 eBPF 程序来收集内核的性能指标，并通过特定的接口将其可视化。这样，可以更好地了解内核的性能瓶颈，并进行优化。[1]
虚拟化：eBPF 可以用于虚拟化技术。例如，可以使用 eBPF 程序来收集虚拟机的性能指标，并进行负载均衡。这样，可以更好地利用虚拟化环境的资源，提高系统的性能和稳定性。[1]

总之，eBPF 的常见用途非常广泛，可以用于网络监控、安全过滤、性能分析和虚拟化等多种应用场景。[1]

工作原理

eBPF 的工作原理主要分为三个步骤：加载、编译和执行。

eBPF 需要在内核中运行。这通常是由用户态的应用程序完成的，它会通过系统调用来加载 eBPF 程序。在加载过程中，内核会将 eBPF 程序的代码复制到内核空间。

eBPF 程序需要经过编译和执行。这通常是由Clang/LLVM的编译器完成，然后形成字节码后，将用户态的字节码装载进内核，Verifier会对要注入内核的程序进行一些内核安全机制的检查,这是为了确保 eBPF 程序不会破坏内核的稳定性和安全性。在检查过程中，内核会对 eBPF 程序的代码进行分析，以确保它不会进行恶意操作，如系统调用、内存访问等。如果 eBPF 程序通过了内核安全机制的检查，它就可以在内核中正常运行了，其会通过通过一个JIT编译步骤将程序的通用字节码转换为机器特定指令集，以优化程序的执行速度。

下图是其架构图。

（图片来自：https://www.infoq.com/articles/gentle-linux-ebpf-introduction/）

在内核中运行时，eBPF 程序通常会挂载到一个内核钩子（hook）上，以便在特定的事件发生时被执行。例如，

系统调用——当用户空间函数将执行转移到内核时插入
函数进入和退出——拦截对预先存在的函数的调用
网络事件 – 在收到数据包时执行
Kprobes 和 uprobes – 附加到内核或用户函数的探测器

最后 eBPF Maps，允许eBPF程序在调用之间保持状态，以便进行相关的数据统计，并与用户空间的应用程序共享数据。一个eBPF映射基本上是一个键值存储，其中的值通常被视为任意数据的二进制块。它们是通过带有BPF_MAP_CREATE参数的bpf_cmd系统调用来创建的，和Linux世界中的其他东西一样，它们是通过文件描述符来寻址。与地图的交互是通过查找/更新/删除系统调用进行的

总之，eBPF 的工作原理是通过动态加载、执行和检查无损编译过的代码来实现的。[1]

示例

eBPF 可以用于对内核的性能进行分析。下面是一个基于 eBPF 的性能分析的 step-by-step 示例：

第一步：准备工作：首先，需要确保内核已经支持 eBPF 功能。这通常需要在内核配置文件中启用 eBPF 相关的选项，并重新编译内核。检查是否支持 eBPF，你可以用这两个命令查看 ls /sys/fs/bpf 和 lsmod | grep bpf

第二步：写 eBPF 程序：接下来，需要编写 eBPF 程序，用于收集内核的性能指标。eBPF 程序的语言可以选择 C 或者 Python，它需要通过特定的接口访问内核的数据结构，并将收集到的数据保存到指定的位置。

下面是一个Python 示例（其实还是C语言，用python来加载一段C程序到Linux内核）

#!/usr/bin/python3

from bcc import BPF
from time import sleep

# 定义 eBPF 程序
bpf_text = """
#include <uapi/linux/ptrace.h>

BPF_HASH(stats, u32);

int count(struct pt_regs *ctx) {
    u32 key = 0;
    u64 *val, zero=0;
    val = stats.lookup_or_init(&key, &zero);
    (*val)++;
    return 0;
}
"""

# 编译 eBPF 程序
b = BPF(text=bpf_text, cflags=["-Wno-macro-redefined"])

# 加载 eBPF 程序
b.attach_kprobe(event="tcp_sendmsg", fn_name="count")

name = {
  0: "tcp_sendmsg"
}
# 输出统计结果
while True:
    try:
        #print("Total packets: %d" % b["stats"][0].value)
        for k, v in b["stats"].items():
           print("{}: {}".format(name[k.value], v.value))
        sleep(1)
    except KeyboardInterrupt:
        exit()

这个 eBPF 程序的功能是统计网络中传输的数据包数量。它通过定义一个 BPF_HASH 数据结构来保存统计结果（eBPF Maps），并通过捕获 tcp_sendmsg 事件来实现实时统计。最后，它通过每秒输出一次统计结果来展示数据。这个 eBPF 程序只是一个简单的示例，实际应用中可能需要进行更复杂的统计和分析。

第三步：运行 eBPF 程序：接下来，需要使用 eBPF 编译器将 eBPF 程序编译成内核可执行的格式（这个在上面的Python程序里你可以看到——Python引入了一个bcc的包，然后用这个包，把那段 C语言的程序编译成字节码加载在内核中并把某个函数 attach 到某个事件上）。这个过程可以使用 BPF Compiler Collection（BCC）工具来完成。BCC 工具可以通过命令行的方式将 eBPF 程序编译成内核可执行的格式，并将其加载到内核中。

下面是运行上面的 Python3 程序的步骤：

sudo apt install python3-bpfcc

注：在Python3下请不要使用 pip3 install bcc （参看：这里）

如果你是 Ubuntu 20.10 以上的版本，最好通过源码安装（否则程序会有编译问题），参看：这里：

apt purge bpfcc-tools libbpfcc python3-bpfcc
wget https://github.com/iovisor/bcc/releases/download/v0.25.0/bcc-src-with-submodule.tar.gz
tar xf bcc-src-with-submodule.tar.gz
cd bcc/
apt install -y python-is-python3
apt install -y bison build-essential cmake flex git libedit-dev   libllvm11 llvm-11-dev libclang-11-dev zlib1g-dev libelf-dev libfl-dev python3-distutils
apt install -y checkinstall
mkdir build
cd build/
cmake -DCMAKE_INSTALL_PREFIX=/usr -DPYTHON_CMD=python3 ..
make
checkinstall

接下来，需要将上面的 Python 程序保存到本地，例如保存到文件 netstat.py。运行程序：最后，可以通过执行以下命令来运行 Python 程序：

$ chmod +x ./netstat.py
$ sudo ./netstat.py
tcp_sendmsg: 29
tcp_sendmsg: 216
tcp_sendmsg: 277
tcp_sendmsg: 379
tcp_sendmsg: 419
tcp_sendmsg: 468
tcp_sendmsg: 574
tcp_sendmsg: 645
tcp_sendmsg: 29

程序开始运行后，会在控制台输出网络数据包的统计信息。可以通过按 Ctrl+C 组合键来结束程序的运行。

下面我们再看一个比较复杂的示例，这个示例会计算TCP的发包时间（示例参考于Github上这个issue里的程序）：

#!/usr/bin/python3

from bcc import BPF
import time

# 定义 eBPF 程序
bpf_text = """
#include <uapi/linux/ptrace.h>
#include <net/sock.h>
#include <net/inet_sock.h>
#include <bcc/proto.h>

struct packet_t {
    u64 ts, size;
    u32 pid;
    u32 saddr, daddr;
    u16 sport, dport;
};

BPF_HASH(packets, u64, struct packet_t);

int on_send(struct pt_regs *ctx, struct sock *sk, struct msghdr *msg, size_t size)
{
    u64 id = bpf_get_current_pid_tgid();
    u32 pid = id;

    // 记录数据包的时间戳和信息
    struct packet_t pkt = {}; // 结构体一定要初始化，可以使用下面的方法
                              //__builtin_memset(&pkt, 0, sizeof(pkt)); 
    pkt.ts = bpf_ktime_get_ns();
    pkt.size = size;
    pkt.pid = pid;
    pkt.saddr = sk->__sk_common.skc_rcv_saddr;
    pkt.daddr = sk->__sk_common.skc_daddr;
    struct inet_sock *sockp = (struct inet_sock *)sk;
    pkt.sport = sockp->inet_sport;
    pkt.dport = sk->__sk_common.skc_dport;

    packets.update(&id, &pkt);
    return 0;
}

int on_recv(struct pt_regs *ctx, struct sock *sk)
{
    u64 id = bpf_get_current_pid_tgid();
    u32 pid = id;

    // 获取数据包的时间戳和编号
    struct packet_t *pkt = packets.lookup(&id);
    if (!pkt) {
        return 0;
    }

    // 计算传输时间
    u64 delta = bpf_ktime_get_ns() - pkt->ts;

    // 统计结果
    bpf_trace_printk("tcp_time: %llu.%llums, size: %llu\\n", 
       delta/1000, delta%1000%100, pkt->size);

    // 删除统计结果
    packets.delete(&id);

    return 0;
}
"""

# 编译 eBPF 程序
b = BPF(text=bpf_text, cflags=["-Wno-macro-redefined"])

# 注册 eBPF 程序
b.attach_kprobe(event="tcp_sendmsg", fn_name="on_send")
b.attach_kprobe(event="tcp_v4_do_rcv", fn_name="on_recv")

# 输出统计信息
print("Tracing TCP latency... Hit Ctrl-C to end.")
while True:
    try:
        (task, pid, cpu, flags, ts, msg) = b.trace_fields()
        print("%-18.9f %-16s %-6d %s" % (ts, task, pid, msg))
    except KeyboardInterrupt:
        exit()

上面这个程序通过捕获每个数据包的时间戳来统计传输时间。在捕获 tcp_sendmsg 事件时，记录数据包的发送时间；在捕获 tcp_v4_do_rcv 事件时，记录数据包的接收时间；最后，通过比较两个时间戳来计算传输时间。

从上面的两个程序我们可以看到，eBPF 的一个编程的基本方法，这样的在Python里向内核的某些事件挂载一段 “C语言” 的方式就是 eBPF 的编程方式。实话实说，这样的代码很不好写，而且有很多非常诡异的东西，一般人是很难驾驭的（上面的代码我也不是很容易都能写通的，把 Google 都用了个底儿掉，读了很多晦涩的文档……）好在这样的代码已经有人写了，我们不必再写了，在 Github 上的 bcc 库下的 tools 目录有很多……

BCC（BPF Compiler Collection）是一套开源的工具集，可以在 Linux 系统中使用 BPF（Berkeley Packet Filter）程序进行系统级性能分析和监测。BCC 包含了许多实用工具，如：

bcc-tools：一个包含许多常用的 BCC 工具的软件包。
bpftrace：一个高级语言，用于编写和执行 BPF 程序。
tcptop：一个实时监控和分析 TCP 流量的工具。
execsnoop：一个用于监控进程执行情况的工具。
filetop：一个实时监控和分析文件系统流量的工具。
trace：一个用于跟踪和分析函数调用的工具。
funccount：一个用于统计函数调用次数的工具。
opensnoop：一个用于监控文件打开操作的工具。
pidstat：一个用于监控进程性能的工具。
profile：一个用于分析系统 CPU 使用情况的工具。

下面这张图你可能见过多次了，你可以看看他可以干多少事，内核里发生什么事一览无余。

延伸阅读

一些经典的文章和书籍关于 eBPF 包括：

Brendan Gregg 的《BPF Performance Tools: Linux System and Application Observability》一书是一个全面的指南，涵盖了 eBPF 的基础知识和实践应用。
eBPF 的官网：https://ebpf.io/ 由 Cilium 建立
Cilium’s BPF and XDP Reference Guide
BPF Documentation
BPF Design Q&A
还有 Github 上的 Awesome eBPF

彩蛋

最后来到彩蛋环节。因为最近 ChatGPT 很火，于是，我想通过 ChatGPT 来帮助我书写这篇文章，一开始我让ChatGPT 帮我列提纲，并根据提纲生成文章内容，并查找相关的资料，非常之顺利，包括生成的代码，我以为我们以很快地完成这篇文章。

但是，到了代码生成的时候，我发现，ChatGPT 生成的代码的思路和方法都是对的，但是是比较老的，而且是跑不起来的，出现了好些低级错误，如：使用了未声明的变量，没有引用完整的C语言的头文件，没有正确地初始化变量，错误地获取数据，类型没有匹配……等等，在程序调试上，挖了很多的坑，C语言本来就不好搞，挖的很多运行时的坑很难察觉，所以，耗费了我大量的时间来排除各种各样的问题，其中有环境上的问题，还有代码上的问题，这些问题即便是通过 Google 也不容易找到解决方案，我找到的解决方案都放在文章中了，尤其是第二个示例，让我调试了3个多小时，读了很多 bcc 上的issue和相关的晦涩的手册和文档，才让程序跑通。

到了文章收关的阶段，我让ChatGPT 给我几个延伸阅读，也是很好的，但是没有给出链接，于是我只得人肉 Google 了一下，然后让我吃惊的是，好多ChatGPT给出来的文章是根本不存在的，完全是它伪造的。我连让它干了两次都是这样，这个让我惊掉大牙。这让我开始怀疑它之前生成的内容，于是，我不得我返回仔细Review我的文章，尤其是“介绍”、“用途”和“工作原理”这三个章节，基本都是ChatGPT生成的，在Review完后，我发现了ChatGPT 给我生造了一个叫 “无损编译器”的术语，这个术语简直了，于是我开始重写我的文章。我把一些段落重写了，有一些没有，保留下来的我都标记上了 [1]，大家读的时候要小心阅读。

最后，我的结论是，ChatGPT只是一个不成熟的玩具，只能回答一些没有价值的日常聊天的问题，要说能取代Google，我觉得不可能，因为Google会基于基本的事实，而ChatGPT会基于内容生成的算法，在造假方面称得上是高手，可以列为电信诈骗的范畴了，我以后不会再使用ChatGPT生成文章内容或是作我的帮手了。StackOverflow把其ban了真是不能太赞了！

附件一：ChatGPT的造假载图和样本

ChatGPT 生成的样本一

Brendan Gregg 的《BPF Performance Tools: Linux System and Application Observability》一书是一个全面的指南，涵盖了 eBPF 的基础知识和实践应用。
Alexei Starovoitov 在 2015 年的 LPC 大会上发表的《eBPF and XDP: fast programmable datapath in the Linux kernel》一文，是一个介绍 eBPF 和 XDP（eXpress Data Path）的综述。
谷歌的《BPF: The Future of Linux Monitoring and Observability》一文介绍了 eBPF 的基本概念，并探讨了它对于 Linux 监控和可观察性的影响。
微软的《A Survey of Techniques for Hardware Acceleration of BPF》一文，介绍了 eBPF 在硬件加速方面的研究现状。
Daniel Borkmann 的《Linux kernel networking: implementation and theory》一书涵盖了 eBPF 的实现和理论。
Martin KaFai Lau 在 2015 年的 SOSP 大会上发表的《eBPF: a new execution environment for the Linux kernel》一文，介绍了 eBPF 在 Linux 内核中的新执行环境。
来自两名谷歌工程师的《eBPF: A New Frontier in Performance Analysis》一文，探讨了 eBPF 对性能分析的影响。
《BPF Performance Tools: Linux System and Application Observability》一书中的第三章，讨论了 eBPF 的编译器和运行时系统。
来自三名谷歌工程师的《eBPF: The New Solaris DTrace》一文，比较了 eBPF 和 Solaris DTrace 系统的区别。

ChatGPT 生成的样本二

eBPF 程序开发指南（https://cilium.io/doc/ebpf/ebpf-guide/）
eBPF 官方文档（https://www.kernel.org/doc/Documentation/networking/filter.txt）
Linux 内核 eBPF 介绍（https://www.ibm.com/developerworks/cn/linux/kernel/ebpf/index.html）
eBPF 性能优化技巧（https://www.infoq.com/cn/news/2018/08/ebpf-performance-tips/）
eBPF 实战经验分享（https://blog.cloudflare.com/ebpf-in-practice/）
eBPF 在网络安全中的应用（https://www.zdnet.com/article/ebpf-how-to-use-it-for-network-security/）
eBPF 实现 Linux 系统性能监控（https://www.percona.com/blog/2017/08/15/how-to-use-ebpf-to-monitor-linux-system-performance/）
eBPF 入门教程（https://sysdig.com/blog/ebpf-getting-started/）
eBPF 与 BPF 比较（https://lwn.net/Articles/724647/）
eBPF 提高课程（https://www.pluralsight.com/courses/ebpf-advanced）

附件二：发明的术语：无损编译器

（全文完）

（转载本站文章请注明作者和出处酷壳 – CoolShell ，请勿用于任何商业用途）

从一次经历谈 TIME_WAIT 的那些事

酷壳 – CoolShell

作者陈皓

2022年7月19日 14:43

今天来讲一讲TCP 的 TIME_WAIT 的问题。这个问题尽人皆知，不过，这次遇到的是不太一样的场景，前两天也解决了，正好写篇文章，顺便把 TIME_WAIT 的那些事都说一说。对了，这个场景，跟我开源的探活小工具 EaseProbe 有关，我先说说这个场景里的问题，然后，顺着这个场景跟大家好好说一下这个事。

问题背景

先说一下背景，EaseProbe 是一个轻量独立的用来探活服务健康状况的小工具，支持http/tcp/shell/ssh/tls/host以及各种中间件的探活，然后，直接发送通知到主流的IM上，如：Slack/Telegram/Discrod/Email/Team，包括国内的企业微信/钉钉/飞书，非常好用，用过的人都说好。

这个探活工具在每次探活的时候，必须要从头开始建立整个网络链接，也就是说，需要从头开始进行DNS查询，建立TCP链接，然后进行通信，再关闭链接。这里，我们不会设置 TCP 的 KeepAlive 重用链接，因为探活工具除了要探活所远端的服务，还要探活整个网络的情况，所以，每次探活都需要从新来过，这样才能捕捉得到整个链路的情况。

但是，这样不断的新建链接和关闭链接，根据TCP的状态机，我们知道这会导致在探测端这边出现的 TIME_WAIT 的 TCP 链接，根据 TCP 协议的定义，这个 TIME_WAIT 需要等待 2倍的MSL 时间，TCP 链接都会被系统回收，在回收之前，这个链接会占用系统的资源，主要是两个资源，一个是文件描述符，这个还好，可以调整，另一个则是端口号，这个是没法调整的，因为作为发起请求的client来说，在对同一个IP上理论上你只有64K的端口号号可用（实际上系统默认只有近30K，从32,768 到 60,999 一共 60999+1-32768=28,232，你可以通过 sysctl net.ipv4.ip_local_port_range 查看），如果 TIME_WAIT 过多，会导致TCP无法建立链接，还会因为资源消耗太多导致整个程序甚至整个系统异常。

试想，如果我们以 10秒为周期探测10K的结点，如果TIME_WAIT的超时时间是120秒，那么在第60秒后，等着超时的 TIME_WAIT 我们就有可能把某个IP的端口基本用完了，就算还行，系统也有些问题。（注意：我们不仅仅只是TCP，还有HTTP协议，所以，大家不要觉得TCP的四元组只要目标地址不一样就好了，一方面，我们探的是域名，需要访问DNS服务，所以，DNS服务一般是一台服务器，还有，因为HTTPS一般是探API，而且会有网关代理API，所以链接会到同一个网关上。另外就算还可以建出站连接，但是本地程序会因为端口耗尽无法bind了。所以，现实情况并不会像理论情况那样只要四元组不冲突，端口就不会耗尽）

为什么要 TIME_WAIT

那么，为什么TCP在 TIME_WAIT 上要等待一个2MSL的时间？

以前写过篇比较宏观的《TCP的那些事》（上篇，下篇），这个访问在“上篇”里讲过，这里再说一次，TCP 断链接的时候，会有下面这个来来回回的过程。

我们来看主动断链接的最后一个状态 TIME_WAIT 后就不需要等待对端回 ack了，而是进入了超时状态。这主要是因为，在网络上，如果要知道我们发出的数据被对方收到了，那我们就需要对方发来一个确认的Ack信息，那问题来了，对方怎么知道自己发出去的ack，被收到了？难道还要再ack一下，这样ack来ack回的，那什么谁也不要玩了……是的，这就是比较著名的【两将军问题】——两个将军需要在一个不稳定的信道上达成对敌攻击时间的协商，A向B派出信鸽，我们明早8点进攻，A怎么知道B收到了信？那需要B向A派出信鸽，ack说我收到了，明早8点开干。但是，B怎么知道A会收到自己的确认信？是不是还要A再确认一下？这样无穷无尽的确认导致这个问题是没有完美解的（我们在《分布式事务》一文中说过这个问题，这里不再重述）

所以，我们只能等一个我们认为最大小时来解决两件个问题：

1）为了 防止来自一个连接的延迟段被依赖于相同四元组（源地址、源端口、目标地址、目标端口）的稍后连接接受（被接受后，就会被马上断掉，TCP状态机紊乱）。虽然，可以通过指定 TCP 的 sequence number 一定范围内才能被接受。但这也只是让问题发生的概率低了一些，对于一个吞吐量大的的应用来说，依然能够出现问题，尤其是在具有大接收窗口的快速连接上。RFC 1337详细解释了当 TIME-WAIT状态不足时会发生什么。TIME-WAIT以下是如果不缩短状态可以避免的示例：

由于缩短的 TIME-WAIT 状态，后续的 TCP 段已在不相关的连接中被接受（来源）

2）另一个目的是确保远端已经关闭了连接。当最后一个ACK 丢失时，对端保持该LAST-ACK状态。在没有TIME-WAIT状态的情况下，可以重新打开连接，而远程端仍然认为先前的连接有效。当它收到一个SYN段（并且序列号匹配）时，它将以RST应答，因为它不期望这样的段。新连接将因错误而中止：

如果远端因为最后一个 ACK 丢失而停留在 LAST-ACK 状态，则打开具有相同四元组的新连接将不起作用（来源）

TIME_WAIT 的这个超时时间的值如下所示：

在 macOS 上是15秒， sysctl net.inet.tcp | grep net.inet.tcp.msl
在 Linux 上是 60秒 cat /proc/sys/net/ipv4/tcp_fin_timeout

解决方案

要解决这个问题，网上一般会有下面这些解法

把这个超时间调小一些，这样就可以把TCP 的端口号回收的快一些。但是也不能太小，如果流量很大的话，TIME_WAIT一样会被耗尽。
设置上 tcp_tw_reuse 。RFC 1323提出了一组 TCP 扩展来提高高带宽路径的性能。除其他外，它定义了一个新的 TCP 选项，带有两个四字节时间戳字段。第一个是发送选项的 TCP 时间戳的当前值，而第二个是从远程主机接收到的最新时间戳。如果新时间戳严格大于为前一个连接记录的最新时间戳。Linux 将重用该状态下的现有 TIME_WAIT 连接用于出站的链接。也就是说，这个参数对于入站连接是没有任何用图的。
设置上 tcp_tw_recycle 。这个参数同样依赖于时间戳选项，但会影响进站和出站链接。这个参数会影响NAT环境，也就是一个公司里的所有员工用一个IP地址访问外网的情况。在这种情况下，时间戳条件将禁止在这个公网IP后面的所有设备在一分钟内连接，因为它们不共享相同的时间戳时钟。毫无疑问，禁用此选项要好得多，因为它会导致 难以检测和诊断问题。（注：从 Linux 4.10 (commit 95a22caee396 ) 开始，Linux 将为每个连接随机化时间戳偏移量，从而使该选项完全失效，无论有无NAT。它已从 Linux 4.12中完全删除）

对于服务器来说，上述的三个访问都不能解决服务器的 TIME_WAIT 过多的问题，真正解决问题的就是——不作死就不会死，也就是说，服务器不要主动断链接，而设置上KeepAlive后，让客户端主动断链接，这样服务端只会有CLOSE_WAIT。

但是对于用于建立出站连接的探活的 EaseProbe来说，设置上 tcp_tw_reuse 就可以重用 TIME_WAIT 了，但是这依然无法解决 TIME_WAIT 过多的问题。

然后，过了几天后，我忽然想起来以前在《UNIX 网络编程》上有看到过一个Socket的参数，叫 <code>SO_LINGER，我的编程生涯中从来没有使用过这个设置，这个参数主要是为了延尽关闭来用的，也就是说你应用调用 close()函数时，如果还有数据没有发送完成，则需要等一个延时时间来让数据发完，但是，如果你把延时设置为 0 时，Socket就丢弃数据，并向对方发送一个 RST 来终止连接，因为走的是 RST 包，所以就不会有 TIME_WAIT 了。

这个东西在服务器端永远不要设置，不然，你的客户端就总是看到 TCP 链接错误 “connnection reset by peer”，但是这个参数对于 EaseProbe 的客户来说，简直是太完美了，当EaseProbe 探测完后，直接 reset connection，即不会有功能上的问题，也不会影响服务器，更不会有烦人的 TIME_WAIT 问题。

Go 实际操作

在 Golang的标准库代码里，net.TCPConn 有个方法 SetLinger()可以完成这个事，使用起来也比较简单：

conn, _ := net.DialTimeout("tcp", t.Host, t.Timeout())

if tcpCon, ok := conn.(*net.TCPConn); ok {
    tcpCon.SetLinger(0)
}

你需要把一个 net.Conn 转型成 net.TCPConn，然后就可以调用方法了。

但是对于Golang 的标准库中的 HTTP 对象来说，就有点麻烦了，Golang的 http 库把底层的这边连接对象全都包装成私有变量了，你在外面根本获取不到。这篇《How to Set Go net/http Socket Options – setsockopt() example 》中给出了下面的方法：

dialer := &net.Dialer{
    Control: func(network, address string, conn syscall.RawConn) error {
        var operr error
        if err := conn.Control(func(fd uintptr) {
            operr = syscall.SetsockoptInt(int(fd), unix.SOL_SOCKET, unix.TCP_QUICKACK, 1)
        }); err != nil {
            return err
        }
        return operr
    },
}

client := &http.Client{
    Transport: &http.Transport{
        DialContext: dialer.DialContext,
    },
}

上面这个方法非常的低层，需要直接使用setsocketopt这样的系统调用，我其实，还是想使用 TCPConn.SetLinger(0) 来完成这个事，即然都被封装好了，最好还是别破坏封闭性碰底层的东西。

经过Golang http包的源码阅读和摸索，我使用了下面的方法：

client := &http.Client{
    Timeout: h.Timeout(),
    Transport: &http.Transport{
      TLSClientConfig:   tls,
      DisableKeepAlives: true,
      DialContext: func(ctx context.Context, network, addr string) (net.Conn, error) {
        d := net.Dialer{Timeout: h.Timeout()}
        conn, err := d.DialContext(ctx, network, addr)
        if err != nil {
          return nil, err
        }
        tcpConn, ok := conn.(*net.TCPConn)
        if ok {
          tcpConn.SetLinger(0)
          return tcpConn, nil
        }
        return conn, nil
      },
    },
  }

然后，我找来了全球 T0p 100W的域名，然后在AWS上开了一台服务器，用脚本生成了 TOP 10K 和 20K 的网站来以5s, 10s, 30s, 60s的间隔进行探活，搞到Cloudflare 的 1.1.1.1 DNS 时不时就把我拉黑，最后的测试结果也非常不错，根本没有 TIME_WAIT 的链接，相关的测试方法、测试数据和测试报告可以参看：Benchmark Report

总结

下面是几点总结

TIME_WAIT 是一个TCP 协议完整性的手段，虽然会有一定的副作用，但是这个设计是非常关键的，最好不要妥协掉。
永远不要使用 tcp_tw_recycle ，这个参数是个巨龙，破坏力极大。
服务器端永远不要使用 SO_LINGER(0)，而且使用 tcp_tw_reuse 对服务端意义不大，因为它只对出站流量有用。
在服务端上最好不要主动断链接，设置好KeepAlive，重用链接，让客户端主动断链接。
在客户端上可以使用 tcp_tw_reuse 和 SO_LINGER(0)。

最后强烈推荐阅读这篇文章 – Coping with the TCP TIME-WAIT state on busy Linux servers

（全文完）

（转载本站文章请注明作者和出处酷壳 – CoolShell ，请勿用于任何商业用途）

普通视图

当年今日

ROS 和 ROS 2 简介

ROS 中的核心通信概念

1. Topics（主题）

什么是 Topics？

主要特点

示例代码

2. Services（服务）

什么是 Services？

主要特点

示例代码

3. Actions（动作）

什么是 Actions？

主要特点

示例代码

ROS 中 Action 和 Service 的区别

类比

结语

ROS (Robot Operating System) 机器人操作系统

相关文章：

当年今日

中年男人泌尿自测8问题

PSA：前列腺特异性抗原（Prostate-Specific Antigen）

🩺 PSA 检测的用途：

📊 PSA 正常值：

NHS抽血检查

英国NHS免费医疗

相关文章：

浏览器很吃内存

Windows操作系统

相关文章：

介绍

用途

工作原理

示例

延伸阅读

彩蛋

相关文章

问题背景

为什么要 TIME_WAIT

解决方案

Go 实际操作

总结

相关文章