📰 Hacker News Top 10 - 2026-04-07

📋 今日 Top 10 列表
1. Show HN: I built a tiny LLM to demystify how language models work
得分: 838 | 评论数: 126
💬 重要评论
thomasfl: 这个项目有没有文档?代码可能是最简单的(不那么)大语言模型实现,但对于不熟悉多头注意力、ReLU FFN、LayerNorm 和学习位置嵌入的开发者来说,理解起来并不容易。这个项目和 Minix 有相似之处。Minix 仍然在大学被用作教学操作系统设计的教育工具。就像 Minix 教会了 Linus Torvalds 如何设计(单片)操作系统一样,让学生为 GuppyLM 添加功能也是学习 LLM 设计的好方法。
achenatx: 把代码交给 LLM,和它讨论一下。
fg137: 这和 Andrej Karpathy 的 microgpt 或 minGPT 相比如何?
2. I won’t download your app. The web version is a-ok
得分: 811 | 评论数: 486
💬 重要评论
KellyCriterion: 大多数人不明白这一点:这里 HN 上的大多数人比今天的”第一批用户”16/17/18 岁要年长得多。对他们来说:”智能手机就是互联网”,而对我们大多数人来说,”智能手机是互联网从我们台式机延伸出来的”,我们已经习惯了(还记得互联网泡沫之前的年月吗,你会说:”我要去地下室用电脑上网一会儿”?:-)。但今天,对年轻人来说,互联网的第一个接触点就是智能手机屏幕。他们甚至在这么小的屏幕上做作业!公司们看到了这种转变,所以他们适应了。就我个人而言,”只提供 app” 的服务我不会用,因为我更喜欢有更大的屏幕,更多信息(实际上我只在公共交通或类似场合使用手机,在家如果我需要什么,我有笔记本电脑放在旁边)。
nkrisc: 但是今天,对年轻人来说,互联网的第一个接触点就是智能手机屏幕。他们甚至在这么小的屏幕上做作业!我见过一条推文完美概括了这一点:对于大多数 30 岁以上的人来说,某些事情是”大屏幕任务”。我用手机做很多事情,但有些事情我还是会放下手机用电脑。对于任何需要写超过几个字或点击超过几次的界面,我最舒服的还是大屏幕和键盘。例如,我在手机上读了你的评论,然后去电脑上写这个回复。就我个人而言,我觉得在手机上做作业很可怕,但我想现在的孩子已经习惯了并且感到舒服,或者他们根本从未用过电脑,不知道错过了什么。虽然我敢说他们可能不习惯键盘打字。老实说,我认为苹果用 iPad 的”什么是电脑?”广告正好说到点子上,关于年轻一代。
SunshineTheCat: 这话说到点子上了。我发现 HN 社区大多数都很有洞察力和有趣,但就消费者反馈而言(特别是 B2C 环境),我不会碰 10 英尺杆都不愿意碰这里的反馈。我不是说这是侮辱,恰恰相反。这里大多数人都是高级用户。但这与普通用户与互联网互动的方式相差了一个银河系。
3. Issue: Claude Code is unusable for complex engineering tasks with Feb updates
得分: 713 | 评论数: 446
💬 重要评论
bcherny: 大家好,我是 Claude Code 团队的 Boris。我刚刚在 issue 上回复了,在这里交叉发布以征集意见。— 首先,感谢你详细的分析。在我继续之前,我想说我感谢你深入思考和关心这个问题。这里发生了两件核心事情:
redact-thinking-2026-02-12这个 beta 头在 UI 中隐藏了思考,因为大多数人不会看它。它不会影响思考本身,也不会影响思考预算,以及底层扩展推理的工作方式。这只是一个 UI 改动。在底层,通过设置这个头我们避免了需要思考总结,这减少了延迟。你可以在settings.json中用showThinkingSummaries: true选择退出(见文档)。
我们在 2 月做了两个会影响这一点的改动:
- Opus 4.6 发布 → 默认自适应思考(2 月 9 日)。Opus 4.6 支持自适应思考,这和我们以前支持的固定思考预算不同。在这种模式下,模型决定思考多长时间,这在大多数情况下比固定思考预算效果更好。使用
CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING可以选择退出。- Opus 4.6 默认中等努力(85)(3 月 3 日)。我们发现 effort=85 在智能-延迟/成本曲线上是一个最佳平衡点,对大多数用户来说,提高了 token 效率同时减少了延迟。我们的产品原则之一是,不应该未经用户同意就改变用户设置,理想情况下我们从一开始就应该设置 effort=85。所以我们觉得改变这个设置很重要,我们的方法是:1. 推出它时会有对话框让用户知道改变,给用户机会选择退出;2. 前几次打开 Claude Code 都会显示 effort,所以不会让人惊讶。有些人希望模型思考更长时间,即使这需要更多时间和 token。为了更高智能,你可以通过
/effort或settings.json设置 effort=high。这个设置在会话间保持粘性,可以在用户之间共享。你也可以用 ULTRATHINK 关键字对单次对话使用高努力,或者设置/effort max为剩余对话使用更高努力。
richardjennings: 直到输出质量骤降,我才知道默认努力已经变成中等了。这花了我大约一天的工作来纠正。我现在确保努力设置为最大,从那以后再也没有糟糕的会话。请问能有一个”总是尽可能努力”模式吗?
noxa: 停止短语保护没有附上,但这里有报告:你可以自己查看本地存储的 transcripts,当设置了这个头,你不会看到原始思考存储,这可能会影响分析。当 Claude 在 transcripts 中看不到思考,它可能意识不到思考仍然存在,只是不面向用户。令人沮丧的是,这种限制是悄悄地引入的,隐藏了思考所以没人能注意到,即使你设置了最大努力、禁用自适应思考、高最大思考 tokens 等等,几乎 1/10 的思考深度。这不是消费者友好的思维:如果 Anthropic 的订阅比同等 API 访问的相同模型行为质量差得多,他们需要清楚说明。今天,Anthropic 完全没有暗示这个限制存在,隐藏是故意的特征,目的是不让受影响的客户注意到,社区在用”写更好的提示”或”把一切拆成小任务,像本地 27B 模型一样盯着它”来自我 Gaslighting — 这太糟糕了。
4. Sam Altman may control our future – can he be trusted?
得分: 652 | 评论数: 210
💬 重要评论
ronanfarrow: Ronan Farrow 在此。Andrew Marantz 和我花了 18 个月做这个调查。很高兴回答关于报道的问题。
cs702: OpenAI 似乎已经在 AI 竞赛中输给 Anthropic 了,对吗?HN 过去一年提到 Claude 的文章是 ChatGPT 的两倍。你对 OpenAI 当前竞争地位的理解和这个相似吗?
taurath: 关于围绕性虐待指控的陈述对我来说最令人困惑——他妹妹的指控和关于他与年轻伴侣的说法。这篇文章似乎给他开了一张相当干净的健康证明,我想你能不能谈谈你是如何调查的?你对 Annie 的指控做了额外调查吗?我觉得结论是恢复记忆不能被信任,这是错误的,因为错误记忆综合征基金会就是为此而生,它是由父母创立的,直接回应指责他们虐待的指控。解离是真实的,我有解离障碍,在青春期和成年早期很长时间都记不得的虐待被第三方证实了,许多 CSA 幸存者都有严重的记忆问题。
5. France pulls last gold held in US
得分: 555 | 评论数: 299
💬 重要评论
u1hcw9nx: 法国美国货币历史二战后:根据布雷顿森林协议(1944-1971),美元是世界储备货币,与黄金挂钩,每盎司 35 美元。其他国家货币挂钩美元。大约 1965 年,戴高乐发起了系统性的激进政策,每次法国从贸易中获得美元都将其兑换为实物黄金,然后法国海军在纽约装载这些金砖。到 1971 年,全球流通的美元已经让美国黄金储备不足以覆盖,尼克松”关闭了黄金窗口”。
kccqzy: 你似乎在暗示戴高乐和他的美元兑黄金政策导致了布雷顿森林体系的崩溃。这是短视的观点。由于设计缺陷,整个布雷顿森林体系从一开始就注定失败。该体系的主要目标是保持所有国家的国际收支平衡,以牺牲经济增长和流动性为代价。如果世界储备货币国美国要保持国际收支盈余,体系就会失去流动性(其他国家想买美国出口但既没有黄金也没有美元),减少盈余。如果美国有国际收支赤字,黄金就会流出美国,美国无法有意义地增加公共债务或支出。
cladopa: 这根本不是收益。至少理论上:你开始有几吨黄金,最后你还是有同样几吨黄金。唯一真正的收益是你之前把黄金放在美国托管,美国随时可能在不告诉你的情况下挪用它,比如入侵格陵兰岛后,胁迫法国什么都不做。现在你获得了你自己东西的保管权。
shin_lao: 这篇文章写得很差。没有创造新财富。他们通过出售旧的、非标准的金条,购买同等重量符合新标准的金条,同时保持黄金总量不变。由于黄金价格上涨,这一操作让他们实现了 150 亿美元的资本收益,你不能说”我们把黄金搬回家并在搬运中赚了 150 亿”。简单说:你以 10 美元买了 x 黄金,很久以后你以 100 美元卖掉,你赚了 90 美元利润,然后你用 100 美元回购 x 黄金,回到同样的黄金敞口,但账本上有 90 美元利润。
6. The cult of vibe coding is dogfooding run amok
得分: 448 | 评论数: 379
💬 重要评论
semicolon_storm: 真的很奇怪,人们一直引用 Claude code 泄露源码的质量,好像这就能证明 vibe coding 不起作用。如果说有什么不同,这恰恰相反。它表明你可以违反所有传统关于”好”代码的规则,却构建出一个疯狂流行且成功的产品。
tombert: 我怀疑,如果人们看到许多、许多、许多产品日常使用的手写代码,他们会震惊。我在大公司和创业公司都工作过,很多糟糕的代码投入生产时我一开始就很震惊,但最后它还是能运行。截止日期,尽管我有时希望不是这样,但它确实存在。有时候你为了让客户或经理开心,不得不交付一个 hack,然后替换这些 hack 更好的代码永远不会发生。
lukev: 我喜欢这个框架,但它确实意味着整个开发商店或整个产品都应该建立在同一个层次上。例如,在我现在工作的应用程序中,某些算法新颖的部分是 0 级(我从 1 级开始,但这是一个极其困难的问题,AI 实际上带来的困惑比想法更多),而其他部分(大多数情况下是 UI)是 7 级。大多数中间件(状态管理、数据模型)介于两者之间。为给定部分识别适当的级别,IMO 就是整个游戏。
physicles: 我 10 岁就自学编程,30 年来从未停止。我真的很沮丧,过去想象构建东西需要花费的时间(10-30 分钟,取决于复杂度),总是被辛辛苦苦磨出来的时间(几天,有时几周)相形见绌。现在不再是这样了,这真的让人解放。所以现在的游戏就是学习如何以我享受的方式使用这些东西,更快,同时在重要的地方保持质量。一些有经验的高级工程师相信我说这是可能的,所以我要试试。
7. Employers use your personal data to figure out the lowest salary you’ll accept
得分: 420 | 评论数: 271
💬 重要评论
alexpotato: 很多年前,回去当公司还能问你之前薪酬的时候,一个招聘经理曾经对我说”永远不要在你之前薪酬上撒谎”。我当时不确定他们怎么能算出来,后来有人告诉我,许多公司做背景调查会查你的信用历史。这让他们可以获得过去的薪酬信息。这里的信息不对称,在谈判中,公司同时有你现在和过去的薪酬历史,而你只有你自己的。这相当疯狂。——这在纽约现在已经不允许了。
jakevoytko: 我的一个老邻居是猎头。他曾经告诉我,有些公司有绕过法律的技巧。你被雇佣后,你会签署一份文件说你同意员工手册中的所有政策。非常标准。其中一项公司政策是,你需要在谈判中证明你所说的任何先前工资。如果相差太远,他们可以直接解雇你。诀窍是,招聘过程中他们根本不问,你已经被雇佣并加入后,HR 才会安排会议向你解释这项政策。
endymi0n: 正确答案是:永远在你之前薪酬上撒谎。这是前进的唯一方法,不管怎样。
anonymars: 冻结你的数据 - The Work Number:https://employees.theworknumber.com/employee-data-freeze 据我理解,工资单把你的工资出售给 Equifax,然后 Equifax 再把它卖给其他人。
8. Battle for Wesnoth: open-source, turn-based strategy game
得分: 368 | 评论数: 93
💬 重要评论
jjmarr: 强烈建议如果你在美国有 C++ 工作岗位联系首席开发者 Charles Dang/Vultraz。他从 2012 年就是 Wesnoth 的开发者,但 2024 年才刚大学毕业。不幸的是,对于新毕业生来说,这是一个非常残酷的市场。即使他是最流行的开源 C++ 项目之一的维护者,也找不到工作。我再怎么推荐他都不为过。
wwilson: 谢谢,我们公司在 DC 地区,所以我已经发出了聊天邀请。Wesnoth 是一个不可思议的项目,我不敢相信他还没有找到编程工作。
EmeraldSky: 即使有 5 个(虽然很小)linux 内核补丁,2 个 Firefox 补丁… 雇主还是不感兴趣。我已经完全停止为开源做贡献了。我正在考虑转行。这很有趣,但这些天我需要一些投资回报,就我个人而言。
9. 81yo Dodgers fan can no longer get tickets because he doesn’t have a smartphone
得分: 326 | 评论数: 369
💬 重要评论
crazygringo: 根据我快速在线研究,他们变成纯数字季票是因为他们不希望人们转卖来获利。他们想要真正的季票长期球迷,所以现在如果你转卖太多场次他们可以追踪并封禁你。这本质上是反黄牛。你仍然可以在体育场买到单场比赛的纸质票。但季票不再提供了。显然,过去这些年他们一直为他破例,能够给他定制打印。今年他们决定不再提供例外。老实说,我不觉得这不合理。在某种程度上,你必须切断旧技术,因为几乎每个人都已经转向更好的东西。你再也不能通过邮寄附上支票来买票了。如果这个家伙能买得起季票(!),他买得起智能手机。他似乎就是喜欢纸质票的怀旧感。但那不再是保留单独售票流程的理由,就像他们一直做到现在。
tomwheeler: 也许这不是钱的问题。也许他就是不想拥有智能手机带来的负面后果。也许他有灵活性问题让使用智能手机变得困难。也许他不想安装入侵性的 app。也许他觉得纸质票更容易管理。也许他认识到供应商做出这个改变是以牺牲球迷利益为代价让自己受益,因为这让他们可以更好地控制转售市场。我自己有智能手机但更喜欢纸质票。幸运的是,我在支持的球队体育场仍然可以(并且确实)买到,虽然我必须亲自去取票。
moondance: 你有没有试过指导技术文盲的祖父母学习使用智能手机?这是一份永无止境的工作,对所有相关方来说都令人沮丧。现代移动 UX 设计没有考虑老年人的可访问性,它不断变化,需要不断重新学习。更不用说通常涉及的残疾和神经系统疾病。
10. What being ripped off taught me
得分: 316 | 评论数: 173
💬 重要评论
eckesicle: 我们也从艰难方式学到了这个教训。现在我们在每个项目中都要求这些条款:
- 发票收到后 X 天内付款,或者顾问解决任何质量问题后立即付款,以先到者为准
- 根据英国延迟付款立法,逾期付款将产生高于英国央行基准利率 8% 的利息和 100 英镑的滞纳金。部分付款适用于滞纳金、利息,然后是本金,顺序不能乱
- 如果由于客户逾期付款导致工作中断,顾问可以推迟交付截止日期,不承担任何责任
- 客户对 SWIFT 交易中产生的任何银行费用负责
- 争议发生时管辖权应为英格兰和威尔士。双方都不受仲裁约束
我们现在不再在交付内容下载链接分享,直到付款完成。他们只获得查看/评论链接用于报告/数据等。我们发现,不接受这些条款的客户无论如何都不会付款。我们根据客户的信用评级确定发票净额。讽刺的是,好客户通常会在 2-3 天内付款,难搞的客户就是”长尾”。大约 1% 的合同会全部或部分违约。在我们这个信用不佳的行业,由于客户逾期付款,我们平均延迟 23 天。那些我们停止交付的客户,平均比我们不停止交付的客户早 11 天付款。
eckesicle: 哦还有另一个教训!确保每张交付发票足够小,使其属于(英国它是 10,000 英镑)简化索赔程序,这大大简化了收款。当你发出”行动前信函”,发票通常会立即支付。你会破坏关系,但可以说,如果你走到这一步,你反正也不想要这个客户了。
avoidyc: 我在 SF 科技圈工作了 10 年,这么多年来,很多 YC 创始人都拖欠过我的工资。经常逾期,有五次,我根本没拿到钱,有一次几个月下来几千块,我差点闹上法院,但最后我还是认栽了。永远不要为 YC 创始人工作。
📊 趋势总结
今日 Hacker News Top 10 涵盖了多个领域:
- AI 开发工具 - Claude Code 二月更新引发社区争议,用户抱怨质量下降和思考深度减少;关于”vibe coding”的辩论引发广泛讨论
- 移动互联网 - 对强制 app 的抵制讨论, accessibility 对于老年用户的重要性
- 地缘金融 - 法国从美国运回最后一批黄金,通过重新计价获得 150 亿美元收益
- 人物调查 - 《纽约客》长篇调查 Sam Altman,讨论他是否应该掌控我们的未来
- 开源社区 - 资深开源贡献者难以找到工作,引发对行业就业市场的讨论
- 劳工权益 - 雇主使用个人数据判断你能接受的最低工资,引发隐私和谈判权力的讨论
🔍 关于 Hacker News
Hacker News 是由 Y Combinator 运营的技术社区网站,每天吸引大量程序员和创业者访问。其投票机制确保了高质量内容的曝光,是了解技术趋势和创新的重要平台。
数据来源: Hacker News API
生成时间: 2026-04-07 08:00:00