Page 2 - Showing 8 of 43 posts
View all posts by years →
- Attention 03:单头注意力的完整计算流程
从一个 3 词短句出发,手推 Attention 公式的每一步维度和数值。
35 min zh-CN - Attention 05:softmax 为什么会变成注意力权重
非负、归一化、放大差异但不绝对独占——softmax 如何把分数变成信息分配比例。
36 min zh-CN - Attention 机制完全指南:16 讲从直觉到工程
一套完整的 Attention 学习路径,覆盖直觉、公式、变体和工程实现。
6 min zh-CN - ESTALE / StaleNetworkFileHandle Root Cause Analysis
深入分析 ESTALE (errno 116, StaleNetworkFileHandle) 错误在 Antares/Dicfuse 虚拟文件系统中的根本原因、触发链路及修复方案。涵盖 libfuse-fs 的 open_by_handle_at 机制、Dicfuse 目录刷新逻辑,以及短期缓解与长期修复策略。
7 min - Orion × Buck2:mount_path 语义统一与验证闭环的深度复盘
从 .buckconfig 缺失导致 Cell Resolver 失败,到 mount_path 语义一致化改造的全过程记录
30 min - 系统设计哲学
把系统当作一套“维持不变量的制度”,而不是一堆“实现功能的代码”。
21 min - 年度文章总结
pg
27 min - 我的2025
记录我的2025年
1 min