2026
26 posts
- 注意力机制中的 Index:从位置下标到预算检索
- KV Cache 的 Prefill、Decode、驱逐与量化:从缓存追加到误差形态
- DeepSeek-V4 的 KV 压缩:从删 token 误解到预算检索
- RoPE(旋转位置编码)讲义:从问题到工程实践
- Transformer / LLM 机制型论文写作素材库
- 机器学习理论论文 LaTeX 通用素材库
- 置顶通用领域学习一页纸:核心方法
- RL 对齐算法学习笔记:从 PPO 到 DAPO 的演进全景
- 强化学习自学教程:从表格方法到大模型对齐
- 代码拆解:oh-my-codex 是如何实现 Ralph Loop 的
- Transformer 逐层解剖:从 Token 到 Logits 的完整维度推导
- Transformer 的持续控制状态:KV Cache 与残差流如何塑造 Agent 决策
- Tool Call Dispatch:从 Normalize 到 Gateway Adapter 的统一分发设计
- Tool Gateway Runtime:代码中涉及的设计模式与架构模式
- Agent 系统设计:LLM 的固有缺陷与 Harness 工程实践
- CCContext 深度解析:Coding Agent 的运行内存与数据总线
- Harness Engineering:LangChain 不换模型、只改环境,从 Top 30 到 Top 5
- Attention 01:为什么需要 Attention
- Attention 02:从查资料直觉理解 Q K V
- Attention 03:单头注意力的完整计算流程
- Attention 04:为什么 QKᵀ 表示词与词的关系
- Attention 05:softmax 为什么会变成注意力权重
- Attention 机制完全指南:16 讲从直觉到工程
- ESTALE / StaleNetworkFileHandle Root Cause Analysis
- Orion × Buck2:mount_path 语义统一与验证闭环的深度复盘
- 系统设计哲学
2025
29 posts
- 年度文章总结
- 我的2025
- 谁在为 Claude Code 买单?解析 AI 时代的开发者价值再分配
- 深度复盘:Buck2 在 Antares/Dicfuse 挂载上的构建问题调试全记录
- 深度复盘:Buck2 SQLite xShmMap 与 OverlayFS Copy-up 故障
- 深度复盘:Dicfuse 测试超时问题调试全记录
- 深度复盘:FUSE 文件系统开发中的阻塞陷阱与异步优化
- 深度复盘:LightweightSandbox 竞态条件调试全记录
- ast-grep 源码阅读笔记
- Scorpio:基于 FUSE 的 Monorepo 虚拟文件系统
- Monorepo 详解:从理念到 Mega 实践
- IPC:进程间通信详解
- Claude Agent SDK 安全篇:权限、Hook 与 Sandbox
- Claude Code 工具系统:内置工具的实现剖析
- Claude Agent SDK vs Google ADK: 两种 Agent 开发范式的深度对比
- 2025 AI SDK 调研报告:从直连模型到 Agent 编排
- Claude Agent SDK 源码与实战(一):整体架构与快速上手
- E2B 源码分析(二):SDK 设计
- E2B 源码分析(一):架构总览与核心概念
- 翻译:Anthropic——打造高效 Agent 的实践指南
- Anthropic:Claude 高级工具使用详解
- 翻译:Anthropic——用 MCP 实现高效 Agent 的代码执行
- DeepSeek-V3.2:将思维过程整合到工具使用中
- Git Worktrees in AI ERA
- OpenAI:用 SAE 潜在归因调试模型对齐问题
- 翻译:OpenAI:A Practical Approach to Verifying Code at Scale
- 沙箱技术(一):从 chroot 到 Serverless/AI 的统一时间线
- Claude Code 生态项目整理
- Go Trace + PProf 性能分析理论(一)