Blog Math Roadmap Murmurs Photos Projects Links About

Back

Archives

`2026`

42 posts

Jun 7, 2026

形式化建模：RL 是当前策略分布上的 reward-tilting 与 KL 正则投影
Jun 6, 2026

形式化建模：SFT 是外部数据分布上的前向 KL 投影
May 24, 2026

注意力熵与动态拓扑：从信息路由到隧道视野
May 24, 2026

Softmax 的几何本质：从相对优势到概率单纯形
May 21, 2026

Post-LN Transformer 为什么需要 Warmup？
May 21, 2026

从谱半径到随机 Jacobian 连乘
May 15, 2026

从普通 RL 到 GRPO
May 14, 2026

从 REINFORCE 到 PPO
May 13, 2026

高斯策略
May 11, 2026

正态分布公式的理论推导
May 10, 2026

理解 GRPO 的 7 个元维度
May 9, 2026

从极大似然到最小二乘
May 7, 2026

LASSO 教材
May 7, 2026

数学工具集合
May 7, 2026

数学工具 2：Ridge 问题
May 7, 2026

SAE 深入理解：从 Superposition 到机制诊断
May 2, 2026

注意力机制中的 Index：从位置下标到预算检索
May 2, 2026

KV Cache 的 Prefill、Decode、驱逐与量化：从缓存追加到误差形态
Apr 30, 2026

DeepSeek-V4 的 KV 压缩：从删 token 误解到预算检索
Apr 28, 2026

RoPE（旋转位置编码）讲义：从问题到工程实践
Apr 28, 2026

机器学习理论论文 LaTeX 通用素材库
Apr 28, 2026

Transformer / LLM 机制型论文写作素材库
Apr 27, 2026

通用领域学习一页纸：核心方法
Apr 15, 2026

RL 对齐算法学习笔记：从 PPO 到 DAPO 的演进全景
Apr 8, 2026

强化学习自学教程：从表格方法到大模型对齐
Apr 2, 2026

代码拆解：oh-my-codex 是如何实现 Ralph Loop 的
Mar 24, 2026

Transformer 逐层解剖：从 Token 到 Logits 的完整维度推导
Mar 23, 2026

Transformer 的持续控制状态：KV Cache 与残差流如何塑造 Agent 决策
Mar 18, 2026

Tool Call Dispatch：从 Normalize 到 Gateway Adapter 的统一分发设计
Mar 18, 2026

Tool Gateway Runtime：代码中涉及的设计模式与架构模式
Mar 17, 2026

Agent 系统设计：LLM 的固有缺陷与 Harness 工程实践
Mar 17, 2026

CCContext 深度解析：Coding Agent 的运行内存与数据总线
Mar 17, 2026

Harness Engineering：LangChain 不换模型、只改环境，从 Top 30 到 Top 5
Mar 16, 2026

Attention 01：为什么需要 Attention
Mar 16, 2026

Attention 02：从查资料直觉理解 Q K V
Mar 16, 2026

Attention 03：单头注意力的完整计算流程
Mar 16, 2026

Attention 04：为什么 QKᵀ 表示词与词的关系
Mar 16, 2026

Attention 05：softmax 为什么会变成注意力权重
Mar 16, 2026

Attention 机制完全指南：16 讲从直觉到工程
Jan 31, 2026

ESTALE / StaleNetworkFileHandle Root Cause Analysis
Jan 23, 2026

Orion × Buck2：mount_path 语义统一与验证闭环的深度复盘
Jan 6, 2026

系统设计哲学

`2025`

29 posts

Dec 27, 2025

年度文章总结
Dec 26, 2025

我的2025
Dec 19, 2025

谁在为 Claude Code 买单？解析 AI 时代的开发者价值再分配
Dec 17, 2025

深度复盘：Buck2 在 Antares/Dicfuse 挂载上的构建问题调试全记录
Dec 17, 2025

深度复盘：Buck2 SQLite xShmMap 与 OverlayFS Copy-up 故障
Dec 15, 2025

深度复盘：Dicfuse 测试超时问题调试全记录
Dec 15, 2025

深度复盘：FUSE 文件系统开发中的阻塞陷阱与异步优化
Dec 13, 2025

深度复盘：LightweightSandbox 竞态条件调试全记录
Dec 11, 2025

ast-grep 源码阅读笔记
Dec 11, 2025

Scorpio：基于 FUSE 的 Monorepo 虚拟文件系统
Dec 9, 2025

Monorepo 详解：从理念到 Mega 实践
Dec 9, 2025

IPC：进程间通信详解
Dec 6, 2025

Claude Agent SDK 安全篇：权限、Hook 与 Sandbox
Dec 6, 2025

Claude Code 工具系统：内置工具的实现剖析
Dec 6, 2025

Claude Agent SDK vs Google ADK: 两种 Agent 开发范式的深度对比
Dec 5, 2025

Claude Agent SDK 源码与实战（一）：整体架构与快速上手
Dec 5, 2025

2025 AI SDK 调研报告：从直连模型到 Agent 编排
Dec 4, 2025

E2B 源码分析（二）：SDK 设计
Dec 4, 2025

E2B 源码分析（一）：架构总览与核心概念
Dec 3, 2025

翻译：Anthropic——打造高效 Agent 的实践指南
Dec 3, 2025

Anthropic：Claude 高级工具使用详解
Dec 3, 2025

翻译：Anthropic——用 MCP 实现高效 Agent 的代码执行
Dec 3, 2025

DeepSeek-V3.2：将思维过程整合到工具使用中
Dec 3, 2025

Git Worktrees in AI ERA
Dec 3, 2025

OpenAI：用 SAE 潜在归因调试模型对齐问题
Dec 3, 2025

翻译：OpenAI：A Practical Approach to Verifying Code at Scale
Dec 3, 2025

沙箱技术（一）：从 chroot 到 Serverless/AI 的统一时间线
Nov 30, 2025

Claude Code 生态项目整理
Jan 7, 2025

Go Trace + PProf 性能分析理论（一）

Moe ICP 114514 • Travelling

© 2026 Jerry & Site Policy

Astro & Pure theme powered