系统设计
AI CodeReview AI CodeReview 架构 RAG RAG 架构 MCP MCP 架构 故障诊断实际场景 故障诊断实际场景 参考阅读 Vonng/ddia: 《Designing Data-Intensive Application》DDIA中文翻译 架构案例
TECHNICAL JOURNAL
AI CodeReview AI CodeReview 架构 RAG RAG 架构 MCP MCP 架构 故障诊断实际场景 故障诊断实际场景 参考阅读 Vonng/ddia: 《Designing Data-Intensive Application》DDIA中文翻译 架构案例
Basics Tokenization Byte-Pair Encoding (BPE) 根据模型参数和硬件能力初略估计耗时 float32 float16 bfloat16 fp8(2022 E4M3和E5M2) fp4(2025) 混合 …
在 Linux 性能观测中,Tracing 侧重于捕捉事件的因果顺序与详细流程,而 Profiling 侧重于统计资源的宏观消耗热点。二者相辅相成。 以下工具为工作中接触和使用过的。参考阅读中提供了更多工具和资源,供进一步探索。 内核与系统 …
Browse by topic
Latest writing
Claude code 安装 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 # 安装 nvm curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.0/install.sh | bash source ~/.bashrc nvm …
内存检测工具与实践:ASAN、Valgrind、手动实现、栈回溯
Google JSON 格式详解(兼容 Trace Viewer / Perfetto) 一、事件通用字段 google 的 trace-viewer 项目,合并到了 catapult 中,工具 perfetto 打算替换 Trace Viewer。 字段名 含义 备注 ph phase,事件类型 关键字段,决定事件 …
ELF文件格式详解,包括传统ELF和异构ELF(Fat Binary)的结构分析
系统架构设计师知识点
加载中...
MPI (Message Passing Interface) C/C++: mpi,h -> libmpi.so 编译:mpicxx -o test_mpi_cpp test_mpi.cpp -lmpi Fortran: mpif.h, 或者使用模板mpiuse mpi -> …
N卡 / A卡 / OpenCL 对比 Nvidia/CUDA AMD/HIP OpenCL Streaming Multiprocessor (SM) Compute Unit (CU) Compute Unit Thread Block Workgroup Work-group Shared Memory …
C++ 开发工作中积累的零散指令与技巧:性能分析、编译选项、ASAN、反汇编、动态链接调试等