我终于看懂了 Attention 是怎么计算的
·
观察 Attention 的数据流动
欢迎来到我的个人博客
观察 Attention 的数据流动
分词器
什么是 LLM 推理
本人从事 GPU 性能分析工具开发工作,希望系统性学习一些原理,而不是浮于表面,故搜寻如下资料
决定开始写博客,不弃坑
大模型面经
深入浅出解析 GPU 显存的硬件架构与软件逻辑
2026 年的规划
个人认为程序员不应该弄混的概念
从初学者角度了解什么是大语言模型
了解流式多处理器的架构
GPU 是如何执行的
调研各个框架的 tensor 实现,思考如何实现一个简单的 tensor
LLM Agent 基础架构
CUDA 究竟是什么?
决定开始写博客,不弃坑