李理的博客

翻译:DeepSeek-V3 Explained 3: Auxiliary-Loss-Free Load Balancing

本文翻译DeepSeek-V3 Explained 3: Auxiliary-Loss-Free Load Balancing


翻译:DeepSeek-V3 Explained 2: DeepSeekMoE

本文翻译DeepSeek-V3 Explained 2: DeepSeekMoE


RoPE代码分析

本文介绍RoPE的不同代码实现。


翻译:DeepSeek-V3 Explained 1: Multi-head Latent Attention

本文翻译DeepSeek-V3 Explained 1: Multi-head Latent Attention


翻译:The Llama 3 Herd of Models

本文分析阅读The Llama 3 Herd of Models。


Huggingface Whisper代码阅读(一)

本文分析阅读Huggingface Whisper的代码。


CMake+OpenMPI环境

本文介绍openmpi的非root安装,并且在cmake中使用它。


《Hands-On Graph Neural Networks Using Python》学习


在两个远程服务器之间复制文件


Turning Whisper into Real-Time Transcription System

本文是论文Turning Whisper into Real-Time Transcription System的翻译。