Zihao Li

了解Diffusion Language Model

Posted on 2025-10-25 Edited on 2026-05-13 In AI Word count in article: 1.8k Reading time ≈ 3 mins.

我们熟悉的 Transformer 等模型采用“自回归”方式逐词生成文本，这限制了生成速度且不易保证长文本连贯。受图像生成领域成功的 扩散模型 (Diffusion Model) 启发，研究者将其引入文本生成，扩散语言模型 (Diffusion Language Model) 应运而生。

内网穿透与远程桌面：用 Tailscale 随时随地访问你的 Windows

Posted on 2025-10-16 Edited on 2026-05-13 In 技术工具 , 系统运维 Word count in article: 4.4k Reading time ≈ 8 mins.

是否曾想在咖啡馆、酒店或任何有网络的地方，像坐在自己书房一样操作家里的电脑？无论是访问重要文件、运行特定软件，还是进行远程维护，直接访问一台不在身边的计算机都是一个常见的需求。

传统方法（如公网 IP + 端口转发）配置复杂且有安全风险。本文将介绍一种极其简单且安全的组合方案：Tailscale + Windows 远程桌面，让你轻松实现稳定、高效的远程访问。

大模型百词

Posted on 2025-10-11 Edited on 2026-05-13 In AI Word count in article: 4.1k Reading time ≈ 7 mins.

当下，大模型（Large Model）无疑是科技领域最炙手可热的话题。从 ChatGPT 的惊艳亮相到各类 AIGC 应用的层出不穷，我们每天都会接触到海量的新名词和新概念。为了帮助大家更好地理解这个日新月异的领域，本文梳理了一系列核心术语，希望能为你构建一个清晰的知识地图。

了解Transformer

Posted on 2025-10-10 Edited on 2026-05-13 In AI , 深度学习 Word count in article: 1.4k Reading time ≈ 3 mins.

在之前的文章中我们了解到，RNN（及其变体如 LSTM、GRU）在处理序列数据时，必须按照时间步顺序计算，这导致其无法进行大规模并行计算。同时，它也难以解决长距离依赖的问题。

为了解决这两个核心痛点，一种全新的、不依赖于循环结构的模型——Transformer 横空出世。

了解RNN

Posted on 2025-10-10 Edited on 2026-05-13 In AI , 深度学习 Word count in article: 1.7k Reading time ≈ 3 mins.

卷积神经网络适合处理图片信息，那文字信息怎么办呢？首先要明白，对于计算机，或者说神经网络来说，文字都是要转换为数字之后再进行处理的。那么我们要面对的第一个问题就是：如何将文字转换为数字？

pytorch train 模板

Posted on 2025-10-08 Edited on 2026-05-13 In AI , PyTorch Word count in article: 9.2k Reading time ≈ 17 mins.

本文提供了一个完整、通用的 PyTorch 模型训练流程模板。它涵盖了从数据准备、模型构建、训练循环、测试评估到结果可视化的每一个关键步骤，是快速搭建深度学习项目的实用骨架。

pytorch入门

Posted on 2025-10-07 Edited on 2026-05-13 In AI , PyTorch Word count in article: 4.7k Reading time ≈ 9 mins.

PyTorch 为深度学习提供了强大的数据加载和可视化工具。掌握 Dataset、DataLoader、Transforms 和 TensorBoard 是高效训练模型的关键。本文将带你快速入门这四大核心组件。

CUDA 软件栈

Posted on 2025-09-19 Edited on 2026-05-13 In CUDA Word count in article: 9.3k Reading time ≈ 17 mins.

本文尝试用一张图把 CUDA 从“硬件→内核→用户态驱动→工具包→深度学习框架”的完整链路讲清楚，并解释常见的版本不匹配问题与定位思路。即便没有 CUDA 基础，也可以按文中的检查顺序逐步排查。

eBPF 入门：原理、程序类型与上手实践

Posted on 2025-09-11 Edited on 2026-05-13 In 系统内核 , 计算机网络 Word count in article: 5.5k Reading time ≈ 10 mins.

为什么近几年大家都在谈 eBPF？一句话：在不改内核源码的前提下，把“小而安全”的代码段挂到内核关键路径里运行，从而获得接近内核旁路的性能，同时保留 Linux 内核栈的安全与可维护性。

CMake 入门

Posted on 2025-09-07 Edited on 2026-05-13 In 开发工具 Word count in article: 3.9k Reading time ≈ 7 mins.

不论你是写 C/C++、CUDA，还是要同时照顾 Linux/Windows/macOS，当项目走出“玩具”阶段，构建就会成为最大的摩擦源：不同编译器、不同 IDE、不同参数、不同依赖的发现与链接。如果还靠手写 Makefile 或分别维护 VS/Xcode 工程，成本会直线上升。

这正是 CMake 出现的原因：用一份跨平台的构建脚本，生成各平台各 IDE 需要的工程与命令。