吃糠咽菜

好记性不如烂笔头

今天来看一下 NVIDIA GPU 的中间表示(PTX)指令。我们以 ld(load)指令为主线,把 PTX 语法GPU 存储层次/缓存/一致性 串起来理解。

阅读全文 »

写 LaTeX 和用 Word 最大的区别在于:它更像是在写代码。既然是代码,就少不了编译环节。从一个 .tex 文本文件到一个精美的 PDF,中间到底发生了什么?为什么有那么多不同的编译命令(pdflatex, xelatex, lualatex)?

这篇笔记带你快速厘清 LaTeX 的编译流程,从此告别盲试编译器的痛苦。

阅读全文 »

最近购入了台17年12寸的 macbook,想着体验一下mac生态,但是熟悉之后感觉确实不错。尤其是 Command 键的位置和用法,但是切换回 Windows 的时候就不太顺畅了。于是就想写一个脚本,实现键位映射。但是用mac RDP win的时候发现这些映射又容易出问题,于是想办法搞成动态映射来解决这个问题。

阅读全文 »

选择合适的优化器以及理解其背后的参数,往往决定了模型是能够快速收敛到最佳状态,还是在训练过程中产生“梯度爆炸”甚至完全无法收敛。本文将通俗地解释这些概念,并深入剖析 PyTorch 中常用优化器的关键参数。

阅读全文 »

本文主要介绍实模式(Real Mode)的基本概念、主要特性,以及其在x86架构启动流程中的作用。通过理解实模式,可以帮助大家更好地理解现代操作系统为何要经历“实模式→保护模式→长模式”等阶段,以及16位、20位寻址等历史遗留问题的成因。

阅读全文 »

想彻底搞懂“翻墙”背后的技术原理?从 VPN 到 TUN 模式,带你硬核拆解网络数据的“隐形隧道”。

阅读全文 »

想快速看懂“上电到操作系统启动”这段黑屏时间到底发生了什么?

阅读全文 »

在计算机科学领域,有一个悬赏一百万美元的世纪难题,它就是“P=NP?”问题。这个问题非常重要,它关系到计算机的算力极限,也和我们生活中的很多问题(如密码学、物流规划、人工智能等)息息相关。

阅读全文 »

我们熟悉的 Transformer 等模型采用“自回归”方式逐词生成文本,这限制了生成速度且不易保证长文本连贯。受图像生成领域成功的 扩散模型 (Diffusion Model) 启发,研究者将其引入文本生成,扩散语言模型 (Diffusion Language Model) 应运而生。

阅读全文 »

是否曾想在咖啡馆、酒店或任何有网络的地方,像坐在自己书房一样操作家里的电脑?无论是访问重要文件、运行特定软件,还是进行远程维护,直接访问一台不在身边的计算机都是一个常见的需求。

传统方法(如公网 IP + 端口转发)配置复杂且有安全风险。本文将介绍一种极其简单且安全的组合方案:Tailscale + Windows 远程桌面,让你轻松实现稳定、高效的远程访问。

阅读全文 »
0%