吃糠咽菜

好记性不如烂笔头

想在不改用户代码的前提下“看见”每条 GPU 指令如何执行?NVBit 是 NVIDIA 开源的“轻量级 CUDA 指令级动态插桩框架”。本文以“能上手能采样”为目标,从 GPU 并行模型 → CUDA 基础 → PTX/SASS → Linux 注入机制 → NVBit API,总结一份可直接套用的插桩笔记。

阅读全文 »

想把 CUDA 程序里的“越界读写、未初始化、数据竞争、Barrier 不匹配”这类顽固 Bug 一网打尽?Compute Sanitizer(前身 cuda-memcheck)就是你的第一生产力工具。本文以“能上手能排错”为目标,按难度循序渐进,从最小示例、常见报错,到命令参数与协同工具给出一份“即插即用”的参考。

阅读全文 »

想在大型项目里写出“既优雅又不掉坑”的 Python?本文用 抽象基类 → 生成器 → 类型提示 → 模块组织 四步,给你一套可复用的工程骨架。

阅读全文 »

想在一张图看懂 GPU 的线程组织与内存层次?本文用表格 + Mermaid 图 + 代码示例,3 分钟带你摸清 Kernel、Warp、合并访存与 bank 冲突的底层逻辑。

阅读全文 »

如果把 CPU 比作“多才多艺的总管”,GPU 更像“高效的流水线工厂”:CPU 擅长复杂分支与少量任务的低延迟处理,GPU 擅长大量相同/相似任务的高吞吐处理。本文先给出关键概念,再用 CPU 对比串起 GPU 的架构、执行模型、内存层次与性能要点。

阅读全文 »

如果把发行版比作操作系统的“应用商店”,包管理器就是开发与运维最常用的“装、删、查、管”工具。本文从概念到实操、从单机到团队,给出一份可以落地的学习大纲与命令速查,帮助你跨发行版高效工作。

阅读全文 »

在数字世界中,我们渴望两全其美:既想要信息传输绝对安全,又追求其过程畅快高效。若把数据加密比作锁门,我们面临一个两难选择:

  • 对称加密像一把普通的房门钥匙:开锁和上锁都用同一把,速度飞快,但把这把唯一的钥匙安全地交给远方的朋友却成了一个大难题。
  • 非对称加密则像一个银行保险箱:对外提供一个只能存东西的“公钥”(存款口),而取东西的“私钥”(保险箱钥匙)则由自己牢牢保管。它完美解决了密钥分发问题,但操作起来却相对“笨重”,处理大量数据时效率不高。

有没有一种方法,能让我们同时拥有对称加密的“快”和非对称加密的“稳”呢?答案是肯定的,这就是我们今天要探讨的主角——混合加密 (Hybrid Encryption)

阅读全文 »
0%