吃糠咽菜

好记性不如烂笔头

是否曾想在咖啡馆、酒店或任何有网络的地方,像坐在自己书房一样操作家里的电脑?无论是访问重要文件、运行特定软件,还是进行远程维护,直接访问一台不在身边的计算机都是一个常见的需求。

传统方法(如公网 IP + 端口转发)配置复杂且有安全风险。本文将介绍一种极其简单且安全的组合方案:Tailscale + Windows 远程桌面,让你轻松实现稳定、高效的远程访问。

阅读全文 »

当下,大模型(Large Model)无疑是科技领域最炙手可热的话题。从 ChatGPT 的惊艳亮相到各类 AIGC 应用的层出不穷,我们每天都会接触到海量的新名词和新概念。为了帮助大家更好地理解这个日新月异的领域,本文梳理了一系列核心术语,希望能为你构建一个清晰的知识地图。

阅读全文 »

在之前的文章中我们了解到,RNN(及其变体如 LSTM、GRU)在处理序列数据时,必须按照时间步顺序计算,这导致其无法进行大规模并行计算。同时,它也难以解决长距离依赖的问题。

为了解决这两个核心痛点,一种全新的、不依赖于循环结构的模型——Transformer 横空出世。

阅读全文 »

卷积神经网络适合处理图片信息,那文字信息怎么办呢?首先要明白,对于计算机,或者说神经网络来说,文字都是要转换为数字之后再进行处理的。那么我们要面对的第一个问题就是:如何将文字转换为数字?

阅读全文 »

本文提供了一个完整、通用的 PyTorch 模型训练流程模板。它涵盖了从数据准备、模型构建、训练循环、测试评估到结果可视化的每一个关键步骤,是快速搭建深度学习项目的实用骨架。

阅读全文 »

PyTorch 为深度学习提供了强大的数据加载和可视化工具。掌握 DatasetDataLoaderTransformsTensorBoard 是高效训练模型的关键。本文将带你快速入门这四大核心组件。

阅读全文 »

本文尝试用一张图把 CUDA 从“硬件→内核→用户态驱动→工具包→深度学习框架”的完整链路讲清楚,并解释常见的版本不匹配问题与定位思路。即便没有 CUDA 基础,也可以按文中的检查顺序逐步排查。

阅读全文 »

不论你是写 C/C++、CUDA,还是要同时照顾 Linux/Windows/macOS,当项目走出“玩具”阶段,构建就会成为最大的摩擦源:不同编译器、不同 IDE、不同参数、不同依赖的发现与链接。如果还靠手写 Makefile 或分别维护 VS/Xcode 工程,成本会直线上升。

这正是 CMake 出现的原因:用一份跨平台的构建脚本,生成各平台各 IDE 需要的工程与命令。

阅读全文 »
0%