在过去的科研、竞赛,日常学习中多多少少接触了一点Pytorch,算是有一点点基础,但是很多知识不成体系,于是为了加深自己在AI方向的基础素养,趁着有时间再系统学习一下Pytorch 水平有限,如有错误,多多指正! 仓库链接github 数据加载数据加载主要使用两个类: Dataset:负责将数据文件从操作系统的文件系统(外存)中读取出来; Dataloader:负责将数据文件组织成一定的形式,例如batch,用来训练;这两个类共同实现了将存储在文件系统中的数据,提供给模型进行训练的功能,属于前后协作; 此外一个数据一般有: 数据本身; label;对于前...
我在大学三年级的秋季学期选修了数据库系统导论这门课程,这篇blog用来记录:1)我对于相关知识点复习的梳理;2)一些习题;3)考试的重点 复习梳理复习梳理≠照搬原文,内容阐释点到为止,最重要的是达成两个目的1)梳理整体知识脉络,形成框架;2)标记重点,便于回到资料中复习;所以最后阶段的背诵记忆,应该用这份梳理为参考结合老师的资料进行 期末:1)过一遍要背的;2)练习时间多关注关系代数、SQL、综合分析(关系数据理论); 绪论这一章主要有4个部分,从前往后,1)在数据库系统概述中了解了与数据库有关的基本概念;2)在此基础上,为了把现实世界中的事物抽象为数据...
这篇blog用来记录我于大三秋季学期,学习操作系统时,了解到的知识,以备复习以及增强自己的专业素养 操作系统的基本概念L1操作系统需要解决的问题操作系统的功能? 作为用户与计算机硬件系统之间的接口(例如上层的编程者使用系统调用完成相关工作) 对计算机系统资源进行管理(eg. 管理硬件CPU、存储器、外设,管理软件程序、数据;管理资源状态,如PCB、TCB;采取相关策略,对资源分配、回收等) 在需要的时候马上对计算机资源进行抽象(通过逻辑功能扩展物理功能,如在裸机上附加外设管理、文件管理、存储管理、处理器管理) 一些启发的问题: 直接使用计算机是很不方便的...
期末复习,知识点记录 传输层端口号的作用;在TCP、UDP中的使用(SOCKET嵌套字);熟知端口号范围;端口号的独立性; 传输层的功能;传输层复用和分用的体现;TCP与UDP差错检测的区别;传输层向应用层提供的两种服务的特点 常见应用层协议使用的传输层端口号:HTTP、FTP、TFTP、DNS;TELENT、SMTP;SNMP 有连接的传输、无连接的传输;可靠的传输、不可靠的传输; UDP首部格式(8B);伪首部的格式(12B);UDP校验和计算方式(伪首部,0,17);UDP使用校验和检错; UDP与TCP的对比:1)首部长度2)是否支持报文的拆分、...
这篇blog用来记录我在大学三年级的秋季学期,选修计算机图形学时学到的专业知识,以备增强自己的专业素养以及应对后续考核 光栅化引入: 到目前为止我们完成了: 1)模型变换-放置好了物品; 2)视图变换-放置好了相机; 3)投影变换-得到了标准空间下的图像信息; 下一步我们需要考虑: 如何将图像显示在屏幕上? 视口变换; 一些基础概念 屏幕: 1)由像素构成,计算机将其抽象为数组进行管理; 2)数组的大小对应分辨率; 3)屏幕是典型的光栅化显示; 光栅:Raster,即德语中的屏幕; 光栅化:Rasterize,画在屏幕上; 像素:Pixel,具有颜色的小...
随着大学课程的进行,每学期总是会被要求搭建各种各样的运行环境,但在学习完成之后通常我不会再用到它们,所以用这篇blog来记录我搭建过的一些环境,简单描述它们的过程,以便我后续能记得我做过哪些改动,从而可以更好地管理我的电脑空间。 default我在Mac上安装了命令行工具、Vscode,配置了C/C++的基本环境(参照[bilibili]) 于是这一部分我想记录一些命令行常用命令 查看当前目录的大小du -sh .,这个命令会显示磁盘使用情况,包括当前目录以及所有子目录 搭建hexo(Mac) 从github上clone了homebrew的仓库...
这篇blog用于记录我使用python对学习向量量化这种聚类算法的复现 算法简介学习向量量化也成为LVQ(Learning Vector Quantization),同样属于原型聚类算法,类似于k-means通过希望划分的簇的数量求得相同数量的“簇中心”并以此为原型将数据集划分为对应的簇,LVQ通过求得与希望划分的簇数量相同的“原型向量”,并以此来将数据集划分为对应的簇。 如果说k-means也同样是借助原型向量的话,那么关键就在于两种算法更新原型向量的方法不同。k-means是不断的用原型向量划分簇,又用簇更新原型向量;LVQ则是利用样本的预先标注作为...
这篇blog用来记录数学建模中常用的算法,针对不同问题进行叙述 数据预处理常用算法速览 拉格朗日插值法和牛顿插值法:补足数据中的缺失值; 正态分布$3\sigma$原则、箱型图:检测数据中的异常值; 标准差法、极值差法、功效系数法:对数据进行归一化处理; 独热编码、标签编码:数据中存在分类变量; 等宽法、等频法、聚类方法:连续变量离散化; PCA主成分分析、T-SNE降维算法、UMAP降维法:数据变量维度过高,需要对数据进行降维处理; 应用背景举例好理解的例子直接给出问题,一些可能不好直接理解的例子给出简单的解释。现有的方法体系足够丰富,关键在于提出?问...
简介高斯混合聚类不同于k-means、LVQ利用原型向量刻画聚类结构,而是利用概率来刻画聚类结构。 简单来说,这种算法认为数据集中的每个样本都符合一个多元高斯分布(多元的原因是样本常是多元向量),如下 所有的样本共同符合“混合高斯分布”。混合高斯分布对应的概率密度函数是所有多元高斯分布密度函数的加权量。 多元高斯分布若$x$服从多元高斯分布,对应概率密度函数为 $p(x) = \frac{1}{(2\pi)^{\frac{n}{2}}\lvert \Sigma \rvert^{\frac{1}{2}}}e^{-\frac{1}{2}(x-\mu...
这篇文献的原名是《Multi-Task Learning as a Bargaining Game》,这是我第一次尝试直接通篇阅读英文原文的文献,中间或许会遇到许多困难。我通过这篇blog来记录阅读的过程中遇到的概念,以及简单地对文章整体的脉络进行梳理。最终我希望对论文提到的算法进行复现,这篇blog将会是一个参考。 概念部分这一部分用于记录阅读时遇到的概念型词汇,并做一些补充解释。困难在于,有的词汇我并不清楚是否是概念型的专业词汇,亦或是只需理解表面含义的词汇... gradients梯度,包含某函数相对自身所有自变量的偏导数。 对于损失函数$L$梯度...