Ai路径 – 李又懂的极客空间

Transformer模型，自注意机制

2023-9-24 1:59

|

122

|

0

|

机器翻译,自然语言处理

406 字

|

2 分钟

序列计算中，传统的RNN在预测下一个符号（token）的时候，会对以往的历史信息有很强的依赖，使得难以充分地并行化，也无法很好地加深网络的层级结构。而对于传统的基于CNN的神经机器翻译模型，两个任意输入与输出位置的信号关联所需要的运算数量与它们的位置距离成正比，Facebook提出的CNNl NMT为线性增长。这两种常见的结构使得学习较远位置的依赖…

long-term dependency Multi-Head Attention RNN self-attention 注意力机制自注意机制

来自Google的Transformer模型

2023-9-24 1:56

|

99

|

0

|

机器翻译,自然语言处理

133 字

|

1 分钟内

Google的Transformer模型编码器，解码器传统的注意力机制及Multi-head attention 基于位置的单词编码，及词向量，输出层可视化multi-head attention Transformer与RNN和CNN神经翻译模型的对比 Google模型的训练细节优化器选择正则化 label smoothing 实战演示…

RNN 可视化注意力机制词向量

RNN网络架构

2023-9-12 23:39

|

98

|

0

|

Ai路径,神经网络

155 字

|

1 分钟内

传统的神经网络 RNN网络架构怎样在这个时间上一个前后的关系给它再联系在一起？在中间的Hidden Layer进行特征组合，输出一个结果如图，x2的结果带有x1，x1的结果带有x0，这样一层一层的最好xt的结果和前面的每一层都有关系。最后一步的输出，包含了前面所有过程的一个信息的总和本内容相关项目实战：项目实战：LSTM情感分析（基于Te…

RNN Tensor

pytorch安装过程太慢怎么办？换清华源

2023-9-10 18:29

|

99

|

0

|

Ai路径,Pytorch

215 字

|

2 分钟

在用conda安装软件的过程中还会经常遇到的一个问题，就是：软件太大老是下载中断我要下载一个软件，conda会告诉我这个软件底层依赖好几个其他的软件，需要将它们一起下载安装，这个时候这一大堆软件中可能有几个体量很大，上百MB，很容易下着下着网络连接就中断了，而conda有没有断点下载功能，一旦下载中断，conda就会终止安装进程退出运行这个问题…

pytorch

【Pytorch官网tutorial】1.4 TRANSFORMS

2023-9-10 0:41

|

100

|

0

|

Ai路径,Pytorch

771 字

|

4 分钟

数据并不总是以最终处理过的形式出现，而机器学习算法需要的是经过处理的数据。我们使用转换（transforms）对数据进行一些操作，使其适用于训练。所有的TorchVision数据集都有两个参数-transform和target_transform，用于接受包含转换逻辑的可调用对象，transform用于修改特征，target_transform用…

pytorch Tensor 对象张量索引

Jupyter怎么使用？

2023-9-04 20:00

|

95

|

0

|

Ai路径,Pytorch

40 字

|

几秒读完

方法1：打开Anaconda Prompt 激活环境进入jupyter 方法2：在PyCharm里新建一个.pynb文件，直接使用

Anaconda Jupyter

【Pytorch官网tutorial】1.3 DATASETS & DATALOADERS

2023-9-03 23:45

|

115

|

0

|

Ai路径,Pytorch

1184 字

|

11 分钟

TENSORS的官方网址：点击进入以下是内容笔记和相关翻译：处理数据样本的代码可能会变得杂乱且难以维护；理想情况下，我们希望数据集的代码与模型训练代码解耦，以提高可读性和模块化性。PyTorch提供了两个数据原语：torch.utils.data.DataLoader和torch.utils.data.Dataset，它们允许您使用预加载的数据…

DataLoader Dataset iter()next()plt.imshow()pytorch Tensor torch.randint()torch.utils.data.DataLoader torch.utils.data.Dataset 可视化可迭代对象基类字典字典变量对象张量构造函数标量梯度索引随机梯度下降

torch.randint()

2023-9-03 21:54

|

105

|

0

|

Ai路径,Pytorch

354 字

|

2 分钟

torch.randint()是PyTorch库中的一个函数，用于生成指定范围内的随机整数张量。下面是对torch.randint()的详细解释： torch.randint(high, size, dtype=None, layout=torch.strided, device=None, requires_grad=False) high：生成…

torch.randint()张量标量梯度索引

字典变量是什么

2023-9-03 21:30

|

83

|

0

|

Ai路径,Pytorch

313 字

|

2 分钟

字典是一种无序的、可变的数据类型，在Python中用花括号（{}）来表示。字典由一系列键（key）和对应的值（value）组成，每个键值对之间使用冒号（:）分隔，键和值之间使用逗号（,）分隔。字典中的键是唯一的，而值可以重复。字典的特点是可以通过键来快速地查找对应的值，这与列表和元组等序列类型不同。可以通过键来访问、修改和删除字典中的值，而不需要…

字典

预加载的数据集

2023-9-03 0:58

|

77

|

0

|

Ai路径,Pytorch

283 字

|

2 分钟

预加载的数据集是指在PyTorch领域库中提供的一些常用和经典的数据集，这些数据集已经预先加载并准备好供用户使用。这些数据集通常是用于图像识别、文本分类、语音处理等机器学习任务的基准数据集。 PyTorch提供了一系列预加载的数据集类，这些数据集类是torch.utils.data.Dataset的子类，实现了特定数据集的加载和预处理逻辑。这些数据…

Dataset

分类： Ai路径