PyTorch里面的torch.nn.Parameter()

在刷官方Tutorial的时候发现了一个用法self.v = torch.nn.Parameter(torch.FloatTensor(hidden_size)),看了官方教程里面的解释也是云里雾里，于是在栈溢网看到了一篇解释，并做了几个实验才算完全理解了这个函数。首先可以把这个函数理解为类型转换函数，将一个不可训练的类型Tensor转换成可以训练的类型parameter并将这个parameter绑定到这个module里面(net.parameter()中就有这个绑定的parameter，所以在参数优化的时候可以进行优化的)，所以经过类型转换这个self.v变成了模型的一部分，成为了模型中根据训练可以改动的参数了。使用这个函数的目的也是想让某些变量在学习的过程中不断的修改其值以达到最优化。

出现这个函数的地方

在concat注意力机制中，权值V是不断学习的所以要是parameter类型，不直接使用一个torch.nn.Linear()可能是因为学习的效果不好。
通过做下面的实验发现，linear里面的weight和bias就是parameter类型，且不能够使用tensor类型替换，还有linear里面的weight甚至可能通过指定一个不同于初始化时候的形状进行模型的更改。

做的实验

self.v被绑定到模型中了，所以可以在训练的时候优化

作者：VanJordan
链接：https://www.jianshu.com/p/d8b77cc02410
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

原文地址：https://www.cnblogs.com/jfdwd/p/11185050.html

时间： 2024-11-08 06:51:41

PyTorch里面的torch.nn.Parameter()的相关文章

[深度学习] Pytorch学习（二）—— torch.nn 实践：训练分类器（含多GPU训练CPU加载预测的使用方法）

Learn From: Pytroch 官方Tutorials Pytorch 官方文档环境:python3.6 CUDA10 pytorch1.3 vscode+jupyter扩展 #%% #%% # 1.Loading and normalizing CIFAR10 import torch import torchvision import torchvision.transforms as transforms batch_size = 16 transform = transform

PyTorch 1.0 中文文档：torch.nn.functional

译者:hijkzzz 卷积函数 conv1d torch.nn.functional.conv1d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) → Tensor 对由多个输入平面组成的输入信号进行一维卷积. 有关详细信息和输出形状, 请参见Conv1d. 注意在某些情况下, 当使用CUDA后端与CuDNN时, 该操作符可能会选择不确定性算法来提高性能. 如果这不是您希望的, 您可以通过设置torch.

PyTorch 1.0 中文文档：torch.nn.init

译者:GeneZC torch.nn.init.calculate_gain(nonlinearity, param=None) 返回给定非线性函数的推荐的增益值.对应关系如下表: 非线性函数增益 Linear / Identity Conv{1,2,3}D Sigmoid Tanh ReLU Leaky Relu 参数: nonlinearity – 非线性函数 (nn.functional 中的名字) param – 对应非线性函数的可选参数例子 >>> gain = nn.in

PyTorch学习笔记之nn的简单实例

method 1 1 import torch 2 from torch.autograd import Variable 3 4 N, D_in, H, D_out = 64, 1000, 100, 10 5 x = Variable(torch.randn(N, D_in)) 6 y = Variable(torch.randn(N, D_out), requires_grad=False) 7 8 # define our model as a sequence of layers 9 m

如何去除项目里面的SVN和CVS文件夹

SVN和CVS是我们常使用的项目版本管理工具,为我们的工作带来了很大的方便.但是,有时候我们需要删除里面的SVN和CVS文件夹. 1 如何快速的删除项目中的版本控制文件夹 (1) 删除项目中的SVN文件夹.我们可以使用bat脚本来实现快速递归删除,代码如下: @echo off echo Deleting SVN folders and files under: %1 REM Open Folder specified by parameter. cd %1 REM Recursive del

一探torch.nn究竟“What is torch.nn really?”

来自: https://pytorch.org/tutorials/beginner/nn_tutorial.html <What is torch.nn really?>这文章看起来不能再流畅了,看完就能了解pytorch的究竟. by Jeremy Howard, fast.ai. Thanks to Rachel Thomas and Francisco Ingham. 推荐入门pytorch必看. 原文地址:https://www.cnblogs.com/yjphhw/p/121491

Afianl框架里面的FinalBitmap加载网络图片

在Afianl框架里,FinalBitmap如何加载网络图片?有什么简单的方法吗?现在让麦子学院的android开发老师讲讲afina框架里面的finalbitmap加载网络图片的方法,Afinal里边FinalBitmap:用于显现bitmap图像,而无需思考线程并发和oom等疑问. 1.测验恳求运用页面翻开http://avatar.csdn.net/C/6/8/1_bz419927089.jpg"可以看到一张图像. 2.新建FinalBitmap目标 1 FinalBitmap bitm

函数的上下文就是函数里面的this是谁

规律1:函数用圆括号调用,函数的上下文是window对象比如小题目: function fun(){ var a = 888; alert(this.a); //实际上访问的是window.a } var a = 666; fun(); //弹出666 函数function fun(){}的上下文是什么!不要看它怎么定义,要看它怎么调用!!此时是fun()函数名加上圆括号直接调用,此时上下文就是window对象! 而我们知道:所有的全局变量都是window对象的属性,(注意:函数里面的局部变量

提取数据库字段里面的值，并改变+图片懒加载，jquery延迟加载

要求:手机端打开某个页面的详细信息,因为网速或者别的原因,响应太慢,因为图片大的原因,希望先进来,图片在网页运行的情况再慢慢加载(jquer延迟加载) http://www.w3cways.com/1765.html() 困难:因为页面的图片是用编辑器加进去的 :图片与文字存到数据库的字段中 :实现思路:从数据库中读取这个字段,把字段里面的src替换成lazyload 然后再返回给页面这里主要讲是怎么把从数据库取到的数据里面的字段里面的值替换然后与页面直接的数据转换首先 pu

猜你喜欢

vps搭建加密squid+stunnel

配置方法: 1. 一台运行在墙外的系统(CentOS 6.5) 2. 该服务器上安装squid 3. 改服务器上生成证书,使用加密方式代理 4. 墙内安装stunnel,可以是windows系统,也可 ...

guava复杂集合的运用

(String[] args) { PrepayTradeRecord ptr = PrepayTradeRecord()ptr.setPrepayAccId()PrepayTra ...

谷歌Cartographer学习（2）-原理阐述与源码解析

最近终于写完了毕业论文.想仔细研究下Cartographer.无奈自己学识有限,先看下网上大牛的解析,作一个汇总. 一.泡泡机器人原创专栏-cartographer理论及实践浅析 http://mp. ...

20145234黄斐《信息安全系统设计基础》第0周学习总结

博客读后感 “健身教练与学员的关系”这种师生关系的确是最能激发学习兴趣的方式,但是很遗憾,这是不可能的,无论如何.因为健身学员不会因为学的不好而挂科.补考,也不会因此而对未来的工作学习产生什么影响.所 ...

ListView加checkBox可以实现全选等功能

1.效果图 2.LIteView_item布局 <?xml version="1.0" encoding="utf-8"?> <Relativ ...

知问前端——Ajax提交表单

本文,运用两大表单插件,完成数据表新增的工作. 一.创建数据库创建一个数据库,名称为:zhiwen,表——user表,字段依次为:id.name.pass.email.sex.birthday.da ...

Entity Framework 4.1 - Code First 指定外键名称

Entity Framework 4.1 中,生成外键的方式有以下几种: 1-指定导航属性,会自动生成外键,命名规则为:“表名_主键名”2-默认情况下与导航属性的主键名称相同的字段会自动被标记为外键, ...

ActionContext.getContext()用法

为了避免与Servlet API耦合在一起,方便Action类做单元测试,Struts 2对HttpServletRequest.HttpSession和ServletContext进行了封装,构造了 ...

扩展方法使用

上篇说道扩展方法的简单介绍,这里就说继续上篇说下使用方法. 扩展方法能够帮助我们向现有类型中加入方法.来符合我们的须要.比如我们能够用扩展方法向string类中加入一个IsValidEmailAddr ...

IntelliJ IDEA: maven & jetty 开发 java web

之前使用eclipse + maven + jetty开发java web应用,本着no zuo no gain的想法, 折腾了一下Intellj idea下开发环境的搭建,顺带学习了maven re ...

vue-路由-多层

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

哈佛结构与冯.诺依曼结构

1. 哈佛结构及其主要特征: 哈佛结构是一种存储器结构.使用哈佛结构的处理器有:AVR.ARM9.ARM10.ARM11等.目前使用哈佛结构的中央处理器和微控制器有很多,除了Microchip公司的P ...

让viewpager不能滑动

1.实现原理: 自定义viewpager,重写onTouchEvent方法,什么触摸事件都不响应即可让viewpager不能滑动. 2.代码如下 public class NoScrollViewPa ...

栈的一些基本操作

#include<iostream>#include<algorithm>#include<cstring>#include<vector>#inclu ...

python通过get方式,post方式发送http请求和接收http响应-urllib urllib2

python通过get方式,post方式发送http请求和接收http响应-- import urllib模块,urllib2模块, httplib模块 http://blog.163.com/[em ...

js判断map是否为空

在HTML页面要判断后台传来的map是否为空,无论有没有内容,在fireBug中始终显示obj{...}, <table class="table table-hover list-t ...

怎样完成自己的博士生涯

怎样完成自己的博士生涯在北大期间,经常和许多师弟师妹交流,常碰到有人问这个问题.昨日,完成了答辩后终于获得了理学博士学位,也决定休息一天就这个问题好好写一篇文章. 我与许多博士研究生有过交流,也从自 ...

00.mp4v2工具的用法

1.交叉编译mp4v2库# ./configure --prefix=/usr/local/mp4v2-2.0.0 --host=arm-hisiv300-linux CC=arm-hisiv300 ...

清蒸个ajax螃蟹

作为前端集大成者的ajax技术,此处应该大写AJAX Asynchronous JavaScript and XML(异步的 JavaScript 和 XML),呵呵.... 今天就做了这只螃蟹, 螃 ...

记账依据

一.账务部门账簿 1.总账P35 涉及岗位:主办会计记账依据:科目汇总表: 凭证字号:汇XXX 2.日记账.明细账P36: 涉及岗位:出纳.主办会计.购进账组.销售账组.费用账组记账依据:记账凭证 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.