cs231n spring 2017 lecture16 Adversarial Examples and Adversarial Training 听课笔记

（没太听明白，以后再听）

1. 如何欺骗神经网络？

　　这部分研究最开始是想探究神经网络到底是如何工作的。结果人们意外的发现，可以只改变原图一点点，人眼根本看不出变化，但是神经网络会给出完全不同的答案。比如下图，左边的熊猫被识别成熊猫，但是加上中间的小“噪音”一样的数值，右图的熊猫就识别不出来了。而且这个小“噪音”不是随机的，它更像是offset，是某种系统误差，叠加到图片上去，总是可以欺骗神经网络。

2. 神经网络从权重到输出的映射是非线性的，非常复杂，非常难优化、训练。但是从输入到输出的映射可以看成线性的，是可以预测的，优化出输入要比优化出权重容易得多。可以利用输入到输出的线性关系，很方便地生成可以欺骗（或者叫攻击）神经网络的样例。

　　FGSM (Fast Gradient Step Method)：一种对抗方法。这个方法的核心思想是在每一步优化的过程中加入少量噪声，让预测结果朝目标类别偏移，或者如你所愿远离正确的类别。

　　Transferability Attack：在自己的网络上找到攻击样例，这个样例往往也能攻破其他神经网络。

3. 对抗样例可以用来训练网络得到更好的效果。

4. 总结

时间： 2024-08-30 16:46:40

cs231n spring 2017 lecture16 Adversarial Examples and Adversarial Training 听课笔记的相关文章

cs231n spring 2017 lecture9 听课笔记

参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的shape:对于卷积层,输出的边长 =(输入的边长 - filter的边长)/ 步长 + 1,输出的通道数等于filter的数量.每个filter的通道数等于输入的通道数.卷积层的参数 = filter的长 * filter的宽 * 输入的通道数 * filter的数量.池化层没有需要学习的参数. 图中分成两个通

cs231n spring 2017 lecture7 听课笔记

1. 优化: 1.1 随机梯度下降法(Stochasitc Gradient Decent, SGD)的问题: 1)对于condition number(Hessian矩阵最大和最小的奇异值的比值)很大的loss function,一个方向梯度变化明显,另一个方向梯度变化很缓慢,SGD在优化过程中会震荡着下降,导致优化很慢.深度学习的网络会有上百万甚至更多的参数需要优化,在这个上百万维的空间里,更容易出现各个维度梯度变化差别很大的问题. 2)陷落在局部最小点或者鞍点(saddle point).

cs231n spring 2017 lecture11 听课笔记

1. Semantic Segmentation 把每个像素分类到某个语义. 为了减少运算量,会先降采样再升采样.降采样一般用池化层,升采样有各种"Unpooling"."Transpose Convolution"(文献中也叫"Upconvolution"之类的其他名字). 这个问题的训练数据的获得非常昂贵,因为需要一个像素一个像素的贴标签. 2. Classification + Localizatoin 一般用同一个网络,一方面得出分类,一

cs231n spring 2017 lecture8 听课笔记

1. CPU vs. GPU: CPU核心少(几个),更擅长串行任务.GPU有很多核心(几千个),每一个核都弱,有自己的内存(几个G),很适合并行任务.GPU最典型的应用是矩阵运算. GPU编程:1)CUDA,只能在英伟达:2)OpenCL类似CUDA,好处是可以跑在任何平台上,但相对慢一些.深度学习可以直接调用现成的库,不用自己写CUDA代码. 用cuDNN比不用快几倍. 深度学习的瓶颈可能不在GPU的运算,而在GPU和数据的通信上,解决办法是:1)把数据读入RAM:2)用SSD而不是HDD:

cs231n spring 2017 lecture12 听课笔记

这一节课很零碎. 1. 神经网络到底在干嘛? 浅层的是具体的特征(比如边.角.色块等),高层的更抽象,最后的全连接层是把图片编码成一维向量然后和每一类标签作比较.如果直接把图片和标签做像素级的最近领域分类,误差很大,但是转成编码之后就准多了. 可以用PCA可视化最后一层的特征,深度学习领域更高阶的做法是用t-SNE(Van der Maaten and Hinton, "Visualizting Data using t-SNE", JMLR 2008). 可视化非线性函数的激活值也可

cs231n spring 2017 lecture15 Efficient Methods and Hardware for Deep Learning 听课笔记

1. 深度学习面临的问题: 1)模型越来越大,很难在移动端部署,也很难网络更新. 2)训练时间越来越长,限制了研究人员的产量. 3)耗能太多,硬件成本昂贵. 解决的方法:联合设计算法和硬件. 计算硬件可以分为通用和专用两大类.通用硬件又可以分为CPU和GPU.专用硬件可以分为(FPGA和ASIC,ASIC更高效,谷歌的TPU就是ASIC). 2. Algorithms for Efficient Inference 1)Pruning,修剪掉不那么重要的神经元和连接.第一步,用原始的网络训练:第

[Paper Review]EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES,2015

Early attempts at explaining this phenomenon focused on nonlinearity and overfitting. We argue instead that the primary cause of neural networks’ vulnerability to adversarial perturbation is their linear nature. Linear behavior in high-dimensional sp

CS231n: Convolutional Neural Networks for Visual Recognition - Spring 2017

喜大普奔!!!!! CS231n 2017新鲜出炉啦!!!!! 课程主页:http://cs231n.stanford.edu/ 有讲义,有教案,有讲座,更重要的是--还有官方授课视频!!!!!意不意外?惊不惊喜?开不开心???!!!

Probabilistic Graphical Models 10-708, Spring 2017

https://www.cs.cmu.edu/~epxing/Class/10708-17/slides/lecture1-Introduction.pdf Computational and CS orientated => DK and NF's book Statistical and easier one => Jordan's book MLAPP => also a good book HWs => Theory, algorithm design and implem

猜你喜欢

PHP快速排序

直接快速排序非常简单 , 是冒泡排序的一种改进 , 是首个时间复杂度达到 O(nlogn) 的算法 , 最坏时间复杂度仍然是 O(n^2) , 它亦是 21 世纪十大最伟大的算法之一 . 快速排序有三 ...

LeetCode 542. 01 Matrix

输入:只包含0,1的矩阵输出:元素1到达最近0的距离算法思想:广度优先搜索. 元素为0为可达区域,元素为1为不可达区域,我们的目标是为了从可达区域不断地扩展至不可达区域,在扩展的过程中,也就计算出 ...

PYTHON之路(四)

迭代器装饰器 ( http://www.cnblogs.com/wupeiqi/articles/4980620.html ) @w1 --- > 执行w1, 把自己装饰的函数的函数名作为参数 ...

IOS程序的启动过程

1 main 方法的UIApplicationMain 创建应用程序代理对象(AppDelegate)对象 2 应用程序代理对象(AppDelegate)对象负责应用程序时间(激活. 进入后台 .进 ...

草，更有春风吹又生的耐力

和朋友吵架,你要求自己先去和好;被上司欺负,你还要求自己面带微笑.你说你不坚强,软弱给谁看?可是,你有没有发现,你的朋友都开始以为你大方宽容心地善良,却也因为这样,她们可以迟到爽约任性霸道,你却不可以 ...

一个例子深入理解ClassLoader

文件类加载器,该加载器重载了loadClass方法,逻辑是只读取文件来加载类,不委托给父类加载器进行加载 package com.ydd.study.hello.classloader; import ...

WPF入门教程系列(一) 创建你的第一个WPF项目

WPF入门教程系列(一) 创建你的第一个WPF项目 WPF基础知识快速学习绝不是从零学起的,良好的基础是快速入手的关键,下面先为大家摞列以下自己总结的学习WPF的几点基础知识: 1) C#基础语法知 ...

iPhone/iOS图片相关(读取、保存、绘制、其它相关)

http://blog.csdn.net/jerryvon/article/details/7526147 20:50:42 一.读取图片 1.从资源(resource)读取 [cpp] view p ...

ES6新特性学习（一）

一.什么是ES6 ECMAScript和JavaScript的关系 ECMAScript 6(以下简称ES6)是JavaScript语言的下一代标准,已经在2015年6月正式发布了.Mozilla公司 ...

[Compose] Isomorphisms and round trip data transformations

What is Isomorphisms?We have a value x, then apply function 'to' and 'from' to value 'x', the result ...

项目评价

5TH 各组作品ALPHA发布体会 1:俄罗斯方块组做了主要功能,这个项目我自己原来拿c语言做过一部分,感觉此游戏细节特别多,逻辑思维需要组织,以为我的水准来说,感觉做的挺好的. 2:连连看游戏虽然平 ...

提高效率的 Android Studio 技巧汇总

这是从Philippe Breault的系列文章<Android Studio Tips Of the Day>中提取出来的自认为精华的部分. 这些技巧在实际应用中能够非常大的提高工作效率 ...

唐诗宋词学习·95～99节

95. 上李邕大鹏一日同风起,扶摇直上九万里.假令风歇时下来,犹能簸却沧溟水. 时人见我恒殊调,闻余大言皆冷笑.宣父犹能畏后生,丈夫岂可轻年少. 96. 过旧宅新丰停翠辇,谯邑驻鸣笳.园荒一径 ...

js 鸭式辨型法

无意中看到arr.length === +arr.length;这句代码,然后就去了解了下这是一种鸭式辨型的判断方法. 鸭式辨型:像鸭子一样走路.游泳和嘎嘎叫的鸟就是鸭子这句话表示: a.arr有 ...

iOS开发多线程篇—基础知识 NSOperation

原文 http://www.cnblogs.com/dyf520/p/3807187.html -------NSOperation简介---- 1.NSOperation的作用 ·配合使用NSOp ...

【神经网络和深度学习】笔记 - 第三章如何提高神经网络学习算法的效果

文章导读: 1.交叉熵损失函数 1.1 交叉熵损失函数介绍 1.2 在MNIST数字分类上使用交叉熵损失函数 1.3 交叉熵的意义以及来历 1.4 Softmax 2. 过拟合和正则化 2.1 过拟合 ...

使用Python爬取腾讯房产的新闻，用的Python库：requests 、re、time、BeautifulSoup ????

import requests import re import time from bs4 import BeautifulSoup today = time.strftime('%Y-%m-%d' ...

Sql Server Profile 设置

设置新建跟踪模板将自己新建的跟踪模板,设置为默认,如图: 方法,菜单里点击文件 -> 模板 ->编辑模板 ,勾选"用作所选服务器类型的默认模板" 其他设置

message.go

package nsqd import ( "bytes" "encoding/binary" "fmt" ...

GeoHash

GeoHash Geohash is a latitude/longitude geocode system invented by Gustavo Niemeyer when writing the ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.