深度学习5-4-9模型

引用：https://yq.aliyun.com/articles/603116

5步法：

构造网络模型
编译模型
训练模型
评估模型
使用模型进行预测

4种基本元素：

网络结构：由9种基本层结构和其他层结构组成
激活函数：如relu, softmax。口诀: 最后输出用softmax，其余基本都用relu
损失函数：categorical_crossentropy多分类对数损失，binary_crossentropy对数损失，mean_squared_error平均方差损失，mean_absolute_error平均绝对值损失
优化器：如SGD随机梯度下降, RMSProp, Adagrad, Adam, Adadelta等

9种基本层网络结构：

3种主模型：

全连接层Dense，
卷积层conv1d、conv2d，
循环层lstm，gru

3种辅助层：

Activation层，
Dropout层，
池化层

3种异构网络互联层：

嵌入层：用于第一层，输入数据到其他网络的转换
Flatten层：用于卷积层到全连接层之间的过渡
Permute层：用于RNN与CNN之间的接口

引用：https://yq.aliyun.com/articles/603116

原文地址：https://www.cnblogs.com/cekong/p/10237396.html

时间： 2024-11-05 22:57:40

深度学习5-4-9模型的相关文章

时间序列深度学习：状态 LSTM 模型预测太阳黑子

时间序列深度学习:状态 LSTM 模型预测太阳黑子本文翻译自<Time Series Deep Learning: Forecasting Sunspots With Keras Stateful Lstm In R> 原文链接由于数据科学机器学习和深度学习的发展,时间序列预测在预测准确性方面取得了显着进展.随着这些 ML/DL 工具的发展,企业和金融机构现在可以通过应用这些新技术来解决旧问题,从而更好地进行预测.在本文中,我们展示了使用称为 LSTM(长短期记忆)的特殊类型深度学习模型,

zz深度学习中的注意力模型

中间表示: C -> C1.C2.C3 i:target -> IT j: source -> JS sim(Query, Key) -> Value Key:h_j,类似某种“basis”: 从图9可以引出另外一种理解,也可以将Attention机制看作一种软寻址(SoftAddressing):Source可以看作存储器内存储的内容,元素由地址Key和值Value组成,当前有个Key=Query的查询,目的是取出存储器中对应的Value值,即Attention数值.通过Quer

【深度学习】常用的模型评估指标

"没有测量,就没有科学."这是科学家门捷列夫的名言.在计算机科学中,特别是在机器学习的领域,对模型的测量和评估同样至关重要.只有选择与问题相匹配的评估方法,我们才能够快速的发现在模型选择和训练过程中可能出现的问题,迭代地对模型进行优化.本文将总结机器学习最常见的模型评估指标,其中包括: precision recall F1-score PRC ROC和AUC IOU 从混淆矩阵谈起看一看下面这个例子:假定瓜农拉来一车西瓜,我们用训练好的模型对这些西瓜进行判别,显然我们可以使用错误率

针对深度学习的文本分类模型盘点

1.textCNN 优势:短文本分类可参照:https://www.cnblogs.com/AntonioSu/p/11969386.html 2.fast Text 优点:训练速度快 3.HAN(Hierarchical Attention Network) 优点:对文档的分类双向的LSTM,可以获得丰富的词汇表示 attention阶段:词在句子中的重要程度 4.Transformer 可参考:https://www.cnblogs.com/AntonioSu/p/12019534.ht

< 转>百度与深度学习

作者余凯,百度技术副总监,千人计划国家特聘专家. 贾磊,百度主任架构师,语音技术负责人. 陈雨强,百度商务搜索部资深研发工程师,负责搜索广告 CTR 预估摘要:深度学习带来了机器学习的新浪潮,推动"大数据+深度模型"时代的来临,以及人工智能和人机交互大踏步前进.如果我们能在理论.建模和工程方面突破深度学习面临的一系列难题,人工智能的梦想不再遥远. 2012 年 6 月,<纽约时报>披露了 Google Brain 项目,吸引了公众的广泛关注.这个项目是由著名的斯坦福大学

【深度解析】Google第二代深度学习引擎TensorFlow开源

作者:王嘉俊王婉婷 TensorFlow 是 Google 第二代深度学习系统,今天宣布完全开源.TensorFlow 是一种编写机器学习算法的界面,也可以编译执行机器学习算法的代码.使用 TensorFlow 编写的运算可以几乎不用更改,就能被运行在多种异质系统上,从移动设备(例如手机和平板)到拥有几百台的机器和几千个 GPU 之类运算设备的大规模分布式系统. TensorFlow 降低了深度学习的使用门槛,让从业人员能够更简单和方便地开发新产品.作为Google 发布的“平台级产品”,很多

为什么深度学习几乎成了计算机视觉研究的标配？

https://zhuanlan.zhihu.com/p/21533690 标签: 深度学习计算机视觉研究标配 2016-07-09 16:38 1951人阅读评论(0) 收藏举报分类: 计算机视觉CV(308) 目录(?)[+] 本次CVPR 2016上,深度学习几乎成了如今计算机视觉研究的标配,人脸识别.图像识别.视频识别.行人检测.大规模场景识别的相关论文里都用到了深度学习的方法,加上Google,Facebook这样的大企业助力,很多人疑惑,为什么深度学习相比其它的AI实现方法

【深度学习Deep Learning】资料大全

转载:http://www.cnblogs.com/charlotte77/p/5485438.html 最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books Deep Learning66 by Yoshua Bengio, Ian Goodfellow and Aaron Courville Neural Networks and Deep Learning42 by Michael Nielsen Deep Learning27 by

为什么现在深度学习才流行起来？

曾经在半个世纪之前,作为深度学习的思想和模型就开始研究和探索了,但是为什么现在深度学习才流行起来呢? 其实原因有三个:计算机技术高速发展.互联网产生大数据和神经网络训练方法改进. 在半个世纪之前,可以想象计算机是多么的落后,一台普通的PC就几十平方的房子那么大,计算能力还不及目前一台普通的智能手机,可想而知,在那样的计算能力之下来研究深度学习,简直就是恶梦.因为内存只有几K,而目前随便使用手机来拍摄一张图片,就有几M大小了,这么大的图片在当时的计算机是不能处理的,所以很难让人来研究更高级的应用,

如何正确理解深度学习（Deep Learning）的概念

现在深度学习在机器学习领域是一个很热的概念,不过经过各种媒体的转载播报,这个概念也逐渐变得有些神话的感觉:例如,人们可能认为,深度学习是一种能够模拟出人脑的神经结构的机器学习方式,从而能够让计算机具有人一样的智慧:而这样一种技术在将来无疑是前景无限的.那么深度学习本质上又是一种什么样的技术呢? 深度学习是什么深度学习是机器学习领域中对模式(声音.图像等等)进行建模的一种方法,它也是一种基于统计的概率模型.在对各种模式进行建模之后,便可以对各种模式进行识别了,例如待建模的模式是声音的话,那么这种