Seq2SQL ：使用强化学习通过自然语言生成SQL

论文： https://einstein.ai/static/images/layouts/research/seq2sql/seq2sql.pdf

数据集：https://github.com/salesforce/WikiSQL

Seq2SQL属于natural language interface （NLI）的领域，方便普通用户接入并查询数据库中的内容，即用户不需要了解SQL语句，只需要通过自然语言，就可查询所需内容。

Seq2SQL借鉴的是Seq2Seq的思想，与Seq2Seq应用于机器翻译与Chatbot类似，Seq2SQL将输入的语句encode后再decode成结构化的SQL语言输出，强化学习是在Seq2SQL中的最后一个模块中应用。同时，这篇论文还推出一个数据集WikiSQL，数据集内有人工标注好的问句及其对应SQL语句。

试验结果显示，Seq2SQL的准确率也不是特别的高，只有60.3%

Seq2SQL结构：

Seq2SQL由三部分组成：

第一部分： Aggregation classifier 这一部分其实是一个分类器，将用户输入的语句分类成是select count/max/min 等统计相关的约束条件

在此处采用的Augmented Pointer Network，Augmented Pointer Network总体而言也是ecoder-to-decoder的结构，

encoder采用的是两层的bi-LSTM, decoder 采用的是两层的unidirectional LSTM，

encoder输出h，ht对应的是第t个词的输出状态

decoder的每一步是，输入y s-1，输出状态gs，接着，decoder为每个位置t生成一个attention的score

，最终生成

在Seq2SQL中，首先为input生成一个表征向量（agg：aggregation clasifier， inp：input，enc:encoder）

首先为Augmented Pointer Network类似，计算出一个attention的分数，，

量化后，通过softmax函数

input的表征向量

通过一个多层的网络和softmax完成分类任务

，

第二部分： select column 这一部分是看用户输入的问句命中了哪个column

首先将每个column name 通过LSTM encode

将用户输入encode成与第一部分类似的

最终通过一个多层的神经元和softmax确定是命中哪一行

第三部分：where clause 确定约束条件，因为最终生成的SQL可能与标注中的不太一样，但是依旧有一样的结果，所以不能像前两部分一样使用交叉熵作为loss训练，因此使用强化训练中reward函数 (g: ground-truth), loss使用梯度

WikiSQL：

WikiSQL包含一系列与SQL相关的问题集以及SQL table

时间： 2024-11-29 06:09:22

Seq2SQL ：使用强化学习通过自然语言生成SQL的相关文章

深度强化学习（Deep Reinforcement Learning）入门：RL base & DQN-DDPG-A3C introduction

转自https://zhuanlan.zhihu.com/p/25239682 过去的一段时间在深度强化学习领域投入了不少精力,工作中也在应用DRL解决业务问题.子曰:温故而知新,在进一步深入研究和应用DRL前,阶段性的整理下相关知识点.本文集中在DRL的model-free方法的Value-based和Policy-base方法,详细介绍下RL的基本概念和Value-based DQN,Policy-based DDPG两个主要算法,对目前state-of-art的算法(A3C)详细介绍,其他

C++强化学习规划表

第一阶段 C语言加强以及C++语言详解(29天) 课程名称课程内容学习目标 C语言强化 · C语言基础复习(数据类型.变量.内存布局.指针基础) · C语言基础强化提高(C语言中的字符串.一维数组.二维数组) · C语言基础强化提高(一级指针,二级指针,三级指针实战,N级指针概念,指针数组和数组指针) · C语言基础强化提高(结构体.文件的使用) · 动态库的封装和设计 · 函数指针回调函数 · C语言面试题强化与提高在基础班C语言知识点之上,掌握C语言深入技巧,为日后做更大的项目打下坚

什么是强化学习？

Reinforcement learning 是机器学习里面的一个分支,特别善於控制一只能够在某个环境下自主行动的个体 (autonomous agent),透过和环境之间的互动,例如 sensory perception 和 rewards,而不断改进它的行为 . 听到强化学习,你脑里应该浮现一只曱甴那样的小昆虫,那就是 autonomous agent 的形象: 对「环境」(environment) 这概念,你应该想到像以下这经典游戏的迷宫: 包括有追捕你的怪物.和吃了会加分的食物

AI+游戏：高效利用样本的强化学习 | 腾讯AI Lab学术论坛演讲

3月15日,腾讯AI Lab第二届学术论坛在深圳举行,聚焦人工智能在医疗.游戏.多媒体内容.人机交互等四大领域的跨界研究与应用.全球30位顶级AI专家出席,对多项前沿研究成果进行了深入探讨与交流.腾讯AI Lab还宣布了2018三大核心战略,以及同顶级研究与出版机构自然科研的战略合作(点击这里查看详情). 腾讯AI Lab希望将论坛打造为一个具有国际影响力的顶级学术平台,推动前沿.原创.开放的研究与应用探讨与交流,让企业.行业和学界「共享AI+未来」. 彭健美国伊利诺伊大学厄巴纳-香槟分校

深度强化学习泡沫及路在何方？

一.深度强化学习的泡沫 2015年,DeepMind的Volodymyr Mnih等研究员在<自然>杂志上发表论文Human-level control through deep reinforcement learning[1],该论文提出了一个结合深度学习(DL)技术和强化学习(RL)思想的模型Deep Q-Network(DQN),在Atari游戏平台上展示出超越人类水平的表现.自此以后,结合DL与RL的深度强化学习(Deep Reinforcement Learning, DRL)迅速

智能语音助手的工作原理是？先了解自然语言处理(NLP)与自然语言生成(NLG)

语音助手越来越像人类了,与人类之间的交流不再是简单的你问我答,不少语音助手甚至能和人类进行深度交谈.在交流的背后,离不开自然语言处理(NLP)和自然语言生成(NLG)这两种基础技术.机器学习的这两个分支使得语音助手能够将人类语言转换为计算机命令,反之亦然. 这两种技术有什么差异?工作原理是什么?NLP vs NLG:了解基本差异什么是NLP?NLP指在计算机读取语言时将文本转换为结构化数据的过程.简而言之,NLP是计算机的阅读语言.可以粗略地说,在NLP中,系统摄取人语,将其分解,分析,确定适

强化学习二

一.前言在第一章强化学习简介中,我们提到强化学习过程可以看做一系列的state.reward.action的组合.本章我们将要介绍马尔科夫决策过程(Markov Decision Processes)用于后续的强化学习研究中. 二.马尔科夫过程(Markov Processes) 2.1 马尔科夫性首先,我们需要了解什么是马尔科夫性: 当我们处于状态StSt时,下一时刻的状态St+1St+1可以由当前状态决定,而不需要考虑历史状态. 未来独立于过去,仅仅于现在有关将从状态s 转移到状态 s

【推荐算法工程师技术栈系列】机器学习深度学习--强化学习

目录强化学习基本要素马尔科夫决策过程策略学习(Policy Learning) 时序差分方法(TD method) Q-Learning算法 Actor-Critic方法 DQN DDPG 推荐系统强化学习建模附录强化学习基本要素智能体(agent):与环境交互,负责执行动作的主体: 环境(Environment):可以分为完全可观测环境(Fully Observable Environment)和部分可观测环境(Partially Observable Environment).

一文让你看懂人工智能、机器学习、深度学习和强化学习的关系

如果说信息技术是第三次工业革命的核心,那么人工智能所代表的智能则是下一次工业革命的核心力量. 2016年,谷歌阿尔法围棋以4:1战胜围棋世界冠军.职业九段棋手李世石,不仅让深度学习为人们所知,而且掀起了人工智能的"大众热".此后,人工智能越来越热,从机器人开发.语音识别.图像识别.自然语言处理到专家系统等不断推陈出新. 同时,人工智能技术越来越多地融入到我们的生活中,出现了智能音箱.智能助理.智能机器人等. 根据应用领域的不同,人工智能研究的技术也不尽相同,目前以机器学习.计算机视觉等

猜你喜欢

C#如何解决对ListView控件更新以及更新时界面闪烁问题

第一个问题:如何更新ListView控件内容很多时候运行窗体程序时,由于程序中使用了多线程加之操作不当,所以在对控件操作时会出现下面这样的异常: 这是因为我们在窗体中添加的控件都有属于自己的线程,所 ...

对一些品种数量校正

update sphwph set shl=1-1 where spid='SPH00002323' and pici='JHAYMA00017433_5 ' and hw='HWI00000022' ...

dede摘要默认长度的限制

今晚做企业站,发现摘要长度一直被限制在250字节.上网上找了找,貌似解决办法很多,但是好像很多都无效.好在试到最后找到了解决办法: 1.进人数据库,更改表dede_archives里descripti ...

公司网站，邮箱，文件服务器搭建实战

项目案例: Tarena公司要求实现公司网站,邮箱,文件服务器的运营,并保证安全可靠,方便管理. 项目分析: 为实现要求我们首先要购买域名tarena.com.然后配置一台DNS和WEB服务器,因为这 ...

包(package)

防止文件重名,包体现在文件夹上.包必须建立文件夹. 类名的全称是:包名.类名 javac xx.java 命令编译的时候,不会建立对应的文件夹, 建立包对应的文件夹的命令,要用 javac -d ...

Image(支持 XML 序列化)，注意C#中原生的Image类是无法进行Xml序列化的

1 /// <summary> 2 /// Image(支持 XML 序列化) 3 /// </summary> 4 [XmlRoot("XmlImage" ...

ThinkPHP3.2.3生成多张缩略图

因为thinkphp3.2.3并没有UploadFile,UploadImage 类,需要从扩展包里提取出来再自己加入,把他们放到ThinkPHP\Library\Think目录下. private ...

（数据挖掘-入门-5）基于内容的协同过滤与分类

1.动机 2.基于内容的分类器 3.python实现一.动机在前面的文章中介绍了基于用户和基于物品的协同过滤推荐方法,其实无论是基于用户还是基于物品,都是通过群体效应来进行推荐,因为衡量相似度的向 ...

Square spiral Nikola picks up a strange circuit board. All of its elements are connected in a spiral ...

uva 1636 Headshot

https://vjudge.net/problem/UVA-1636 首先在手枪里随机装一些子弹,然后抠了一枪,发现没有子弹.你希望下一枪也没有子弹,是应该直接再抠一枪(输出SHOOT)呢,还是随机 ...

awk系列：在awk中如何使用流程控制语句

导读当你回顾所有到目前为止我们已经覆盖的 awk 实例,从 awk 系列的开始,你会注意到各种实例的所有指令是顺序执行的,即一个接一个地执行.但在某些情况下,我们可能希望基于一些条件进行文本过滤操作 ...

10个 iOS 用户暂可以嘲笑 Android 的特点

Android 与 iOS 设备之间的争斗从未停止,毕竟一切高科技产品的理念和实际表现方式都不相同.就拿 Android 来说,很多功能令用户并不太开心,甚至是令人愤怒,下面让我们来简单的盘点 10 ...

Mac出现五国语言灰色屏幕灰屏怎么办？

用CleanMyMac2清理文件之后,mac 死机,强制关机重启后进入灰屏,出现五国语言. 重新启动mac 并按住option按键,进入修复界面后,输入wifi密码,选择右侧的备份硬盘,后出现如下画面 ...

ubuntu升级ruby版本到2.1

ubuntu升级ruby到2.1 1.安装前更新: sudo apt-get -y update sudo apt-get install cmake sudo apt-get install -y ...

Neural Network and DeepLearning (2.1)反向传播算法

How the backpropagation algorithm works 反向传播的目标是计算代价函数C分别关于w和b的偏导数?C/?w和?C/?b. 反向传播的核心是一个对代价函数C关于任何权 ...

全国水质查询api根据流域查询水质量

全国水质查询api根据流域查询水质量,包括监测站点.PH.PH水质类别.溶解氧.溶解氧水质类别.氨氮.氨氮水质类别.高锰酸钾指数.高锰酸钾指数水质类别.总有机碳.总有机碳水质类别.断面属性.监测站点简 ...

从指定的路径中查找含有特殊字符串的文件

import java.io.*;import java.util.*;import java.util.concurrent.*;public class SearchFile{ public ...

FullCalendar日历插件

使用FullCalendar做个自己的日程管理(一)- 基础篇使用FullCalendar做一个自己的日程管理(二)- 事件篇使用FullCalendar做一个自己的日程管理(三)- 持久化篇

Android 批量插入数据到SQLite数据库

Android中在sqlite插入数据的时候默认一条语句就是一个事务,因此如果存在上万条数据插入的话,那就需要执行上万次插入操作,操作速度可想而知.因此在Android中插入数据时,使用批量插入的方式 ...

大型网站技术架构：核心原理与案例分析－李智慧

<大型网站技术架构:核心原理与案例分析>作者是拥有核心技术部门的一线工作经验,直接体验了大型网站构建与发展过程中的种种生与死,蜕与变,见证了一个网站架构从幼稚走向成熟稳定的历程. 没有晦涩 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.026 s.