从SQLSERVER/MYSQL数据库中随机取一条或者N条记录

很多人都知道使用rand()函数但是怎麽使用可能不是每个人都知道

建立测试表

USE [sss]
GO

CREATE TABLE RANDTEST(ID INT DEFAULT RAND()*100,NAME NVARCHAR(200) DEFAULT ‘nihao‘)
GO

CREATE INDEX IX_RANDTEST_ID ON RANDTEST(ID)
GO

INSERT INTO RANDTEST DEFAULT VALUES
GO 2000

SELECT * FROM RANDTEST

第一种写法：大家会想到ORDER BY NEWID()

SET STATISTICS TIME ON
SET STATISTICS IO ON
SELECT TOP 50 [id]  FROM    [dbo].[RANDTEST]
GROUP BY ID
ORDER BY NEWID()
SET STATISTICS TIME OFF
SET STATISTICS IO OFF

这种写法使用到索引扫描，而且每次select出来的结果都是一样的，都是50条记录

第二种写法：

SET STATISTICS TIME ON
SET STATISTICS IO ON
SELECT TOP 50 [t1].[ID] FROM [dbo].[RANDTEST] t1 JOIN (SELECT RAND()*100 AS nid) t2 ON [t1].[ID]>[t2].[nid]
GROUP BY [t1].[ID]
SET STATISTICS TIME OFF
SET STATISTICS IO OFF

跟t2这个表做比较，而且每次能够达到随机取一条或者N条记录的效果

每次select出来的行数都是不一样的

比较一下IO和时间

当两种写法select出来的结果条数都是50条的时候，时间和IO都是一样的，如果第二种写法select出来的记录条数不是50条

那么IO肯定比第一种写法要少

--第一种写法  select出来50条记录
SQL Server 执行时间:
   CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

(50 行受影响)
表 ‘RANDTEST‘。扫描计数 1，逻辑读取 5 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

SQL Server 执行时间:
   CPU 时间 = 0 毫秒，占用时间 = 1 毫秒。

------------------------------------------------------------------------------

--第二种写法  select出来37条记录
SQL Server 执行时间:
   CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

(27 行受影响)
表 ‘RANDTEST‘。扫描计数 1，逻辑读取 4 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

SQL Server 执行时间:
   CPU 时间 = 0 毫秒，占用时间 = 1 毫秒。

总结

如果第一种写法写成下面的样子，那么每次select出来的结果都是一样的，而且不会进行排序，在执行计划里面你看不到排序这个运算符

因为非聚集索引是排好序的，扫描非聚集索引只会得到排好序的结果

SELECT TOP 50 [id]  FROM    [dbo].[RANDTEST]
GROUP BY ID
ORDER BY RAND()*100

综上，想从SQLSERVER数据库中随机取一条或者N条记录时，最好把RAND()生成随机数放在JOIN子查询中以提高效率。

SELECT TOP n [id]  FROM    table
GROUP BY ID
ORDER BY NEWID()

改造成下面这个：

SELECT TOP n   [t1].[ID]  FROM table  t1 JOIN (SELECT RAND()*100 AS nid) t2 ON [t1].[ID]>[t2].[nid]
GROUP BY [t1].[ID]

就可以享受在SQL中直接取得随机数了，不用再在程序中构造一串随机数去检索了。

MYSQL也是同样的原理

CREATE TABLE `t_innodb_random` (
`id` INT(10) UNSIGNED NOT NULL,
`user` VARCHAR(64) NOT NULL DEFAULT ‘‘,
KEY `idx_id` (`id`)
) ENGINE=INNODB DEFAULT CHARSET=utf8;

INSERT INTO `t_innodb_random` (`id`, `user`) VALUES(‘1‘,‘lily‘);
INSERT INTO `t_innodb_random` (`id`, `user`) VALUES(‘3‘,‘tom‘);
INSERT INTO `t_innodb_random` (`id`, `user`) VALUES(‘5‘,‘fancy‘);
INSERT INTO `t_innodb_random` (`id`, `user`) VALUES(‘6‘,‘cici‘);
INSERT INTO `t_innodb_random` (`id`, `user`) VALUES(‘9‘,‘syan‘);

SELECT * FROM t_innodb_random;

SELECT id FROM t_innodb_random ORDER BY RAND() LIMIT 5;
-- 改造成下面这个：

SELECT id FROM t_innodb_random t1 JOIN (SELECT RAND()*10 AS nid) t2 ON t1.id > t2.nid LIMIT 5;

---------------------------------------------------------------------------------------------

如有不对的地方，欢迎大家拍砖o(∩_∩)o

从SQLSERVER/MYSQL数据库中随机取一条或者N条记录,布布扣,bubuko.com

时间： 2024-12-28 20:36:19

从SQLSERVER/MYSQL数据库中随机取一条或者N条记录的相关文章

hibernate4中oracle,sqlserver,mysql数据库的sql方言配置(SQL Dialects)

hibernate4中oracle,mysql,sqlserver数据库的sql方言配置(SQL Dialects) 数据库类型 Hibernate sql方言 DB2 org.hibernate.dialect.DB2Dialect DB2 AS/400 org.hibernate.dialect.DB2400Dialect DB2 OS390 org.hibernate.dialect.DB2390Dialect PostgreSQL 8.1 org.hibernate.dialect.Po

mysql实现高效率随机取数据

从数据库中(mysql)随机获取几条数据很简单,但是如果一个表的数据基数很大,比如一千万,从一千万中随机产生10条数据,那就相当慢了,如果同时一百个人访问网站,处理这些个进程,对于一般的服务器来说,肯定是要死机的. mysql数据库获取随机数据的函数rand(),我建议轻易不要用这个,我写博客的时候试了一下,从16万数据里随机获取5条数据,用时14.02秒,这个耗费满惊人的. SELECT * FROM t_share ORDER BY rand() LIMIT 5; 通过mysql最大值函数m

JDBC远程从一个MySql数据库中的一张表里面读出数据（这个数据库需要用SSH隧道连接，大约8W条数据），然后分别插入到另一个数据库中的两张表里

package com.eeepay.lzj.db; import java.sql.Connection; import java.sql.Date; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet; import java.sql.SQLException; import com.jcraft.jsch.JSch; import com.jcraft.jsc

使用Python向MySQL数据库中存入json类型数据

0.说明因为出于个人项目的需要,获取到的数据都是json类型的,并且都要存入MySQL数据库中,因为json类型数据不像一般的文本数据,所以在存入MySQL时需要注意的问题很多. 在网上找了很多方法,整理了一下比较实用可靠的,总结下来就是下面的过程: MySQL表中需要保证存储json数据的列类型为BLOB: 使用sql语句时,使用MySQLdb.excape_string函数来对json数据进行转义: 查询数据时,将结果使用json.loads就能够得到原来的Python数据类型: 下面就来

MySQL数据库中的索引（一）——索引实现原理

今天我们来探讨一下数据库中一个很重要的概念:索引. MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构,即索引是一种数据结构. 我们知道,数据库查询是数据库的最主要功能之一.我们都希望查询数据的速度能尽可能的快,因此数据库系统的设计者会从查询算法的角度进行优化.最基本的查询算法当然是顺序查找(linear search),这种复杂度为O(n)的算法在数据量很大时显然是糟糕的,好在计算机科学的发展提供了很多更优秀的查找算法,例如二分查找(binary searc

Java学习总结（十八）——MySQL数据库（4）MySQL数据库中的视图，函数，存储过程中常见循环

一．MySQL存储过程中常见的循环1.while循环:WHILE.....DO.....END WHILE例1:创建存储过程(求1+2+.......+num的和):创建成功,进行调用:显示结果:2.REPEAT循环: REPEAT.........UNTLL END REPEAT例2:创建存储过程:创建完成,调用存储过程:显示结果:3.LOOP循环:LOOP END LOOP 例3:创建存储过程:创建成功,调用存储过程:显示结果:二．MySQL中的视图1.概念:有结构(有行有列),但没有结果(

MySQL数据库中的算术运算符

MySQL数据库中的算数运算符 MySQL数据库中的算术运算符一.运算符的概述: 运算符在MySQL数据库中也是很重要的知识体,在执行sql语句的时候这个运算符对操作数据帮助很大.其中运算符的运用可以帮助你减省大量的时间,操作起来也比较灵活. 二.运算符运算符主要包括"算数运算符"."比较运算符"."罗运算符"."位运算符"四大类,下面我们就一次学习一下. 1.算术运算符算术运算符在sql语句的时候经常使用,例如对表的字

查看MYSQL数据库中所有用户及拥有权限

查看MYSQL数据库中所有用户 mysql> SELECT DISTINCT CONCAT('User: ''',user,'''@''',host,''';') AS query FROM mysql.user; 查看数据库中具体某个用户的权限mysql> show grants for 'cactiuser'@'%';

mySQl数据库中不能插入中文的处理办法

1. 修改MySQL安装目录下(C:\Program Files\MySQL\MySQL Server 5.5)的my.ini文件设置: default-character-set=utf8 character-set-server=utf8 然后重启MySQL服务,MySQL 没有重启的命令,要先停止,然后再启动.开始 -> cmd -> net stop mysql -> net start mysql 2.设置表的编码格式,执行;alter table ttname CONVER