SQLite R*Tree 模块测试

目录

  • SQLite R*Tree 模块测试

    • 1、SQLite R*Tree 模块特性简介
    • 2、SQLite R*Tree 模块简单测试代码

SQLite R*Tree 模块测试

相关参考:

MySQL空间索引简单使用

MongoDB地理空间数据存储及检索

The SQLite R*Tree Module

Memory-Mapped I/O

In-Memory Databases

libspatialindex

R* tree - Wikipedia

1、SQLite R*Tree 模块特性简介

关于SQLite的空间索引相关介绍可以查看官方文档 The SQLite R*Tree Module ,这里只做简单的介绍。

1、SQLite R *Tree模块实现部分在其源代码内(源码下载页面),无需另外合并。但是默认是没有启用的,启用需要定义SQLITE_ENABLE_RTREE=1宏再编译。

2、SQLite R *Tree模块采用虚拟表实现,每个R *Tree索引都是一个虚拟表。对于这个表,其第一列必须是64位有符号整数类型,作为主键。其它的列(2-12列)根据空间维度确定,每个维度包含一对(两列),分别是该维度的最小和最大值。例如:一维R *Tree索引虚拟表包含3列,分别是Int64主键| 最小值| 最大值;二维R*Tree索引虚拟表包含5列,分别是Int64主键| 第一维最小值| 第一维最大值| 第二维最小值| 第二维最大值;3、4、5维R*Tree索引虚拟表列数情况的以此论推,SQLite R *Tree实现不支持宽度超过5维的R *树。

3、对于各个维度的最大最小值列,SQLite中可以使用int32或者float32类型进行数据存储。与其它常规表中的列不同,这里存储就是二进制类型的值,而不是转换为字符串。如果在插入数据的时候,使用了这两者之外的类型,则会进行隐式转换。

    -- 创建整型坐标rtree索引虚拟表
    CREATE VIRTUAL TABLE intrtree USING rtree_i32(id,x0,x1,y0,y1,z0,z1);
    -- 创建浮点型坐标rtree索引虚拟表
    CREATE VIRTUAL TABLE floatrtree USING rtree(id,x0,x1,y0,y1,z0,z1);

4、SQLite R *Tree中查询并不限制查询的维度一定要与所查询的表中的维度一致,可以仅查询其中的某几个维度(如3维空间仅查询2个维度)。一般来说,约束(维度)越多,查询的范围框越小,速度越快。

5、默认情况下使用float32存储坐标值,当无法精确表示传入值时,下限坐标向下舍入,上限坐标向上舍入,因此边界框可能略大于指定,但永远不会变小。这在查询某个范围之外的数据时,可能会有极小的误差。

6、对于3.24.0之前的版本,SQLite R *Tree索引虚拟表仅能存储整数主键和坐标值列,其它的信息需要另存于其它表中(通过主键进行关联)。从3.24.0版本开始,SQLite R *Tree索引虚拟表可以存储任意类型数据的辅助列,辅助列必须以+开头,最多可以存储100个辅助列。

    CREATE VIRTUAL TABLE demo_index2 USING rtree(
       id,              -- 64位整型主键
       minX, maxX,      -- X方向最小最大值
       minY, maxY,      -- Y方向最小最大值
       +objname TEXT,   -- 辅助列 文本类型
       +objtype TEXT,   -- 辅助列 文本类型
       +boundary BLOB   -- 辅助列 二进制数据
    );

7、可以自定义R-Tree查询,以便实现非矩形框碰撞。这需要通过sqlite3_rtree_query_callback(新,3.8.5开始提供)或sqlite3_rtree_geometry_callback(旧)注册查询SQL语句和匹配检测回调。相关信息在SQLite网站上有详细介绍。

8、一个SQLite R *Tree会附带三个影子表,用于存储数据,分别是虚拟表名_node(存储节点) 虚拟表名_parent(存储父节点) 虚拟表名_rowid(存储节点的rowid)。

9、可以使用SELECT rtreecheck(‘虚拟表名‘)来对R-Tree索引进行完整性和正确性检查。

2、SQLite R*Tree 模块简单测试代码

写了一个简单的测试程序来测试一下**R *Tree**树的速度,结果还是可以的。

我的机器环境是:

Windows 10 1903 x64专业版

AMD 锐龙 2600X

DDR4 2400 8G

编译器:VS2017 Native x64

使用本地文件的时候,十万条数据插入时间大概在2秒以内,查询一个5x5度大小的范围,时间基本在0.07秒以内;使用内存模式时,插入时间大概在1.8秒以内,查询一个5x5度大小的范围,时间基本在0.04秒以内。

注意:编译SQLite的时候要定义SQLITE_ENABLE_RTREE宏,开启RTree索引支持。

#include "sqlite/sqlite3.h"
#include<time.h>
#include <stdlib.h>
#include <stdio.h>

// 因为仅仅是进行一下试用测试,所以有些地方就没有处理,包括close

int main()
{
    sqlite3* db = NULL;
    int rc = sqlite3_open(":memory:", &db);
    // int rc = sqlite3_open("D:/sqlite_rtree/test.db", &db);
    if (rc != SQLITE_OK)
    {
        return -1;
    }

    char* errmsg;
    // 创建RTree索引虚拟表
    rc = sqlite3_exec(db,
                      "CREATE VIRTUAL TABLE demo_index USING rtree(id,minX, maxX,minY, maxY)",
                      NULL, NULL, &errmsg);
    if (rc != SQLITE_OK)
    {
        printf("%4d Error:%sn", __LINE__, errmsg);
        return -2;
    }

    // 开始计时
    clock_t start = clock();

    // 开启事物
    if (sqlite3_exec(db, "begin", NULL, NULL, &errmsg) != SQLITE_OK) {
        printf("%4d Error:%sn", __LINE__, errmsg);
        return -2;
    }

    // 生成十万个大小在 边长在[0.002,0.202]度大小以内的数据(0.2~22.5公里左右)
    srand(time(NULL));  // 初始化随机数种子
    sqlite3_stmt *pStmt = NULL;

    // 预处理SQL语句
    if(sqlite3_prepare_v2(db,
                          "INSERT INTO demo_index VALUES(?,?,?,?,?)",
                          40, &pStmt, NULL) != SQLITE_OK) {
        printf("%4d Error:%sn", __LINE__, errmsg);
        return -3;
    }
    // 逐个插入
    for (int i = 0; i < 100000; ++i) {
        // 生成在经纬度范围内的x,y
        double x0 = ((double)rand() / (double)RAND_MAX) * 360 - 180;
        double y0 = ((double)rand() / (double)RAND_MAX) * 180 - 90;
        double x1 = x0 + 0.002 + ((double)rand() / (double)RAND_MAX)*0.2;
        double y1 = y0 + 0.002 + ((double)rand() / (double)RAND_MAX)*0.2;
        // 绑定数据
        sqlite3_bind_int(pStmt, 1, i);
        sqlite3_bind_double(pStmt, 2, x0);
        sqlite3_bind_double(pStmt, 3, x1);
        sqlite3_bind_double(pStmt, 4, y0);
        sqlite3_bind_double(pStmt, 5, y1);
        // 执行
        sqlite3_step(pStmt);
        // 重置
        sqlite3_reset(pStmt);
    }
    sqlite3_finalize(pStmt); //结束语句,释放语句句柄

    // 结束事物
    if (sqlite3_exec(db, "commit", NULL, NULL, &errmsg) != SQLITE_OK){
        printf("%4d Error:%sn", __LINE__, errmsg);
        return -2;
    }

    // 结束计时
    clock_t end = clock();
    double hs = (double)(end - start) * 1000 / CLOCKS_PER_SEC;
    printf("插入总耗时: %lf msn", hs);
    // 查询
    // 预处理SQL语句
    pStmt = NULL;
    if (sqlite3_prepare_v2(db,
            "SELECT id,minX,minY FROM demo_index WHERE minX>=? AND maxX<=? AND minY>=?  AND maxY<=?;",
            -1, &pStmt, NULL) != SQLITE_OK) {
        printf("%4d Error:%sn", __LINE__, errmsg);
        return -4;
    }

    //-------------------------------------------------------------------------

    // 输入查询的范围框数据
    puts("Input x0,x1,y0,y1:");
    double x0, x1, y0, y1;
    scanf("%lf,%lf,%lf,%lf", &x0, &x1, &y0, &y1);
    printf("-----------[%lf,%lf,%lf,%lf]-------------n", x0, x1, y0, y1);

    // 开始计时
    start = clock();

    // 绑定查询范围数据
    sqlite3_bind_double(pStmt, 1, x0);
    sqlite3_bind_double(pStmt, 2, x1);
    sqlite3_bind_double(pStmt, 3, y0);
    sqlite3_bind_double(pStmt, 4, y1);
    while (sqlite3_step(pStmt) == SQLITE_ROW) {
        int id = sqlite3_column_int(pStmt, 0);
        double x = sqlite3_column_double(pStmt, 1);
        double y = sqlite3_column_double(pStmt, 2);
        printf("%dt %lf,%lfn", id, x, y);
    }
    sqlite3_finalize(pStmt); //结束语句,释放语句句柄

    // 结束计时
    end = clock();
    hs = (double)(end - start) * 1000 / CLOCKS_PER_SEC;
    printf("本次查询总耗时: %lf msn", hs);

    sqlite3_close(db);
    system("pause");
    return 0;
}

原文地址:https://www.cnblogs.com/oloroso/p/10941099.html

时间: 2025-01-02 01:39:50

SQLite R*Tree 模块测试的相关文章

MySQL 创建高性能索引--&gt;空间索引(R—Tree)

全文索引 全文索引是一种特殊类类型索引,它查找的是文本中的关键词,而不是直接比较索引中的值. 全文索引 更类似于搜索引擎做的事情,而不是简单的WHERE条件匹配. 全文搜索和其他几类索引 的匹配方式完全不一样.它有许多需要注意的细节,如停用词,词干,复数.布尔搜索等. 全文索引 适用于MATCH AGAINST操作,而不是普通的WHERE条件操作.

SQLite busy handler

SQLite doesn't support high concurrency. In case of a lot of concurrent access from multi-process or multi-thread, calling a SQLite r/w function is prone to hit the case that the database is locked by another process or thread. The default behavior i

POJ3237 Tree(树链剖分 边权)

题目大意:指定一颗树上有3个操作:询问操作,询问a点和b点之间的路径上最长的那条边的长度:取反操作,将a点和b点之间的路径权值都取相反数:变化操作,把某条边的权值变成指定的值. #include <iostream> #include <algorithm> #include <cstring> #include <cmath> #include <queue> #include <map> #include <set>

Aizu 2450 Do use segment tree 树链剖分+线段树

Do use segment tree Time Limit: 1 Sec Memory Limit: 256 MB 题目连接 http://www.bnuoj.com/v3/problem_show.php?pid=39566 Description Given a tree with n (1 ≤ n ≤ 200,000) nodes and a list of q (1 ≤ q ≤ 100,000) queries, process the queries in order and out

hdu 1710 Binary Tree Traversals 前序遍历和中序推后序

题链;http://acm.hdu.edu.cn/showproblem.php?pid=1710 Binary Tree Traversals Time Limit: 1000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 4205    Accepted Submission(s): 1904 Problem Description A binary tree i

spoj 375 Query on a tree (树链剖分)

Query on a tree You are given a tree (an acyclic undirected connected graph) with N nodes, and edges numbered 1, 2, 3...N-1. We will ask you to perfrom some instructions of the following form: CHANGE i ti : change the cost of the i-th edge to ti or Q

UPC 2224 Boring Counting (离线线段树,统计区间[l,r]之间大小在[A,B]中的数的个数)

题目链接:http://acm.upc.edu.cn/problem.php?id=2224 题意:给出n个数pi,和m个查询,每个查询给出l,r,a,b,让你求在区间l~r之间的pi的个数(A<=pi<=B,l<=i<=r). 参考链接:http://www.cnblogs.com/zj62/p/3558967.html #include <iostream> #include <cstdio> #include <cstring> #incl

SPOJ - QTREE Query on a tree题解

题目大意: 一棵树,有边权,有两个操作:1.修改一条边的权值:2.询问两点间路径上的边的权值的最大值. 思路: 十分裸的树链剖分+线段树,无非是边权要放到深度大的一端的点上,但是有两个坑爹的地方,改了好久: 1.数组定义10000和40000会TLE,要乘10: 2.以前的树剖求解的最后是这样的: if (deep[x]>deep[y]) swap(x,y); return max(ans,MAX(1,n,id[x],id[y],1)); 但是WA了,膜拜大神后发现这样就AC了: if (x==

线段树(segment tree)

1.概述 线段树,也叫区间树,是一个完全二叉树,它在各个节点保存一条线段(即"子数组"),因而常用于解决数列维护问题,基本能保证每个操作的复杂度为O(lgN). 线段树是一种二叉搜索树,与区间树相似,它将一个区间划分成一些单元区间,每个单元区间对应线段树中的一个叶结点. 对于线段树中的每一个非叶子节点[a,b],它的左儿子表示的区间为[a,(a+b)/2],右儿子表示的区间为[(a+b)/2+1,b].因此线段树是平衡二叉树,最后的子节点数目为N,即整个线段区间的长度. 使用线段树可以