关于数据筛选的不打不小的问题

问题如下:

假设这样一种情况,首先说明,信息是存放在mysql数据库中的。情况如下,A表信息堆是百万级信息堆(每条信息长度不长,基本在20字符以内,属于简短词语),B则是一条普通信息(长度大概在500字符左右),问,有哪种最有效的方式可以来判断B信息中是否包含有A堆中的信息并返回包含的信息?

在此提供一种解法,如果大家有更好的解法欢迎大家留言交流!

由于A信息堆数据量比较大并存放于数据库中,故产生一个很简单的解法,直接通过一条sql解决,当然,这样会衍生一个问题就是sql优化,如何减少搜索时间就要看你自己的优化手段啦。

查询sql如下:

select GROUP_CONCAT(匹配表字段) content from 表名 where  instr(B表信息,匹配表字段)>0

另外,大家还可以采用全文检索的方式来提高检索速度

关于数据筛选的不打不小的问题,布布扣,bubuko.com

时间: 2024-08-07 22:01:58

关于数据筛选的不打不小的问题的相关文章

LINQ to Object初体验(使用对象取代二维数组作数据筛选)

VS2008里面有个神奇的东西,称之为LINQ,可以透过相同的语法方式来处理各式各样的数据(SQL,XML,Object,...),小喵此次初体验感受一下这个东西,真的很好用,初体验来做个简单的测试,请看小喵娓娓道来 VS2008里面有个神奇的东西,称之为LINQ,可以透过相同的语法方式来处理各式各样的数据(SQL,XML,Object,...),小喵此次初体验感受一下这个东西,真的很好用,初体验来做个简单的测试,请看小喵娓娓道来 先来看一张LINQ的架构图(数据来源:曹祖圣老师在TechEd2

excel3——数据筛选

元数据 数据--筛选---自动筛选---输入条件和数值

用聚合数据API快速写出小程序(苏州实时公交)

利用聚合数据API快速写出小程序,过程简单. 1.申请小程序账号 2.进入开发 3.调用API.比如"苏州实时公交"小程序,选择的是苏州实时公交API. 苏州实时公交API文档:https://www.juhe.cn/docs/api/id/31 如下,是"苏州实时公交"小程序调用代码:  var url = "https://apis.juhe.cn/szbusline/bus";    //为了您的密钥安全,建议使用服务端代码中转请求,事例代

javascript 复合数据的定义和使用 ( 小例子 )

思路:主要是先要获取到三个 box 元素的 top 值 和 left 值,然后有复合数据进行存值,再进行数组值的位置移动来实现切换 box 位置效果: <!doctype html> <html lang="en"> <head> <meta charset="UTF-8"> <title></title> </head> <style> #warp{margin:50p

DataGridView如何实现列标头带数据筛选功能,就象Excel高级筛选功能一样

'近日有本论坛网友问:DataGridView如何实现列标头带数据筛选功能,就象Excel高级筛选功能一样 '今晚正好闲着没事,加之以前也没用到过这个需求,所以就写了个模拟功能,供各位坛友酌情参考. 'VB.NET 2008 环境 '新建一个项目后,只需在Form1中拉一个DataGridView,一个ComboBox,然后将下面代码复制粘贴即可,其它什么也不用做 Public Class Form1 Dim SelectedCol As Integer = 0, IsFindit As Boo

C#进行数据筛选(二)

这里介绍LINQ+Lambda表达式进行数据筛选的方式 这里是第一种方式,还是使用了if条件语句去判断,根据选择的条件去筛选出我所需要的数据 public GxAnaly SelectDay(string ID, DateTime Day) { try { DBEntities db = new DBEntities(); var temp = (from pt in db.Tb_Analysis where pt.ID == Sn select pt).ToList(); // return

酷客多大数据平台“数据魔方”上线,赋能小程序商户精细化运营

单商户小程序V1.7.8版本更新说明更新时间:2018年7月27号 一. 更新功能清单1. 新增拼团活动与促销活动的数据统计分析功能,为商家提供活动数据参考,需要将小程序更新到最新1.7.8版本,才可以完全使用活动数据统计功能:2. 新增DIY营销活动组件,可将进行中的拼团.抽奖团.秒杀活动添加到首页或自定义页面:3. 新增DIY标题组件,自定义标题名与链接入口,也可额外开启倒计时显示配合营销组件使用:4. 同城配送新增可配送时间段,与指定时间送达开启设置,适合外卖商家使用:5. 商家版小程序增

pandas DataFrame数据筛选和切片

DataFrame数据筛选--loc,iloc,ix,at,iat 条件筛选 单条件筛选 选取col1列的取值大于n的记录: data[data['col1']>n] 筛选col1列的取值大于n的记录,但是显示col2,col3列的值: data[['col2','col3']][data['col1']>n] 选择特定行:使用isin函数根据特定值筛选记录.筛选col1值等于list中元素的记录: data[data.col1.isin(list)] 多条件筛选 可以使用&(并)与|

小技巧:域账号变更信息筛选\用户数据筛选

本文纯属为发骚而生,本着简化工程师.管理员的工作量而整理的一种实用高效方法. 实际工作中,我们有以下几种场景出现: 导入导出帐号信息后,需要对现有账号信息进行筛选比对: 统计备份表格数据之后新生的用户账户信息: 不同时期账户信息状态差异汇总: 分批导入导出账户数据信息比对: 或者是资产盘点的时候对重复数据进行筛选排查: 相同表格不同时期差异对比等: 常规思路: 第一列抽出一个,然后依次对比第二列.找出是否不同: 然后第一列抽出第二个,依次对比第二列,找出是否不同: 或者通过Excel中函数来处理