PHP模拟SQL的GROUP BY算法

BY JENNER · 2015年1月24日· 阅读次数:25

github地址:https://github.com/huyanping/Zebra-PHP-ArrayGroupBy

packagist地址:https://packagist.org/packages/jenner/array_group_by

为什么使用Zebra-PHP-ArrayGroupBy

在如下场景中,我们总是希望能够在php中使用类似mysql的groupby操作:

  • SQL过于复杂,造成数据库运算效率低下
  • 从数据库中读取出原始数据,在php中进行运算,增强代码重用率
  • 其他非数据库场景的数组归并场景

Zebar-PHP-ArrayGroupBy能够做什么

  • 对二维数组进行归并
  • 归并的同时,支持对字段进行自定义处理
  • 比SQL更灵活的自定义函数,你可以随意编写归并和字段合并函数

示例:

$records = [
    [‘order_date‘ => ‘2014-01-01‘, ‘price‘ => 5],
    [‘order_date‘ => ‘2014-01-02‘, ‘price‘ => 10],
    [‘order_date‘ => ‘2014-01-03‘, ‘price‘ => 20],
    [‘order_date‘ => ‘2015-01-04‘, ‘price‘ => 25],
];

$group_by_fields = [
    ‘order_date‘ => function($value){
            return date(‘Y‘, strtotime($value));
        }
];

$group_by_value = [
    ‘order_date‘ => [
        ‘callback‘ => function($value_array){
                return substr($value_array[0], 0, 4);
            },
        ‘as‘ => ‘year‘
    ],
    ‘price‘ => function($value_array){
            return array_sum($value_array);
        },
];

$grouped = \Jenner\Zebra\ArrayGroupBy::groupBy($records, $group_by_fields, $group_by_value);
print_r($grouped);

结果:

Array
(
    [0] => Array
        (
            [year] => 2014
            [price] => 35
        )

    [1] => Array
        (
            [year] => 2015
            [price] => 25
        )

)

你也可以使用链式方法调用,对数据进行多次汇总,更加灵活:

$records = [
    [‘bill_time‘=>‘2014-01-01 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-01 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-01 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-01 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-01 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-01 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-02 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-02 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-02 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-02 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-02 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-03 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-03 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-03 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-03 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-03 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-04 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
    [‘bill_time‘=>‘2014-01-04 00:00:00‘, ‘price‘=>1, ‘cnt‘=>3,],
];

$group_by_fields = [
    ‘bill_time‘ => function($field){
            return substr($field, 0, 10);
        }
];

$group_by_values = [
    ‘bill_time‘ => function($field_values){
            return substr($field_values[0], 0, 10);
        },
    ‘price‘ => function($field_values){
            return array_sum($field_values);
        },
    ‘cnt‘ => function($field_values){
            return array_sum($field_values);
        }
];

$week_fields = [
    ‘bill_time‘ => function($field){
            return date(‘w‘, strtotime($field));
        }
];

$week_values = [
    ‘bill_time‘ => function($field_values){
            return date(‘w‘, strtotime($field_values[0]));
        },
    ‘price‘ => function($field_values){
            return array_sum($field_values);
        },
    ‘cnt‘ => function($field_values){
            return array_sum($field_values);
        }
];

$grouped = (new \Jenner\Zebra\ArrayGroupBy($records))->groupByField($group_by_fields)->groupByValue($group_by_values)->groupByField($week_fields)->groupByValue($week_values)->get();

print_r($grouped);

举例

  • 归并过程中,实现对结果的中值计算
  • 归并过程中,对时间字段进行自定义处理,例如归并每5分钟的数据
  • 等等

原创文章,转载请注明: 转载自始终不够

本文链接地址: PHP模拟SQL的GROUP
BY算法

时间: 2024-11-08 22:36:50

PHP模拟SQL的GROUP BY算法的相关文章

SQL Server 聚合函数算法优化技巧

Sql server聚合函数在实际工作中应对各种需求使用的还是很广泛的,对于聚合函数的优化自然也就成为了一个重点,一个程序优化的好不好直接决定了这个程序的声明周期.Sql server聚合函数对一组值执行计算并返回单一的值.聚合函数对一组值执行计算,并返回单个值.除了 COUNT 以外,聚合函数都会忽略空值. 聚合函数经常与 SELECT 语句的 GROUP BY 子句一起使用. v1.写在前面 如果有对Sql server聚合函数不熟或者忘记了的可以看我之前的一片博客.sql server 基

SQL中Group By的使用

SQL中Group By的使用 1.概述 “Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“数据集”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理. 2.原始表 3.简单Group By 示例1 select 类别, sum(数量) as 数量之和 from A group by 类别 返回结果如下表,实际上就是分类汇总. 4.Group By 和 Order By 示例2 select 类别, sum(数量) AS 数量之和 fr

SQL 之 Group By

SQL 之 Group By Group By从字面意义上理解就是根据By指定的规则对数据进行分组,所谓的分组就是将一个数据表划分成若干个小区域. 例如:有这么一张表 在执行group by 类别操作之后表就变成了这种形式 无标题文档 类别 组 a 数量 摘要 5 a2002 2 a2001 11 a2001 b 数量 摘要 10 b2003 6 b2002 3 b2001 c 数量 摘要 9 c2005 9 c2004 8 c2003 7 c2002 4 c2001 因为是按照类别进行分组,所

sql 的group by order by having 等等与mongo的对应关系

http://docs.mongodb.org/manual/reference/sql-aggregation-comparison/ unwind解释    拆解数组 http://blog.nosqlfan.com/html/3648.html 几种方式做group http://blog.csdn.net/huntzw/article/details/8669986 sql 的group by order by having 等等与mongo的对应关系,布布扣,bubuko.com

C# Linq to sql 实现 group by 统计多字段 返回多字段

Linq to sql 使用group by 统计多个字段,然后返回多个字段的值,话不多说,直接上例子: var wflist = from u in db.TWelFare where u.fy_no == fy_no orderby u.we_no group u by new { weno = u.we_no, wename = u.we_name } into g select new { g.Key.weno, g.Key.wename }; 结果就是根据we_no和we_name的统

Python 操作文件模拟SQL语句功能

Python操作文件模拟SQL语句功能 一.需求 当然此表你在文件存储时可以这样表示 1,Alex Li,22,13651054608,IT,2013-04-01 现需要对这个员工信息文件,实现增删改查操作 1. 可进行模糊查询,语法至少支持下面3种: 1. select name,age from staff_table where age > 22 2. select * from staff_table where dept = "IT" 3. select * from

操作系统: 最佳适配算法和邻近适配算法的模拟实现(内存分配算法)

实现动态分区的分配算法. (1) 最佳适配算法:选择内存空闲块中最适合进程大小的块分配. (2) 邻近适配算法:从上一次分配的地址开始查找符合要求的块,所查找到的第一个满足要求的空闲块就分配给进程. 模拟添加进程的时候,假定内存是一块完整的空闲区,对于算法(1)来说,分配的时候遍历所有的空闲内存块,找出其中最适合的一块,注意此时内存分区的总块数可能已经发生了变化: 对于算法(2)来说,则需要从上次分配的内存块(使用变量记录即可)接着向下找到第一个满足条件的块即可,内存分区的总块可能也已经发生了变

linq to sql (Group By/Having/Count/Sum/Min/Max/Avg操作符) (转帖)

http://wenku.baidu.com/link?url=2RsCun4Mum1SLbh-LHYZpTmGFMiEukrWAoJGKGpkiHKHeafJcx2y-HVttNMb1BqJpNdwaOpCflaajFY6k36IoCH_D82bk2ccu468uzDRXvG 基于LINQ+to+Entity数据访问技术的应用研究 Group By/Having操作符 适用场景:分组数据,为我们查找数据缩小范围. 说明:分配并返回对传入参数进行分组操作后的可枚举对象.分组:延迟 1.简单形式:

sql中group by使用(转发)

1.概述 2.原始表 3.简单Group By 4.Group By 和 Order By 5.Group By中Select指定的字段限制 6.Group By All 7.Group By与聚合函数 8.Having与Where的区别 9.Compute 和 Compute By 1.概述 “Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“数据集”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理. 2.原始表 3.简单Group