一个比ack速度快n倍的代码搜索工具: ag

一个比ack速度快n倍的代码搜索工具:  ag

银搜索者(The Silver Searcher)

一个类似于代码搜索工具ack,着重于速度。

Github:   https://github.com/ggreer/the_silver_searcher

Ag有什么好处?

  • 它比一个数量级快ack
  • 它忽略了你.gitignore和你的文件模式.hgignore
  • 如果您的源代码中有文件您不想搜索,只需将其模式添加到.ignore文件中即可。(*咳嗽* *.min.js*咳嗽*)
  • 命令名称比起第33行短ack,所有的键都在主排上!

Ag现在相当稳定 大多数更改是新功能,小错误修复或性能改进。比我的基准要快得多:

ack test_blah ~/code/  104.66s user 4.82s system 99% cpu 1:50.03 total

ag test_blah ~/code/  4.67s user 4.58s system 286% cpu 3.227 total

Ack和Ag发现了相同的结果,但是Ag的速度是34倍(3.2秒vs 110秒)。我的~/code目录是大约8GB。感谢git / hg / ignore,Ag只搜索了700MB。

还有各版本的性能图表

怎么这么快?

  • Ag使用Pthreads并行利用多个CPU内核和搜索文件。
  • 文件被mmap()编辑而不是读入缓冲区。
  • 文字字符串搜索使用Boyer-Moore strstr
  • 正则表达式搜索使用PCRE的JIT编译器(如果Ag使用PCRE> = 8.21构建)。
  • pcre_study()在每个文件执行相同的正则表达式之前,Ag调用它。
  • 而不是调用fnmatch()忽略文件中的每个模式,非正则表达式模式将加载到数组中并进行二进制搜索。

我写了几篇博客文章,显示了我如何改进性能。这些包括我如何添加pthreads写我自己的scandir()基准测试每个版本以找到性能回归,并用gprofValgrind进行分析

安装

MACOS

brew install the_silver_searcher

要么

port install the_silver_searcher

Linux的

  • Ubuntu> = 13.10(Saucy)或Debian> = 8(Jessie)

      apt-get install silversearcher-ag
    
  • Fedora 21及以下
      yum install the_silver_searcher
    
  • Fedora 22+
      dnf install the_silver_searcher
    
  • RHEL7 +
      yum install epel-release.noarch the_silver_searcher
    
  • Gentoo的
      emerge the_silver_searcher
    
  •   pacman -S the_silver_searcher
    
  • Slackware的
      sbopkg -i the_silver_searcher
    
  • openSUSE的:
      zypper install the_silver_searcher
    
  • CentOS的:
      yum install the_silver_searcher
    
  • SUSE Linux Enterprise:按照这些简单说明进行操作

BSD

  • FreeBSD的

      pkg install the_silver_searcher
    
  • OpenBSD系统/ NetBSD的
      pkg_add the_silver_searcher
    

Cygwin的

运行相关的setup-*.exe,并在“Utils”类别中选择“the_silver_searcher”。

从源头建造

建筑大师

  1. 安装依赖关系(Automake,pkg-config,PCRE,LZMA):

    • MacOS的:

        brew install automake pkg-config pcre xz
      

      要么

        port install automake pkgconfig pcre xz
      
    • Ubuntu的/ Debian的:
        apt-get install -y automake pkg-config libpcre3-dev zlib1g-dev liblzma-dev
      
    • Fedora的:
        yum -y install pkgconfig automake gcc zlib-devel pcre-devel xz-devel
      
    • CentOS的:
        yum -y groupinstall "Development Tools"
        yum -y install pcre-devel xz-devel
      
    • openSUSE的:
        zypper source-install --build-deps-only the_silver_searcher
      
    • Windows:这很复杂 看到这个维基页面
  2. 运行构建脚本(它运行aclocal,automake等):
     ./build.sh
    

在Windows上(在msys / MinGW shell内):

    make -f Makefile.w32
  1. 安装:

     sudo make install
    

建立释放tarball

GPG签名的版本可在这里

构建版本tarball需要相同的依赖关系,除了automake和pkg-config。安装依赖项后,只需运行:

./configure
make
make install

您可能需要以sudoroot身份使用或运行make install。

编辑器集成

VIM

您可以使用Ag与[ack.vim] []添加以下行到您的.vimrc

let g:ackprg = ‘ag --nogroup --nocolor --column‘

要么:

let g:ackprg = ‘ag --vimgrep‘

哪个有同样的效果,但会报告每一场比赛。

Emacs的

您可以使用ag.el作为Ag的Emacs前端。参见:helm-ag

TextMate的

TextMate用户可以使用Ag与流行的AckMate插件的分支,这可以让您同时使用Ack和Ag进行搜索。如果您已经有AckMate,您只需要用Ag替换Ack,移动或删除"~/Library/Application Support/TextMate/PlugIns/AckMate.tmplugin/Contents/Resources/ackmate_ack"并运行ln -s /usr/local/bin/ag "~/Library/Application Support/TextMate/PlugIns/AckMate.tmplugin/Contents/Resources/ackmate_ack"

你可能会喜欢的其他东西

  • Ack - 比grep好。没有Ack,Ag不会存在。
  • ack.vim
  • 丰富的Ctags - 比Ag快,但它预先构建了一个索引。对于真正的大代码库很好
  • Git-grep - 与Ag一样快,但只适用于git repos。
  • ripgrep
  • Sack - 包裹Ack和Ag的实用程序。它从搜索和打开匹配文件中删除了很多重复。
时间: 2024-10-02 03:43:27

一个比ack速度快n倍的代码搜索工具: ag的相关文章

Dirty Markup - 在线代码美化工具

如果你需要一个帮助你规整书写混乱的代码的工具的话,我强烈推荐给你这个在线代码美化工具 - Dirty Markup.这个在线工具能够帮助你有效的处理HTML/HTML5,CSS和javascript代码. 这个工具内建了HTML Tidy, CSS Tidy 和 JS Beautify的功能,可以快速有效的帮助你规整代码. 如何使用 使用非常简单,你只需要选择你需要美化的代码类型,例如,HTML,CSS或者是Javascript,然后在右边的代码编辑框中输入你需要规整的代码,即可. 同时它提供了

Code Index: 基于Lucene.Net的代码检索工具

目录 用途 Github地址 示例 特性 用途 维护一个拥有巨大代码量的项目, 依靠自带的代码搜索工具搜索速度缓慢, 一个快速的代码检索工具就显得极为必要, 所以自己撸了个小工具. Github地址 https://github.com/qiuhaotc/CodeIndex 支持文本内容 文件名 文件后缀 文件位置 查询, 支持补全提醒, 还在开发中 语法, 参考Lucene query parser语法: http://www.lucenetutorial.com/lucene-query-s

sql server 导入平面文件源数据,错误 0xc02020a1错误 0xc020902a 错误 0xc02020c5,返回状态值 4 和状态文本“文本被截断,或者一个或多个字符在目标代码页...

使用sql server 导入平面文件源数据时,报错:错误 0xc02020a1: 错误 0xc020902a: 错误 0xc02020c5:错误 0xc0047022: 返回状态值 4 和状态文本"文本被截断,或者一个或多个字符在目标代码页中没有匹配项. 错误 0xc02020a1: 数据流任务 1: 数据转换失败.列"列 6"的数据转换返回状态值 4 和状态文本"文本被截断,或者一个或多个字符在目标代码页中没有匹配项.". (SQL Server 导入

分享一个jquery功能强大的提示信息插件代码

代码属于提示文字特效,很好,使用有些复杂,请参demo使用 下载地址:jquery功能强大的提示信息插件代码 预览DEMO:DEMO 分享一个jquery功能强大的提示信息插件代码,布布扣,bubuko.com

【Heritrix源代码分析4】开始一个爬虫抓取的全流程代码分析

在创建一个job后,就要开始job的运行,运行的全流程如下: 1.在界面上启动job 2.index.jsp 查看上述页面对应的源代码 <a href='"+request.getContextPath()+"/console/action.jsp?action=start'>Start</a> 3.action.jsp String sAction = request.getParameter("action"); if(sAction !

一个php生成16位随机数的代码(两种方法)

一个php生成16位随机数的代码,php生成随机数的二种方法. 方法1<?php$a = mt_rand(10000000,99999999);$b = mt_rand(10000000,99999999);echo $a.$b; 方法2:<?php$a = range(0,9);for($i=0;$i<16;$i++){$b[] = array_rand($a);} // www.yuju100.comvar_dump(join("",$b));//结果string

一个多线程问题引发的血案-(代码段执行完毕,子进程未执行完毕导致段错误)

今天遇到一个问题,gdb执行程序完全没有问题,但直接执行就会段错误,百思不得其解,各种纠结,各种搜索引擎都试了一遍,无果!后来问题还是被我自己挖出来了. 看下边一段代码: int TaskSendControl() { pthread_t prov_thread[CLIENT_NUM]; int prov[CLIENT_NUM]; for(int i=0; i< CLIENT_NUM; i++) { prov[i] = i; if( pthread_create(&prov_thread[i

iOS开发精选知识点讲解 - 视频等 iOSStrongDemo是由@李刚维护,总结一些iOS开发精选知识点。每一个知识点都有相应的测试代码,非常适合iOS初学者。

https://github.com/worldligang/iOSStrongDemo iOSStrongDemo是由@李刚维护,总结一些iOS开发精选知识点.每一个知识点都有相应的测试代码,非常适合iOS初学者. 涉及功能点 iOS9横竖屏设置的处理方法和实例讲解 iOS开发之如何跳到系统设置里的WiFi界面 iOS视频播放器 UIWebView用法详解及代码分享 使用UIDataDetectorTypes自动检测电话.网址和邮箱 iOS开发之NSTimer使用初探 iOS开发之NSStri

一个程序猿可以控制多少行代码

 我认为大家初看到这个题目时,一定会非常奇怪,一个程序猿可以控制多少行代码全然取决于该程序猿的能力强弱,这有什么规律可循么?事实上当这个想法突然冒出来时,我也都有些诧异. 首先介绍一下我遇到的情况,我当时正在编写一个小程序,是模拟cache工作原理的.这个程序中有一个函数集的实现文件(function.cpp),大概由20个左右的函数组成,由main.cpp中的main函数直接去调用它们.这个文件我是从头開始一点一点码起来的,開始时都非常顺利,编写代码的速度也非常平稳.可是当我的代码达到60