golang初试:坑爷的

用Golang与perl脚本比较, 初想至多差一倍吧...结果可不是一般的坑爹, 简直就是坑爷了.

Perl脚本

#!/bin/bash

source /etc/profile;

function extractAndZip(){
        _debug "$FUNCNAME,[email protected]";
        local logFile="${2}"
        local gzipFile="${1}"
        perl -ne ‘if(m/([^ ]*) \- ([^ ]*) \[([^ ]*) [\+\-][0-9]{4}\] \"(\-|(([^ ]*) )?([^\?\;\% ]*)([\?\;\%]([^ ]*))?( ([^\"]*))?)\" ([^ ]*) ([^ ]*) \"([^\"]*)\" \"([^\"]*)\" \"([^\"]*)\" ([^ ]*) (\-|([^\-]+))/){printf("%s\001%s\001%s\001%s\001%s\001%s\001%s\001%s\001%s\001%s\001%s\001%s\001%s\001%s\n", ${1}, ${2}, ${3}, ${6}, ${7}, ${9}, ${11}, ${12}, ${13}, ${14}, ${15}, ${16}, ${17}*1000, ${19}*1000)}‘ ${logFile} | gzip > ${gzipFile};
}

extractAndZip "[email protected]"

[email protected]:/data2/rsynclog/gotest$ time bash perl.sh result.gz 2014-06-17+yyexplorer+58.215.138.18+yyexplorer-access.log
/data/sa/profile_common: line 23: ulimit: open files: cannot modify limit: Operation not permitted
perl.sh: line 6: _debug: command not found

real    4m5.222s
user    5m54.630s
sys     0m9.720s

6分钟全部搞定...

golang代码:

package main

import (
    "bufio"
    "compress/gzip"
    "fmt"
    "os"
    "regexp"
    "strconv"
    //"strings"
)

var recordRegExp = regexp.MustCompile(`([^ ]*) \- ([^ ]*) \[([^ ]*) [\+\-][0-9]{4}\] \"(\-|(([^ ]*) )?([^\?\;\% ]*)([\?\;\%]([^ ]*))?( ([^\"]*))?)\" ([^ ]*) ([^ ]*) \"([^\"]*)\" \"([^\"]*)\" \"([^\"]*)\" ([^ ]*) (\-|([^\-]+))`)

func toInt(str string) int {
    val, err := strconv.Atoi(str)
    if err != nil {
        return val
    }
    return 0
}

func main() {
    if len(os.Args) < 3 {
        fmt.Println("Usage:", os.Args[0], "<out_zip_file>", "<in_txt_file1...>")
        os.Exit(1)
    }

outZipFile, err := os.Create(os.Args[1])
    if err != nil {
        fmt.Errorf("错误:%s\n", err.Error())
        os.Exit(1)
    }
    defer outZipFile.Close()

inTxtFiles := make([]*os.File, len(os.Args)-2)
    for _, path := range os.Args[2:] {
        file, err := os.Open(path)
        if err != nil {
            fmt.Errorf("错误:%s\n", err.Error())
            os.Exit(1)
        }
        defer file.Close()
        inTxtFiles = append(inTxtFiles, file)
    }

zipIo := gzip.NewWriter(outZipFile)
    defer zipIo.Close()
    out := bufio.NewWriter(zipIo)
    for _, file := range inTxtFiles {
        scan := bufio.NewScanner(file)
        for scan.Scan() {
            line := scan.Bytes()
            items := recordRegExp.FindSubmatch(line)
            out.Write(items[1])
            out.Write([]byte("\t"))
            out.Write(items[2])
            out.Write([]byte("\t"))
            out.Write(items[3])
            out.Write([]byte("\t"))
            out.Write(items[6])
            out.Write([]byte("\t"))
            out.Write(items[7])
            out.Write([]byte("\t"))
            out.Write(items[9])
            out.Write([]byte("\t"))
            out.Write(items[11])
            out.Write([]byte("\t"))
            out.Write(items[12])
            out.Write([]byte("\t"))
            out.Write(items[13])
            out.Write([]byte("\t"))
            out.Write(items[14])
            out.Write([]byte("\t"))
            out.Write(items[15])
            out.Write([]byte("\t"))
            out.Write(items[16])
            out.Write([]byte("\t"))
            out.Write([]byte(strconv.Itoa(toInt(string(items[17])) * 1000)))
            out.Write([]byte("\t"))
            out.Write([]byte(strconv.Itoa(toInt(string(items[19])) * 1000)))
            out.Write([]byte("\n"))
        }
        out.Flush()
    }

}
结果手工kill时:

16m才完成了3分之1左右...坑你爷了...

时间: 2024-10-14 05:14:00

golang初试:坑爷的的相关文章

golang采坑一 expected &#39;;&#39;, found &#39;import&#39;

golang变成使用IDE,注意IDE的默认换行符号 我使用的是PHPstrome IED工具,注意右下角这个默认换行符.不然,总是提示错误 expected ";",found "import".换成\r\n 就好了 golang采坑一 expected ';', found 'import' 原文地址:https://www.cnblogs.com/iifeng/p/11458311.html

golang的哪些坑爷事: package实践

在golang中package是个困惑的概念, 特别是package还可以与folder不同名, 委实让我恶心了一把. 关于golang的package的最佳实践: package is folder. package name is folder name. package path is folder path. 信耶稣得永生! 1. 同一个folder存在不同package, 编译错误: D:/go/bin/go.exe build [E:/cgss/src/pkg01] can't lo

golang爬坑:操作Linux命令

通常在启动项目服务程序的时候,需要判断该服务是否已经被启动,一般的做法有两种,其一是每次启动后将pid写入文件中,启动的时候读取这个文件,如果里面有数值,就表示服务已启动:另一种是通过shell命令查找: ps -ef | grep XXX | grep -v grep | awk '{print $2}' 很多语言都可以直接执行这行命令:偏偏go语言不行,因此,我们可以利用go中提供的一些方法实现它(不说了,直接上代码): func Pipeline(cmds ...*exec.Cmd) (p

Golang的坑

https://i6448038.github.io/2017/07/28/GolangDetails/ new(type)不为nilfmt.Println(new(int)==nil) # falsevar i *intfmt.Println(i==nil) # true 一个包里可以有多个init函数,多个init函数的调用顺序 https://golang.org/ref/spec#Program_initialization_and_execution 原文地址:http://blog.

golang爬坑:一个简单的http内网转发

最近有一个需求,就是需要从内网服务器的一个端口请求数据,问题是这个内网端口不能被外网访问到,所以需要做一个转发代理服务.原理就是当请求到达时,将本机的地址替换成目标地址,然后其他格式不变,待目标请求返回后,又将目标的报文头及报文返回给客户端.具体代码如下: func main() { localHost := "127.0.0.1:9001" targetHost := "127.0.0.1:8001" httpsServer(localHost, targetHo

Golang 语言坑之for-range

go只提供了一种循环方式,即for循环,其中有两种方式.第一种是for [initStmt];[Condition];[PostStmt]{} for i:=0;i++;i<10{ .... } 第二种是for-range可以用来历容器类型如数组.切片和映射,channel .但是使用for-range时,如果使用不当会程序运行不是预期结果,例如,下面的示例程序将遍历一个切片,并将切片的值当成切片值存入,切片类型是一个结构体,切片的类型是为Point型,值是一个地址. package main

golang踩坑之floa64精度丢失

问题:19.90转为float64类型,再乘以100,精度丢失 废话不说多,show you the code package main import ( "fmt" "strconv" ) func main() { num, _ := strconv.ParseFloat(fmt.Sprintf("%.2f", 19.90), 64) fmt.Println(num) fmt.Println(num * 100) } 运行输出 19.9 19

golang: 常用数据类型底层结构分析

虽然golang是用C实现的,并且被称为下一代的C语言,但是golang跟C的差别还是很大的.它定义了一套很丰富的数据类型及数据结构,这些类型和结构或者是直接映射为C的数据类型,或者是用C struct来实现.了解golang的数据类型和数据结构的底层实现,将有助于我们更好的理解golang并写出质量更好的代码. 基础类型 源码在:$GOROOT/src/pkg/runtime/runtime.h .我们先来看下基础类型: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1

【GoLang】golang底层数据类型实现原理

虽然golang是用C实现的,并且被称为下一代的C语言,但是golang跟C的差别还是很大的.它定义了一套很丰富的数据类型及数据结构,这些类型和结构或者是直接映射为C的数据类型,或者是用C struct来实现.了解golang的数据类型和数据结构的底层实现,将有助于我们更好的理解golang并写出质量更好的代码. 基础类型 源码在:$GOROOT/src/pkg/runtime/runtime.h .我们先来看下基础类型: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1