拼合逐月数据系列

近期数据处理中搜集到一个地方的降雨数据按月排列,如下表所示:

Station Year Type Month 1 2 3 4 29 30 31
BJ0030C 1961 Precip 01 0 0 0 0 0 0 0
BJ0030C 1962 Precip 01 0 0 0 0 0 0 0
BJ0030C 1963 Precip 01 0 0 0 0 0 0 0
BJ0030C 1964 Precip 01 0 0 0 0 0 0 0
BJ0030C 1965 Precip 01 0 0 0 0 0 0 0
BJ0030C 1966 Precip 01 0 0 0 0 0 0 0
BJ0030C 1967 Precip 01 0 0 0 0 0 0 0
BJ0030C 1968 Precip 01 0 0 0 0 0 0 0
BJ0030C 1969 Precip 01 0 0 0 0 0 0 0
BJ0030C 1970 Precip 01 0 0 0 0 0 0 0

为了得到逐日的数据序列,编写了以下宏代码:

Public Sub CombineDates()
    Dim wsSrc As Worksheet, wsResult As Worksheet
    Dim s1 As String, s2 As String
    Dim i As Integer
    Dim InvalidSheet As Boolean

    Set wsSrc = ActiveSheet
    ‘Check source format
    InvalidSheet = False
    If wsSrc.Cells(1, 1).Text <> "Station" Then InvalidSheet = True
    If wsSrc.Cells(1, 2).Text <> "Year" Then InvalidSheet = True
    If wsSrc.Cells(1, 3).Text <> "Type" Then InvalidSheet = True
    If wsSrc.Cells(1, 4).Text <> "Month" Then InvalidSheet = True
    For i = 1 To 31
            If wsSrc.Cells(1, 4 + i).Text <> i Then InvalidSheet = True
    Next
    If InvalidSheet Then
        MsgBox "Invalid source sheet." & vbCrLf & "The first row of the sheet must be: " & vbCrLf & _
            "Eg gh id,Year,Eg el abbreviation,Month,1...31", vbCritical
        Exit Sub
    End If

    ‘Create the result sheet
    s1 = wsSrc.Name & "_Rlt"
    On Error Resume Next
    s2 = s1
    i = 1
    Do
        Set wsResult = Nothing
        Set wsResult = ActiveWorkbook.Sheets(s2)
        If wsResult Is Nothing Then Exit Do
        s2 = s1 & "(" & i & ")"
        i = i + 1
    Loop
    On Error GoTo 0
    Set wsResult = ActiveWorkbook.Sheets.Add(, wsSrc)
    wsResult.Name = s2

    ‘Convert
    wsResult.Cells(1, 1).Value = "Station"
    wsResult.Cells(1, 2).Value = "Date"
    wsResult.Cells(1, 3).Value = wsSrc.Name
    wsResult.Columns(2).ColumnWidth = 12
    Dim rowIdx As Long, rowIdxRlt As Long, curYear As Integer, curMonth As Integer
    rowIdx = 2
    rowIdxRlt = 2
    While Not IsEmpty(wsSrc.Cells(rowIdx, 1))
        s1 = wsSrc.Cells(rowIdx, 1).Text
        curYear = wsSrc.Cells(rowIdx, 2).Value
        curMonth = wsSrc.Cells(rowIdx, 4).Value
        For i = 1 To 31
            If IsEmpty(wsSrc.Cells(rowIdx, i + 4)) Then Exit For
            wsResult.Cells(rowIdxRlt, 1).Value = s1
            wsResult.Cells(rowIdxRlt, 2).Value = DateSerial(curYear, curMonth, i)
            wsResult.Cells(rowIdxRlt, 3).Value = wsSrc.Cells(rowIdx, i + 4).Value
            rowIdxRlt = rowIdxRlt + 1
        Next
        rowIdx = rowIdx + 1
    Wend
    MsgBox "In total " & (rowIdxRlt - 2) & " records were generated.", vbInformation, "Congratulation"
End Sub
时间: 2024-08-05 12:46:49

拼合逐月数据系列的相关文章

玩转大数据系列之Apache Pig高级技能之函数编程(六)

原创不易,转载请务必注明,原创地址,谢谢配合! http://qindongliang.iteye.com/ Pig系列的学习文档,希望对大家有用,感谢关注散仙! Apache Pig的前世今生 Apache Pig如何自定义UDF函数? Apache Pig5行代码怎么实现Hadoop的WordCount? Apache Pig入门学习文档(一) Apache Pig学习笔记(二) Apache Pig学习笔记之内置函数(三) 玩转大数据系列之Apache Pig如何与Apache Lucen

大数据系列(2)——Hadoop集群坏境CentOS安装

前言 前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMware虚拟机.CentOS 6.8 64 bit 安装流程 因为我的笔记本是Window7操作系统,然后内存配置,只有8G,内存配置太低了,当然为了演示,我会将Hadoop集群中的主节点分配2GB内存,然后剩余的三个节点都是1GB配置. 所有的节点存储我都设置为50GB. 在安装操作系统之前,我们需要

大数据系列(3)——Hadoop集群完全分布式坏境搭建

前言 上一篇我们讲解了Hadoop单节点的安装,并且已经通过VMware安装了一台CentOS 6.8的Linux系统,咱们本篇的目标就是要配置一个真正的完全分布式的Hadoop集群,闲言少叙,进入本篇的正题. 技术准备 VMware虚拟机.CentOS 6.8 64 bit 安装流程 我们先来回顾上一篇我们完成的单节点的Hadoop环境配置,已经配置了一个CentOS 6.8 并且完成了java运行环境的搭建,Hosts文件的配置.计算机名等诸多细节. 其实完成这一步之后我们就已经完成了Had

大数据系列之分布式数据库HBase-1.2.4+Zookeeper 安装及增删改查实践

之前介绍过关于HBase 0.9.8版本的部署及使用,本篇介绍下最新版本HBase1.2.4的部署及使用,有部分区别,详见如下: 1. 环境准备: 1.需要在Hadoop[hadoop-2.7.3] 启动正常情况下安装,hadoop安装可参考LZ的文章 大数据系列之Hadoop分布式集群部署 2. 资料包  zookeeper-3.4.9.tar.gz,hbase-1.2.4-bin.tar.gz 2. 安装步骤: 1.安装zookeeper 1.解压zookeeper-3.4.9.tar.gz

大数据系列之数据仓库Hive原理

Hive系列博文,持续更新~~~ 大数据系列之数据仓库Hive原理 大数据系列之数据仓库Hive安装 大数据系列之数据仓库Hive中分区Partition如何使用 大数据系列之数据仓库Hive命令使用及JDBC连接 Hive的工作原理简单来说就是一个查询引擎 先来一张Hive的架构图: Hive的工作原理如下: 接收到一个sql,后面做的事情包括:1.词法分析/语法分析 使用antlr将SQL语句解析成抽象语法树-AST2.语义分析 从Megastore获取模式信息,验证SQL语句中队表名,列名

大数据系列之数据仓库Hive安装

Hive主要分为以下几个部分 ?户接口1.包括CLI,JDBC/ODBC,WebUI元数据存储(metastore)1.默认存储在?带的数据库derby中,线上使?时?般换为MySQL驱动器(Driver)1.解释器.编译器.优化器.执?器Hadoop1.?MapReduce 进?计算,?HDFS 进?存储 前提部分:Hive的安装需要在Hadoop已经成功安装且成功启动的基础上进行安装.若没有安装请移步至大数据系列之Hadoop分布式集群部署. 使用包: apache-hive-2.1.1-b

大数据系列之分布式计算批处理引擎MapReduce实践

关于MR的工作原理不做过多叙述,本文将对MapReduce的实例WordCount(单词计数程序)做实践,从而理解MapReduce的工作机制. WordCount: 1.应用场景,在大量文件中存储了单词,单词之间用空格分隔 2.类似场景:搜索引擎中,统计最流行的N个搜索词,统计搜索词频率,帮助优化搜索词提示. 3.采用MapReduce执行过程如图 3.1MapReduce将作业的整个运行过程分为两个阶段 3.1.1Map阶段和Reduce阶段 Map阶段由一定数量的Map Task组成 输入

一步一步学习大数据系列

概要 一步一步学习大数据系列 包括: 一步一步学习大数据系列之 Linux 一步一步学习大数据系列之 Linux 01-Linux 系统安装 02-Linux 图形界面及文件系统结构介绍 03-局域网工作机制和网络地址配置 04-vmware 虚拟网络的配置 05-Linux 网络配置及 CRT 远程连接06- Linux常用命令 09-SSH免密登录配置. 10-CRT 工具设置 11 -more service- chkconfig 命令12.Linux软件安装 一步一步学习大数据系列之 H

大数据系列之分布式计算批处理引擎MapReduce实践-排序

清明刚过,该来学习点新的知识点了. 上次说到关于MapReduce对于文本中词频的统计使用WordCount.如果还有同学不熟悉的可以参考博文大数据系列之分布式计算批处理引擎MapReduce实践. 博文发表后很多同学私下反映对于MapReduce的处理原理没有了解到.在这篇博文中楼主与大家交流下MapReduce的数据处理原理及MR中各角色的职责. 文末还有示例代码讲解.. 1.MapReduce中的数据流动 最简单的过程: map - reduce 定制了partitioner以将map的结