2020春季学期第三周学习总结

本此博客对自己第三周主学习进行一些总结,本周主要学习了关于python以及大型数据的一些操作,学习的主要内容基本是关于数据的获取以及对数据进行一些分析。前面的博客已经介绍过对DataX的使用了,本次介绍一下另一种数据分析工具Kettle的使用,以下是自己的实际操作例子:

一、安装

链接: https://pan.baidu.com/s/1fabX8HCiYcHcGZXq-myDKA

提取码: wsxd

安装教程网上搜索即可

安装好后,打开安装的文件,找到spoon这个文件,双击进入kettle的欢迎界面,然后就可以进行操作了

1、先建一个作业

2、在核心对象这边选择自己要用到的工具。

简单的操作就不一一介绍了,推荐学习链接:http://113.31.104.47/portal/#/course/preview/b34d160db64624732ef152a1118af11a?courseId=1b7e84f4eb8552536e2267093dbd7972&fileId=2020021813_ef5f0bf841d95717a64dfaad4b2af879_lv0.mp4

下面是我用kettle将三个文本文档的数据读入到一个MySQL的数据表中

jjj转换

hb转换

tj转换

地点转换

去重:

时间转换:

结果截图:

原文地址:https://www.cnblogs.com/lover995/p/12445888.html

时间: 2024-08-30 14:39:33

2020春季学期第三周学习总结的相关文章

2020春季学期第八周学习总结

本周学习了python编程的一些常见算法编程实现,总结如下: 1.蒙特·卡罗法计算圆周率 1 import random 2 print("掷飞镖次数:") 3 number = int(input()) 4 k = 0 5 for i in range(1, number + 1): 6 x = random.uniform(-1, 1) # x随机取到-1到1的随机数 7 y = random.uniform(-1, 1) # Y随机取到-1到1的随机数 8 if (x * x +

2019春季学期第三周编程总结

实验代码: include <stdio.h> define a 10 int main() { int T,n,i,h,l,j,p; int sz[a][a]; scanf("%d",&T); for(i=1;i<=T;i++) { scanf("%d",&n); for(h=0;h<=n-1;h++) { for(l=0;l<=n-1;l++) scanf("%d",&sz[h][l]);

2019-2020-1学期 20192403 《网络空间安全专业导论》第三周学习总结

2019-2020-1学期 20192403 <网络空间安全专业导论>第三周学习总结 第六章 学习收获 计算机能够执行的操作 机器语言的定义 Pep/8 指令格式 汇编语言,汇编器,实例Hello程序的汇编语言版本 表达算法,伪代码 测试 理解思路 计算机能真正执行的程序设计是机器语言编写的-在Pep/8中体会运用机器语言-关于Pep/8本身(指令格式,一些指令)-汇编语言-表达算法(伪代码)-写伪代码算法,并检测-伪代码算法和汇编语言之间的联系(翻译) 理解难点 Pep/8的指令格式-时刻谨

2019-2020-1学期20192429《网络空间安全专业导论》第三周学习总结

2019-2020-1学期20192429<网络空间安全专业导论> 第六章 低级程序设计语言与伪代码 6.1 计算机操作 计算机是能够存储.检索和处理数据的可编程电子设备. 要改变计算机对数据的处理,只需要改变指令即可. 存储.检索和处理是计算机能够对数据执行的动作. 6.2 机器语言 计算机真正执行的程序设计指令是用机器语言编写的指令,这些指令固定在计算机的硬盘中. 机器语言(machine language):由计算机直接使用的二进制编码指令构成的语言. 这些指令是处理器唯一**真正能够执

20172313 2018-2019-1 《程序设计与数据结构》第三周学习总结

20172313 2018-2019-1 <程序设计与数据结构>第三周学习总结 教材学习内容总结 概述 队列是一种线性集合,其元素从一端加入,从另一端删除:队列的元素是按FIFO方式处理的.第一个进入的元素,也就是第一个退出的元素. 队列有队头(front)和队尾(rear),数据从队尾进入队列,从队头出队列,队头(front)指向队列的第一个数据,队尾(rear)指向队列中的最后一个数据. JavaAPI中的队列 Java集合API提供了java.util.Stack类,它实现了栈集合.但它

2018-2019-20172329 《Java软件结构与数据结构》第三周学习总结

2018-2019-20172329 <Java软件结构与数据结构>第三周学习总结 教材学习内容总结 <Java软件结构与数据结构>第五章-队列 一.概述 1.队列是什么? 队列是种线性集合,其元素从一端加入,从另一端删除:注:队列是按照先进先出的方式处理的.从队列中删除元素的次序,与放置元素的次序是一样的. 2.队列的构成 (1)方法: 操作 描述 enqueue 向队列末端添加一个元素 dequeue 从队列前段删除一个元素 first 考察队列前端的那个元素 isempty

20172332 2017-2018-2 《程序设计与数据结构》第三周学习总结

20172332 2017-2018-2 <程序设计与数据结构>第三周学习总结 教材学习内容总结 第五章 队列 1.队列是一种线性集合,元素从一段加入从另一端删除(先进先出). 2.队尾(tail),队首(head),队列前端(front),队列末端(rear). 3.使用队列的一些实例:凯撒密码,售票口模拟. 4.分别用链表和数组实现队列. 5.双端队列,允许从队列的两端添加.删除和查看元素. 6.环形数组实现队列. 教材学习中的问题和解决过程 问题1:为什么用数组实现队列时,环形数组较好?

20172310 2017-2018《程序设计与数据结构》(下)第三周学习总结

20172310 2017-2018<程序设计与数据结构>(下)第三周学习总结 教材学习内容总结 第五章 队列 队列:队列是一种线性集合,其元素从一端加入,从另一端删除,队列中的元素是按先进先出的方式处理的(FIFO).一个队列一端为前端(front,head), 一端为末端(rear,tail). 队列ADT所定义的操作 Java API中的队列 1.Java集合API提供了java.util.Stack类,它实现了栈集合.但它并没有提供队列类,而是提供了一个Queue接口, 由多个类(包括

2018-2019-1 20165214 《信息安全系统设计基础》第三周学习总结

20165214 2018-2017-1 <信息安全系统设计基础>第三周学习总结 教材学习内容总结 1.实际上gcc命令调用了一系列程序,将源代码转化成可执行代码. 2.存储器系统的实际实现是将多个硬件存储器和操作系统软件组合起来. 3.ISA:指令集体系结构,它定义了处理器状态.指令的格式.以及每条指令对状态的影响. 4.程序计数器(在IA32中,通常称为"PC",用%eip表示),指示将要执行的下一条指令在存储器中的地址. 5.操作系统负责管理虚拟地址空间,将虚拟地址翻