hadoop 输入路径用正则表达式被默认处理为多个参数的问题

运行命令

hadoop jar wordcount.jar com.WordCount /inpath/*{beijing,shanghai,guangzhou}* /outpath/

这个/inpath/*{beijing,shanghai,guangzhou}* 地址，hadoop自己会解析为多个参数，判定第二个参数，不是输出路径

解决方式：

hadoop jar wordcount.jar com.WordCount /inpath/‘{*beijing*,*shanghai*,*guangzhou*}‘ /outpath/

这样就可以了。

原文地址：https://www.cnblogs.com/yanghaolie/p/10538226.html

时间： 2024-08-12 20:26:57

hadoop 输入路径用正则表达式被默认处理为多个参数的问题的相关文章

Hadoop进阶之输入路径如何正则通配？

在hadoop的编程中,如果你是手写MapReduce来处理一些数据,那么就避免不了输入输出参数路径的设定,hadoop里文件基类FileInputFormat提供了如下几种api来制定: 如上图,里面有 (1)addInputPath(),每次添加一个输入路径Path (2)addInputPaths, 将多个路径以逗号分割的字符串,作为入参,支持多个路径 (3)setInputPath ,设置一个输入路径Path,会覆盖原来的路径 (4)setInputPath , 设置多个路径,支持Had

Hadoop on Mac with IntelliJ IDEA: 1 解决输入路径不存在问题

本文讲述使用IntelliJ IDEA时遇到Hadoop提示input path does not exist(输入路径不存在)的一种解决办法. 环境:Mac OS X 10.9.5, IntelliJ IDEA 13.1.4, Hadoop 1.2.1 Hadoop放在虚拟机中,宿主机通过SSH连接,IDE和数据文件在宿主机. 这是自学Hadoop的第三天.以前做过点.NET开发,Mac.IntelliJ IDEA.Hadoop.CentOS对我而言,相当陌生.第一份Hadoop代码就遇到了问

MapReduce wordcount 输入路径为目录 java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$POSIX.stat(Ljava/lang/String;)Lorg/apache/hadoop/io/nativeio/NativeIO$POSIX$Stat;

之前windows下执行wordcount都正常,今天执行的时候指定的输入路径是文件夹,然后就报了如题的错误,把输入路径改成文件后是正常的,也就是说目前的wordcount无法对多个文件操作报的异常是getStat出了问题,也就是说SHELL.WINDOWS是false了,于是猜测是hadoop.dll的问题,因为之前用的是3.0的,于是去GitHub上下了个3.1的,链接https://github.com/s911415/apache-hadoop-3.1.0-winutils/blob/

hadoop 输入路径用正则表达式被默认处理为多个参数的问题

hadoop 输入路径用正则表达式被默认处理为多个参数的问题的相关文章

Hadoop进阶之输入路径如何正则通配？

Hadoop on Mac with IntelliJ IDEA: 1 解决输入路径不存在问题

MapReduce wordcount 输入路径为目录 java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$POSIX.stat(Ljava/lang/String;)Lorg/apache/hadoop/io/nativeio/NativeIO$POSIX$Stat;

只能输入数字的正则表达式

38 py改变函数参数的值关键字参数和参数默认值函数中可变参数将序列中的元素值作为函数对应的参数值传

JMeter学习-011-JMeter 后置处理器实例之 - 正则表达式提取器（三）多参数获取进阶引用篇

MapReduce 编程系列八根据输入路径产生输出路径和清除HDFS目录

hadoop输入分片计算(Map Task个数的确定)

虚拟机上Hadoop输入相关命令都提示not found