1、按照时间戳范围查询记录
echo "scan ‘event_log‘, { COLUMN => ‘cf:sid‘, TIMERANGE => [1466265600272, 1471622400481]} " | hbase shell > ./record.txt
其中这里的cf:sid和key一致, 时间戳范围需要按照时间自己转换:
#current=`date "+%Y-%m-%d %H:%M:%S"` #获取当前时间,例:2015-03-11 12:33:41
current=“2015-03-11 12:33:41”
timeStamp=`date -d "$current" +%s` #将current转换为时间戳,精确到秒
currentTimeStamp=$((timeStamp*1000+`date "+%N"`/1000000)) #将current转换为时间戳,精确到毫秒
echo $currentTimeStamp
2、通过shell命令提取record.txt中的sid字段,并拼成hbase删除行命令
cat record.txt|awk ‘{print "deleteall ‘\‘‘event_log‘\‘‘", ",", "‘\‘‘"$1"‘\‘‘"}‘ > del.sh
3、生成hbase删除脚本
在del.sh头尾分别加上:
#!/bin/sh
exec hbase shell <<EOF
和
EOF
4、执行删除脚本
sh del.sh
时间: 2024-11-09 00:39:51