AV1 比特流&解码过程规范-符号和缩略语

3、符号和缩略语

DCT

离散余弦变换

ADST

非对称离散正弦变换

LSB

最低有效位

MSB

最高有效位

WHT

沃尔什 Hadamard变换

该规范使用了一些常量整数,与特定句法元素的语义相关的常量在第6节中定义,其他的常数定义如下:

符号名 描述
REFS_PER_FRAME 7 帧间编码可以使用的参考帧数目
TOTAL_REFS_PER_FRAME 8 参考帧类型的数量(包括帧内类型)
BLOCK_SIZE_GROUPS 4 解码y_mode时上下文数目
BLOCK_SIZES 22 使用的不同块大小的数目
BLOCK_INVALID 14 标记值以标记非法的分区选择
MAX_SB_SIZE 128 超块以像素为单位的最大尺寸
MI_SIZE 4 模式信息块以像素为单位的最小尺寸
MI_SIZE_LOG2 2 最小模式信息块大小以2为底的对数值
MAX_TILE_WIDTH 4096 一个tile以亮度像素为单位的最大宽度
MAX_TILE_AREA 4096 * 2304 一个tile以亮度像素为单位的最大范围
MAX_TILE_ROWS 64 tile行的最大数目
MAX_TILE_COLS 64 tile列的最大数目
INTRABC_DELAY_PIXELS 256 可以使用intra块复制之前的水平像素数量
INTRABC_DELAY_SB64 4 可以使用intra块复制之前的64x64块的数量
NUM_REF_FRAMES 8 可以存储为将来参考的帧数
IS_INTER_CONTEXTS 4 is_inter上下文数目
REF_CONTEXTS 3 single_refcomp_refcomp_bwdrefuni_comp_refuni_comp_ref_p1 和 uni_comp_ref_p2的上下文数目
MAX_SEGMENTS 8 段映射中允许的段数
SEGMENT_ID_CONTEXTS 3 segment_id上下文数目
SEG_LVL_ALT_Q 0 量化器段特性索引
SEG_LVL_ALT_LF_Y_V 1 垂直亮度环滤波段特性索引
SEG_LVL_REF_FRAME 5 参考帧段特性索引
SEG_LVL_SKIP 6 skip段特性索引
SEG_LVL_GLOBALMV 7 全局mv特性索引
SEG_LVL_MAX 8 段特性数目
PLANE_TYPES 2 不同平面类型的数目(亮度和色度)
TX_SIZE_CONTEXTS 3 变换大小上下文数目
INTERP_FILTERS 3 interp_filter值的数目
INTERP_FILTER_CONTEXTS 16 interp_filter上下文数目
SKIP_MODE_CONTEXTS 3 解码skip_mode上下文数目
SKIP_CONTEXTS 3 解码skip上下文数目
PARTITION_CONTEXTS 4 解码partition上下文数目
TX_SIZES 5 正方形变换大小的数目
TX_SIZES_ALL 19 变换大小的数目 (包括非正方形大小)
TX_MODES 3 tx_mode值的数目
DCT_DCT 0 反变换 行用DCT算法 列用DCT算法
ADST_DCT 1 反变换 行用DCT算法 列用ADST算法?
DCT_ADST 2 反变换 行用ADST算法 列用DCT算法?
ADST_ADST 3 反变换 行用ADST算法 列用ADST算法
FLIPADST_DCT 4 反变换 行用FLIPADST算法 列用DCT算法
DCT_FLIPADST 5 反变换 行用DCT算法 列用FLIPADST算法
FLIPADST_FLIPADST 6 反变换 行用FLIPADST算法 列用FLIPADST算法
ADST_FLIPADST 7 反变换 行用ADST算法 列用FLIPADST算法
FLIPADST_ADST 8 反变换 行用FLIPADST算法 列用ADST算法
IDTX 9 反变换 行和列用恒等式
V_DCT 10 反变换 行用恒等式 列用DCT算法
H_DCT 11 反变换 行用DCT算法 列用恒等式
V_ADST 12 反变换 行用恒等式 列用ADST算法
H_ADST 13 反变换 行用ADST算法 列用恒等式
V_FLIPADST 14 反变换 行用恒等式 列用FLIPADST算法
H_FLIPADST 15 反变换 行用FLIPADST算法 列用恒等式
TX_TYPES 16 反变换类型数目
MB_MODE_COUNT 17 YMode值的数目
INTRA_MODES 13 y_mode值的数目
UV_INTRA_MODES_CFL_NOT_ALLOWED 13 当色度不允许从亮度推导时uv_mode值的数目
UV_INTRA_MODES_CFL_ALLOWED 14 当色度允许从亮度推导时uv_mode值的数目
COMPOUND_MODES 8 compound_mode值的数目
COMPOUND_MODE_CONTEXTS 8 compound_mode上下文数目
COMP_NEWMV_CTXS 5 当构建compound_mode上下文时可以使用的新的mv值的数目
NEW_MV_CONTEXTS 6 new_mv上下文数目
ZERO_MV_CONTEXTS 2 zero_mv上下文数目
REF_MV_CONTEXTS 6 ref_mv上下文数目
DRL_MODE_CONTEXTS 3 drl_mode上下文数目
MV_CONTEXTS 2 解码运动矢量上下文数目,包括一个用来做intra块复制
MV_INTRABC_CONTEXT 1 用来做intra块复制的运动矢量上下文
MV_JOINTS 4 mv_joint值的数目
MV_CLASSES 11 mv_class值的数目
CLASS0_SIZE 2 mv_class0_bit值的数目
MV_OFFSET_BITS 10 解码运动矢量使用的最大bit数
MAX_LOOP_FILTER 63 环滤波使用的最大值
REF_SCALE_SHIFT 14 缩放参考帧时的精度位数
SUBPEL_BITS 4 选择一个帧间预测过滤器内核时的精度位数
SUBPEL_MASK 15 ( 1 << SUBPEL_BITS ) - 1
SCALE_SUBPEL_BITS 10 计算帧间预测位置时的精度位数
MV_BORDER 128 裁剪运动矢量时使用的值
PALETTE_COLOR_CONTEXTS 5 颜色上下文值的数目
PALETTE_MAX_COLOR_CONTEXT_HASH 8 颜色上下文哈希和颜色上下文之间的映射数量
PALETTE_BLOCK_SIZE_CONTEXTS 7 调色板块大小值的数目
PALETTE_Y_MODE_CONTEXTS 3 调色板Y平面模式上下文值的数目
PALETTE_UV_MODE_CONTEXTS 2 调色板UV平面模式上下文值的数目
PALETTE_SIZES 7 palette_size值的数目
PALETTE_COLORS 8 palette_color值的数目
PALETTE_NUM_NEIGHBORS 3 调色板计算时考虑的相邻的数目
DELTA_Q_SMALL 3 用来表示量化器索引delta可选编码的值
DELTA_LF_SMALL 3 用来表示环滤波delta值可选编码的值
QM_TOTAL_SIZE 3344 量化矩阵值的数目
MAX_ANGLE_DELTA 3 AngleDeltaY 和 AngleDeltaUV最大幅度
DIRECTIONAL_MODES 8 方向帧内模式的数目
ANGLE_STEP 3 AngleDeltaY 或者 AngleDeltaUV每单位增加的角度.
TX_SET_TYPES_INTRA 3 帧内变换集类型的数目
TX_SET_TYPES_INTER 4 帧间变换集类型的数目
WARPEDMODEL_PREC_BITS 16 变形运动模型的内部精度
IDENTITY 0 变形模型只是一个恒等式变换
TRANSLATION 1 变形模型只是一个单纯的平移
ROTZOOM 2 变形模型是旋转 + 对称缩放 + 平移
AFFINE 3 变形模型是一个通用的仿射变换
GM_ABS_TRANS_BITS 12 如果是ROTZOOM或者AFFINE模型的一部分,此值是编码全局运动模型的平移分量的bit数
GM_ABS_TRANS_ONLY_BITS 9 如果是TRANSLATION模型的一部分,此值是编码全局运动模型的平移分量的bit数
GM_ABS_ALPHA_BITS 12 此值是编码全局运动模型非平移分量的bit数
DIV_LUT_PREC_BITS 14 在除数查找表中条目的分数bit数
DIV_LUT_BITS 8 在除数查找表中查找的分数bit数
DIV_LUT_NUM 257 除数查找表的条目个数
MOTION_MODES 3 运动模式的个数
SIMPLE 0 使用平移或者全局运动补偿
OBMC 1 使用重叠块运动补偿
LOCALWARP 2 使用本地变形运动补偿
LEAST_SQUARES_SAMPLES_MAX 8 计算一个本地变形时使用的最大样点数
LS_MV_MAX 256 在本地变形计算中包含的最大运动矢量差
WARPEDMODEL_TRANS_CLAMP 1<<23 变形平移分量使用的最大值
WARPEDMODEL_NONDIAGAFFINE_CLAMP 1<<13 变形矩阵分量使用的最大值
WARPEDPIXEL_PREC_SHIFTS 1<<6 用于变形过滤的相位数
WARPEDDIFF_PREC_BITS 10 变形过滤的额外精度bit数
GM_ALPHA_PREC_BITS 15 发送非平移变形模型系数需要的分数bit数
GM_TRANS_PREC_BITS 6 发送平移变形模型系数需要的分数bit数
GM_TRANS_ONLY_PREC_BITS 3 单纯的平移变形需要的分数bit数
INTERINTRA_MODES 4 帧间帧内模式的数目
MASK_MASTER_SIZE 64 MasterMask数组的大小
SEGMENT_ID_PREDICTED_CONTEXTS 3 segment_id_predicted上下文数目
IS_INTER_CONTEXTS 4 is_inter上下文数目
SKIP_CONTEXTS 3 skip上下文数目
FWD_REFS 4 前向参考帧句法元素的数目
BWD_REFS 3 后向参考帧句法元素的数目
SINGLE_REFS 7 单一的参考帧句法元素数目
UNIDIR_COMP_REFS 4 单向混合参考帧句法元素数目
COMPOUND_TYPES 2 compound_type值的数目
CFL_JOINT_SIGNS 8 cfl_alpha_signs值的数目
CFL_ALPHABET_SIZE 16 cfl_alpha_u 和 cfl_alpha_v值的数目
COMP_INTER_CONTEXTS 5 comp_mode上下文数目
COMP_REF_TYPE_CONTEXTS 5 comp_ref_type上下文数目
CFL_ALPHA_CONTEXTS 6 cfl_alpha_u 和 cfl_alpha_v上下文数目
INTRA_MODE_CONTEXTS 5 intra_frame_y_mode上下文数目
COMP_GROUP_IDX_CONTEXTS 6 comp_group_idx上下文数目
COMPOUND_IDX_CONTEXTS 6 compound_idx上下文数目
INTRA_EDGE_KERNELS 3 帧内边缘过滤器的过滤器核的数目
INTRA_EDGE_TAPS 5 帧内边缘过滤器的kernel taps数目
FRAME_LF_COUNT 4 环滤波强度值的数目
MAX_VARTX_DEPTH 2 可变变换树的最大深度
TXFM_PARTITION_CONTEXTS 21 txfm_split上下文数目
REF_CAT_LEVEL 640 近距离运动矢量的额外权重
MAX_REF_MV_STACK_SIZE 8 堆栈中运动矢量的最大数目
MFMV_STACK_SIZE 3 运动场运动矢量的栈大小
MAX_TX_DEPTH 2 当最大变换大小是8x8的时候tx_depth上下文的数目
WEDGE_TYPES 16 楔形掩模过程的方向数
FILTER_BITS 7 维纳滤波系数使用的bit数
WIENER_COEFFS 3 要读取的维纳滤波系数的数量
SGRPROJ_PARAMS_BITS 4 指定自导向过滤器集所需的位数
SGRPROJ_PRJ_SUBEXP_K 4 控制如何读取自引导的deltas
SGRPROJ_PRJ_BITS 7 在自引导的恢复过程中精度
SGRPROJ_RST_BITS 4 Restoration precision bits generated higher than source before projection
SGRPROJ_MTABLE_BITS 20 mtable划分表的精度
SGRPROJ_RECIP_BITS 12 按n表划分的精度
SGRPROJ_SGR_BITS 8 selfguided_restoration核心的内部精度
EC_PROB_SHIFT 6 在算术编码中减少CDF精度的位数
EC_MIN_PROB 4 算术编码中分配给每个符号的最小概率
SELECT_SCREEN_CONTENT_TOOLS 2 此值表示allow_screen_content_tools句法元素被编码
SELECT_INTEGER_MV 2 此值表示force_integer_mv句法元素被编码
RESTORATION_TILESIZE_MAX 256 一个循环恢复tile的最大值
MAX_FRAME_DISTANCE 31 计算加权预测时的最大距离
MAX_OFFSET_WIDTH 8 一个投影运动矢量最大水平偏移
MAX_OFFSET_HEIGHT 0 一个投影运动矢量最大垂直偏移
WARP_PARAM_REDUCE_BITS 6 修剪过程中参数的舍入位宽
NUM_BASE_LEVELS 2 量化器基础等级的数目
COEFF_BASE_RANGE 12 在num_base_level之上的量化器范围,即指数-哥伦布编码过程被激活之上
BR_CDF_SIZE 4 coeff_br上下文的数目
SIG_COEF_CONTEXTS_EOB 4 coeff_base_eob上下文的数目
SIG_COEF_CONTEXTS_2D 26 只有水平或者只有垂直变换的coeff_base上下文偏移
SIG_COEF_CONTEXTS 42 coeff_base上下文偏移
SIG_REF_DIFF_OFFSET_NUM 5 在决定coeff_base 和 coeff_base_eob上下文索引时使用的最大上下文样点数.
SUPERRES_NUM 8 上采样率的分子
SUPERRES_DENOM_MIN 9 上采样率的最小分母
SUPERRES_DENOM_BITS 3 指定上采样率分母的bit数
SUPERRES_FILTER_BITS 6 上采样过滤器选择的分母精度位数
SUPERRES_FILTER_SHIFTS 1 << SUPERRES_FILTER_BITS 上采样过滤器的相位数
SUPERRES_FILTER_TAPS 8 上采样过滤器的taps数目
SUPERRES_FILTER_OFFSET 3 上采样过滤器的像素偏移
SUPERRES_SCALE_BITS 14 在上采样中计算位置时需要的小数位数
SUPERRES_SCALE_MASK (1 << 14) - 1 在上采样中计算位置的掩码
SUPERRES_EXTRA_BITS 8 SUPERRES_SCALE_BITS 和 SUPERRES_FILTER_BITS精度之间的差异
TXB_SKIP_CONTEXTS 13 all_zero上下文数目
EOB_COEF_CONTEXTS 22 eob_extra上下文数目
DC_SIGN_CONTEXTS 3 dc_sign上下文数目
LEVEL_CONTEXTS 21 coeff_br上下文数目
TX_CLASS_2D 0 在两个方向上执行非恒等式变换的变换种类
TX_CLASS_HORIZ 1 只在水平方向上执行非恒等式变换的变换种类
TX_CLASS_VERT 2 只在垂直方向上执行非恒等式变换的变换种类
REFMVS_LIMIT ( 1 << 12 ) - 1 可以保存的最大参考MV分量
INTRA_FILTER_SCALE_BITS 4 帧内过滤过程缩放偏移
INTRA_FILTER_MODES 5 帧内过滤类型数目
COEFF_CDF_Q_CTXS 4 coeff( )句法结构可选择上下文类型的数目
PRIMARY_REF_NONE 7 primary_ref_frame表示没有主参考帧

原文地址:https://www.cnblogs.com/hspx/p/8978872.html

时间: 2025-01-08 19:22:34

AV1 比特流&解码过程规范-符号和缩略语的相关文章

TS流解码过程-ES-PES-PTS-DTS

转载自http://blog.chinaunix.net/uid-9688646-id-1998407.html TS 流解码过程: 1. 获取TS中的PAT 2. 获取TS中的PMT 3. 根据PMT可以知道当前网络中传输的视频(音频)类型(H264),相应的PID,PCR的PID等信息. 4. 设置demux 模块的视频Filter 为相应视频的PID和stream type等. 5. 从视频Demux Filter 后得到的TS数据包中的payload 数据就是 one piece of

使用C#处理基于比特流的数据

使用C#处理基于比特流的数据 0x00 起因 最近需要处理一些基于比特流的数据,计算机处理数据一般都是以byte(8bit)为单位的,使用BinaryReader读取的数据也是如此,即使读取bool型也是一个byte.不过借助于C#基础类库中提供的一些方法,也实现了对基于比特的数据的读取.任务完成后觉得基于比特的数据挺有意思,自己试了下用7比特和6比特编码常用ASCII字符.最后把一点新的写成博客,一方面做个记录,另一方面希望对有类似需求的园友有所帮助. 0x01 比特流数据的读取 假设我们有一

H.264解码过程剖析-4

x264开源工程实现H.264的视频编码,但没有提供对应的解码器.ffmpeg开源多媒体编解码集合汇集了市面上几乎所有媒体格式的编解码的源代码.其中的H264.c就是一个能正常解码x264编码码流的独立的源文件,其使用步骤也与上述的编码或解码CODEC应用案例基本相同.这一节通过自顶向下的方式,讲述H264.c如何实现H.264视频解码过程. H264.c源文件有几千行,代码量庞大,很不便于浏览.分析和移植.同时该文件还依赖其他源文件,组织结构较复杂,实现平台由于不是基于Windows的VC++

ffmpeg强化一:编解码过程,基本用法

1  术语: 什么是影片?其实就是一组(很多张)图片,时间间隔很小的连续展示出来,人们就觉得画面中的人物在动,这就是影片.那电影的实质就是N多张图片的集合.那 每张图片和帧又有什么关系呢?事实上,如果一部影片里面的图片,我们原封不动的全部存起来,空间会很大很大很大,但是如果通过一定的算法(这里不讲相关算 法),把每一张图片压缩(编码_encode)一下,变成 帧.再把帧连起来变成流,再把不同的流放到某个容器里面,这就是我们平常看见的电影文件了,文件 碟中谍4.H264.ACC.mkv,他为什么要

多媒体开发之---h264 取流解码实现

解码器在解码时,首先逐个字节读取NAL的数据,统计NAL的长度,然后再开始解码. nal_unit( NumBytesInNALunit ) {  /* NumBytesInNALunit为统计出来的数据长度 */       forbidden_zero_bit    // forbidden_zero_bit  等于 0表示网络传输没有出错     nal_ref_idc //   指示当前 NAL 的优先级.取值范围为 0-3,  值越高,表示当前 NAL 越重要,需要优先受到保护.H.2

[Python3]subprocess.check_output() 在python3的输出为bytes而非string,在实际使用过程中得增加一个解码过程decode(),不然会有问题

按以往python2的习惯编码输出报错 1 #-*- coding:utf-8 -*- 2 ''' 3 Created on 2018年7月21日 4 5 @author: lenovo 6 ''' 7 import os 8 import sys 9 import subprocess 10 from uiautomator import device as d 11 cmd = r'adb install F:\听力.apk' 12 info = subprocess.check_outpu

多路RTSP流解码:最高可支持12路视频编解码

RK3399/RK3328具有强大的视频编解码能力,Soc集成的硬件视频编解码器VPU,能同时处理多路视频的编解码,Soc集成的图形加速引擎RGA, 可以高效地处理图形缩放.旋转.颜色空间转换等操作.结合VPU和RGA,可以高效地实现视频流的解码和后处理,作为第三方应用处理的数据源. 调用API Rockchip开发的mpp库,提供了非常易于使用API,通过各种不同的控制项,可以适应多种不同场景的视频编解码应用. 硬件准备 RK3399平台:AIO-3399C主板 + 12路摄像头 RK3328

osgearth earth文件规范-符号参考

osgearth earth文件规范-符号参考 osgEarth用样式表渲染要素和注记. 本文档列出了可在样式表中使用的所有符号属性.不是每个符号是适用于每种情况:这只是一个主列表. 跳转到符号: •Geometry •Altitude •Extrusion •Icon •Model •Render •Skin •Text 开发人员注意: 在SDK 中,符号在osgEarth::Symbology命名空间中,每个符号类是以类似AltitudeSymbol这样的形式.下面的属性就是他们出现在ear

互不相同正整数的压缩算法:分页式多比特流

先记着,等实现完毕后再写测试表明:压缩比跟数据特征有关有的能达到170,有的只能达到18 不管怎么样,满足开发要求了 分页将整数按照65536进行分组,每组叫做一个页面,压缩处理都在此页面内进行;好处:4字节的整数全变成2字节的short了 多比特流将每个页面再次按照一定长度进行分块base:此块的基数bits:此块内整数的比特流,1表示对应整数存在,0表示不存在gate:bits中每固定个数个bit记作一个单元,此单元的bit全部为0,那么gate中对应的单个bit为0,否则为1bits压缩: