这里有篇论文《基于子带谱平滑度的音频篡改检测》,可供参考。
这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。
大部分假无损就是上采样为高质量的音频,然后用无损格式封装。
11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。
22050Hz原始音频,一般情况下是自然逐步衰减(这取决与音频的内容,也有例外)
最后用各种分类器,足以检测出上采样的音频。
时间: 2024-09-29 17:51:04
这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。
大部分假无损就是上采样为高质量的音频,然后用无损格式封装。
11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。
22050Hz原始音频,一般情况下是自然逐步衰减(这取决与音频的内容,也有例外)
最后用各种分类器,足以检测出上采样的音频。