算术编码的基本概念

article/2025/9/16 3:21:10

二、算术编码的基本概念
算术编码属于熵编码的一种重要的类型,其作用同变长编码等熵编码方法类似,用于压缩输入数据中的统计冗余,并且使用算术编码的压缩同样是无损压缩。

在本系列第1篇中讨论了典型的变长编码方法——哈夫曼编码。包括哈夫曼编码在内的变长编码具有一个共同特点,就是针对每一个码元不同的概率,分配每个码元对应的码字。通常针对概率更高的码元,分配长度更短的码字;针对概率较低的码元,分配长度较长的码字。通过这种不同长度码字的分配使得整体输入信息的平均码字长度小于定长编码,达到数据压缩的效果。

另一方面,由于采用这种变长度的编码方法,变长编码存在一项难以突破的性能瓶颈:即使是某一个输入信源的概率再高,也至少需要1个bit的码字。这种特性限制了编码性能进一步向信源熵逼近,也导致了无法进一步提升整体的压缩性能。

算术编码的引入可以有效解决这个问题。算术编码的思想同变长编码完全不同,算术编码无法针对每一个输入码元准确细分出对应的码字。另外,变长编码可以针对短输入信息进行编码,而算术编码对类似一两个码元的输入信息通常没有任何意义,因为生成的码流长度通常更长。

在算术编码执行的过程中,始终需要两个区间来计算,这两个区间即信源的概率区间和码流的编码区间。

三、概率区间与编码区间
信源的概率区间用于表示输入信源的码元之间的概率关系。假设输入的信源为二进制信源,只存在0和1两个元素,那么元素0和1的概率之和为100%。如果0和1的概率比为7:3,那么概率区间可以用下图表示:

与概率区间按照码元的概率分割不同,编码区间为了标记输出码流,将自身区间递归二等分,分割点的左右分别表示一个码元0和1。每一次分割都增加一个bit输出。编码区间可以用下图表示:


四、一个简单的算术编码执行过程
在一次算术编码的执行前,为简便起见,首先假设输入的信源为0/1的二进制信源,0和1的概率比为7:3。即二者的概率为:

 p(0) = 0.7;
p(1) = 0.3;

假设输入的待编码信息为[0, 0, 1],在编码每一个符号时,都需要对概率区间进行分割,并通过与编码区间进行比较,判断是否输出码流的bit位,以及更新编码下一个符号的上下文。

在第一次进行分割之后,概率区间和编码区间的关系如下图所示:


第一个字符的概率区间分割之后,不满足输出码流的条件,因此结束这个字符的编码,准备开始编码下一个字符。

第二个字符依然为0,此时概率区间和编码区间的关系为:


此时概率区间已经完全处于编码区间的下半区,因此应输出一个bit-0。而后,编码区间的下半区间扩展2倍到原有的完整编码区间继续进行下一个编码。该过程由下图所示:


我们设定的最后一个待编码符号为1,因此最后一次分割概率区间,选取上30%作为结果。此时的概率区间分割结果如下图所示:

 

 
由图中可看出,概率区间已经完全处于编码区间的上半区,因此需要输出一个bit-1,并循环进行如下操作,直到概率区间长度大于编码区间总长的一半:

1.检测概率区间的长度和位置;
2.根据概率区间特性,输出0或1,或记录待输出位;
3.概率区间随编码区间归一化。


当循环结束后,对每一个码元编码的区间分割过程结束。

对码元的区间分割结束后,整个编码过程并未完全结束,还需要一个重要的收尾过程,即处理最终的概率区间。最终的概率区间的处理方法为:

1.检查最终概率区间下限的位置;
2.若该下限位置小于整体编码区间的1/4分割点,输出bit-0,否则输出bit-1。

原文链接:https://blog.csdn.net/shaqoneal/article/details/79167491

#ifndef _ARITHMETIC_CODER_H_
#define _ARITHMETIC_CODER_H_//定义编码区间的节点(4个)
#define FIRST_QUATER 2500
#define HALF_VALUE	 5000
#define THIRD_QUATER 7500
#define FULL_VALUE	 10000//定义一个算术编码器
typedef struct ARITHMETIC_ENCODER
{//定义区间long low;long high; //若概率区间小于半区长度但跨过编码区间的中点,则记录下一个待输出的比特long bits_to_follow;
} ARITHMETIC_ENCODER;int Encode_one_symbol(unsigned int symbol);int Encode_stop();#endif
#include "ArithmeticCoder.h"
#include "stdio.h"
/*|0---------------------7000|----------10000|输入0,在0-7000,输入1,在7000-10000,概率是7:3
*/
static unsigned int probability_model[3] = { 0, 7000, 10000 };
static unsigned int upper_bound = 10000;
//上下节点+待输出比特
ARITHMETIC_ENCODER encoder = { 0, FULL_VALUE, 0 };void output_bits(int bit)
{printf("%d", bit);while (encoder.bits_to_follow > 0){//持续输出待输出位的相反值,直到没有带输出位printf("%d", !bit);encoder.bits_to_follow--;}
}int Encode_one_symbol(unsigned int symbol)
{//当前区间长度long range = encoder.high - encoder.low + 1;//encoder.high = encoder.low + (range * probability_model[symbol + 1] / upper_bound) - 1;encoder.low = encoder.low + (range * probability_model[symbol] / upper_bound);while (1){//当前的高点小于中点,输出0if (encoder.high < HALF_VALUE){// Output 0;output_bits(0);}//当前低点大于中点,输出1,并重新归一化区间else if (encoder.low >= HALF_VALUE){// Output 1;output_bits(1);//输出1后,值在上半区,不能直接高低点直接*2,会导致范围超过10000,//所以先减去半区间的值。在最后再做*2操作进行归一化encoder.high -= HALF_VALUE;encoder.low -= HALF_VALUE;}//低点大于1/4分界点,高点小于3/4分界点,不确定输出0还是1else if (encoder.low >= FIRST_QUATER && encoder.high < THIRD_QUATER){//记录待输出比特,并归一化,需要先减去1/4,再乘2//[2500-7500]-->[0-10000]encoder.bits_to_follow++;encoder.high -= FIRST_QUATER;encoder.low -= FIRST_QUATER;}//区间长度大于半区长度,直接退出else{break;}//最后再归一化encoder.low = 2 * encoder.low;encoder.high = 2 * encoder.high + 1;}return 0;
}int Encode_stop()
{//待输出自增1encoder.bits_to_follow++;//如果低点小于前1/4值,输出0if (encoder.low < FIRST_QUATER){output_bits(0);} //否则输出1else{output_bits(1);}printf("\n");return 0;
}
#include "stdafx.h"
#include "ArithmeticCoder.h"
int main() {unsigned int input_data[] = { 0, 1, 1 };//计算输入数组中有多少个元素unsigned int input_length = sizeof(input_data) / sizeof(unsigned int);for (int idx = 0; idx < input_length; idx++){//编码每一个元素Encode_one_symbol(input_data[idx]);}Encode_stop();return 0;
}


http://chatgpt.dhexx.cn/article/Sd8edyPi.shtml

相关文章

Otsu大津算法公式推导及python实现

目录 前言 一、类间平方差是什么&#xff1f; 二、公式推导及实现 1.求类间平方差 2.opencv-python编程实现 2.1 引入图像并灰度化 2.2 查看灰度值的分布情况 2.3 求全局平均阈值 2.4 求最大类间方差 3.算法的验证 总结 前言 OTSU&#xff08;大津算法&#xff09;是…

OTSU算法原理

OTSU算法原理及实现&#xff1a; 最大类间方差是由日本学者大津(Nobuyuki Otsu)于1979年提出&#xff0c;是一种自适应的阈值确定方法。算法假设图像像素能够根据阈值&#xff0c;被分成背景[background]和目标[objects]两部分。然后&#xff0c;计算该最佳阈值来区分这两类像素…

大津阈值分割算法(OTSU处理图像)

1.算法原理简述 对于图像I(x,y)&#xff0c;前景(即目标)和背景的分割阈值记作T&#xff0c;属于前景的像素点数占整幅图像的比例记为ω0&#xff0c;其平均灰度μ0&#xff1b;背景像素点数占整幅图像的比例为ω1&#xff0c;其平均灰度为μ1。图像的总平均灰度记为μ&#xf…

[图像处理]14.分割算法比较 OTSU算法+自适应阈值算法+分水岭

参考文献&#xff1a; OTSU阈值分割孔洞填充海陆分离_SwordKii的博客-CSDN博客 drawContours函数_普通网友的博客-CSDN博客_drawcontours R329-opencv阈值分割算法——自适应阈值_Third Impact的博客-CSDN博客_opencv自适应阈值分割 分水岭算法的python实现及解析_进不去的…

OTSU算法 (大津算法)理解代码

OTSU算法&#xff1a;对图像进行二值化的算法 介绍 OTSU算法是一种自适应的阈值确定的方法&#xff0c;又称大津阈值分割法&#xff0c;是最小二乘法意义下的最优分割。 它是按图像的灰度特性&#xff0c;将图像分成背景和前景两部分。因方差是灰度分布均匀性的一种度量,背景…

Pr-快速上手-基本操作-教程

视频链接: Pr教程 视频设计到的知识点: 视频的剪辑bgm的管理添加字幕及弹幕的添加鬼畜视频的制作发布教程

Pr常用操作技巧

操作技巧持续更新中 1.premiere如何裁剪视频尺寸 视频尺寸怎么修改 1.将premiere左下角的视频素材直接向右拖动到编辑区中 2.鼠标左键单击视频,然后选择上方的【效果】 3.这时,页面左侧将弹出效果的菜单栏,依次选择效果→视频效果→变换→裁剪 4.鼠标左键按住【裁剪】不放,直接…

Premiere: 基本操作

1、首先进入编辑模式&#xff0c;使得视频能加效果 2、这时候能找到视频的效果添加&#xff0c;这里有视频的水平翻转&#xff0c;高斯模糊等&#xff0c;需要什么效果直接&#xff0c;把该效果抓到视频上就可以。

PR的入门基础教程

提示&#xff1a;这里只记述作者学习PR入门基础教程视频后的总结 文章目录 常用视频概念第1天学习总结第2天学习总结第3天学习总结 常用视频概念 第1天学习总结 第2天学习总结 第3天学习总结

Adobe Premiere Pro快速入门教程

简介&#xff1a; 适用于纯新手零基础&#xff0c;看完本教程即可完成常用视频编辑技巧。 采用Adobe Premiere Pro 2020版本 windows10操作系统 一、制作 照片音频字幕的视频 目标&#xff1a;把三张图片和一个音乐做成带字幕的视频。&#xff08;素材请自行准备&#xff0…

使用pr的8大技巧

许多小伙伴是通过pr这个软件进行素材剪辑的&#xff0c;当我们面对许多素材需要剪辑的时候&#xff0c;往往被这些素材弄得头昏脑涨&#xff0c;剪辑拼接的费时费力&#xff0c;最后出来的成品效果也不太好&#xff0c;下面就告诉大家一些pr使用的技巧&#xff0c;来提升我们的…

Premiere 零基础快速上手教程

关注并星标“高级农民工” 回复“视频”可获取视频剪辑软件和教程 在前几天的文章中&#xff0c;我分享了几款主流视频剪辑软件&#xff1a; 最主流的视频剪辑软件 简单来说就是&#xff0c;手机端用「剪映」这一款 app 就够&#xff0c;当你熟练到发现手机剪视频不方便&#x…

pr基础学习笔记

pr基础学习笔记&#xff08;正题&#xff09; 推荐几个小技巧 1.快速插入 2.快速移动小片段 2. 另&#xff1a;移动Ctrl是多轨移动移动CtrlAlt是单轨移动3.如何去除两个片段之间的空档&#xff1f; 4.两种选择工具的比较 附&#xff1a; pr快捷键 应用程序 选择工具…

pr基础入门

一、快速认识 PR 主界面并导入素材 修改 名称、位置&#xff0c;其他不用变&#xff0c;点击确定 进入界面如下&#xff1a; 认识、添加必要 窗口 导入素材方法 1.直接将文件拖入pr中 2.导入媒体以开始&#xff0c;部分右键创建 素材箱 进入素材箱&#xff0c;右键选择导入&a…

PR(基础剪辑)

一.剪辑步骤&#xff1a; 1.先粗剪后精剪&#xff1a; 粗剪&#xff1a; 精剪&#xff1a; 二. 常用键&#xff1a; 1. i&#xff1a;设置素材的起点 o&#xff1a;设置素材的终点 &#xff08;在预览素材时&#xff09; 2.快速浏览素材&#xff1a; l&#xff1a;按一次常速…

Pr 入门系列之十:基本图形

在 Pr 中&#xff0c;文字&#xff08;包括字幕&#xff09;以及形状等被归类为图形 Graphics。 一个图形剪辑里可包含多个文本图层、形状图层以及其它媒体文件等图形元素。 提示&#xff1a; 1、图形剪辑不会出现在项目面板中&#xff0c;除非升级为源图。 2、与 Ps 一样&…

PR(Adobe Premiere Pro)软件基础知识

一、基础参数设置 时长 时长为视频时间的长度。基本单位为秒。但是在PR软件中&#xff0c;有更为精准的时间单位计算为帧&#xff0c;也就是把1秒分为若干份&#xff0c;一份就是一帧&#xff0c;一帧也就可以理解为一张图片。所以在PR软件中视频显示的时间长度表述为 时&…

Premiere基础操作

一&#xff1a;设置缓存 二&#xff1a;ctrI导入素材 三&#xff1a;导入图像序列 四&#xff1a;打开吸附。 打开吸附后素材会对齐。 五&#xff1a;按~键可以全屏窗口。 六&#xff1a;向前选择轨道工具。 在时间线上点击&#xff0c;向前选中时间线上素材。向后选择轨道工具…

pr剪视频基本操作

1 打开pr 2 导入设置 1&#xff09;双击左下角“项目”窗口&#xff0c;导入准备好的视频 2&#xff09;建立一个序列 点击文件 -> 新建 -> 序列 设置自定义序列 3 修建编辑 1&#xff09;双击视频素材&#xff0c;在预览框&#xff08;源&#xff09;中可以点击播放或…

【PR】零基础快速入门教程

【PR】零基础快速入门教程 PR&#xff08;Premiere&#xff09;能做什么&#xff1f;PR欢迎界面及新建项目工作区及窗口说明导入文件建立序列视频剪辑添加字幕导出视频 使用软件&#xff1a;Premiere2020 新年卷起来&#xff0c;写文章已近不能满足与我了&#xff0c;我要向着更…