1. base64
bse64是一种以64个可见字符集对二进制数据进行编码的编码算法。
1.1 应用范围
base64常用于网络数据传输过程的编解码环节。HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了base64来将一个较长的一个标识符(一般为128-bit的UUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用Base64编码不仅比较简短,同时也具有不可读性,即所编码的数据不会被人用肉眼所直接看到 [引用百度百科] 。
- 电子邮件加密;
- 数据加密;
- 采用base64来规避反垃圾邮件工具,因为那些工具通常都不会翻译base64的讯息;
- 图片、文件网络传输;
- Json存储二进制数据。
1.2 编码表
bse64编码表是64个可见字符集。
1.3 编码过程
base64编码,每3个8位明文数据为一组,取这3个字数据的ASCII码,然后以6位为一组组成4个新的数据。对于不足3字节的处理:
【1】不足三字节后面填充0;
【2】对于编码前的数据产生的6位,如果为0,则索引到的字符为‘A’;因不足3字节而填充的0,用’=’来替代,有点结束符的意思。
例如对“ABCD”进行base64编码:
对于不足6位的补零(图中浅红色的4位),索引为“A”;对于最后不足3字节,进行补零处理(图中红色部分),以“=”替代,因此,“ABCD”的base64编码为:“QUJDRA==”。
1.4 解码过程
base64解码,即是base64编码的逆过程,如果理解了编过过程,解码过程也就容易理解。将base64编码数据根据编码表分别索引到编码值,然后每4个编码值一组组成一个24位的数据流,解码为3个字符。对于末尾位“=”的base64数据,最终取得的4字节数据,需要去掉“=”再进行转换。
解码过程可以参考上图,逆向理解:“QUJDRA==” ——>“ABCD”
2. 实现
base64应用范围很广,因此很多编程语言的标准库都提供base64编解码库,如PHP、Python等,一般不需重复造轮子,但能够重复造一遍轮子,会理解更透彻。
2.1 C语言版
#include <stdint.h>
#include <stdbool.h>
#include <stdlib.h>
#include <string.h>
#include <stdio.h>const char *base64_table="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"; /* base64编码表 */ static int num_strchr(const char *str, char c)
{const char *p = strchr(str, c);if (NULL == p){return -1;}return p - str;
}uint32_t base64_get_dest_len(uint32_t src_len)
{return 4 * ((src_len+2)/3);
}uint32_t src_get_dest_len(uint32_t base64_len)
{return base64_len/4*3 - 2;
}int base64_encode(const char *src_str, uint32_t src_len, char *dest_str, uint32_t dest_len)
{ uint32_t i = 0;uint32_t len = 0; len = base64_get_dest_len(src_len);if (dest_len < len){/* 空间不足 */return -1;}for (i=0; i<src_len/3; i++) { *dest_str++ = base64_table[(src_str[0]>>2) & 0x3f]; /* 取第一字符前6bit */ *dest_str++ = base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)]; /* 第一字符的后2bit与第二字符的前4位进行合并 */ *dest_str++ = base64_table[((src_str[1]<<2) & 0x3c) | ((src_str[2]>>6) & 0x03)]; /* 将第二字符的后4bit与第三字符的前2bit组合并 */ *dest_str++ = base64_table[src_str[2] & 0x3f]; /* 取第三字符的后6bit */ src_str += 3;} /* 非3的整数倍补“=” */if (1 == (src_len%3)){*dest_str++ = base64_table[(src_str[0]>>2) & 0x3f]; *dest_str++ = base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)]; *dest_str++ = '='; *dest_str++ = '='; }else if (2 == (src_len%3)) { *dest_str++ = base64_table[(src_str[0]>>2) & 0x3f]; *dest_str++ = base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)]; *dest_str++ = base64_table[(src_str[1]<<2) & 0x3c];*dest_str++ = '='; } *dest_str = '\0'; return 0;
}int base64_decode(const char *src_str, uint32_t src_len, char *dest_str, uint32_t dest_len)
{uint32_t i = 0;char buf[4] = {0};if (dest_len < src_get_dest_len(src_len)){return -1;}for (; (src_str[i]!='\0') && (i<src_len); i+=4){/* 四个码译成三个字符 */buf[0] = num_strchr(base64_table, src_str[i]);buf[1] = num_strchr(base64_table, src_str[i+1]);*dest_str++ = ((buf[0] << 2) & 0xfc) | ((buf[1]>>4) & 0x03);if (src_str[i+2] == '='){break;}buf[2] = num_strchr(base64_table, src_str[i + 2]);*dest_str++ = ((buf[1] << 4) & 0xf0) | ((buf[2] >> 2) & 0x0f);if (src_str[i + 3] == '='){break;}buf[3] = num_strchr(base64_table, src_str[i + 3]);*dest_str++ = ((buf[2] << 6) & 0xc0) | (buf[3] & 0x3f);}*dest_str = '\0';return 0;
}int main(int argc,char **argv)
{ char *buf = NULL;uint32_t dest_len = 0;uint32_t src_len = 0;if (argc < 3){return -1;}if (strcmp(argv[1],"decode") == 0) { src_len = strlen(argv[2]);dest_len = src_get_dest_len(src_len);buf = (char*)malloc(dest_len);if (NULL == buf){return -1;}base64_decode(argv[2], src_len, buf, dest_len);printf("base64 str:%s\n",argv[2]); printf("base64_decode str:%s\n",buf);}else if(strcmp(argv[1],"encode") == 0) {src_len = strlen(argv[2]);dest_len = base64_get_dest_len(src_len);buf = (char*)malloc(dest_len);if (NULL == buf){return -1;}base64_encode(argv[2], src_len, buf, dest_len);printf("src str:%s\n",argv[2]); printf("base64_encode str:%s\n",buf); }free(buf);buf = NULL;return 0;
}
编译测试:
可用base64编码工具验证:http://tool.oschina.net/encrypt?type=3