BASE64编码转换原理-河北省电子商务认证有限公司（河北CA）

<%@ page contentType="text/html;charset=UTF-8"%> <%@ include file="/common/taglibs.jsp"%>BASE64编码转换原理-河北省电子商务认证有限公司（河北CA）

BASE64编码转换原理

Base64编码其实是将3个8位字节转换为4个6位字节,( 3*8 = 4*6 = 24 ) 这4个六位字节

其实仍然是8位,只不过高两位被设置为0. 当一个字节只有6位有效时,它的取值空间为0

到 2的6次方减1 即63,也就是说被转换的Base64编码的每一个编码的取值空间为(0~63)

。

事实上，0~63之间的ASCII码有许多不可见字符，所以应该再做一个映射，映射表为

‘A‘ ~ ‘Z‘ ? ASCII（0 ~ 25）

‘a’ ~ ‘z‘ ? ASCII（26 ~ 51）

‘0’ ~ ‘9‘ ? ASCII（52 ~ 61）

‘+‘ ? ASCII（62）

‘/‘ ? ASCII（63）

这样就可以将3个8位字节，转换为4个可见字符。

具体的字节拆分方法为：(图（画得不好，领会精神 :-))

aaaaaabb ccccdddd eeffffff

~~~~~~~~ ~~~~~~~~ ~~~~~~~~

字节 1 字节 2 字节 3

00aaaaaa 00bbcccc 00ddddee 00ffffff

注：上面的三个字节位原文，下面四个字节为Base64编码，其前两位均为0。

这样拆分的时候，原文的字节数量应该是3的倍数，当这个条件不能满足时，用全零字节

补足，转化时Base64编码用=号代替，这就是为什么有些Base64编码以一个或两个等号结

束的原因，但等号最多有两个，因为：如果F(origin)代表原文的字节数，F(remain)代

表余数，则

F(remain) = F(origin) MOD 3 成立。

所以F(remain)的可能取值为0,1,2.

如果设 n = [F(origin) – F(remain)] / 3

当F(remain) = 0 时，恰好转换为4*n个字节的Base64编码。

当F(remain) = 1 时，由于一个原文字节可以拆分为属于两个Base64编码的字节，为了

让Base64编码是4的倍数，所以应该为补2个等号。

当F(remain) = 2 时，由于两个原文字节可以拆分为属于3个Base64编码的字节，同理，

应该补上一个等号。

该文章转载自Visualc版。