<%@ page contentType="text/html;charset=UTF-8"%> <%@ include file="/common/taglibs.jsp"%>BASE64编码转换原理-河北省电子商务认证有限公司(河北CA)
首页 > 技术专栏 > PKI相关知识 > PKI相关文档研究  
 
BASE64编码转换原理  

 

Base64编码其实是将3个8位字节转换为4个6位字节,( 3*8 = 4*6 = 24 ) 这4个六位字节

其实仍然是8位,只不过高两位被设置为0. 当一个字节只有6位有效时,它的取值空间为0

到 2的6次方减1 即63,也就是说被转换的Base64编码的每一个编码的取值空间为(0~63)

事实上,0~63之间的ASCII码有许多不可见字符,所以应该再做一个映射,映射表为

‘A‘ ~ ‘Z‘ ? ASCII(0 ~ 25)

‘a’ ~ ‘z‘ ? ASCII(26 ~ 51)

‘0’ ~ ‘9‘ ? ASCII(52 ~ 61)

‘+‘ ? ASCII(62)

‘/‘ ? ASCII(63)

这样就可以将3个8位字节,转换为4个可见字符。

具体的字节拆分方法为:(图(画得不好,领会精神 :-))

aaaaaabb ccccdddd eeffffff

~~~~~~~~ ~~~~~~~~ ~~~~~~~~

字节 1 字节 2 字节 3

||

\/

00aaaaaa 00bbcccc 00ddddee 00ffffff

注:上面的三个字节位原文,下面四个字节为Base64编码,其前两位均为0。

这样拆分的时候,原文的字节数量应该是3的倍数,当这个条件不能满足时,用全零字节

补足,转化时Base64编码用=号代替,这就是为什么有些Base64编码以一个或两个等号结

束的原因,但等号最多有两个,因为:如果F(origin)代表原文的字节数,F(remain)代

表余数,则

F(remain) = F(origin) MOD 3 成立。

所以F(remain)的可能取值为0,1,2.

如果设 n = [F(origin) – F(remain)] / 3

当F(remain) = 0 时,恰好转换为4*n个字节的Base64编码。

当F(remain) = 1 时,由于一个原文字节可以拆分为属于两个Base64编码的字节,为了

让Base64编码是4的倍数,所以应该为补2个等号。

当F(remain) = 2 时,由于两个原文字节可以拆分为属于3个Base64编码的字节,同理,

应该补上一个等号。

该文章转载自Visualc版。