欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Base64编码解码原理及C#编程实例

程序员文章站 2023-12-19 14:36:04
一. base64编码由来 为什么会有base64编码呢?因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ascii码的控制字符就不能通过邮...

一. base64编码由来

为什么会有base64编码呢?因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ascii码的控制字符就不能通过邮件传送。这样用途就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情况下,做一种扩展方案来支持二进制文件的传送。把不可打印的字符也能用可打印字符来表示,问题就解决了。base64编码应运而生,base64就是一种基于64个可打印字符来表示二进制数据的表示方法。

二. base64编码原理

看一下base64的索引表,字符选用了"a-z、a-z、0-9、+、/" 64个可打印字符。数值代表字符的索引,这个是标准base64协议规定的,不能更改。64个字符用6个bit位就可以全部表示,一个字节有8个bit位,剩下两个bit就浪费掉了,这样就不得不牺牲一部分空间了。这里需要弄明白的就是一个base64字符是8个bit,但是有效部分只有右边的6个bit,左边两个永远是0。

Base64编码解码原理及C#编程实例

  那么怎么用6个有效bit来表示传统字符的8个bit呢?8和6的最小公倍数是24,也就是说3个传统字节可以由4个base64字符来表示,保证有效位数是一样的,这样就多了1/3的字节数来弥补base64只有6个有效bit的不足。你也可以说用两个base64字符也能表示一个传统字符,但是采用最小公倍数的方案其实是最减少浪费的。结合下边的图比较容易理解。man是三个字符,一共24个有效bit,只好用4个base64字符来凑齐24个有效位。红框表示的是对应的base64,6个有效位转化成相应的索引值再对应base64字符表,查出"man"对应的base64字符是"twfu"。说到这里有个原则不知道你发现了没有,要转换成base64的最小单位就是三个字节,对一个字符串来说每次都是三个字节三个字节的转换,对应的是base64的四个字节。这个搞清楚了其实就差不多了。

Base64编码解码原理及C#编程实例Base64编码解码原理及C#编程实例

  但是转换到最后你发现不够三个字节了怎么办呢?愿望终于实现了,我们可以用两个base64来表示一个字符或用三个base64表示两个字符,像下图的a对应的第二个base64的二进制位只有两个,把后边的四个补0就是了。所以a对应的base64字符就是qq。上边已经说过了,原则是base64字符的最小单位是四个字符一组,那这才两个字符,后边补两个"="吧。其实不用"="也不耽误解码,之所以用"=",可能是考虑到多段编码后的base64字符串拼起来也不会引起混淆。由此可见base64字符串只可能最后出现一个或两个"=",中间是不可能出现"="的。下图中字符"bc"的编码过程也是一样的。

Base64编码解码原理及C#编程实例

三.编程实现(c#)

编码:

复制代码 代码如下:

byte[] bytes=encoding.default.getbytes("要转换的字符串");
convert.tobase64string(bytes);

解码:
复制代码 代码如下:

byte[] outputb = convert.frombase64string("ztkwrstj");
string orgstr= encoding.default.getstring(outputb);

上一篇:

下一篇: