字符集{a,b,c,d,e,f,g,h}中的字母构成,这8个字母出现的概率分别为0.07,0.19,0.02,0.06,

汉字抱歉2022-10-04 11:39:540条回答

字符集{a,b,c,d,e,f,g,h}中的字母构成,这8个字母出现的概率分别为0.07,0.19,0.02,0.06,0.32,0.03,0.21,0.1
为这8个字母设计哈夫曼编码.
1001
   b:01
   c:10111
   d:1010
   e:11
   f:10110
   g:00
   h:1000
或a:0110;b:010;c:1110;d:0111;e:00;f:1111;g:10;h:110
那个是对的还是都是对的,

已提交,审核后显示!提交回复

共0条回复

相关推荐

为一下的字符集编写正则表达式.(1) 第一个不为0的所有数字串.(2) 所有表示奇数的数字串
dianzi0611年前1
焰火宝贝 共回答了19个问题 | 采纳率94.7%
1、[1-9]d*
2、d*[13579]
在下列汉字编码标准(字符集)中,包含汉字最多的是哪一个?
在下列汉字编码标准(字符集)中,包含汉字最多的是哪一个?
A. GB2312-80 B. UCS-2 C. GB18030 D. CJK
我有两本书,答案分别是B和C,请问到底哪一个是正确的,并请解释一下。非常感谢!
AK17u1年前1
5291350 共回答了19个问题 | 采纳率89.5%
C
应该是GB18030多
UCS2表示的是unicode bmp上的全部字符
GB18030包括了extension A和B
extension A在bmp上,
但是extension B不在(它在sip上)
所以gb18030的汉字多
设字符集D={A,B,C,D,E},各字符使用频率W={10,2,5,6,4},画出对字符进行哈夫曼编码时所对应的哈夫曼
设字符集D={A,B,C,D,E},各字符使用频率W={10,2,5,6,4},画出对字符进行哈夫曼编码时所对应的哈夫曼树,并给出各字符的编码.是不是只有一种可能
香茶蛋1年前0
共回答了个问题 | 采纳率
国家标准信息交换用汉字编码基本字符集GB2312(80)中给出的二维代码表,共有__________.
国家标准信息交换用汉字编码基本字符集GB2312(80)中给出的二维代码表,共有__________.
A、94行×94列
B、49行×49列
C、49行×94列
D、94行×49列
133567031年前1
横箫斜吹雨 共回答了17个问题 | 采纳率100%
70.国家标准信息交换用汉字编码基本字符集GB2312(80)中给出的二维代码表,共有( B ).
A.94行×49列 B.94行×94列 C.49行×94列 D.49行×49列
在你的题里也就是选 A .
这个事一整套的题目.全套见链接:
请问:一个字符与一个汉字和一个英文字母还有一个符号的关系?还有什么是字符集?
请问:一个字符与一个汉字和一个英文字母还有一个符号的关系?还有什么是字符集?
最好列个等价式.
bizput31年前1
yrmt 共回答了18个问题 | 采纳率100%
一个英文字母占1个字节.
一个汉字所占字节取决于字符集的选择.
一个字符就是指一个英文字母或一个汉字.
一个符号所占字节取决于字符集.
常用中文字符用utf-8编码占用3个字节,超大字符集中的更大多数汉字要占4个字节,GBK、GB2312收编的汉字占2个字节.
utf-8,GBK什么的都是字符集.
哈夫曼编码问题假设一段报文中所含的字符集为{A,B,C,D,E,F,G},它们各自出现的频率为{7,3,5,4,10,6
哈夫曼编码问题
假设一段报文中所含的字符集为{A,B,C,D,E,F,G},它们各自出现的频率为{7,3,5,4,10,6,9},请构造对应的哈夫曼树,给出各个字符的哈夫曼编码,并计算出该哈夫曼树的带权路径长度.
陈雪21年前0
共回答了个问题 | 采纳率
为以下的字符集编写正则表达式。 (1) 第一个不为0的所有数字串。 (2) 所有表示奇数的数字串。
凌子mm1年前1
红色的牙齿 共回答了19个问题 | 采纳率100%
1、 ^[^0]d* 匹配所有第一个不为0的正整数
2、 ^-?d*[13579]$ 匹配所有末位数为奇数的整数
什么是GBK字符集仅仅就GBK字符集进行名词解释,有何作用,优缺点,产生的时间原因
三清居主人1年前1
翅膀在飛 共回答了24个问题 | 采纳率91.7%
GBK 是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称 Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会 1995 年 12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司 1995 年 12 月 15 日联合以技监标函 [1995] 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施.这一版的 GBK 规范为 1.0 版.GB 即“国标”,K 是“扩展”的汉语拼音第一个字母.
GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准.
ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称 UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与 Unicode 组织的 Unicode 编码完全兼容.ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》.我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1).
ISO 10646 是一个包括世界上各种语言的书面形式以及附加符号的编码体系.其中的汉字部分称为“CJK 统一汉字”(C 指中国,J 指日本,K 指朝鲜).而其中的中国部分,包括了源自中国大陆的 GB 2312、GB 12345、《现代汉语通用字表》等法定标准的汉字和符号,以及源自台湾的 CNS 11643 标准中第 1、2 字面(基本等同于 BIG-5 编码)、第 14 字面的汉字和符号.
一、字汇
GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充.具体包括:
1.GB 2312 中的全部汉字、非汉字符号.
2.GB 13000.1 中的其他 CJK 汉字.以上合计 20902 个 GB 化汉字.
3.《简化字总表》中未收入 GB 13000.1 的 52 个汉字.
4.《康熙字典》及《辞海》中未收入 GB 13000.1 的 28 个部首及重要构件.
5.13 个汉字结构符.
6.BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 个图形符号.
7.GB 12345 增补的 6 个拼音符号.
8.汉字“○”.
9.GB 12345 增补的 19 个竖排标点符号(GB 12345 较 GB 2312 增补竖排标点符号 29 个,其中 10 个未被 GB 13000.1 收入,故 GBK 亦不收).
10.从 GB 13000.1 的 CJK 兼容区挑选出的 21 个汉字.
11.GB 13000.1 收入的 31 个 IBM OS/2 专用符号.
二、码位分配及顺序
GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线.总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个.
全部编码分为三大部分:
1.汉字区.包括:
a.GB 2312 汉字区.即 GBK/2:B0A1-F7FE.收录 GB 2312 汉字 6763 个,按原顺序排列.
b.GB 13000.1 扩充汉字区.包括:
(1) GBK/3:8140-A0FE.收录 GB 13000.1 中的 CJK 汉字 6080 个.
(2) GBK/4:AA40-FEA0.收录 CJK 汉字和增补的汉字 8160 个.CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列.
2.图形符号区.包括:
a.GB 2312 非汉字符号区.即 GBK/1:A1A1-A9FE.其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号.计符号 717 个.
b.GB 13000.1 扩充非汉字区.即 GBK/5:A840-A9A0.BIG-5 非汉字符号、结构符和“○”排列在此区.计符号 166 个.
3.用户自定义区:分为(1)(2)(3)三个小区.
(1) AAA1-AFFE,码位 564 个.
(2) F8A1-FEFE,码位 658 个.
(3) A140-A7A0,码位 672 个.
第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性.
三、字形
GBK 对字形作了如下的规定:
1.原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致.
2.在 CJK 汉字认同规则的总框架内,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形.
3.对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在 GBK 码位上暂安放旧字形.这样,在许多情况下 GBK 收入了同一汉字的新旧两种字形.
4.非汉字符号的字形,凡 GB 2312 已经包括的,与 GB 2312 保持一致;超出 GB 2312 的部分,与 GB 13000.1 保持一致.
5.带声调的拼音字母取半角形式.
GB2312-80汉字字符集共有6763个汉字,一个24×24点阵的汉字占___B.
从此替爷征1年前1
yangxc1 共回答了19个问题 | 采纳率84.2%
24*24/872 BYTES
标准的ASCII码字符集包含的编码个数为多少个
标准的ASCII码字符集包含的编码个数为多少个
127,or128?
ww是ss的1年前1
喵喵JJ 共回答了9个问题 | 采纳率77.8%
标准ASCII码字符集总共的编码有128个,包括32个通用控制符,10个十进制数码,52个英文大小写字母和34个专用符号.
3. 设有字符集S={A,B,C,E,F,G},权值集合W={2,4,7,9,6,11},对字符集合根据对应权值集合进行
3. 设有字符集S={A,B,C,E,F,G},权值集合W={2,4,7,9,6,11},对字符集合根据对应权值集合进行哈夫曼编码.
(1) 画出构造的哈夫曼树;
(2) 计算哈夫曼树带权路径长度;
(3) 求各字符的哈夫曼编码.
用Java写,谢谢
jjm8888881年前1
大哲小宝 共回答了14个问题 | 采纳率85.7%
要写出完整的哈夫曼编码?我给你算这3个问题的答案行不,写代码20分好少的说