第5章数字媒体及应用5.1文本与文本处理5.2图像与图形5.3数字声音及应用5.4数字视频及应用5.1文本与文本处理5.1文本与文本处理5.1.1字符的编码5.1.2文本准备5.1.3文本的分类5.1文本与文本处理写作编辑排版印刷发行写作传统的文字处理过程5.1文本与文本处理计算机文字处理过程文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:(文本编辑器)文本编辑与排版格式化的电子文本(2)文本展现(文本阅读器)(5)文本处理(文本处理软件)(3)文本准备电子文本(1)(文字与图表的输入)文本存储与传输(4)(存档/通信软件)5.1文本与文本处理5.1.1.字符在计算机中的表示5.1文本与文本处理字符、字符集及其编码表文字的基本元素是字母和符号,统称为“字符”(character),它包括:字母、数字、标点、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符的二进位表示,称为该字符的编码或代码(code)不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的码表5.1文本与文本处理西文字符的编码——ASCII码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(ASCII码):(考点)ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII字符存在问题:字符集太小(只有128个字符)不同国家和地区使用不同的字符集及其编码,互不兼容东亚地区使用的大字符集无法编码0XXXXXXX5.1文本与文本处理标准ASCII字符集及其码表b6b5b4b3b2b1b0012345670123456789ABCDEFb6b5b4b3b2b1b0011010011010115.1文本与文本处理汉字如何编码?汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马······)汉字的特点数量大;字形复杂,同音字多,异体字多如何编码?确定收入多少字、哪些字?在字符集中如何排列?使用多少个二进位进行编码?05.1文本与文本处理常用的汉字编码字符集国家标准GB2312-1980汉字扩充规范GBK国家标准GB18030-2005台湾地区的标准汉字字符集CNS11643(BIG5,俗称“大五码”)...