DNA:染色体和基因的结构在学习DNA作为遗传信息库之前,有必要重新考虑一下信息的本质。我们已经知道信息表达的序列,而且它与反应的混乱度和随机性的熵是完全相反的(Box14-1,364页);信息也被称为负熵。由此我们知道信息是与能量有关的。实际上,去定量和测量信息并把它与熵单位联系起来是可能的,但这就需要我们对这种可能性和数据进行复杂的考虑。在今天这个电子计算器和电脑大量被应用的时代,我们明白它们在遗传信息的贮存、加工处理和检索方面对减少劳动力的巨大作用。在计算机语言中,信息的单位是字节,它代表在两个被选择的可能性之间做出正确选择的数量。信息需要在两个字节给出的两个选择之间做出连续的选择。同样的信息需要在16个插件中按照两个选择的顺序选出正确的插件组成4个字节。通过这种方式,数字电脑就可以把信息转化为一系列双重选择并且保存清单、准备工资名单甚至录制交响乐。然而人体细胞内在信息的种类和数量远远超过了数字电脑的编程和生化学家提供信息和它们之间联系的能力。蛋白质中的20种氨基酸不仅仅只有20种编码单位,因为任意给定氨基酸在不同蛋白质内可能有不同含义。例如丝氨酸,一方面它可以作为一个信号分子修饰一个极性羟基使其能力形成氢键,或着作为酶活性中心的重要基团(例如胰蛋白酶、糖原磷酸化酶),另一方面又可以作为磷酸盐的载体(像牛奶中的酪蛋白干酪素)。要将具有多样性的DNA语言和20个氨基酸单位组成的蛋白质语言转化为数字语言是不可能的。也许有一个更简单的方式去说明DNA内的巨大的信息量,回到只有5386个碱基对的φΧ174病毒的碱基序列,对其详细的印刷仅仅只需要一页纸的空间。如果一个有四百万碱基对的大肠杆菌染色体碱基被印刷出来,大概需要740页纸如果把人体细胞内46对染色体碱基序列都印刷出来,大概需要820,000页纸,相当于我们这本书的容量的820倍。然而如果在转录、翻译和基因表达的调控过程(也许需要大量的附加信息)中没有丰富的关于编码和编程规则的知识,这些印刷品都将是无效的。现在让我们来学习DNA贮存遗传信息的结构以及其主要功能单位和遗传物质——基因和染色体的本质。DNA和RNA的不同功能首先,让我们简单的了解一下核酸的本质、功能和它在细胞内的位置。DNA是一个非常长的分子,有四种不同的脱氧核糖核甘酸组成,在每个有机体内都有特定的序列。DNA分子都是双链分子。原核细胞的染色体是由单个DNA分子束状分布在核区或者类核内。前面已经提到过原核生物是没有由...