基因表达网络构想
保留所有版权,请引用而不是转载本文(原文地址 https://yeecode.top/blog/85/ )。
说起神经网络,我们首先想到的是如火如荼的人工神经网络。这是计算机领域中正火的概念。
如图所示,一个人工神经网络包含多层(图中只绘制了四层),输入层的信息经过层层映射后得到了输出层的结果。而每一条连线,都代表了一个权重。即每一层的节点会按照不同权重受到上一层节点的影响,并将自己的结果输出给下一层。整个过程是单向的。
这样,输入层输入一组数据后,就会在输出层得到一个结果。
经过训练之后,神经网络能够对输入给出结果,但是往往不具有可解释性。也就是说,我们无法得知隐藏层中某个节点的含义,也无法得知某条连接的权重大小的含义。
人工神经网络的层级可以很多,被称为深度神经网络。基于它的软件系统已经能够在自动驾驶、棋类博弈、计算机视觉等诸多领域取得了卓越的成就。
听名称也能得知,人工神经网络是仿生学的成果。它的本源是生物神经网络。
生物神经网络中,神经元是一个非常重要的结构,层级上它是一个细胞。
一个神经元包含多个树突和一个轴突。其树突可以接受其他神经元或者信号源的刺激。神经元对这些刺激进行汇总后,可以判断自身是否产生神经冲动。而神经冲动则可以沿着轴突传导,最终传递给下一个神经元的树突。
这时我们便可以发现,人工神经网络中的节点和节点之间的关系,其实就是对神经元的模仿。
动物的神经系统就是一个神经网络,它能对外界环境做出判断,甚至产生记忆、意识等等。其同样的,整个系统的运行也不具有可解释性,甚至到现在,人类对其具体机制也不甚清楚。
神经网络,是一个起源于生物的绝佳发明。
既然这样,造物者可能不止使用一次。
我认为,遗传信息的表达就是神经网络的另一个应用。其输入是生物的DNA(也可能是RNA甚等),然后经过复杂的映射,形成各种性状。
例如,第一层,可以是碱基对(部分内含子外显子,全部包括)。第二层,可以是密码子,如下图所示。第三层,可以是氨基酸。
于是,可以网络的前几层可以这样标定含义。
但是我们也要知道,神经网络本身就不是可解释的。因此,我们的标定也只是粗略的指导。
例如,第三层中我们标定为氨基酸。但事实上,64个密码子中有61个指定了蛋白质中最常见的20种氨基酸。仍然有一些不常见的氨基酸不能被密码子指定,例如胶原蛋白中含有的羟脯氨酸1。
因此,第三层中的节点数实际上要大于20才对,并不是和密码子指定的氨基酸相对应的。
最终,经过组织、器官等层层表达,形成了一个复杂的生命体。
因此,不仅仅是神经系统。基因的表达,也可能是一个网络,其层级不少于7。
以上,我的个人猜测。
其验证,需要大量个体的基因序列。前期可以只训练和验证单一性状。
最后,我是架构师易哥,这里是架构研究所。
希望本文能让大家有所收获,也欢迎大家共同参与讨论。
欢迎关注我们,我会偶尔出没分享软件架构和编程开发相关的干货知识。
- 〔美〕J.D.沃森. 基因的分子生物学[M]. 科学出版社, 2005. [return]
可以访问个人知乎阅读更多文章:易哥(https://www.zhihu.com/people/yeecode),欢迎关注。