分类目录归档:世界之理

落后的生物学 · 下

让我们从最初的惊愕中冷静下来。首先,能在广袤无垠同时生存条件又极端苛刻的野外找到黑龙的准确位置已经是大功一件。因为我们冒险的出发点并不是这里,而在更早。能从一张白纸变成这么复杂的网络图本身就已经是巨大的一步。这就如同社会发展初期的资本原始积累一样,是一件很枯燥甚至“血淋淋”的事。也就是大概十多年前吧,能克隆出一个基因就已经是可以拿生物学博士学位的事情(所谓克隆基因就是根据你找到的突变体的性状最终定位出造成这种变化的具体基因在染色体上的位置,也就是正向遗传学的内容)——我的意思是说,这个“血淋淋”的时代距离我们并不遥远。

继续阅读

[Op.Cr]关于逻辑与生命的一些历史

OpCr总述视频(我自己私底下是这么命名的)最后敲定的,其实是它正式上传时的标题。也就是《再一次,去用逻辑理解生命》这个标题。当时构思标题时其实是比较仓促的,标题本身并不能和视频的内容完美契合,实际上包含了一些视频中未讲述到的背景。比如,为什么是“再一次”?实际上,在了解了一些这个话题上的历史、以及一些现状之后,可以发现我的这个OpCr这个想法并非空穴来风,而是整个文明向着某个更高等级智慧一次又一次冲锋中的一个小小浪花。


BATTLE 1:希尔伯特计划(1920s)
20世纪初的科学家们应该是目前来说最意气风发的一届科学家了,经典物理学的胜利让他们觉得自己已经就要完成theory of everything了。在我看来,希尔伯特计划背后的野心比所谓的万物理论甚至更大。如果说“科学就是事实”(语出爱因斯坦),那希尔伯特计划几乎就是想用“科学”去描述一切,那么所有是“事实”的描述就是真,不是“事实”的描述就是假。并且,这一个判定过程可以让一个机器自动完成。这如果真的完成了,那恐怕不仅仅是theory of everything了,而是theory of everything even it does not exist…
不用猜,这个计划最后失败了。就算到了今天,阿贝尔不完备定理到底是不是“人工智能”的天花板都还是处于一个颇具争议的位置。
MORE:《【混乱博物馆】哥德尔、埃舍尔、巴赫》https://www.bilibili.com/video/av15566273/
《【混乱博物馆】哥德尔证明:智力的交响乐》https://www.bilibili.com/video/av15719703/

BATTLE 2:EDVAC(1940s)
EDVAC被誉为世界上第一台电子计算机,也就是我们现在所谓的computer的老祖宗。但是其实,设计制造EDVAC的初衷并不像现在电脑的使用那么“世俗”,看电影玩游戏购个物什么的。
——在用逻辑去解释一切这个尝试失败之后,那群伟大的前辈(就算失败了)转而思考一个更弱一点命题
——如果用逻辑去解释“一切”还存在难度,那能否只是去解释“一切”中的某一个“存在”呢?
——哪个存在我们最感兴趣?
——当然是我们自己了
——也就是生命
其实在计算机设计之初,试图用逻辑去解释生命,比如大脑的运作,就已经有先例了。他们试图使用当时最先进的数学语言,比如控制论来描述“知道”本身。想用逻辑去冲破弗洛伊德的精神分析法。某种程度上,他们做到了。但是当他们想进一步,用1:1理论(而不是某种被高度抽象化简的模型)来解释大脑的行动时,进展却不如预期的顺利。再加上一些世俗(八卦)的原因,这次远征以失败告终,最后两位前辈献出了自己的生命。
MORE:《逻辑与人生:一颗数学巨星的陨落》http://mp.weixin.qq.com/s/UJFDbl3hxNkn2ggp54KTvA

BREAK (1970s)
虽然用逻辑去解释大脑的尝试也以失败告终,但是计算机却幸运地活了下来,在工业水平的不断提高之下,计算机的计算速度也成指数地提高。20世纪的最后几十年就像一个中场休息一样,我不敢确定,但是肯定有人,看着不断上升的计算机性能,握紧手心,跃跃欲试。虽然他们肯定明白,前辈的失利,和计算速度并无多少关系。

BATTE 3(2010s)
确实,前辈的失利确实和计算速度并无多少关系。但是人类啊,或者说生命就是这样的一种存在。哪怕已经经历了千百次失败,现状也跟之前的失败也没有多少改善,可总有人还要再次尝试,哪怕用着一个看起来挺笨的方法。
计算机工程师想穷尽一切可能、
生物学家想摸清楚每一个蛋白分子之间的关系、
合成化学家想重现从无机到有机,从死到生的这个世界过程,
有时候觉得,这些研究的思路和前辈相比并不算高明,但是我们无法以此批评他们,甚至我们应该向他们致以敬意。在传统数理逻辑几乎黔驴技穷的现在,是他们还在探索着下一个办法,笨拙地——因为他们能依靠的实在不多;但是却从未放弃——大概因为他们都还相信着一个更美好的未来吧。

让我们再一次,去用逻辑理解生命吧。

[Op.Cr]一些比较成熟的设想

项目结构:
不同于传统机器学习所基于的“数据库中的知识发现”,我们需要开发出一种“计算过程中的知识发现”方法来对不同于静止的数据表,而是一个不断变化的过程进行分析。在本项目中,需要分析挖掘的过程限制为自然条件下的生物化学反应。
既然是知识发现,就需要对知识的形式进行确定,我们假设在本课题中的知识可以由以下两种知识形式完备表述:
存在式知识:像_________这样的东西,叫做__________;
运动式知识:它们在_________的时候,在 ,会_________。
值得指出的是,存在式知识是一种递归形式,即可由原子存在a定义存在b,进一步还可由存在b定义更高一级的存在c。
本项目就需要设计一种程序,以第一原理、量子理论所描述的对象(基本粒子)作为原子存在,在输入一个以原子存在为对象集合的世界(w_0)之后,输出:1. t时间后这个世界的状态(w_t);2. 在此模拟过程中所形成的知识库(d_w)。这样,若再输入一个与先前世界有部分不同的差异世界Δw,在知识库(d_w)的帮助下,对差异世界的模拟会得到加速,同时差异世界中发生的一些全新情况也会更新数据库(d_(Δw∨w))。如此反复,对于一系列满足某些特定条件的世界簇W={w,Δw,…},我们就能得到一个描述此世界簇的知识库d_W=∨{d_·}。
其次,我们将本项目中需要分析的过程看作是由第一原理约束的一种随机过程。那么,存在式知识实质上就是对状态空间的一种归约与化简。通过存在式知识,原状态空间中的若干自由度x,y,z,可能被化简为新单一自由度i。而这种约化则是靠分析模拟计算中各个自由度之间的互信息来达成。同时,约化时挑选出原自由度这个行为本身,也可以看作对原状态空间的一种划分,即状态空间的拓扑结构。存在式知识的递归,也是对状态空间在拓扑结构上的递归。

[Op.Cr]一个想法

如今,“人工生命”已经不是难题,我们已经可以根据一些已知的生命共有规律来设计出一些模拟生命行为的对象——比如某种计算机程序;生命游戏就是一个经典的例子。它通过四条非常简单的游戏规则就展现出了一个千变万化的“生命”世界。
科普视频:《【混乱博物馆】生命游戏:另一种计算机》 https://www.bilibili.com/video/av11279860/
但是这都还仅仅是在我们自己设计的游戏规则内进行演绎,自然界的生命里那些我们未知的部分依然无法探究。所以我们更应该把目光集中到模拟现实中已知的生命活动上去。
2012年,发表在cell上的一篇文章,第一次对一个完整细胞(支原体)的生命过程进行了模拟。作者将细胞的生命过程分成了28个子模块,按时间片递进的架构进行演绎。虽然文章取得了令人瞩目的成功,但是整个模拟还是属于“建模”的层面。如果按照计算化学中,一切都必须从量子力学中的“第一原理”出发的“从头计算”方法来看,这个模型显然还是不符合的,这也就限制了这个模型的价值。
Karr, Jonathan R., et al. “A Whole-Cell Computational Model Predicts Phenotype from Genotype.” Cell (2012)
制约我们直接按从头计算方法来模拟生命过程的主要因素之一就是计算量(除此之外还有计算精度等技术性瓶颈)。虽然理论上,所有生命活动以及生化反应都应服从基本物理定律。但是由于这些物理定律的描述对象大多是原子甚至亚原子级(或者是一个同构系统),而一个高级生命作为一个高度异构的系统,包含的原子是一个天文数字。我们现在的计算机性能几乎只能勉强达到模拟宏观物质水平的一半——是数量级上的一半。当然,坐等计算机性能提高自然是一个办法;但是,除了干等,我们应该还有其他办法。

我的看法是,我们实际上没有必要一定要去完成这么多模拟计算。一个生命过程中很多子过程都是高度冗余、高度重复或者是可以忽略不计的,我们理应对这些子过程进行抽象与简化。就像解题时我们在前面已经计算出了1+1=2,那么在后面的计算中再次遇到需要计算1+1的时候,就会直接代入先前的答案而没必要再算一遍。
实际上,我们人在进行研究时已经有意识或无意识地完成了这步工作。比如,研究水流时将无数水分子看作一个整体,研究细胞间的通讯时不再考虑细胞内部的活动,而是将细胞看作一个整体,仅仅考虑细胞膜表面的受体以及信号分子。在研究生命之间的相互影响时也用少数几个状态量来代表生命体。而这其中的隐患与问题在于,这些抽象是严重依赖研究者自身的,缺乏足够的客观性。比如,在现在的分子生物学研究中,同一个基因在不同的实验中体现出了不同的功能就可能被命名为多个名字,当然也有人尝试解决这个混乱与冗余,比如基因本体论(GO)。但是其本质依旧是一种人为的划分。
如果我们能寻找出一个公理化的抽象与化简标准,将这步工作交给计算机来完成,是否就可以在加速模拟效率的同时还不失模拟的客观性呢?
总的来说,我们在进行科学研究的过程中,已经形成了一套约定俗成的认识世界的流程与方法。现在我们要做的,不是把认识世界的结果教给计算机,而是将这套方法论教给计算机。这样计算机在重复发现我们的认识结果的基础上,还可能发现一些我们认识不到,或者根本在以前无法认识的对象。

实际上,在实验科学中,“重复”是一个非常重要的问题,以生物学为例有生物学重复、技术重复等等。但是生物学实验由于实验对象的特殊性,其黑盒性是无法避免的。这从游戏规则上就制约了我们对生命的进一步了解。
相反在计算机领域,每一次Debug都可以看做一次白盒实验,毕竟计算机本身就是我们人自己创造出来的机器,我们对其中的构造与运行是可以做到了如执掌的。那么,想办法利用计算机的白盒性,在计算机中重复出一个生物过程,对生物学研究的帮助无疑是巨大的。如先前所介绍的,这种重复在一些低级生物学过程上已经可以完成,但是对于高级生命过程我们现在还无能为力,我们的目标就是让计算机学会“跳步”,甚至学会“偷懒”,加速我们的模拟进程。

而这,就是「数字重复」——Cyber Repeat。
“行动”一词更能带给人行动力,所以整个构想的命名就成了「数字重复行动」,CR同时又可以是铬元素的缩写,那就neta为「铬元素行动」吧~

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

不完备能力评价及相关话题

推荐BGM:永远亭组曲 http://music.163.com/#/song?id=850990

在各种RPG游戏中,一般都会根据你的“能力”与“装备”水平分配给你相应难度的任务去完成。比如你的能力值为5,那么一般可以领到能力要求为4左右的任务,而绝不可能领到能力水平为233的任务;反过来,如果你能力已经是233,当然可以去接受能力值要求为5的任务,不过这时任务的收益对于你来说就微乎其微,让你感觉自己就是在浪费点卡。

在这里,主要就存在「评估系统」和「分配系统」,分别对每个玩家的能力值进行评级,以及分发各种难度水平的任务。

现实(也就是大家熟悉的地球OL)中也存在这样的系统,只不过要更复杂一些。首先对于大多数“雇佣制”的大家,评估和分配任务都是由自己的上司老板来进行的。当然,老板也有老板的老板,自然地,那“Final Boss”由谁来评估和分配任务呢?简单起见,想想各位创业的同学的情况就好了,社会、世界是最终的评估和分配者。创业的成功与否,取决于创业的现实收益与预期收益等,对于这个问题这个世界自有一套标准。

然而问题在于,跟游戏不同,我在这一段会简单证明:不存在能完整评述一个人能力的评估系统。这个命题可以由哥德尔不完备定理直接推导出来。这是一个数学上的著名定理,哥德尔证明了任何一个(数学中的形式)系统,哪怕是自洽的,它也必定包含某些既不能证明也不能证伪的命题。好了,接下来一个三段式推理就OK了:一个评估系统必然是一套数学形式系统的具体;对一个人的能力评估必然是该系统语境下的一个命题;那么必然存在一些该系统无法证明也无法证伪的(能力评估)命题。也就是说,这个人的能力评价中永远存在「未知」的部分,而无法被完整的评述。

当然,对于我们每个人的能力评价并不是一次成型的,中考、高考、考研、各种考核都是对我们能力的一次(再)评价。我们虽然永远无法获得一个完全与自己实际能力相称的评价,但是我们可以通过这种多次再评价来不断逼近这个「真实」。简单起见,假设你的真实能力为5,第一次评价的结果是4,如果系统足够“智慧”,发现了这个评价偏低、低估了你的能力,下一次给了6的评价,结果发现又高估了你的能力……如此不断。然而这种尝试与逼近并不是无限次的,对于大多数人的评估次数就那么几次。在这之中,高估一个人的能力是非常容易发现的,所以「系统」肯定会倾向于看低一个人的能力,以保证分配的任务最后能成功完成。只有非常少的幸运儿,可以拿到与自己能力相称的“完美任务”。

这些都还是建立在一个人的能力值固定的基础上的讨论,如果考虑进一个人能力的动态变化,情况将会更加复杂,这里就从略了。

――✽+†+✽――✽+†+✽――✽+†+✽――

――✽+†+✽――✽+†+✽――✽+†+✽――

这里似乎得出了一个挺悲观的结论:我们永远无法得到与自己相称的社会评价、也永远无法去接手与自己实力相称的工作。明白点说这就是这个世界的套路,为了生存,“Final Boss”必须考虑他手中的资源被有效地利用,为了保证分配出去的任务都能被完成,在无法完整确认一个人的真实能力的情况下,「上位者」们只能对于我们被迫只能选择一个较低的评价。

当你的能力被评估确定,那你所能领取的任务也就相应被确定,由此你的生活环境也就被确定了。也就是说:被评价成有怎样的能力,就会被要求去做怎样的事,就有怎样的生活,也就会遇到怎样的人。这一点对于我来说,多少还有点细思恐极的。因为简单地说,一旦「系统」对某个人评估“失败”——给了他一个比实际能力低太多的评估结果,这个失误对于「系统」可能无足轻重,但是对于个人却几乎是毁灭性的。极端的例子比如,一些天才的能力在被人们认识到以前就患焦虑症、自闭症最终早逝。

有的人或许是乐见于此的:轻轻松松地就可以完成任务,何乐而不为?去尝试高难度的任务意味着更辛苦的工作、更高的失败风险,游戏里失败了可以重新挑战,人生里失败了就不一定了。人生的“副本”攻略一次下来可能就是几年、甚至十几年,人生又有几个十年呢?然而人是智慧生命,以上的这些都是纯逻辑推理,我们的智慧肯定并不止于此。以上的这些,无非都是一些基本的趋利避害,任何一个动物、植物甚至病菌都是可以完成决策的——哪怕它们或许并不能看懂这些文字——但是这些原则与逻辑是刻在我们的DNA中的。而我们人如果也只是单纯像个动物一样活着的话……想到这,我觉得我理解一些日语中「社畜」一词背后的深意了。

就算如此,就算是自己确认自己的能力极限到底在哪里也是个困难的问题。比如现在,在研究所的大家讨论的都是手里的课题与项目;在NGA里则是一帮子的工作党玩家,游戏之外就是工作老婆的日复一日;微信朋友圈里的各位同学则是哪位昨天做了一顿好菜、今天又去了某地玩耍、或者是某个新段子新鸡汤。这些是我的生活吗?好像是的,又好像不是。这些是我想要的生活吗?好像是的,又好像不是。看过我以往日志的朋友大概可以了解,我所投身或者致力于投身的生活,不是日常、也不是所谓的“人生需要点仪式感”这样简单,而是某些已经可以算作「史诗」的存在——然而问题在于,我有这样的能力来完成这样的史诗级任务吗?怎么证明?又或者、这种我所谓的「史诗」,只是一种自取灭亡的聊以自慰的托辞?这种疑惑是双重的,因为这既是对自己的质疑、也是对于这个世界的质疑——我对这个世界的运行法则、和对自己的实力一样,是打了一个问号的。随便看看周围吧各位,我们现在深深困于经济、种族、阶级问题而无法自拔,别说什么我们的征途是星尘大海了,这样下去人类迟早自己把自己玩死。

――✽+†+✽――✽+†+✽――✽+†+✽――

――✽+†+✽――✽+†+✽――✽+†+✽――

自从八年前被一脚踹了出来(具体见《从梦再次启程的地方·上》),我就一直保持着“旅行者”的姿态在缓缓前行,大学去东秦学物联网是这样、研究生来上海读生信也是如此。我似乎已经习惯了在纷繁的景色中一次又一次地转换,单一的色彩无论如何鲜艳,最后总会了解、熟悉、厌倦,然后就会去寻找下一种鲜艳的颜色。似乎也有朋友说过我这是“业务能力太突出导致过剩”,不过我并不敢接受这个答案,因为从事实上的任何考试、考核评估都没有能佐证这个的证据。如果我的业务能力真的优秀到溢出的话,那我的考试以及各种考核的结果应该十分优异才对,然而事实并非如此;反过来,如果我的业务能力不够突出,那我应该不会很快地熟悉。也就是说,这个命题就是妥妥的前面说的“不能证明也无法证伪的部分”,这也是我为什么会对自己以及世界产生质疑的动因。当然我还是相信肯定有一个答案能完美解释这个“二律背反”的,某个比我们在这讨论的评价体系更高级的体系。

之前微信一条状态就写到:“当一位旅者用太多的时间游历了太多的地方之后,「家乡」也就逐渐对他失去了意义。”别看“异国的旅者”似乎是一个非常光鲜的角色,万一哪天玩脱了“客死他乡”那可是很惨的~,这里的旅行、客死,当然不仅仅是指地理上的、还有学术上的意义;不仅仅指的躯体上的、还有灵魂上的意义。所以人生的旅行和平时的旅行不同,并不是一件轻松的事情。哪怕因此其实已经有过很多不愉快甚至悲伤,我也没有停下来的理由。深呼吸、揉一揉双眼、握了握左右手,继续上路。

写到这里这篇日志也基本结束了,日志的标题是neta自《欧拉图及相关话题》——本来欧拉图以及欧拉回路等的问题在普通教材中最多也就是半章的事,可原始文献中这本书却足足写了近500页的一整本书,真心佩服前人的治学精神。2017年,24岁,在各种名人传记中,这已经到了“make something different”的时候了,虽然确实有可以这么形容的行动规划,也已有几位朋友听过我的大概设想了,不过还有很多技术细节需要逐一解决。这里是一位行走在科学与梦之间的旅者的闲言碎语,各位新年快乐。

唐启鸣ΣSyaoran
2016.12.31