项目结构:
不同于传统机器学习所基于的“数据库中的知识发现”,我们需要开发出一种“计算过程中的知识发现”方法来对不同于静止的数据表,而是一个不断变化的过程进行分析。在本项目中,需要分析挖掘的过程限制为自然条件下的生物化学反应。
既然是知识发现,就需要对知识的形式进行确定,我们假设在本课题中的知识可以由以下两种知识形式完备表述:
存在式知识:像_________这样的东西,叫做__________;
运动式知识:它们在_________的时候,在 ,会_________。
值得指出的是,存在式知识是一种递归形式,即可由原子存在a定义存在b,进一步还可由存在b定义更高一级的存在c。
本项目就需要设计一种程序,以第一原理、量子理论所描述的对象(基本粒子)作为原子存在,在输入一个以原子存在为对象集合的世界(w_0)之后,输出:1. t时间后这个世界的状态(w_t);2. 在此模拟过程中所形成的知识库(d_w)。这样,若再输入一个与先前世界有部分不同的差异世界Δw,在知识库(d_w)的帮助下,对差异世界的模拟会得到加速,同时差异世界中发生的一些全新情况也会更新数据库(d_(Δw∨w))。如此反复,对于一系列满足某些特定条件的世界簇W={w,Δw,...},我们就能得到一个描述此世界簇的知识库d_W=∨{d_·}。
其次,我们将本项目中需要分析的过程看作是由第一原理约束的一种随机过程。那么,存在式知识实质上就是对状态空间的一种归约与化简。通过存在式知识,原状态空间中的若干自由度x,y,z,可能被化简为新单一自由度i。而这种约化则是靠分析模拟计算中各个自由度之间的互信息来达成。同时,约化时挑选出原自由度这个行为本身,也可以看作对原状态空间的一种划分,即状态空间的拓扑结构。存在式知识的递归,也是对状态空间在拓扑结构上的递归。