吕琳媛链路预测 网络科学与工程丛书:链路预测

2018-04-09
字体:
浏览:
文章简介:直接注释方法将根据网络中某个蛋白质的连接情况直接推测该蛋白质的功能.这类方法基于的假设是:在蛋白质相互作用网络中,距离相近的两个蛋白质更加倾向于拥有相似的功能.链路预测中基于节点相似性的方法实际上为我们提供了一系列计算节点距离的方式,可以认为相似性大的节点距离更近,因此倾向于具有相似的功能.此外,当已知标签稀疏,即只知道少量蛋白质的功能时,可以通过链路预测的方式挖掘未标签蛋白质与已标签蛋白质之间的潜在联系,从而提高功能预测的精度.基于模块的方法的思路是:首先将网络相关的蛋白质组成不同的模块,然后

直接注释方法将根据网络中某个蛋白质的连接情况直接推测该蛋白质的功能。这类方法基于的假设是:在蛋白质相互作用网络中,距离相近的两个蛋白质更加倾向于拥有相似的功能。链路预测中基于节点相似性的方法实际上为我们提供了一系列计算节点距离的方式,可以认为相似性大的节点距离更近,因此倾向于具有相似的功能。

此外,当已知标签稀疏,即只知道少量蛋白质的功能时,可以通过链路预测的方式挖掘未标签蛋白质与已标签蛋白质之间的潜在联系,从而提高功能预测的精度。

基于模块的方法的思路是:首先将网络相关的蛋白质组成不同的模块,然后根据该模块中已知的蛋白质的功能来得到整个模块所共有的可能功能,最后再来预测其中未知成员的功能。一个功能模块指其中的蛋白质所处的细胞位置以及相互作用使得它们可以实现一个特定的功能。

而基于功能模块的蛋白质功能标注方法主要目的不再是预测单个蛋白质的功能,而是试图发现模块中所有蛋白质的共同内在的功能。一旦模块确定,可以通过一些简单的方法来预测其功能,比如该模块中如果大部分的蛋白质都具有某种功能,那么这种功能就将赋予该模块。

本质上这种模块的划分与复杂网络的社团结构划分有很大的相似之处,而链路预测的方法可以帮助提高社团划分的准确性——基于节点相似性的方法本身也是社团划分的一类主要方法。

其他一些相关的问题包括:(1)探测蛋白复合体。蛋白复合体由几个蛋白质组成,在蛋白质作用网中表现为紧密的小子图。因此,通常的图聚类、派系挖掘、图分解等方法,都可以用来寻找蛋白复合体。

同样,通过预测来完整化蛋白质作用网,可以帮助寻找蛋白质复合体。(2)网络可靠性评估。前面提到测定蛋白质相互作用的实验成本很高,因此可以通过链路预测的方法提前给出一些可靠性较高的链接关系作为实验对象,与此同时也可以排除一些可靠性较低的链接关系。

另一方面,由于实验中的随机性因素和噪声的干扰,使得实验结果有可能是不可靠的。这时,链路预测中对于虚假边的识别方法可以帮助我们找出这些不可靠的结果,从而对实验结果进行有效的修正。……