下图是用 Gephi 对 LF4T (临汾4推)及他们好友/跟随关系的呈现,包括节点3974,连线5026,数据量不算很大,但效果看上去还算生动,尤其中间部分表现好友/跟随关系时所画出来的错综复杂、密密麻麻的连线颇有如梦似幻的玄妙之美。

 

但要读懂却不容易,为获得更可读的图形,做更多调整后,得到两幅可以读出ID的LF4T好友/跟随关系图。

LF4T 的共同好友

LF4T 的共同跟随

但这样把好友与跟随分开展示会失掉一些好友与跟随的交集,而在其它好友与跟随合并的图中又很难理解一些数据为什么要分布在不同的位置,以及为什么他们的排列不能更规则更易懂一些。也许这中间会有一些技法上的因素,但到后来还是想到从源头——两个用户与他们好友/跟随的关系中去寻找解释。于是就有了以下关于TaFFTb关系模型的发现,一个演示实例和一个还在拓展中的评分试验。

TaFFTb关系模型

在包含两个推特所有好友/跟随的群体中,会有一些好友/跟随是与这两个推特一起发生连接关系的,由这两个推特(Ta、Tb)与他们的共同好友/跟随(F/F)三者所形成的有向关系组合可以把这两个推特共同的好友/跟随区分为九种类型。这九种类型现被命名为TaFFTb关系模型。TaFFTb关系模型的生成方式见下图,以下每条连线组中间的圆表示某一类型所包含好友/跟随的集合。

说明:

* 并不一定每两个用户间都存在九种类型的好友与跟随,但充足情况下最多这九种关系;

* 在 TaFFTb 关系模型中,每个类型的好友/跟随都是唯一的;

 

TaFFTb 关系模型的一个实例

下面以LF4T中 @wangxm@waffler22 为例做一个实测,以展示 TaFFTb 关系模型在实际中可以使用的一个样子,见下图。

说明:

* 上图中间的三组九个节点,分别是九种类型用户节点的组合。九个节点从上到下的顺序与 TaFFTb关系模型相对应。

* 也可以用文本方式描述两个Twitter 在 TaFFTb 中的关系,比如可以用: @wangxm->31<-@waffler22 ,  @wangxm<->3<-@waffler22 ,  @wangxm->9<->@waffler22  分别表示模型中的前三个类型。

以TaFFTb关系模型为基础的一个评分设想

也可以把TaFFTb关系模型理解为投票形成,由Ta、Tb和他的好友/跟随共同投票形成。如果用九种关系的24个箭头表示票,则来自Ta、Tb的各六票,来自好友/跟随的共12票。并且这九种关系天然能够反映Ta、Tb的一些互相关系,在排列这些关系的过程中,逐渐萌生了一种打分的设想,于是尝试给TaFFTb关系模型增加一个评分方式。在这个评分方式中,九种类型的关系分为三组打分,每组中无法显示Ta与Tb差异的类型不参与评分。也就是说每组两个类型的关系参与评分,具体方式是比较两个参与评分的 F/F 的大小,如果对 Ta 有优势的类型中 F/F 圆大,则 Ta 加 1分;否则 Tb 加 1 分,满分是3分,具体见下图。

说明:

这里计算出的分值只是Ta 和 Tb 在Ta 、Tb在他们 F/F 网络中的权重比较。这种比较包含两方面的含义。

一种可以算是精神层面的,出发点的问题是:Ta和Tb谁更受人喜欢谁?谁比谁更有影响力?谁在网络中更有权力?谁的价值更大?等抽象的东西。虽然这些因素可能是非常微小的,但微弱的差异也是差异。但谁也无法否认,很多情况下微弱的差异是可以忽略不计的,所以这可能还是一个“你看着办吧”的结论。

另外一种稍微物质层面一些的,可以以路径为着眼点,他们认为,无论如何分值高的有更多的路径把信息重现在分值低的用户眼前——这主要是因为:好友会转发或评论分值高用户的消息。这听上去多少靠谱一些。