网络与社会备考提纲

小学期选课是网络与社会,当时这门课给我的感觉是讲社交网络,SNS的一些知识,没想到讲的是复杂网络,不过基本上是科普性质的。

课程教材老师选用的是巴拉巴西的 《链接网络新科学》,书的目录如下:

第1章 导言
第2章 随机宇宙
第3章 六度分隔
第4章 小世界
第5章 中心节点和连接者
第6章 80/20规则
第7章 富者愈富
第8章 爱因斯坦的遗产
第9章 阿基里斯的脚踵
第10章 病毒与时尚
第11章 互联网的觉醒
第12章 破碎的万维网
第13章 生命地图
第14章 网络经济
第15章 没有蜘蛛织网的网络

 

其中考试内容大概就是六度分隔,80/20规则这些。

这里总结收集一些概念。

一、导言

从今天开始,对于复杂网络开始进行介入和学习。

主要是在最近看了《社会计算》方面的相关信息。发现基于图的研究能够很好的拓展一个人对于社会网络的认识,增强对于用户和产品之间的认识,这种认识能够帮助你找到一种新的思路用于拓展对于后续的web*.0的理解。所以会形成一个每章节的心得体会笔记。

image

image (引自http://hi.baidu.com/wxc2009hi/blog/item/ad5a88c58b33dfc2d10060a0.html)

 

二、随机宇宙

随机宇宙是在数学基础上定义的一个名字,它并不是真实宇宙的客观模型,而是数学家从随机的角度定义的一个虚拟的宇宙模型。

简述

从欧拉发明“图论”(哥尼斯堡的7桥问题)开始,到艾尔德&莱利去探究图(或者说网络)(party上的客人问题)的形成原因,几位大家都用属于自己的思维方式开创了图论的发展。欧拉研究图论主要是基于对于现实世界进行了一种新的思路的扩展,首次提出用图来解释身边的应用。而艾尔德&莱利则是在前人的基础上,面对着错综复杂的各种网络类型,思考了一个基于现状更为有价值的问题:网络是怎么形成的?

两者之间一静一动,侧重点完全不同。静者研究网络本身的属性,提取图论中的关键各项指标,而动者研究网络形成和传播的方式。将从无到有的整个过程进行了假设和分析,都有很重要的社会使用价值。

当然重点我们还是说说网络是怎么形成的。面对着各种复杂的网络,如人类社会、细胞、自然界中的各种不同网络,他们都是不同系统按照各自完全不同的规则而建立的网络,想抽象出一个统一的general系统模型来涵盖对于复杂网络的描述,这个是根本不可能的。所以两人从一开始也没有这么想。只不过他们做了一个假设:世界是随机的(创造网络最简单的方法是掷骰子)。于是他们构造了一个模型:随机网络理论。该网络用一个单一的结构描述复杂的网络图:

网络在添加了一定数量的链接后,会发生急剧的改变。随着节点平均链接数量增加到一个临界值,被排除在巨型节点串(基于该网络的最长路径)外的节点数量就会急剧减少。【从图论的角度来说,就是从最初的n个节点构成的n个连通分支,最终随着edge的随机加入,节点平均度不断增加,最终连通分支不断减少,直至变为1个连通图】

规则网络图的特殊之处在于每一个节点都有恰好同等数量的链接,而随机网络根本不存在这样的规则性。

随机网络模型针对每一个节点度的分布,画图得到的是一个泊松分布【有一个明显的峰值,表明大多数节点的平均度一样,峰值两边都出现迅速下降】。对于随机宇宙来说,平均值占主导地址。

核心观点

欧拉:图或网络具有自身的属性,这种属性隐藏在它们自身的结构中,可以限制或增强我们使用网络的能力。“网络的结构是理解我们周围复杂世界的关键”

随机网络模型:这个模型完全是建立在数学之上,并没反应真实世界。在艾尔德-莱利的随机网络理论中,复杂性=随机性。他们实际上并不打算提出一个放之四海而皆准的理论,只是对随机网络的数学表达感兴趣,而对于其是否真的反应现实网络的特征并不关心,因而随机网络理论本身存在很大的漏洞。

抛出问题

既然“随机世界模型”体现了“数学之美”,那么真实世界到底是什么样子的?

收获

理解复杂的世界,找一个general的模型,通常是一种理解和假设。他们排除了复杂网络的相异性,用“数学之美”中的“随机”解释整体复杂网络。虽然对真实世界反映价值不大,但是这是研究迈出的一大步。(引自http://hi.baidu.com/wxc2009hi/blog/item/5d9faadabc7a962b33fa1c9e.html)

 

三、六度分隔

上一章最后的时候抛出一个问题:到底真实世界是什么样子的呢?这章就会从社会实验了解到真实的网络世界是什么样子。

简述

好了,我们想了解真实世界,那我们就去做实验,做调研吧。于是通过实验心理学家对社会结构的结论能看出点端倪:

六度分隔是一个非常著名的结论,是对社会调研后进行的一个深刻认识。对于提出者米尔克莱姆本人来说,此人是一位实验心理学教授。他通过使用实验的手段,不但对社会结构这个概念有深刻认识,而且还探讨了对权威的服从和个人良心之间的冲突。

真实世界中网络多而复杂,典型的就是人类社会网络。六度分隔的理论就是在这个基础上提出的:“虽然我们的社会规模庞大,但沿着一个人接一个人的社会链接,就很容易把握其脉络——一个由60亿人组成的巨大网络,其中每对节点之间都间隔有6个链接”。再通俗一点来说,如果你想和世界上的任何一个人认识,那么你最多需要通过6个人的中介介绍,就能达到目的。

网络的庞大,让我们无法做到完成全部实验。但是上述的分析和结论的得出,却可以通过统计学中的一个方法来较好的完成:这就是一般用来对付成分和结果都无法预期的随机系统的物理学分支【也就是进行n次随机抽取样本,按照不同规则和策略,n的取值不同,将n次结果进行对比和模型建立,得出结论。例如1000个节点的间隔、10000个节点的间隔……,多次迭代,通过样本反映总体,预知总体】。
在网络中,有某种超越了人类主观愿望的更根本的东西,决定了网络中的链接分布。在所有人类研究过的网络中,间隔都比较小。

那么这种原因到底是为什么呢?答案就是每一种网络的节点之间都有高度的相关性!而上章提到的随机网络则是完全从随机的角度来看待问题,忽略了节点间的相关性(【下一章会描述小世界,那么这个是从相关性的强弱上来看待真实世界】)。

考虑一个节点的平均链接为K的网络,实际网络中间隔为2个链接的节点数量为K*K个,间隔为d个链接的节点数量为K的d次方个。而网络节点间隔之所以小,是因为公式中的对数值小。节点之间大量的链接将无比庞大的网络也能缩小为小世界。

(d为节点间隔,N为网络节点数量)【节点间隔和网络节点数量的对数成正比】

对于六度分隔理论来说,这只是对于真实世界的一个表征,应用价值也不大。因为任何两个节点之间实际上有很多长短不一的路径,六度分隔只是一个描述,并不一定代表了现实世界中两个节点之间的最短路径。显然,**分隔将社会间隔给高估了。但是我们要充分认识到“社会链接的重要性”,他将无比巨大的网络缩小成小小的世界。

“小世界”是所有网络都具备的一种遗传属性。

核心观点

(1)当然对于互联网来说,著名的Pagerank就是和“六度分隔”的一种结合,将链接的相关性考虑到rank算法中。

(2)当然,对于任何一个网络,从实验的角度,我们无法cover到每一对节点之间去验证这个结论。此时统计学就发挥了很大优势。这种方法很有用。

(3)从宏观的角度看,人类社会网络很大,难以控制和琢磨,从微观的角度看,任何两个人之间的“距离”(从认识的角度看),都不会超过6个人。所以如果以某一个人为核心,我们可以得到这个人的小世界。因为我们每一个人是个体,所以和自己切身相关应用价值更高的信息都主要来自于微观。

(4)当d和N相差很大是,在建立数学模型时,采用对数能够将两者的关系拉的很近,具有一定的使用价值。

抛出问题

小世界既然是真实世界的微观外在表现,那么小世界到底是一个什么样的东西,他是如何把相关性进行量化和细化的呢?

收获

本章提到的统计学分析方法和建立数学模型的手段值得借鉴;

如果将目前看到的所有网络从点和边的角度去看,觉得经济学市场使用复杂网络手段进行验证和分析未尝不是一个好的方式。我们都知道经济学就是对“需求和供应”的研究。这两个动词体现在两个主题名词上:人和资源。任何一种经济模式或者经营方式都是将资源进行重分配。每一个人(有可能是一部分人)手中都有指定的资源列表,经济或者创业发展的机会只不过是发现这个复杂网络中某一种资源可以考虑被用来作为缩短人与人之间的距离。任何一个企业或者经济主体本质上就是一个中介。所以去发现你身边的资源吧,当你发现时,你做好中介,你就为人类提供了便利,促进了社会的发展。(引自http://hi.baidu.com/wxc2009hi/blog/item/2f46e42e65e987f28a139989.html)

 

四、小世界

上一章节我们知道了对于真实社会网络有了一个微观认识,但是这种相关性是通过什么方式来量化衡量的呢?那么真实社会网络有会有什么样的新发现呢?本章将会带来一些新的感悟。

简述

本章开始就从格兰诺维特的“弱关系理论”介入,描述了人类社会网络的一个特点:个体周围的社会关系网络结构很像基因结构,是一个高度密集的社会结构。在朋友圈内的人相互都认识,保持亲密关系,圈子通过少数的向外链接与外部世界连为一体,不至于处于隔绝状态。完整的网络通过几个较弱的联系,即熟人关系,将不同的朋友圈联系起来。这种关系对于圈子与外部世界的交流互动起到了至关重要的作用。对于个体而言,想获取新的信息,就必须利用弱关系。

虽然格兰诺维特关于弱关系重要性的观点乍看上去有些与直觉不符,但的确揭示了我们的社会组织的一个简单事实:社会是由完全相连的朋友圈组成的破碎的网络,朋友圈通过弱关系相互联系。根据早期对随机网络的理解,随机网络中并不存在朋友,因为任何两个人之间的链接完全是随机的。那么真正的社会结构应该是什么样子的呢?

要想更好的理解社会结构,随机网络理论有必要和格兰诺维特的朋友圈概念结合起来,而这一结合就花了30年的时间……

紧接着又有两位重要人物登场:瓦特和斯托加茨。他们基于前人的理解,提出了一个问题:两个朋友相互认识的可能性有多大?经过研究他们提取了一个指标【群集系数】用于衡量某一个人的朋友圈有多密。基于该问题他们自己做了一个假设:社会应包括许多高度联系的群集,群集之间由较弱关系联系。这样高度联系的网络的群集系数应该较高。于是基于该假设做了如下的一个实验去验证:通过科学网络(以艾尔德相关的科学网)来验证【科学网络是我们社会网络的缩小的原型】。

最终经过多篇论文的认证大家验证了上述的假设成立。科学家的协作网络就具有上述的特点。最终得出一个理论:社会系统中确实存在群集现象,而且群集现象不止存在于社会网络中。科学家相继又研究了很多网络都具有这个特点:万维网、互联网、企业间合资、食物链、分子构成的网络……于是群集现象便成为了复杂网络的一个共同特征。

新模型的诞生:将群集现象和随机网络图的偶然性统一起来,即使只是添加少数几个链接,就能把所有节点之间的平均间隔大大降低,而这少数几个链接却不会太大的改变网络的群集系数。这一个理论和特性说明一个问题:人们在交友的时候范围虽然有可能比较有限,只要其中有少数人的交往比较广,拥有远距离的链接,社会就能构成小世界。

于是现在有了2个模型:瓦特-斯托加茨模型和艾尔德-莱特模型。

核心观点

(1)社会系统中确实存在群集现象,而且群集现象不止存在于社会网络中。

(2)群集现象和随机网络图的偶然性可以统一。

(3)社会是由完全相连的朋友圈组成的破碎的网络,朋友圈通过弱关系相互联系。。

抛出问题

带有异乎寻常多的链接的节点的出现,打破了过去对真实网络的认识,是否要颠覆过去的思想?

收获

(1)节点间相关性(形象的说就是两个人间的熟悉度或者亲密性)通过强关系和弱关系来体现,沈老师有句话很精辟:强关系带来信任,弱关系带来信息的传递!

(2)衡量一个人或者一个网络的稠密度有一个不错的指标:群集系数。另外,在验证时所抽象的方法值得学习和采用:一个问题、一个假设、一个指标、一个实验。
(3)群集现象的普遍性是科学家始料未及的,这种普适性能够在很多网络中得以体现和应用。能不能用就去想一下有没有像“科学家的协作关系”那样的网络特点。

(引自http://hi.baidu.com/wxc2009hi/blog/item/d16664c8fcc03f58f21fe7a6.html)

 

五、中心节点

前几章在研究网络时,根据对于网络的认识,经历了网络的随机性和群集现象的发展,看似对真实网络已经有了一个大体的感知。本章将会给出真实网络存在的一种普遍现象(绝不是偶然现象):中心节点(也就是连接者)的存在。

简述

本章开始通过格拉德威尔的实验慢慢开始了解并体现到:在真实的社会网络中存在那么一部分连接者,他们是社会网络中极端重要的成员,他们创造趋势与时尚,制定重大决定,散布流行主题。他们是社会的桥梁,把不同地域、种族、受教育背景和社会背景的人联系在一起。

所谓连接着,是指带有大量链接的节点,表现出度的高密集性,我们称之为中间节点,它存在于多种网络体系中。因此,中心节点是网络的基本组成部分,在很多复杂网络中,都存在“连接者现象”!

每一个人都可以在网络上发信息,但是看你信息的人有多少?从发信息的角度来看,这个过程是随机的,每一个人的机会都是均等的,但是有多少人能看到你发的信息呢,换句话说,有多少链接指向你的信息呢?这个就完全取决于可见度(也就是指向你的页面的链接数)!实践证明:万维网的拓扑结构存在高度的不平衡现象。“中心节点的存在,颠覆了某些人的认为电脑空间是平等主义乐园的乌托邦式幻象。”

规模并不总是演员网络最重要的因素,虽然三级片明星饰演过的影片数量惊人,但是他们就是没能靠近好莱坞的中心。网络真正的中心留给了那些在多个大型群集里都有自己的位置的节点。我们需要突出那些有重要影响力的节点!

在任何存在中心节点的网络中,它们都对网络结构起着关键作用,使该网络呈现小世界的特点。

核心观点

(1)中心节点是复杂的相互关联的世界的基因特性,从随机宇宙和小世界模型都不能很好的解释这种现象。

(2)万维网的拓扑结构存在高度的不平衡现象。

抛出问题

(1)中心节点是如何出现的?

(2)在某一个既定网络中,可能出现多少中心节点?

收获

(1)中心节点的存在是某些复杂网络发展的必然,这种节点经常表现出权威性高、涉猎领域广、用户需求认可度高的节点。

(2)“连接者现象”突出了个体。“群集现象”突出了小团体。而随机模型则是配合真实网络进行的操作。

(引自:http://hi.baidu.com/wxc2009hi/blog/item/af9bbff1a8bb47d50b46e04c.html)

 

六、80/20规则

随着对于真实网络研究的深入,很多人尝试对中心节点的存在通过多种不同方式去验证和分析。他们在分析的过程中,将此现象映射到了各个领域,包括物理、数学、社会学领域等。本章将会对截止到现在的3种网络给出一个统一的理解,虽然不能解释这种无序到有序的过程和原因,但是你有一个很大的收获就是“原来从无序到有序是一种自组织的过程”,在这里面蕴含着一个big规律。

image

本章主要是描述了两种网络的差异,通过上面的对比,我想应该可以看得很明白了。

下一步就是对于从无序态到有序态的相变过程。我们更多的是去关注接近临界值时发生相变仍然是遵循幂律分布的。

这是自组织和秩序的存在。那么是不是必然呢?又是什么原因导致了上述状态的改变呢?下章将会为你揭晓谜底……

(引自http://hi.baidu.com/wxc2009hi/blog/item/2bb1d86253b8e35aeaf8f826.html)

 

七、富者愈富

马太效应,它是由美国科学史研究者罗伯特·莫顿(Robert K. Merton)在1973年正式提出的。“对已有相当声誉的科学家作出的科学贡献给予的荣誉越来越多,而对那些未出名的科学家则不承认他们的成绩。”莫顿用这句哈概括了当今社会中存在的一个普遍现象:好的愈好,坏的愈坏,多的愈多,少的愈少。在经济上,马太效应也反应了一种贫者愈贫,富者愈富,赢家通吃的经济学中收入分配不公的现象。

对于莫顿说的这句话,这个例子将更好的解释其中的意义:在同一个项目上,一个声誉和奖项总是授予最资深的研究者,即使所有工作都是一个研究生完成的。生活中的一些实际例子也可以说明马太效应,比如说:地价越拍越高,房子越涨越抢,越抢越涨。前一阵的股票热现象,在股市狂潮中,最赚的总是庄家,最赔的总是散户。于是,不加以调节,普通大众的金钱,就会通过这种形态聚集到少数人群手中,进一步加剧贫富分化。

马太效应可以归纳于:任何个体、群体或地区,一旦在某一个方面(如金钱、名誉、地位等)获得成功和进步,就会产生一种积累优势,就会有更多的机会取得更大的成功和进步。

马太效应对于领先者来说就是一种优势的累计,当你已经取得一定成功后,那就更容易取得更大的成功。强者总会更强,弱者反而更弱。物竞天择,适者生存,强者随着积累优势,将有更多的机会取得更大的成功和进步。所以你不想在任何所在的领域的被打败的话,你就要成为这一领域的领头羊,并且不断地扩大。当你成为领头羊后,即便你的投资回报率相同,你也能更轻易地获得比弱小的同行更大的收益。

马太效应除了解释现象外,同样还有消极和积极影响。名人更出名,就会导致某些名人丧失理智,居功自傲,在人生道路上跌跟头,这是消极影响。而积极影响是,马太效应也不断鞭策无名者奋发,去追求和超越已有成果。刘翔奥运夺冠,一举成名,打破了原本亚洲田径弱者的地位;可随着成名影响,更多的期待就压在刘翔身上,又导致了刘翔在田径场上时好时坏的发挥。

马太效应告诉我们:想在某一个领域保持优势,就必须在此领域迅速做大。再者,当目标领域有强大对手的情况下,就要另辟蹊径,找准对手的弱项和自己的优势。

(引自http://www.mifengtd.cn/articles/matthew-effect-life-hacks.html)

 

 

八、爱因斯坦的遗产
九、阿基里斯的脚踵

欧洲的谚语“阿喀琉斯之踵”的道理。任何一个强者都会有自己的致命伤,没有不死的战神,是这个神话告诉人们的一个道理。

 

其他资料:

整个20世纪的科学研究,大部分都是依照简化论进行的。简化论告诉我们,想要了解世界,首先要把它拆解开来。所以,我们被教育用微观的方式观察和理解世界。可是,世界并不是单纯的片段,而是拥有无数组合的复杂系统。而要了解这个系统,则必须研究其自组织的法则。这本书就是告诉我们,自然的万事万物不是独立存在,而是相互关联,相互作用的。处于其中的维系各个事物联系的链接——网络,其如何产生,拥有的本质特性及对人类有何启示,都是本书所要讨论的内容。
    早期研究网络理论的科学家,倾向于认为宇宙是随机的。他们认为自然是通过随机组织起来的,而这正像上帝掷骰子一样创造了世界。这个理论引申出,万事万物没有特别的好与坏,幸运与倒霉,因为都是随机的。一个节点的破坏不会导致网络的崩溃,因为随机性使网络的各个节点连接其他节点的数量非常均匀。在此之后,我们现在所熟知的“六度分隔”理论——每个人只要通过六个人就能找到世界上其他任何人——也被提出来。
    但这些研究与发现并不能让科学界满足。因为人们发现,节点的链接数量并不是均匀分布的。在社会中间,存在着群集现象。不仅在社会中,在经济、互联网、细胞中,都发现了群集现象。这对“真实的网络都是随机的”这一观点提出了挑战。在每个群集中,都存在者一个或多个中心节点,这些中心节点都带有比其他节点多得多的链接的节点。而如果其他节点连接了中心节点,则这个节点与其他某些节点的距离就会大大缩短。
    通过进一步研究,人们发现拥有中心节点的网络具有许多特性,比如它们的分布符合幂率:若是做成分布图,其走势是从最高点缓缓下降,说明某些中心节点拥有大量的链接。用现在我们比较熟知的80/20理论作类比可能比较容易理解。再有,中心节点更容易吸引到其他节点。所以我们就会看到,拥有客户多的大公司比其他的小公司更容易吸引到客户;朋友多的人更容易结交到新的朋友;钱越多的人更容易赚到钱。所谓马太效应——富者愈富,赢者通吃——在网络中体现的淋漓尽致。
    可是,如果网络中新链接的建立只取决于节点带有链接的数量,那后来者就没有机会了吗?当然不是。在竞争环境中,每个节点都有一个特定的适应性。所谓的适应性,举几个例子来说,就是相比于周围的人,你结交朋友的能力;某家公司相比于其他公司吸引消费者的能力;某个网站相较其他网站吸引访问者的能力。为每个节点赋予适应性值,可以衡量其获得链接的能力。所以,我们看到,先来者或是拥有众多链接的节点虽然有比较大的优势,但这只是关键的一部分。自身的特性也是决定成败的关键。在现实中,Google的成功就是一个很好的例子。
    中心节点的特性也是网络不易因为移除某些节点而崩溃,现实中具有中心节点的网络拥有比其他网络更稳健的特性。这既是好处,也能带来灾难,因为对中心节点的破会也可以导致网络的崩溃,这可以解释为什么许多的意外和事故导致了严重的后果,以及病毒传播的某些特点。911事件正是破坏了美国的重要经济和安全设施使美国蒙难;流行病的传播也可看出在网络中中心节点所扮演的关键作用:某些节点比其他节点更容易向周围传播疾病。
    此外,网络在经济中发挥着重要的作用。每个公司都只是网络中的节点,其他公司的好坏并不是那么的无足轻重;相反,单个公司的兴衰也有可能决定着网络中其他公司的命运。所以在21世纪,人们将会更加注意自己在网络中扮演的作用。若是谁忽视了它,小到个人,大到公司,甚至国家都有可能遭受伤害。

(引自http://www.bookooo.cn/thread-95903-1.html)

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注