社交网络定义范文

时间:2024-03-26 17:43:10

导语:如何才能写好一篇社交网络定义,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

社交网络定义

篇1

数年前,当Friendster刚刚兴起,而Twitter还没有出现时,社交网络还是一个不为人了解的现象。然而随着经验的积累,社交网站的行为开始标准化。这并不是说社交网站中的新兴事物已无法流行,或是这一行业中已不能容纳新企业。相反的,这一行业仍有大量的发展空间。不过,在系统建设等方面,一些新的规则将在行业发展中扮演重要角色。

以下是社交网络高管普遍认同的6点规则:

1.当拥有规模后,失败是容许的

谷歌知道这一点:当你拥有数百万用户后,你应当在一小部分用户中尝试试验性功能。社交网络仍然很年轻,没有任何成规,因此失败是可以容忍的。Ning创始人及CEO吉娜·比安奇尼(Gina Bianchini)表示:“行业变化很快,你可以去尝试并犯错。”目前,Ning每天创建的网络超过4000个,其中80%存在时间都不长,或是遭到失败,然而Ning仍然拥有21.5万个网络可供投放广告,或收取服务费。

2.寻求个性

社交网站正越来越多,发现内容、评论及共享的方式也层出不求。用户有大量选择,而找到与自己在某一领域具有同样热情的人总是有价值的。这样的领域可以是工作,例如LinkedIn,但是不要期待会有大量用户通过这类网站社交。另一种领域是家庭,例如Facebook,但在这种情况下用户不会大量活动。第三种则是兴趣爱好,这一领域有着明显的多样性。如果未来有新的社交网站诞生,那么该网站需要关注用户的某一种热情,即用户觉得能真正反映个性的事物。

3.用户对社交网络充满疑虑

信任是社交网络中最具价值的元素,而最好的情况是用户给出有关他们身份的各种重要信息。如果能成功做到这一点,并使用户、用户的好友,以及类似的陌生人尊重这些信息,那么社交网站将可以把用户紧密的联系在一起。然而,社交网站做到这一点很困难。在用户不理解社交网络本质的情况下,他们对社交网络的担忧非常明显。

Digg创始人之一杰·安德尔森(Jay Adelson)表示:“在缺乏信息的情况下,用户总是假定社交网站中存在‘阴谋’。”这一现状的原因很简单:社交网络是新兴事物,而用户也担心计算机网络本身存在匿名控制问题。从网站运营者的角度来看,解决该问题的方法是让用户明确为何要这样做。

4.信任是存在风险的,因此要保持一定的不透明

对社交网站来说,在开放的同时也要保持一定的不透明,尤其是在有关排名和过滤系统工作原理方面。社会化评价网站Epinions前高管凯文·劳斯(Kevin Laws)表示:“所有算法都会被人破解。在算法如何工作方面,你必须保持不透明。”只有知道系统是健全的,用户才会信任该系统。但这意味着用户不可能知道一切。

5.尊重能带来价值

Epinions和Digg等网站最初向用户付费,吸引他们做出评价。但这样做带来问题,一些用户利用系统漏洞,导致其他用户不再相信系统提供的结果。正如在开源软件领域一样,用户参与的目的是为了获得其他人的肯定。金钱的激励只会让事情变得复杂。

篇2

关键词:社交网络;剪枝策略;传播模型;话题

中图分类号:TP391.41 文献标识号:A

The Research on Pruning Strategies Topic Propagation Model of Social Network

YIN Zelong, TANG Xianglong

(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)

Abstract: With the spreading of topics in the social network, topic models would spent more time and more storage space with the increase of the size of data. However, most topics focus on some key nodes and parts of nodes have no significant effect on topic propagation in the real process of topic propagation. If we could reasonably cut some nodes in the social network during the spread of topics, the runtime of the program and the storage space both would be reduced. To solve the above problem, the paper designs two novel graph pruning algorithm to reduce the number of nodes in the social network. The two algorithms presented in this paper introduced the thought of recommend system into the research on pruning strategy of topic propagation models and have a certain novelty. With the analysis and comparison, the paper analyzes the impact of different pruning strategies of propagation model on the effectiveness, the space, running time and the robustness of the graph.

Keywords: Social Network; Pruning Strategy; Propagation Model; Topic

0 引 言

剪枝是一种机器学习技术,通过移除树的某些节点来减少决策树的大小,其中这些节点对分类实例拥有很小的影响因子[1-2]。剪枝不仅能够减小算法的复杂性,同时还能够提高算法的预测准确性。

在决策树算法中,一个重要的问题就是优化最终树的规模。如果树的规模过大,就会存在训练数据集过度拟合而新样本概括不准确的问题;树的规模过小也会无法把握样本空间重要的信息结构。同时,也很难分析出算法何时应该停止,因为此时仍无法判断新加入的节点能否动态地减少错误,这个问题被称为视界效应。一个一般化的策略是让树自然生长直到停止为止,再使用剪枝策略去移除那些没有重要作用的节点。

在本文中,研究拟将将剪枝技术运用到社交网络话题传播模型中。在进行社交网络话题传播时,话题在不同的用户之间相互传播,这些用户则形成了社交网络关系图[3]。当随着时间不断向前推移,社交网络关系图变得更加复杂,则话题传播模型在这样的社交关系图上模拟将会花费更多的时间和空间。为了节省空间和时间开销,本文提出并设计了两种新颖的图剪枝策略来减少社交网络图中的节点数量。文中的算法是将推荐系统的思想引入到社交网络传播模型剪枝策略中,具有一定的新颖性。在本文实验部分,则将本文提出的算法同随机剪枝策略[4]和基于度的剪枝策略[5]进行比较分析,结果表明本文的算法在剪枝效果上具有明确显著的优越性。

1 问题定义

该小节介绍了相关概念和符号以及社交网络话题传播模型剪枝问题的定义。在此假设给定一个社交网络关系图 , 是社交网络关系图中用户的集合, 是社交网络关系图中用户和用户关系的集合。同时假设以关键词 作为用户讨论的话题,且在社交网络关系图 中存在的话题集合为 ,由于话题在社交网络中是分布在不同的用户 上,因此 和 之间存在二元映射关系,如图1所示。

图1 话题与用户的映射关系图

Fig.1 Mapping relationship between topics and users

一个用户可以包含多个话题,一个话题也可能对应多个用户。同时话题对于不同用户,其权重也是不同的,因此上假设关键词 对于用户 的权重为 。根据上述定义,可以抽象出本文的研究问题:已知社交网络关系图 和话题集合 ,求出 。为了解决上述问题,本文提出了两种新颖的图剪枝算法,根据 和话题集合 提供的信息,结合图剪枝算法来获取 。下面将介绍本文所研究的社交网络话题模型的剪枝策略。

2 剪枝策略算法研究

本节介绍了两种社交网络话题模型的剪枝策略,基于话题权重和基于用户兴趣相似性的剪枝策略。总而言之,这两种算法均是将推荐系统的思想引入图剪枝策略中。

2.1 基于用户话题权重的剪枝策略

基于用户话题权重的剪枝策略与基于用户兴趣相似度剪枝策略类似,都是利用了话题与用户之间的关系。不同之处是后者计算与用户具有共同兴趣用户广泛度,前者是计算拥有话题的广泛度。在传播模型中,如果多个话题出现在某个用户上,则在一定程度上可以说明话题在传播过程中频繁地经过该用户,因此这样的用户可以被看作关键用户。基于上述的原因,研发设计了一种基于用户话题权重的剪枝策略算法。

假设社交网络关系图为 以及话题集合为 ,每一个话题 被一个或者几个用户所拥有,则假设拥有话题 的用户集合为 ,用户 拥有话题 的权重为 。首先,对每一个话题 的用户集合 按照用户 拥有该话题的权重 进行排序,如图2所示。

图 2 基于话题权重的剪枝步骤1

Fig.2 Topic weight pruning step 1

然后,将每个话题的用户按照从小到大的顺序进行编码,如图3所示。

图 3 基于话题权重的剪枝步骤2

Fig.3 Topic weight pruning step 2

最后,循环遍历每一个 来统计每一个 的话题权重总和,并排序,如图4所示。

图 4 基于话题权重的剪枝步骤3

Fig.4 Topic weight pruning step 3

2.2 基于用户兴趣相似度的剪枝策略

在本节中,给出了话题集合 与用户集合 存在映射关系,即同一个用户可以拥有多个话题,同一个话题可以被多个用户拥有,因此即以用户拥有的话题相似性来表示用户的兴趣相似性。在以上研究中,已经阐述到用户的兴趣相似度对话题转移概率是有影响的,当用户间兴趣相似度越大,则话题更有可能在同群用户之间经常传播。如果某个用户与很多用户均具有颇高的兴趣相似度,则这样的用户就是话题传播过程中的关键用户而应该得到保留。假设用户 的话题集合分别为 和 ,则采用cosine-index[6]来衡量兴趣相似度,即:

(1)

由公式(1)可知,可以计算出 的 。下面将以4个用户( )为例来说明该算法步骤。当计算出所有用户之间的兴趣相似度后,就可以得到如下所示的矩阵图:

图 5 基于用户兴趣相似性的剪枝步骤1

Fig.5 Interest similarity pruning step 1

如图5所示,该图的前半部分表示用户兴趣相似度的矩阵图,后半部分即将每一个用户与之关联的用户兴趣相似度进行排序。而后再对排序后的矩阵进行归一化处理,如图6所示。

图 6 基于用户兴趣相似性的剪枝步骤2

Fig.6 Interest similarity pruning step 2

最后,则将归一化的矩阵中每一个用户的兴趣相似度进行统计,并排序得到综合结果。具体如图7所示。

图 7 基于用户兴趣相似性的剪枝步骤3

Fig.7 Interest similarity pruning step 3

用户最终得到的权值越大,就说明用户和周围用户有着更为广泛的兴趣相似度,反之亦然。

3 实验结果与结论分析

本节主要介绍上述几种剪枝策略的实验设计原理以及实验结果。实验中采用真实的微博数据集来构建社交网络关系图和相关话题的提取,并运用上述几种剪枝策略来对社交网络关系图进行剪枝,完成后则将传播模型的算法在剪枝后的社交网络关系图上进行传播模拟,从而比较不同剪枝策略下传播模型的预测效果。

3.1 数据集

本文采用的是微博数据集,抽取的是在某一时间粒度下的数据集来构建社交网络关系图以及话题的抽取,实验数据及环境配置如表1所示。

表 1 实验数据及环境配置

Tab.1 The experimental data and environment configuration

名称 参数

实验数据 User(节点)

Connection(边)

Topic(话题) 11589

72395

107

机器配置 8G RAM,3.40GHZ Core i7 处理器

编程语言 C++

分析工具 Matlab2010,Excel

数据库 Mysql

3.2 实验设计

本节从新浪微博数据中选取了11 589个节点以及106 198条边构成一个社交网络关系图,并从中抽取107个话题。首先是将不同的剪枝策略对社交网络关系图进行剪枝,然后用传播模型算法分别在不同的剪枝后的关系图上模拟话题传播,比较不同剪枝策略下的预测效果和运行时间。同时,对于每一种剪枝策略,均将会构建实验并据此分析不同剪枝程度对传播模型话题预测效果的影响。

3.3 实验效果评估

图8是将准确率和召回率进行结合所得到关于不同剪枝策略对于剪枝比例同传播模型F1值关系的曲线图。从图中可以看出,Degree PruningASC 的F1变化最快也是最低,主要是因为按照节点度数从大到小的顺序进行剪枝,首先就会剪掉一些关键节点。其次是Random Pruning,然后是Degree PruningDESC。上述三种剪枝方式从某种程度可以反映出节点的度数同节点的影响力之间的正相关性。Interest Similarity Pruning和 Topic Weight Pruning在随着剪枝比例增大时,前期对传播模型的准确率并没有太多的影响。到后期时二者的F1值都会发生下降,但Interest Similarity Pruning的F1值会出现陡降,因为当剪枝比例越大时,通过Interest Similarity Pruning所剪掉的节点才是正真意义上的关键传播节点,因此将会导致话题传播严重受阻,F1急速下降。

图 8 不同剪枝策略下剪枝比例与F1的关系对比图

Fig.8 Relation between F1 and pruning proportion based on different pruning strategies

图9 展示了不同剪枝策略下,剪枝比例同程序运行时间的关系图。整体上看,随着剪枝比例增大,所用的时间呈线性下降。Degree PruningDESC的程序运行时间低于其他剪枝策略,因为这具体是按照节点度数从大往小进行剪枝,将容易破坏图的连通性,致使信息传播受阻。其次是Random Pruning。利用Interest Similarity Pruning,Degree PruningASC 以及Topic Weight Pruning三种剪枝策略剪枝后,传播模型的运行时间将十分相近,这在某种程度来说如上三种剪枝策略都能够保证社交网络中图的连通性。

图 9 不同剪枝策略下剪枝比例与运行时间的关系对比图

Fig.9 Relation between runtime and pruning proportion based on different pruning strategies

4 结束语

本文主要是介绍并研究社交网络传播模型剪枝策略。因为在进行社交网络话题传播的过程中,数据量会不断地增大,传播模型在进行传播模拟时所花销的时间必将增多,程序运行所占用的空间也会不断加大,所以本文提出了几种社交网络传播模型的剪枝策略来对社交网络进行削减,保证在不降低传播模型预测效果的情况下,能够减少传播模型所花销的时间和空间。首先,本文给出了社交网络话题传播模型剪枝策略研究的相关概念和问题定义,主要包括图的定义,话题定义以及研究的问题描述。其次,本文给出了两种新颖的剪枝策略,包括基于用户兴趣相似性的剪枝策略和基于用户话题权重的剪枝策略。最后,本文又给出了上述几种算法的实验分析结果,主要从时间的运行效率,所包含节点比例以及传播模型的预测效果来进行对比和分析。实验结果表明,按节点度大的顺序进行剪枝的效果最差,但是模型的运行时间最短;其次是随机剪枝,效果和运行时间居中;基于用户话题权重的剪枝策略,预测效果表现最好,同时剪枝策略设计并不复杂。

参考文献:

[1] HARABOR D, GRASTIEN A. Online graph pruning for pathfinding on grid maps[C]//Association for the Advancement of Artificial Intelligence ,San Francisco, CA, USA:AAAI, 2011.

[2] KRETZSCHMAR H, STACHNISS C, GRISETTI G. Efficient information-theoretic graph pruning for graph-based SLAM with laser range finders[C]//Intelligent Robots and Systems(IROS),San Francisco, CA :IEEE/RSJ,2011 :865-871.

[3] DENG H, HAN J, ZHAO B, et al. Probabilistic topic models with biased propagation on heterogeneous information networks[C]// KDD’11, New York, NY, USA:ACM, 2011:1271-1279

[4] GOYAL A, BONCHI F, LAKSHMANAN L V S. A Data-Based Approach to Social Influence Maximization[J]. VLDB 2012, 2012,5(1):73-84

篇3

关键词:物联网;SD-WAN;智慧城市;美国

1 智能终端数量将激增

根据公开数据,未来十年全球对智慧城市的投资额将达到2万亿美元,因智慧城市是通过传感器将所有城市设施物联成网,智能终端的数量因此也会激增。2016年,物联网终端设备的数量预计将达到64亿,同2015年相比增长30%,至2020年,全球物联网设备的数量可能达到208亿。

这一预测并非空穴来风,以英国为例,近日,英国白金汉郡的米尔顿凯恩斯镇与跨国公司英国电信(BT)签署一项合同,将针对物联网建立一个全新的公共网络,该项目需要建立15个网络站,可以接收从洗衣机到停车场中全部的传感器信号。

2 智能终端网络联接面临的挑战

将城市设施与所有的传感器及应用程序联接面临着许多挑战,其中就包括网络联接的挑战:

首先,必须有一个或多个极度可靠且价格低廉的网络,能够精准地收集全部传感器每时每刻所生成的数据。

其次,网络的连通性需要做到无处不在并且及时可靠。众所周知,WiFi并不是无处不在,公共宽带的专用线路又非常昂贵。智慧城市需要整合公共宽带和私人WiFi,实现可靠稳定的网络连接。

3 SD-WAN技术将助力智慧城市

要解决这些问题,广域网简化技术就变得非常重要。以往的广域网配置复杂,尤其是电路类型和服务供应商各不相同。所以,建立一个能覆盖不同实体网络的虚拟网络是将物联网与智慧城市相连的关键。

SD-WAN(软件定义广域网)技术应运而生。这是一项新的网络变革技术,用软件重新定义网络能力,使网络从静态走向动态,批量收集数据。

篇4

轻松查看更新信息

如今玩微博、用人人网的用户都很多,可每次查看更新情况或发消息都必须登录,非常麻烦。其实在安装360极速浏览器之后,用户可以安装各种网络扩展程序,从而轻松查看和更新信息。

添加新浪微博与人人网提醒

首先打开360极速浏览器,单击“自定义”菜单选择“工具/管理扩展程序”(如图1),此时会出现“选项”页面,单击“获取更多扩展程序”切换到“扩展”页面,找到“360微博提醒(增强版)”拓展程序,接下来单击后面的“安装”按钮即可,稍后在浏览器工具栏上即会出现应用的图标。

接下来分别点击单击“360微博提醒”按钮,输入新浪微博账号,单击“授权”按钮,稍后在按钮上会提示新微博的数量(如图2),单击该按钮出现微博面板,可以查看微博,单击“写微博”按钮可以直接撰写微博, 非常方便。如果有多个新浪微博账号,还可以单击“添加账号”按钮继续添加,单击“设置”按钮可修改新浪微博相关设置。

最后,再按同样的步骤搜索并安装“360人人提醒”拓展程序即可。

腾讯微博

对于使用腾讯微博的用户来说,360浏览器并没有专门提供扩展应用插件,不过也没有关系,因为360浏览器可使用谷歌浏览器的各种插件。

进入“扩展”页面,单击下方的“谷歌扩展中心”打开“Chrome网上应用店”,在左侧搜索栏中输入“腾讯微博”,按下回车键会列出所有相关插件(如图3),单击“腾讯微博”后的“添加至Chrome”按钮出现对话框,单击“安装”按钮即可添加到工具栏,这样以后就可以直接从浏览器查看或更新腾讯微博。

即时分享潮流资讯

看到精彩的网络资讯,通常会分享到各种网络应用上,如,微博、空间等,此时只需要给浏览器安装一些分享插件即可。打开“Chrome网上应用店”,搜索“分享”则可获取各种网络分享应用扩展(如图4),如:腾讯微博右键分享,可以给浏览器的右键菜单添加“分享到腾讯微博”命令,以后只要选中需要分享的内容即可分享到腾讯微博;添加“神奇分享”插件,则可将资讯快速分享到新浪微博和人人网;安装“奇文共赏-URL缩短”,则可将资讯分享到开心网、豆瓣、QQ、百度、Google Reader等。

娱乐游戏方便安全

篇5

近年来,随着网络技术的飞快发展与应用,尤其是社交网络的日渐普及及应用,社团发现成为一项重要的研究课题。基于模块度的社团发现算法对于现阶段的社团划分研究具有重要意义。CNM算法就是基于模块度的算法中的一种。本文提出了基于Hadoop的MapReduce框架下对CNM算法的研究分析。最后展望了该领域未来的研究方向。

【关键词】社团发现算法 模块度 CNM MapReduce框架

随着社会的不断发展和个体之间关系的日益复杂,这给传统的社交网络带来了极大考验。由此,各类社团发现算法应运而生。基于模块度的社区发现算法是现阶段较流行,研究较为广泛的算法。CNM算法就是这其中的一种。但对于社交网络中日渐增长的庞大数据量,这对传统的数据存储及处理方式提出了巨大的挑战。将全部数据信息存入到内存或是硬盘中已经变得不现实。由此,分布式处理方式进入到研究者的视线中。分布式系统,因拥有多种通用的物理和逻辑资源,可以动态的分配任务,分散的物理和逻辑资源通过计算机网络实现信息交换,鉴于分布式系统具有的高吞吐、高并发、低延迟性的特点,可满足当今社团网络处理的要求。

Hadoop是一个能够对大量数据进行分布式处理的软件框架,由Apache基金会所开发。基于Hadoop的Mapreduce框架可对大规模的数据进行并行运算。从CNM算法运行的步骤中可看出,每一步的进行可划分成多个任务进行并行的处理,非常适合Mapreduce框架,这解决了该算法应用于大规模网络时会出现内存溢出的问题。鉴于此,本文提出基于MapReduce架构的CNM社团发现算法。

1 基于模块度的社团发现算法

在社交网络中,社团可理解为社交网络的一个子集。在同一个社团中的节点,一定有着某种相同或相似的属性。在在社交网络中检测、发现社团结构的过程就是社团发现。而发现社团所用的算法,就是社团发现算法。现阶段有很多种类的发现方法。例如:基于模块度优化的方法,分裂方法,谱方法,基于推理的方法等等。

1.1 模块度函数

所有的社团发现算法都需要有一个评价标准来衡量社团发现结果的合理性和有效性。这便引入了模块度的概念。模块度的定义由Newman等人提出,是目前常用的一种衡量网络中社区稳定度的方法。下面引入模块度的定义:

给定一个图G,它表示一个社交网络,C表示社交网络中的社区,m表示G中边的数量,则:

若节点i和j之间有边相连,否则

是节点i的度

由此,模块度的定义可表示为:

归纳来说,模块度表示所有被划分到同一个社团的边所占的比例再减掉完全随机情况时被划分到同一社团的边所占的比例。

模块度增量的定义是:

1.2 CNM算法介绍

CNM算法是基于模块度的社团发现算法,它是一种基于贪心策略的聚合算法。通过初始化每一个节点作为一个单独的社团,然后通过聚合相似的节点或者联系最为紧密的节点,最终将分散的小社团聚合为大的社团,从而达到社团划分的目的。CNM算法用堆的数据结构来计算和更新网络的模块度,所以其时间复杂度可接近线性复杂度。

在CNM算法的执行过程中用到以下数据结构:

(1)模块度增量矩阵ΔQ:记录了有边相连的社团之间的模块度增量。

(2)最大堆H:该堆中包含了模块度增量矩阵ΔQ中每一行中的最大元素。

(3)辅助向量a:用来记录节点的度。

2 MapReduce框架介绍

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。主要分为两个部分Map(映射)和Reduce(归约)。利用MapReduce框架可实现并行编程。

Map函数可接受一个键值对(key-value),产生一组中间结果,在Reduce函数中指定如何对中间结果进行归约并生成最终的处理结果。MapReduce框架下程序的并发处理过程可如图1所示。

3 CNM算法在Mapreduce框架下的分析研究

3.1 算法思想

采用MapReduce框架实现CNM算法可分四步骤进行:

第一步:进行数据预处理,将稀疏矩阵中存储的相连边之间的信息转换为键值对的形式。

第二步:根据第一步得到的数据预处理的结果,求模块度增量ΔQ。

第三步:将所有的ΔQ进行比较,得到最大的ΔQ。

第四步:进行更新操作,修改矩阵中的行列值。

以上四个步骤设计的关键点在于如何设计MapReduce。

3.2 算法描述

a 一次读取矩阵中一行的信息

Map阶段:将转换成对

for(values.hasNext()) {

if(values!=null)

Emit(key,value[n]); }

Reduce阶段:合并表示同一连接关系的

if(key1=value2&&key2=value1)

delete;

else Emit(key,value)

b 求模块度增量ΔQ

Map阶段:读入上步骤所得的结果

while(keys.hasNext()){

CalculateQ;

Emit() ;}

Reduce阶段:根据Map输出的结果求模块度增量ΔQ

CalculateΔQ;

Emit(,ΔQ)

c 找到ΔQ值增大量最大所对应的顶点对

仅有Reduce阶段

Max=0;

while(values.hasNext()){

if(Max

max=value.get();

}

Emit(,Max);

if(Max==0)

exit();

d 更新操作

Map 上一步所得的结果作为输入

update((,Max) );

Emit;

Reduce 更新新的节点所对应的模块度;

For(key:keys)

Update( );

value.get()= Q;

Emit

递归运行a~d步骤,直到ΔQ值不再变化,程序结束。

4 实验结果与分析

实验软件平台为Java JDK1.6和Hadoop0.23.4,在虚拟机上搭建伪集群进行测试,实验中选择1亿数据在不同数目的集群节点上进行测试,得到如图2所示的测试结果。

从该图中可以看出,当数据量保持不变的情况下,当集群中的节点适当的增加时会使并行加速比增加,但当并行加速比增加到一定的值后,加速比反而会下降,这可能是因为当Map数和Reduce数增加过多时,会使节点间的通信量增加,造成网络延迟从而导致并行加速比的下降。

图2中,横坐标n表示集群中设置的节点数,纵坐标 ε表示并行加速比。

5 结论

通过对CNM算法按适用MapReduce框架的要求进行编程后,利用及群众的多个节点运行该算法,会使算法运行时间减少,从而提高了效率。在实际的应用中,应注意在集群中要选取适当数目的节点和合适的Map和Reduce数目,这样才能使系统发挥最大优势,即不造成资源浪费,有提高了系统吞吐量。在今后的学习研究中,将对CNM算法进行改进,使其更能适应基于Hadoop的MapReduce框架。

参考文献

[1]White T.Hadoop权威指南[M]. 周傲英,曾大聃译.北京:清华大学出版社,2009.

[2]Sggarwal C.Social Network Data Snalytics[M].America:Springer-Verlag New YorkInc,2011.

[3]Newman M E J.Fast algorithm for detecting community structure in networks [J].Phts Rev:E,2004,69(6): 133-137.

[4]吴晓伟.MapReduce并行编程模式的应用和研究[I].中国科学技术大学.2009,5.

[5]解?,汪小帆.复杂网络中的社团结构分析算法研究综述[J].复杂系统与复杂性科学,2005,2(3).

[6]Clauset A,M.E.J Newman,Moore C. Finding community structure in very large networks [J].Phys.Rev.E,2004, 70(6):066111.

[7]Lin J,Schatz M,Design patterns for efficient graph algorithms in MapReduce[C] // Proceedings of the Eighth Workshop in Ming and Learning with Graphs.New York:ACM,2010:78-85.

[8]Newman M E J,Girvan M.Finding and Evaluating Community Structure in Networks[J].Phys.Rev.E,2004,69(2).

篇6

【关键词】网络传播;表情包;情感表达;身份认同

一、表情包的概念界定

现今学界还未针对表情包给出一个清晰而明确的定义。学者林晓冬对表情包概念的解释是:“多个同类型表情组成的系列表情的集合,通常是由群众对其抱有特殊印象的明星、网络近期流行的语录以及动漫、影视截图为素材来源,配上一系列与图像意境相匹配的流行文字,用以表达使用者所需要传达的特定含义。”[1]笔者认为,林晓冬对表情包的界定较为准确地描述出了表情包的特征,目前大多数表情包都以传递幽默的情绪为主要目的,是当前网络传播中的一种重要表达形式。

二、表情包的兴起

表情包的兴起可以分为三个阶段。第一阶段:表情符号应用的起点可以追溯到上世纪80年代斯科特法尔曼将“:-)”用来表示“微笑”之时,此后ASCII字符正式被运用于社交平台之中。接着,日本运用ASCII字符来模拟各种肢体动作,由此衍生出独具特色的“颜文字”。第二阶段:伴随着社交媒体的疾速发展,网络交流中新一代卡通图像出现,腾讯公司随即开发了“自定义表情”。最初的自定义表情分为JPG格式、GIF格式(即静态与动态)两种形式,电视作品、动画片段等均可成为表情符号的制作选材,且多为UGC生成内容。第三阶段:现今,流行于网络平台的表情包被注入了更多的活力。这一阶段的表情符号的表现形式多以明星、现实中人们的夸张动作的照片加上文字制作而成,例如电视剧中表现夸张的人物、沉浸于演唱曲目的歌手等,常会成为表情包的创作素材。

三、网络传播中表情包的使用情况调查

笔者使用了问卷调查的方法,通过随机问卷发放,为本文提供数据依据。通过几天的调研,发放了300份问卷,回收282份,其中有效问卷273份,主要针对18至24岁青年群体,这一群体占有效问卷人数的63.37%。

(一)调查对象基本情况

1、性别情况本次问卷调查涉及人数为273人。其中男性人数75人,占被调查人数的27.47%;女生人数为198人,占被调查人数的72.53%。2、年龄情况参与问卷访谈人员的年龄分布如下:18岁以下7人,占总人数的2.56%;18-24岁173人,占63.37%;25-30岁13人,占4.76%;31-35岁3人,占1.1%;36-45岁18人,占6.59%;45岁以上59人,占总人数的21.61%。3、受教育程度被调查者受教育程度为初中及初中以下17人,占总人数的6.40%;高中39人,占总人数的14.13%;专科63人,占总人数的23.17%;本科121人,占总人数的44.16%;研究生及以上33人,占总人数的11.69%。

(二)网络传播中表情包的使用情况

1、使用频率在调查中,每天使用表情包15次以上的人数为171人,占总比例的64.53%;每天使用表情包5-15次的人数为92人,占总比例的34.72%;每天使用表情包5次以下的人数为2人,占总比例的0.75%。2、用户喜欢使用的表情包类型经过调查发现,用户喜欢使用的表情包涵盖了纯文字类型、真人面孔配少量文字类型和卡通形象类型(如暴走漫画、网友手绘等)以及其他类型,其中喜欢卡通形象类型(如暴走漫画、网友手绘等)的人数最多,占比83.14%,其次是真人照片中加注文字信息类,占比50.96%。

(三)网络传播中表情包的用途

1、使用表情包的场合调查对象常在QQ/微信聊天中使用表情包,比例高达96.98%,其次是在、更新日常动态时使用表情包,占比43.02%,而在网页文章时以及实际生活应用中使用情况较少,仅分别占比10.19%和6.42%。2、使用表情包的原因调查对象喜欢使用表情包的原因有多种。其中,认为表情包方便、节省时间的人数为136人,占总人数的52.51%;认为表情包能够增加聊天趣味性,缓解气氛的人数为225人,占总人数的86.87%;认为表情包能够拉近彼此距离,融入群体的人数为136人,占总人数的52.51%;认为表情包能够弥补语言、文字的不足的人数为170人,占总比例的65.64%。由此我们可以看出,用户使用表情包很大一部分原因是表情包能够增加用户聊天时的趣味性,缓解气氛、拉近彼此距离,融入群体、弥补语言、文字的不足、缓解冷场的尴尬。

(四)网络传播中表情包的使用分析

在现实的交往中,没有空间的限制,传播者的语气、神情、肢体动作等均可作为非语言信息来辅助彼此间的交流。而在社交媒体的交流中由于受时间与空间的限定,文字成为了双方交流的主要传播介质。但文字信息也仅仅只是语言传播中的一种符号,易导致传播率(传播率=接收者接收的信息/传播者传播的信息)差强人意。表情包的出现,在一定程度上弥补了网络交流中传播者表情、动作等匮乏的缺陷,降低了彼此之间沟通耗时,提高了传播的效率。从问卷调查中可以清晰地看到表情包的传播优势。随着社交媒体的发展,表情包在便捷、增加趣味性、缓解气氛、拉近彼此距离,融入群体、缓解冷场方面,有着自身独特的优势。同时,在双方具备“共通的意义空间”下进行表情包交流的这种沟通方式,在社交媒体交往中占据了至关重要的位置,表情包的使用在表达使用者情绪、身份认同以及减少使用者身份迷失的焦虑方面都具有优势。

四、表情包在网络传播中的意义与作用

(一)使用便捷,丰富聊天内容

1、便捷性一方面,在网络传播中使用表情包十分的便利。如在QQ聊天中,表情包的保存只需要点击右键即可被保留在系统中,无需重复操作,但文字的使用则无法实现在线保存的功能,往往需要传播者再次编辑与组织。因此,人们在网络交流时使用表情包进行沟通,往往会比使用单一的文字传播更加便捷。另一方面,网络表情包的制作也十分便捷。往往一张图片+文字+创作者的想法就可以制作出一张生动有趣的表情包,其简单易操作的特性,也大大刺激了网友们的创作热情,因此现今表情包的种类较多。2、引发联想,补充聊天内容从传播学的角度上理解,表情包不仅仅是网络传播与交流中的一种介质,同时也是对文字信息传播的有效补充。传播学者多丽丝格雷伯曾指出:“我们一度推崇的借助文字符号传递的抽象意义,已经开始让位于建立在图像传播基础上的现实与感受。”[2]结合学者研究,笔者认为表情包在网络传播中具有下述两种功能。其一,表情包可以直接表达双方的沟通信息,同时弥补单一的文字传播的不足。网络传播中,纯文字的交流往往在视觉体验方面、判断情感方面存在不足,并且无法避免网络传播中较单调的特性,而表情包却能够针对文字信息的不足,提供重要的补充信息。其二,表情包可以在一定程度上表现出事物的内涵与外延,引起接受者们的遐想。由于文字信息在网络传播中具有含糊性及多义性,因此在网络传播的过程中,表情包能够帮助沟通双方理解对方所要传达的意义。语言学家索绪尔也曾表示,语言符号所代表的事物和符号形式能够不断演进,因此表情包的使用在不同情况下也会被赋予不同的意义。例如,在微信聊天中使用“愤怒”的表情,不同定表示你的聊天对象正在生气,而要结合双方聊天时的具体情境来判断传播者的情绪;在社交媒体中使用“微笑”也常被视为“呵呵”(无奈)之意的代表。因此,我们需在瞬息万变的网络环境和不断更新的传播语境中,重新解读表情包所富含的新意义。

(二)娱乐性较强

有趣、诙谐、幽默、适用范围广成为了表情包作品的共同特征。无论是相识已久的沟通双方还是彼此陌生的沟通双方之间,使用表情包都能够一定程度上快速缓和尴尬、增加幽默感、进入聊天状态。对于年轻一代的使用者来说,表情包是一个表达情感、放松情绪的载体,同时也是互联网泛娱乐化的突出体现。例如,在里约奥运会上,凭借真实、活泼的采访表现而迅速蹿红的20岁国家队游泳小将傅园慧,其接受采访时的表情被网友们截屏,并配以“我已经使用了洪荒之力”等经典语句制作出“傅园慧系列表情包”。尼尔波兹曼在其著作《娱乐至死》中指出:“这是一个娱乐至死的年代,一切公众话语日渐以娱乐的形式出现。”[3]他的看法,如今看来或许有些夸张,但我们必须承认,在网络交流中表情包的传播比单一的文字传播更加具有娱乐性,而表情包中所蕴含的娱乐性也很大程度上激发了网友的热情。其中的娱乐性可理解为社会亚文化群体通过搞笑、模仿等方式对社会主流文化与精英文化的解构。

(三)契合大众心理,提高受众参与度

1、契合大众心理,寻求身份认同往往在网络中表达出的文化语境,其映射的是社会大众的心理。2016年夏天,“葛优躺”的爆红并非偶然。在都市的繁华背后,都市人也有着敏感、脆弱和对未来不确定性的焦虑。因此,在闷热的夏季,人们的社会心理似乎从“葛优躺”中所展现的随性、颓废、瘫倒的形象中找到情感、压力的宣泄口。表情包在沟通中具有丰富的内涵。表情包的使用,成为人们传达自我想法时的一种延伸手段,同时也是一种新的话语方式,用来表达对自我身份的认同,减少迷失感。2、提高受众参与度,推动网络文化发展随着网络表情符号被广泛运用,社交软件上所提供的官方表情包(即系统自带表情)已经明显不能满足各年龄段、各层次使用者的需求,于是表情包在此背景下也进行了逐渐细分。菲利普在其“利基受众”理论中表示,社会中的个体都是不尽相同的,并且都有着各自的兴趣与爱好,拥有同样兴趣爱好的人往往会组成一个群体,这个群体便是“利基受众”。为满足自己所在群体使用表情包的需求,其成员往往会自行制作与传播自己喜爱的表情包。正如青年人群体会喜欢暴走漫画类可爱动漫表情包;中老年人喜爱传统的闪烁大字和用语正能量的表情包,同种类型表情包的传播者与制作者组成了一个个群体内的小圈子,无形之中推动了网络文化的发展。

篇7

SNS(社会性网络服务)系统

SNS(Social Networking Services,社会性网络服务),专指那些旨在帮助人们建立社会性网络的互联网应用服务,以认识朋友的朋友为基础,扩展自己的人脉。

SNS的另一种常用解释是“社交网站”或“社交网”(SociaI Net-work site)。

SNS是当下炙手可热的互联网服务,虽然目前SNS网站的盈利模式和发展前景仍被许多人所质疑,但不可否认的是当下SNS和类SNS应用正在大幅度增长,国内的主流网站也都相继开通了自己的SNS服务。

Facebook

语言:PHP

网址http://aevelopers.facebook com

Facebook创建于2004年2月,是目前社会化网络和Web 2,O的风向标。Facebook开放平台的推出,让互联网业界认为它是最有可能和Google比肩的公司。

虽然Facebook在SNS领域的地位已无需多言,但作为全球最大的社交网站它在赢利方面一直很不理想,不仅至今都没有成熟的盈利模式,广告收入也低于同级竞争对手。正是由于对赢利能力的担忧,使得很多互联网专家对Facebook和SNS网站的未来前景持保留态度。

抛开运营层面的问题,Facebook在技术层面的表现可以用卓越来形容。其开放的技术架构使得基于Facebook平台的应用插件丰富多彩。而Facebook也以开放化的心态公布了网站的源代码和应用工具。

Facebook目前提供最新的PHP源代码下载,包括API架构、FQL分析器、FBML分析和FBJs等。Facebook的开放平台具有很强的可扩展性,可以添加你自己独特的功能,如你自己的FBML标签、API方法等。

OpenPNE

语言PHP

网址:http://.cn

OpenPNE搭载了丰富的SNS机能,在PC和手机上都可以免费使用。它的应用领域非常广泛,涉及到手机服务、视频服务、招聘、交友/婚介、商品搜索购物、行业SNS商务人脉扩展、健康/美容、教育等服务领域。

自2008年正式登陆中国以来,它一直专注于开发适合中国用户使用习惯的开源SNS产品。中国的社区站长可以利用OpenPNE-SNS解决方案,以最快速、零技术门槛开拓自己的社区应用和社交网络服务平台。

NetSNS

语言:

网址:http://

NetSNS是基于Asp,Net开发的社交网络互动Web应用程序,采用SQL2000数据库、Ajax、Div+CSS布局等诸多网络流行元素,适合各方面应用的要求。

NetSNS使用“网站模板与网站程序完全分离”的架构,具有强大的标签加样式的个性化组合,自定义标签、自定义表单、Js管理加JS模型的灵活应用,支持不同频道、栏目、内容页、专题等应用不同的模板。

在数据层面,用户可根据自己的需要自定义数据表,自定义字段,从而组合出新的频道如房产、招聘等,每个频道都可以拥有独立的表,彻底减轻了数据库的压力。自定义字段的内容录入可支持HTML可视化编辑,方便前后台数据录入界面的排版布局,扩展出更多的特殊效果。

NetSNS整站程序支持全静态HTML文件生成,可将站点首页、频道首页、各栏目及每个内容页都生成静态HTML文件,并自定义文件存放路径。

Elgg

语言:PHP

网址:http:///

Elgg是一款开源的社会性网络脚本程序,它以Blog为中心实现社会网络化。

Elgg作为一个社会性网络构建平台原来是为教育设计,但它的功能却让它成为很不错的社交平台。Elgg一经问世即好评如潮,更有人将其与大名鼎鼎的Moodle相提并论。

它是一个灵活的网络引擎,旨在建立以社会意识为核心的应用。用Elgg构建一个社会化网络平台会非常容易,因为它能为你处理常规的Web应用和社会化功能。而你只要专注于开发你的思想即可。

InSOShi

语言:Ruby on Rails

网址:http://

Insoshi是一个英文的基于Ruby on Rafts构建的建站程序。相对于其它同类开源产品,它的功能还比较简单,只有迷你博客、站内信、好友,群组等常见功能。

我们推荐Insosh/更多的原因是在于它所使用的开发语言。虽然在国内了解Ruby on Rails(简称RoR)的人并不多,但它已成为进行Web应用程序开发的一个新途径,并在国外Web开发领域迅速流行。

RoR是一种结合Ruby语言与Rails框架的网页编程平台:Ruby语言以自然、简洁、快速著称,全面支援面向对象程序设计,而Rails则是Ruby广泛应用方式之一。Rails设计为一套清晰的MVC开发架构,采取模型、视图、控制器分离的开发方式,减少了开发中的问题。

ThinkSNS

语言:PHP

网址:http://

ThinkSNS是国内新兴的SNS程序,于去年了预览版。它全部基于优秀的开源软件开发,同时也作为开源项目免费提供全方位的社交网络解决方案。

ThinkSNS源于办公园项目,在Web端基于国内的ThinkPHP框架开发(国产快速、简单的面向对象轻量级PHP开发框架)。由于基于ThinkPHP框架的设计,ThinkSNS生来就具备优秀的国际化能力,支持多语言、多模版等功能。ThinRPHP内置支持WordPress式插件开发,并可通过API和其他系统无缝集成。

ThinkSNS项目框架目前仍在发展之中,官方网站有望于近期1.6.0版。此外该项目的文档和开发社区方面仍处于建设阶段。

EasySNS

语言:PHP

网址:http://

EasySNS是一个组件化的开源SNS平台,EasySNS第一个开源版本v1.1在BSD协议下。该 联网上分享信息就是这样的轻松和简单。

Laconica就是一个微型博客系统,类似于Twitter。Laconica允许用户通信通过浏览器、电子邮件和短信进行通讯,同时还支持OpenID,用户的信息会按Creativecommons 3.0协议进行授权。这个强大免费的工具让那些想要建立属于自已的社交网络或微型博客平台的人有了一个绝佳选择。

Habari

语言:PHP

网址:http://

Habari为“下一代”Blog程序,它来源于WordpreSs,是Wordpress的部分成员因为不满Wordpress日益商业化和matt的独断,离开Wordpress另外开发一个项目。

Habari采用模块化和面向对象的设计模式使其非常容易扩展,支持多种数据库(MySQL,SQLite,PostgreSQL),可以存储不同形式的媒体,支持静态页面内容。Habari是一款支持多作者的博客平台,并可安装多个站点。

Geeklog

语言:PHP

网址:http:///

Geeklog原来是一款优秀的Weblog系统,经过不断的完善,现已成为一个免费的、开放源码的动态Web内容管理系统。鉴于它强大的Weblog功能和研发历史,我们仍将其归为博客类程序中。

Geeklog可以使用户创建一个虚拟的社区,可以管理用户,张贴文章等,非常适合个人、团体、小型企业的Web blog应用。Geeklog采用PHP实现,以MySQL为后台数据库。

Geekklog最显著的特点是支持多语言:它可以对应不同的浏览器的语言设置,显示对应语言的内容,同时可以在多种语言内容中切换(这要比其它软件的“多语言用户界面”更加强大)。

Geeklog支持多种版式,使你的网站可以适应于不同的浏览环境,如手机、PDA上的Web浏览器,并允许浏览者按自己的喜好切换。Geeldog也支持插件功能,可以添加插件支持论坛、影音多媒体、文件下载、数据库备份等多种应用。

TextPattern

语言:PHP

网址:http://

TextPattern由著名的写作语法Textile作者Dean Allen开发。可以说是最久远的blog系统。

最初开发于2000年,在2003年之前绝大部分blog是用MovableType和TextPattern。但后来由于TextPattern开发进度缓慢,失去了很多用户。然而其显而易见的优点、独具一格的特色,使其依然不失为一个经典blog系统。

Textpattern结构小巧、代码简洁、功能强大,模板也很容易定制,支持多国语言。可以从Wordpress和MT完美导人数据。其最大的特点在于模板非常灵活,各个不同的页面元素用内置的标签组成,用户甚至可以不通过FTP就能轻松地把Textpattem~构的网站随心所欲地改成自己想要的样式。本。对于那些想要设立一个庞大的博客网络的人来说是很理想的。

使用WordPress的多用户版本,你将可以给你的使用者提供注册新博客的机会。他们将可以安全地管理他们的模板和设置,而不会影响到其他使用者。你可以拥有无数个用户,这些用户又可以拥有无限制的博客。并且这些用户在各自的博客上拥在有不同角色(管理员、编辑、作者、投稿人、订阅者)。

―个或多个网站管理员可以执行整个站点的管理任务,包括添加用户和博客,变更权限和给主题授予访问权限。

WordPress MU

语言:PHP

网址:http://

WordPress MU,或者叫做wordpressμ,是著名的WordPress博客程序的多用户版

MoveableType

语言:Perl+PHP

网址:http://

Movable Type(简称MT)是由位于美国加卅l的Six Apart公司推出的Blog系统。它曾经是全球最受欢迎的多用户博客系统之一,包含评论、引用(TrackBack)、主题等功能,并广泛的支持各种第三方插件。

Movable Type是使用Perl开发的,支持My SQ L数据库。MovableType通过许可证对平台进行收费,这种收费模式引起了很多Blogger的质疑并转向了WordPress(简称WP)。之后,Six Apart于2007年12月12日正式宣布MovableType以GPL2协议开源。

与同样作为国际著名的博客系统的WP多用户版对比,MT安装架设较为复杂需要掌握一定的软件知识才能安装成功,WP的安装就非常简单。功能方面,WP的第三方插件要明显超过MT。而在性能方面MT要比WP多用户版执行效率要更优秀一些。

除以上开源产品外,还有一些开源/半开源产品因产品成熟度、授权协议形式等原因没作介绍,下面列出这些产品供感兴趣的朋友参考。

UCenter Home:国内著名的SNS产品,由Discuz!论坛的开发公司康盛创想出品。国内很多SiNS网站都基于UCenter Home搭建。U Center Home使用康盛创想公司自己的商业性授权协议,并且需要与该公司其它商业性产品联合使用。(http://)

成幻SNS(CHSNS):成幻SNS是国内的一款SNS社区类网站程序,采用开发。(http://.cn)

Community Server:Commu-nity Server是国外重量级的SNS社区源码,不过只开放了ExpressEdition版本,其他版本只提供了试用版。(http://)

AROUNDMe:该软件是Barnraiser项目所提供的社会网络工具中的一个,完全开源,但已有近一年半的时间没有更新,似乎已停止了开发。(http:///aroundme)

OneBody:一个开源的社交网络程序,从去年二月开发至今,目前仍为测试版。(http://beonebody.corn)

LovdbyLess:基于Ruby 0nRails开发的SNS开源产品。(http://)

篇8

【关键词】社交网络;图论;模型;应用

一、图论与社交网络

图论〔Graph Theory〕是数学的一个分支。它以图为研究对象。图论中的图是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间具有这种关系。图论起源于著名的哥尼斯堡七桥问题。[1]

社交网络源自网络社交,网络社交的起点是电子邮件。互联网本质上就是计算机之间的联网,早期的E-mail解决了远程的邮件传输的问题,至今它也是互联网上最普及的应用,同时它也是网络社交的起点。BBS则更进了一步,把“群发”和“转发”常态化,理论上实现了向所有人信息并讨论话题的功能,随着网络社交的悄悄演进,一个人在网络上的形象更加趋于完整,这时候社交网络出现了。

二、社交网络分析的图形方法

数学和图形技术通常被用来以系统性方式描述社交网络,用以描述和解释社交网络分析的数学科学就是图形理论。相关社交网络分析的的基本概念和测量方法均来自图形理论。图形理论的一个巨大优势是可以应用于计算的数学准则,也因此可以应用于商业问题。在社交网络中每个人可以看做一个点,朋友关系看做连接两点之间的线。这样整个社交网络就形成一个复杂网络图,社交网络本身就是一个复杂的人际关系网络。物以类聚,人以群分,采集社交网络人际关系数据,进行聚类分析,发现群组。

三、社交网络分析

分析社交网络,主要是研究社会实体的关系连结以及这些连结关系的模式、结构和功能。社交网络分析被用于描述和测量行动者之间的关系或通过这些关系流动的各种有形或无形的东西,比如信息、资源等。根据分析的着眼点不同,社交网络分析可以分为两种基本视角:关系取向(relationalapproach)和位置取向(positional approach)。关系取向关注行动者之间的社会性粘着关系,通过社会连结(socialconnectivity)本身――如密度、强度、对称性、规模等――来说明特定的行为和过程。位置取向则关注存在于行动者之间的、且在结构上处于相等地位的社会关系的模式化。它讨论的是两个或两个以上的行动者和第三方之间的关系所折射出来的社会结构,强调用“结构等效”来理解人类行为。

(一)关系距离及中心性分析

1.度(degree)

度指的是社会网络图中邻点的个数。

2.密度(density)

密度指的是图中各个点之间关系的紧密程度,是实际分布图与完备图的差距。在一个群体的结构型态分析中,密度是一项重要变量,因为一个团体可以有紧密团体,也可以有疏离团体,一般来说,关系紧密的团体有效的合作行为较多,信息流通较容易,团体工作绩效也会较好,而关系十分疏远的团体则常有信息不通、情感支持太少、集体满意程度较低等问题。社交网络图(无向图)的密度公式如下:

其中n为图中节点的数目,L为图中线的数目。

3.中心度(centrality)

如果一个行动者与很多其他行动者有直接的关联,该行动者就居于中心地位。因此在无向社会网络图中,一个点的度就是该点的中心度。在有向图中,中心度包括内中心度(in-centrality)和外中心度(out-centrality),三分别对应“入度”和“出度”。A. Bavelas最先对中心度的形式特征进行了开创性研究,验证了如下假设,即行动者越处于网络的中心位置,其影响力越大。

中心度分为三种形式:程度中心性、亲近种新型、中介中心性。

(1)程度中心性常用来衡量谁在团体中是最主要的中心地位。无向图计算公式为:

(2)中介中心性指标

衡量了节点作为媒介的能力。中介中心性高的节点掌握了信息流以及商业机会,进而可以控制两群节点,获得中介利益。社会网络分析中衡量一个人作为桥的程度的指标就是中介中心性。

是节点j到节点k的捷径数,是节点j到节点k的快捷方式上有节点i的快捷方式数,g是网络节点数。

(3)群体中介性公式:

含义是,一个图形中,中介性最高的节点的中介性与其他人中介性的差距。差距越大,群体中介行数值越高,表示此团体分成数个小团体而太依靠某个节点传话,这个节点特别重要。

(二)小团体(子群)分析

派系(subgroup)是社群中的一小群人关系特别紧密,以至于结合成一个次团体。在一个社交网络图中,派系指的是至少包含三个点的最大完备子图。该定义意味着:

派系的成员至少包含三个点;派系是“完备”的,即任何两点之间都是直接相关,都是邻接的;派系是“最大”的,不能再向该派系加入新点,否则将改变“完备”这个性质。

1.成分(component)

如果一个点集的任何两点都可以通过一定的路径相连,这样的点集叫做成分(component)。很显然,派系比成分要严格得多,一个成分中的所有点之间不要求都是邻接的,而派系中的点都必须邻接。

2.n-派系(n-cliques)

对于一个总图来说,如果其中的一个子图满足如下条件,就称之为n-派系:在该子图中,任何两点之间在总图中的最短距离最大不超过n。其形式化定义为:

其中d(i,j)是点i和点j之间的距离。

四、案例分析对象及问题

本文研究主要以人人网为例。人人网为整个中国互联网用户提供服务的SNS社交网站,给不同身份的人提供了一个互动交流平台,提高用户之间的交流效率,通过提供日志、保存相册、音乐视频等站内外资源分享等功能,搭建了一个功能丰富高效的用户交流互动平台。对于在人人网中,能否找到一种方法自动地为我的所有好友进行分组。

(一)解决方案思路

人人网是一个复杂的人际关系网络,物以类聚,人以群分。对于解决本案例中的问题,首先是采集社交网络人际关系数据,进行聚类分析,发现群组。

其次是选择开发语言――Python,是一种解释型的,面向对象的、带有动态语义的高级程序设计语言。自从20世纪90年代初Python语言诞生至今,它逐渐被广泛应用于处理系统管理任务和Web编程。具有优雅、明确、简单的特点。能完成系统编程、用户图形接口、Internet脚本、组件集成、数据库编程、快速原型、数值计算与科学计算编程、游戏、图像、人工智能、XML、机器人等功能。

再次是熟练掌握复杂网络处理程序库:

1.Boost Graph Library――准C++标准库

代码结构良好、灵活、高运行效率,没有提供复杂网络分析算法,可帮助 C++ 开发人员将实际工程问题转化成图论问题。

2.QuickGraph――.NET平台下的BGL

BGL在.NET平台下的实现,提供有方向和无方向的.NET图形结构图和算法库。

3.Igraph――C语言写的复杂网络分析库

包括图论各种经典算法以及网络分析算法,它提供了一些非常有效的挖掘功能,提供Python、R语言接口。

workX――全面支持复杂网络分析的Python包包括图论经典算法和复杂网络分析算法,具有文档清晰易读、程序结构组织较好,执行效率比igraph要低很多,便于用户对复杂网络进行创建、操作和学习。利用networkx可以以标准化和非标准化的数据格式存储网络、生成多种随机网络和经典网络、分析网络结构、建立网络模型、设计新的网络算法、进行网络绘制等。

(二)社交网络数据采集

社交网络数据的采集主要是通过运营商开放平台API,用网络爬虫爬取页面。

开放平台(Open Platform)在软件业和网络中,开放平台是指软件系统通过公开其应用程序编程接口(API)或函数(function)来使外部的程序可以增加该软件系统的功能或使用该软件系统的资源,而不需要更改该软件系统的源代码。

网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。网页爬虫所用的网页搜索策略主要有广度优先搜索策略、最佳优先搜索策略、深度优先搜索策略,网页分析算法有网络拓扑的分析算法和网页分析算法等。

(三)简单网络爬虫过程分析

1.模拟用户登录,保存Cookie。所谓Cookie,可以简单认的为是在浏览器端记录包括登录状态在内的各种属性值的容器名称。

图1保存人人网cookie

2.指定抓取入口

图2人人网抓取入口

3.次级页面自动发现

图3次级页面

4.已爬地址处理。通过以上方式可以抓取到网页,但还要从这些页面中解析出需要的文本信息,如,标题、内容、URL链接地址等。之后提出这些信息组成一个document对象,通过Lucene将document对象加入到索引,提供用户搜索用。在实际项目中通常使用HTML解析器(如,HTMLParser)来提取网页内容。

5.信息采集强度控制,主要包括多线程数和停歇时间。

五、结论

本文主要介绍了图论在社交网络上的应用,通过对图论和社交网络分析基础知识的分析,探讨了在社交网络中如何用图论理论来分析解决实际问题。重点采集了“人人网”人际关系数据,进行聚类分析,发现群组,对数据进行可视化,生成了“人人网社交网络图”。探讨了在社交网络中常用到图论来分析解决实际问题。指出社交网络信息是一类重要的分析对象,其中蕴含着丰富的社会网络信息。

参考文献:

[1]Carlos Andro Reis Pinherio[著],漆晨曦等[译].社交网络分析及案例详解[M].人民邮电出版社,2013.01.

[2]王桂平,王珏,任嘉辰.图论算法理论、实现及应用.北京大学出版社,2011.11.

[3]徐俊明.图论及其应用.中国科学技术大学出版社,2010.03.

篇9

关键词:社交化企业;新规律;新趋势

中图分类号:F270

一、社交化时代全面到来

本文认为,从整体上来说,我们已经进入到万物互联、移动互联的社交化时代。所谓的社交化,就是指随着社交网络、社交媒体、社交营销等迅速兴起,基于网络的社交行为已经深深植根于人类的任何活动之中,它将深刻的改变人们的生产生活方式、企业发展、产业发展及区域发展。

全球社交网络兴起。社交网络的兴起以Facebook的建立为代表,Facebook建立以后,迅速吸引了大批的美国知名大学的学生加入,尤其是在开放对外注册以后,更是呈现出爆发式的增长。在Facebook的带动下,社交媒体在全球范围内出现井喷式增长:截至2013年,全球互联网用户超过30亿,而全球约有1/5的人(即16.1亿)每个月至少使用一次社交网络,使用社交网络已成为互联网用户的主要行为之一。

中国社交网络兴起。随着互联网的快速普及,中国互联网用户快速增长,为社交网络发展奠定了基础,截止2013年,我国网民数量达到了6.04亿,移动互联网用户数量达到了8.28亿,其中手机网名用户突破5亿,中国全面进入互联网时代。新一代社交媒体的诞生,进一步促进了中国社交网络的发展。其中,以强关系为主打特色的微信,迅速融入公众的生活当中,达到超过5亿的使用规模,并逐渐取代短信等沟通方式,成为新的交流沟通渠道;微信的快速成长使我国的社交化程度达到国际水平,并且,其增长速度甚至超越了美国和全球社交化普及速度。

社交化时代呈现去中心化和信任背书两大特点。社交网络最大的特点就是去中心化。信息的传递由发送方、信息内容和接受方三个主体组成,在传统社会中发送方以及信息内容都有可能为政治权力或商业利益所“绑架”,因此就出现了这样的情况,人们所能接受信息的来源和内容都是固定和有限的,就产生了所谓的“中心”。然而在社交化时代,社交网络中的内容不再是由专业机构或特定人群所产生,而是由社交网络中的全体参与者共同完成,任何人都可以在社交网络上表达自己的观点或创造原创的内容,共同生产信息,这提升了网民参与贡献的积极性、降低了生产信息的门槛,最终使得每一个网民均成为了一个微小且独立的信息提供商,使得互联网更加扁平、内容生产更加多元化,从而进一步加速解构中心,完全“去中心化”。信任背书成为社交网络成功运行的基础。信任背书存在于社交网络的各个环节,从信息本身看,虽然只是不多的140字,但信息者个人的专业、情感、价值、判断、喜好、历史等关键要素,会依附在这条信息之上,流动在好友(关系链)中,看到信息的人也会将自己对该人的信任及其他因素做出回应,并传递下去。信任在这个传导链条中起到了至关重要的作用,成为整个社交网络中的最关键因素。在社交平台中不断涌现的内容大号、自媒体账号,都在有意无意中遵循这些原则,并由此建立了一个庞大的基于弱关系的信任链条,当无数的信任链条汇聚在一起时,便产生了庞大的社交红利。

二、社交化时代下企业发展的新规律

社交化企业的三张网―内部、伙伴、外部。

处在社交化时代的企业,需要重新审视和定义内部员工之间、企业与合作者之间、企业与消费者之间的关系,构建“三张网”:内部社交网络、伙伴社交网和外部社交网络。

内部社交网络。企业以内部社交工具或云端社交系统为平台,将全部员工纳入到平台当中,实现任意员工间的无缝交流和沟通,形成覆盖整个企业的内部交流网络。内部社交网络的出现,打破了传统企业中的部门隔离、科层制的层级结构等限制,使员工之间可以无障碍的沟通和分享知识,将传统的上下级关系和离散的同事关系转变为紧密的协同、分享关系。

伙伴社交网络。企业基于现有专家及合作伙伴资源,通过社交化平台或网络手段,将所有的合作伙伴链接起来,实现企业间的快速的无缝交流和业务信息的资源共享。伙伴社交网络,将企业与合作伙伴间基于传统供应链关系的固定链式关系,转变为基于网络的动态合作关系,使企业突破了自身边界限制,实现了从封闭向开放的转变。

外部社交网络。企业利用现有公共社交网络,开辟对外沟通交流窗口,形成联接消费者的开放社交网络。全球社交网络的出现,消除了消费者与企业间的隔膜,使消费者可以参与到企业的产品研发、营销推广的众多活动当中,也使消费者与企业之间的关系实现了从传统的买卖关系向合作共赢关系的转变(见图1)。

三、新趋势

新趋势主要有以下几方面。

(一)颠覆商业模式:跨界融合

社交网络的产生改变了企业与消费者的供需关系、产品理念及行业界限等一系列工业化生产的传统法则,催化出一系列新的商业模式,逐步推动着企业组织的重塑和商品市场的变革。

社交化趋势下的新兴商业模式具有三大显著特征。一是粉丝经济,消费者与企业间的关系发生了明显变化,消费者从被动的信息接收者变为主动的信息获取和活动参与的粉丝,企业以消费者为核心,聚集起自身的粉丝团体,并借此开展企业的研发、生产营销等活动。二是极致体验,产品从单一的功能载体向服务载体转变,与文化、价值观相融合,将长板做到极致,打造行业标杆产品,为消费者提供极致的产品和服务体验,让消费者为产品尖叫。三是跨界融合,不同行业纷纷吸纳互联网元素,以互联网新概念、新技术、新产品和新模式为基础,融入自身行业内容,实现跨界融合。

社交化已孕育出平台模式、数据模式及免费模式等对行业具有颠覆性效应的新型商业模式。平台模式,以粉丝理念为核心,企业通过搭建平台,聚集消费者粉丝和合作伙伴粉丝,共同创造价值,实现消费者、企业自身及合作伙伴的协同式发展。数据模式,以丰富产品价值为核心,通过积累大量的用户数据和行业数据,实现精准营销、数据运营和服务、行业数据枢纽。免费模式,以极致体验为核心,最大化产品性价比,甚至免费为消费者提供,转而通过内容的创造与运营实现长期盈利。

新型商业模式改变了竞争方式,对市场格局产生了巨大冲击。一是社交化颠覆了传统大型企业在信息传播、营销和渠道上的优势地位,为创新创业企业的爆发式、破坏式增长提供了土壤;二是社交化成为连接不同行业的纽带,行业间的隔膜正逐渐消退,企业不仅面临本行业的竞争,更随时面临着来自相关行业、甚至完全无关行业的冲击;三是基于平台化运作的新模式,产生了超越一般企业概念的巨无霸式对手――生态圈,使企业间的竞争更加残酷。

篇10

社交网络

社交网络的理论基础是由耶鲁大学的社会心理学家StanleyMilgram米尔格兰姆提出的六度分割(小世界现象)的概念。小世界现象(smallworldphenomenon)的假说,大意是说,任何两个素不相识的人中间最多只隔着6个人,也就是说,只用6个人就可以将两个陌生人联系在一起。社交网络典型实例有美国的facebook网站、中国的开心网、人人网等。起源于即时通信功能的MSN、QQ,由于其具有庞大的注册用户,现在也发展为具备社交网络能力的网络平台。

社交网络的另一成功应用是微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过互联网、移动互联网以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。最早也是最著名的微博是美国的twitter,根据相关公开数据,截至2010年1月,该产品在全球已经拥有7500万注册用户。微博提供了这样一个平台,你既可以作为观众,在微博上浏览感兴趣的信息;也可以作为者,在微博上内容供别人浏览。的内容一般较短,微博由此得名。也可以图片,分享视频等。微博最大的特点就是:信息快速,信息传播的速度快。例如你有200万听众,你的信息会在瞬间传播给200万人。

网络搜索引擎

当今网络中容纳了大量的资源,离开了网络搜索工具,人们很难快速定位和检索自己需要的信息,发现新增资源。搜索引擎是网络中的特殊站点,专门用来帮助人们查找存储在其他站点上的信息。搜索引擎有能力告诉你文件或文档存储在何处。

教学方法设计

循证医学即遵循证据的医学,其核心思想是:任何医疗决策的确定都应基于客观的临床科学研究依据;任何临床的诊治决策,必须建立在当前最好的研究证据与临床专业知识和患者的价值相结合的基础上。这是DavidSackett教授对于循证医学的定义。这句话定义了临床医学的新模式,强调最佳证据、专业知识和经验、患者需求三者的结合,并且指出三者缺一不可,相辅相成,共同构成循证思维的主体。

证据是循证医学的基石,其主要来源是医学期刊的研究报告,特别是临床随机对照试验(RCT)的研究成果,以及对这些研究的Meta分析;运用循证医学思想指导临床实践,最关键的内容是根据临床所面临的问题进行系统的文献检索,了解相关问题的研究进展,对研究结果进行科学评价以获得最佳证据。计算机和网络技术、国际Cochrane协作网和世界各国Cochrane中心网的建立与发展,为临床医生快速地从光盘数据库及网络中获取循证医学证据,提供了现代化技术手段。结合第1部分中介绍的几种信息技术,我们在以下三个方面改进了EBM教学方法。

1快速搜索文献资料

以前检索循证医学证据,主要通过检索Cochrane光盘数据库,随着Cochrane协作网和各国Cochrane中心网的发展,通过网络检索已逐渐取代光盘数据库检索,我们在教学过程中,充分利用现在互联网的普及,调动每个学生的探索积极性,让学生不仅在Cochrane中心网,同时采用网络搜索引擎如google的学术搜索功能在互联网中搜索相关文献和数据,作为临床问题的分析基础。

这些特殊搜索引擎不仅更新搜索算法以提升搜索速度,同时也不断更新数据源,与国际各主要检索数据库同步,能快速检索到文献目录。利用网络搜索引擎还能检索网页和博客(Blog),这就把与临床问题有关的研究机构、企业、个人成果也包含在了检索范围内,与单纯查找Cochrane中心相比,可以获得更多的证据。当然,一开始我们对检索范围扩大可能会导致查找速度减低产生过担忧,但实践证明,当前的搜索引擎能力非常强,google学术搜索通常在0.03秒内完成检索。

2分布式分析和讨论

目前学生注册到各个主流社交网站的比例非常高,在MSN、QQ都扩展成为社交网站后,QQ更成为大多数同学广泛使用的社交平台。另外,学生在社交网络上主要交流的话题还是以学习为主,例如美国全国学校董事会协会(NationalSchoolBoardsAssociation)的报告称近60%的学生使用社交网络谈论教育主题,50%谈论作业。因此,我们认为在教学中顺应这种趋势是一个必然结果。采用社交网络如QQ,指导教师和学生不仅能交流文字消息,语音、视频、文件、图片都可以共享,对EBM教学非常有利。

在我们的教学过程中,首先由指导教师先创建一个EBM教学QQ群,与此相关的教师和同学都加入该群,将根据教学计划确定的临床问题在群中,先由学生去检索医学文献,提出自己的证据,并给出结论,在这个过程中,指导教师根据已准备的材料以及丰富的个人经验,针对每个学生的意见给出指导,通过群的方式能有效地组织起讨论,并能利用好病房和门诊以外的时间和空间,有效地提升了教师的指导作用。学生基于社交网络参与EBM教学,也更加有兴趣,对锻炼独立科研能力也很有好处。并且随着移动互联网的发展,教师或学生还能通过智能手机和终端以无线方式登录讨论群,当教师在临床过程中发现很好的问题时,能快速有效地组织学生进行查证,无论是对教学还是对诊断都大有益处。

2000年DavidSackett教授在新版《怎样实践和讲授循证医学》中,再次定义循证医学为“慎重、准确和明智地应用当前所能获得的最好的研究依据,同时结合临床医师的个人专业技能和多年临床经验、考虑患者的价值和愿望,将三者完美地结合制定出患者的治疗措施。”对EBM而言,考虑患者自身的要求也非常重要,我们在教学中引导学生采用多种沟通方式与病患及其家属交换意见,其中就包括基于社交网络的方式,我们创建了另一个允许病患和家属参与的讨论组,通过这种方式,与病患的沟通频次和程度相比原来的面对面交流有了很大增强,在改进临床沟通方法的同时更加保证了EBM教学效果。

3与国际同行远程交流

国内循证医学的发展和教学离不开与国际的交流,很多国际知名专家都拥有自己的BLOG、微博,并且在主流社交网络上进行了注册。通过关注其博客,可以了解本领域的发展动态,及时获取新思想。通过社交网络,还可以直接或间接地与专家建立联系,共同探讨感兴趣的问题。在今后的教学中,一旦条件成熟,我们会将国际同行引入我们的诊断和教学过程,提升教学质量。

教学效果总结

作者所在北京儿童医院每天有大量来自全国各地的病患儿童,无论是数量还是疾病类型都比其他综合医院儿科要多,作为临床教学老师既要担负医生职责,同时也要给所带医学生以教学指导,这对我们来说,是精力和时间的严峻挑战。通过采用本文介绍的改进教学法后,对教师而言,预先设计好的临床问题可以通过零碎的时间在网络上与学生进行讨论,减轻了边工作边教学的压力,对在工作中突发的问题,如果很适合作为教学题材,也可以利用网络及时给其他教师和学生。