松林一航(YIHANG)

网熵指数是单一的综合指标表征成员对诸社交网络的影响力。
正文

社交网络成员影响力排行点评

(2011-06-15 11:27:29) 下一个


社交网络是项新鲜事物,在国际国内迅速发展,其社会、经济、文化和科技意义十分重大,但理论研究还跟不上实际应用。社交网络成员影响力 -W 熵指数课题就是在此大气候下,以促进社交网络健康发展为宗旨,应运而生 。

W 熵指数是单一的综合指标表征成员对诸社交网络的影响力,排行榜的研究和发布本着:独立、公正、科学、及时的基本原则。目前, W 熵指数门户网站暂时发表中国社交网络成员影响力 -W 熵指数两百人排行榜和政府、企业、财经等领域的 TOP 5 排行榜。 W 熵指数门户网站后端操作系统的虚拟 “ 机器蜘蛛 ” 自动在网络上获取信息,考虑到数据的社会实用性和专家意见反馈等因素,排行榜更新频率初定为 15 天,测试期间暂不定期。

社交网络 W 熵指数门户网站测试版(http://www.transtech.unb.br/w-entropy/)于 2011 年 6 月 8 日上线,首次推出两百人排行榜,  见图一。原数据来自国内各大主要社交网络三千余人,如新浪、腾讯和谷歌搜索、百度百科等。最后按 W 熵指数排序推出前两百人 (6 月 10 日数据 ) 。



                       图一  社交网络影响力W熵指数门户网站截图

网页表中各栏的指标定义如下,微博是指某成员在新浪微博的粉丝数或在滕讯微博的听众数,如果某成员在两个平台都有微博,表中列出占主导地位的平台标志 ( 下同 ) 。博客是指某成员在新浪或的博客访问量或滕讯博客的历史浏览量。网络搜索是指某成员在谷歌搜索的文档数或在百度百科上的访问量。平均指标是指综合某成员上述三项指标的加权平均数。分布系数是指某成员在上述社交网络平台的信息传播分布系数。最后一栏是 W 熵指数相对值 ( 简称 W 熵指数 ) ,以本次排行第一名的 W 熵指数绝对值为基数,依次算出。

1. W 熵指数门户网站介绍

社交网络 W 熵指数门户网站 (www.transtech.unb.br:8080/w-entropy/) 是以信息理论为基础 、 数学模型和计算方法完整独立的 、 由网络技术支撑的信息系统。总体设计有四大主要部分组成:

1) 信息获取。使用 Web 搜索技术 [10] ,建立社交网络成员数据获取模块,系统设计虚拟 “ 机器蜘蛛 ” 自动在网络上获取数据。

2) 数据处理。使用 Web 数据挖掘等人工智能技术 [11] ,建立社交网络成员数据处理模块,自动对数据进行过滤、去重、 索引 等知识挖掘业务。

3) W 熵计算。使用社交网络成员影响力 -W 熵指数的理论和算法 [1-5] ,建立社交网络成员 W 熵指数计算模块,自动实现各成员的 W 熵指数和排序。

4) 前端显示。使用 Web 相关的数据库、网页技术等,建立 W 熵指数门户网站前端显示系统,进一步将实现人机互动界面。

社交网络 W 熵指数门户网站信息系统尚处于测试阶段。系统构成和功能将在以后各方同仁和用户的建议下,不断更新完善 。

2. W熵指数千人排行榜的源数据分析

W 熵指数千人排行榜的数据来源于国内主要社交网络诸如新浪 ( 微博、博客 ) 、腾讯 ( 微博、博客 ) 等。搜索方面的数据直接来自谷歌搜索或百度百科的统计结果。在计算成员平均指标时,微博指数的权重暂时定为 40% ;博客指数的权重为 35% ,网络搜索指数的权重为 25% 。

社交网络成员影响力 -W 熵指数排行榜的研究和颁布以促进社交网络良性发展为宗旨,本着:独立、公正、科学、及时的基本原则。

1) 独立。社交网络成员影响力 -W 熵指数项目研究的问题提出、定义建模、理论分析、实例验证、系统开发和实时上线均由项目组成员完成,项目投资和设备独立自主、拥有全部知识产权。

2) 公正。 W 熵指数排行榜的原数据来自网上社交网络成员的公开资料。对排行榜结果的任何评价,都是客观的、建设性的,不涉及任何个人隐私、避免使用不适当语言。课题组欢迎任何社交网络成员和各方行家学者的指导和建议。

3) 科学。社交网络成员影响力 -W 熵指数的理论计算、数据分析等使用科学方法并有现代信息技术实现,通过学术论文在相关国际信息技术会议上发表,全过程公开透明。课题研究的反馈意见主要来自两方面:一是专家对参加本课题的研究人员提交的科技论文的审稿评语;二是在千人计划网超博等社交网络本身的网友们的意见。

4) 及时。 W 熵指数门户网站暂时发表中国社交网络成员影响力 -W 熵指数千人排行榜和政府、企业、财经、科技、体育以及信息技术 (IT) 等领域的 TOP 5 排行榜。虽然 W 熵指数门户网站后端操作系统自动在网络上获取数据,考虑到数据使用的社会实用性等,排行榜更新频率暂不定期。

目前,社交网络 W 熵指数门户网站收集的数据暂来自新浪 ( 微博、博客 ) 、腾讯 ( 微博、博客 ) 社交网络平台。搜索方面的数据来自谷歌搜索或百度百科的统计结果。进一步的研究,将涉及到其它社交网络平台如中华网、搜狐、网易、人人以及盘古、人民等网络搜索。

[ 打印 ]
阅读 ()评论 (0)
评论
目前还没有任何评论
登录后才可评论.