智商和情商有个共同点,既是科学指标,又是通俗用语。表达方式的相对性使其大为流行,很是受用。饭后茶余、 HappyHour ,聊聊社交网熵,会是个很酷的话题。新浪微博推出 “ 微数据 ” 分析工具来反映成员的影响力,其概念和表达方式都很清楚。美中不足的是,该影响力用绝对数值表示,更新频率过快,其算法和参数还需进一步斟酌和验证。本文使用社交网熵算法,把 “ 微数据 ” 的影响力转换成相对的微熵指数,使其表达方式易为网友接受。
1. 从智商情商说起
智商 (Intelligence Quotient-IQ) 用于反映人的智力发展水平 [1] 。智力商数是综合表征一个人的观察力、记忆力、思维力、想象力、分析判断能力、应变能力、创造力等的指数。智商已广泛应用到多个领域,企业招聘时让菜鸟答上几个 IQ 题,已是常事;精神病院为患者做个 IQ 检查,不足为奇;甚至法院算算犯人的 IQ ,来定其生死,亦有传闻。微友的《担忧中国正在成为 “ 低 IQ 社会 ” 》 [2] 对智商有独到见解。
真正奋斗在科研第一线的国内外华人学者,聪慧、勤奋、能干和富有创造力,是中华民族的希望之光。对别的领域不敢妄加评论,就以计算机专业来说,有几个世界顶尖级的国际会议,华人参与的论文能到 50% 上下。例如由 World Wide Web Consortium (W3C) 举办的 International WWW 年会。每年收稿上千,但能和 Web 之父 Sir Tim Berners-Lee 一块喝咖啡的团队难以上百。来自纽约大学的 BeiBei Li 博士 ( 李贝贝 ) 等的工作 [3] ,荣获 2011 年最佳论文,可谓千里挑一,名至荣归,参见图一。
图一 WWW2011 : Web 爵士 Tim Berners-Lee 和 MM 才女李贝贝
笔者有关社交网熵指数的稿子 [4] ,投在 IADIS WWW/INTERNET 2011 国际会议。该年会档次虽没前者高,但采取匿名审阅 (blind peer-review) 方式选稿。会议主席系斯坦福大学的 Bebo White 教授, 7 月 1 日发来通知,两位审稿人都给予各单项和总评满分的成绩。
情商 (Emotional Intelligence Quotient-EQ) 用于反映人的自我情绪控制能力 [5] 。情绪商数是综合表征一个人的情绪认知、情绪管理、挫折耐受甚至爱情交友等方面能力的指数。新华网新华读书曾于 2008 年评出中国历史上影响最大的 10 首诗 [6] ,妙绝古今的《静夜思》位居第一,有人还试着为诗仙李白算算 EQ 。不过要推选最感人的抒情诗,能雷到痴男怨女的情圣之作,还是元好问的《摸鱼儿 雁丘词》。现代人中也只有徐志摩和琼瑶堪能相比。笔者的《 Web 传情 点击相许》 [7] 略述网络情商一二,让读者体会到网络时代的价值观。
网熵 (Web Entropy Quotient-WQ) 用于反映社交网络成员的影响力 [4] 。社交网熵指数 (W-entropy Index) 是单一的综合指标 [8] ,使用信息熵理论,科学地反映了成员在社交网络各平台间的影响力。说到熵,不能不提申农 (Claude Shannon) ,大师是现代通讯理论 -- 信息论 [9] 的创始人、影响人类社会进程的科学家。 1988 年笔者用其理论,给出复杂系统结构有序度 -- 负熵算法 [10] 。网熵算法 [4] 再次使用申农的理论,应用到社交网络的信息传递分析上 。 本文将使用此算法,把新浪微博 “ 微数据 ” 影响力的千位数绝对值转换成百分制的相对微熵指数。
商数 (Quotient) 在数学上就是除法算术的答案 [11] 。当除数变成了一个基准值,而被除数变成一个数据值,商数就可以变成一系列数据值的比较标准。智商、情商的迷人之处,就在于 “ 商 ” 字为其点睛。一般来说智商情商相克,网熵均与两者相悦。
顺便提一下,对推广情商有卓越贡献的美国心理学家丹尼尔 . 格尔曼 (Daniel Goleman) ,于 2007 年又提出社交商 (Social Intelligence) 概念,作为衡量社交活动和生存能力一项指标。同时网商一词已普遍用于表示从事网络的商业人士或企业。网熵表述就自然浮出水面。
2. 新浪微博 “ 微数据 ” 的美中不足
2011 年 5-6 月,新浪微博推出 “ 微数据 ” 分析工具 [10,11] ,让成员对自己或周围粉丝的影响力进行定量分析。按新浪的定义,微友影响力是覆盖度、传播力、活跃度三者的综合体现,参见图二 ( 笔者新浪微博 6 月 30 日数据 ) 。如影星姚晨的影响力为 1293 ,新浪微群小助手的影响力为 1391 。这项工作很有意义,增加了粉丝间的相互了解,迈出社交网络平台内影响力量化分析的可喜一步。
“ 微数据 ” 的 影响力的概念和意思都很清楚。 美中不足的是, 用一个 千位绝对数 来表征指数,加上其算法和相关参数尚未公开,就令人难有认同的感觉。例如,姚晨的影响力 1293 是什么意思?新浪微群小助手的影响力 1391 又是个什么意思 ? 这就需要一个相对指标来衡量,即商数,让粉丝们能体会到影响力是大是小。
图二 新浪微博 “ 微数据 ” 影响力 (6 月 30 日数据 ) [10]
美国的 Klout 公司,使用 Klout 指数 (Klout Score) 表征用户在推特 (Twitter) 和脸书 (Facebook) 上的综合影响力 [12] ,其值亦是相对值,介于 1-100 间,反映了用户在推特和脸书上行为的 35 个变量。这种表示清晰明确,已逐渐为推特和脸书用户接受,成为测试用户在推特和脸书内影响力的准官方指标。
进一步对新浪微博成员 “ 微数据 ” 影响力的分析,笔者还有三个不成熟的意见:一是,影响力的计算对博主粉丝数过于不敏感。如姚晨的粉丝数为 9307944 是微群小助手粉丝 1258125 的 7 倍多,但后者影响力却比前者多近 100 。二是,微群小助手犹如写字楼里的物业人员,她对微博的影响有没有 ? 有!但与拥有近千万粉丝的姚晨比,影响力的意义和性质都不可同日而语。三是, “ 微数据 ” 影响力的定义、参数和计算等还需要重新考虑。作为统计数据,每天更新是自然的。但如果说某位博主对社交网络的影响力,这么快更新,还需商讨。不能因为姚晨今天少发几个微博,影响力就低下来。所以对 “ 微数据 ” 影响力算法和参数,还应斟酌和试验,以便得出令人信服和贴切的结果。
社交网熵指数使用商数概念和若干非线性转换 [4] ,把成员影响力用百分制相对表示,大大增加了实用性。下一节,就尝试着把新浪微博成员的 “ 微数据 ” 影响力转换为社交网熵指数。
3. 社交网熵表征 “ 微数据 ” 影响力
为了简单明了表达新浪微博成员的 “ 微数据 ” 影响力,下面采用社交网熵指数 算法 [ 4 ] , 给出微博影响力和微熵指数对照表。这里说的微熵指数,是因为其本身并没按原社交网熵指数算法计算,只是用网熵的非线性转换,把微博影响力转换为网友容易接受的相对商数。表一中的最大微博影响力为 1500 ,其微熵指数为 100 ;最小微博影响力为 0 ,其微熵指数为 0 。根据新浪微博的演变,最大微博影响力上限还可以视情调整。
表一 “ 微数据 ” 影响力和微熵指数转换表
读者不免要问,如果要取商数,直接除上最大值就好了,何必进行非线性变换 ? 如表第二栏中: 影响力 / 最大影响力 。该栏的优秀分数, 100 和 93 ,占 16 个分数等级 (0-1500) 的 12.5% ;良好分数: 87 和 80 ,占 12.5% ;而不及格的分数, 0 到 60 间,占 56.25% 。按此算法,姚晨 的 “ 微数据 ” 影响力为 1293 ,相对于 1500 ,商数仅为 86 。这个分数打得没错,但有点太 “ 铁面无私 ” 了,会让大部分博友却步,不大符合社交网络精神。
再看看表中第三栏,经过平滑的微熵指数:该栏的优秀分数, 100 、 99 、 97 、 95 和 92 ,占 16 个分数等级 (0-1500) 的 31.25% ;良好分数: 89 、 85 和 80 ,占 18.75% ;而不及格的分数, 0 到 60 间,占 37.5% 。这样的转换,优秀和良好占多数,为 50% 。博主们会为此欢欣鼓舞,新浪微博运营商也会皆大欢喜。重在参与,这才是社交网络精神的体现。
依据表一的转换,表二给出若干博主的 “ 微数据 ” 影响力和微熵指数 (6 月 30 日数据 ) 。 微群小助手的 “ 微数据 ” 影响力为 1391 ,转换为微熵指数 99 。姚晨 的 “ 微数据 ” 影响力为 1293 ,转换为微熵指数 97 。笔者的粉丝 星语的星愿 “ 微数据 ” 影响力为 220 ,转换为微熵指数 28 。其它转换结果详见表二。
从另一角度讲, “ 微数据 ” 影响力对动态因素过于敏感,变化较快。如姚晨6月 28 日的影响力为 1195 , 到 30 日 增至 1293 ,增加8%。很难说在正常情况下,姚晨两天内的影响力会浮动如此之大。如果换算为微熵指数,从 95 增至 97, 增加2%。可见微熵指数的变化较为平滑,容易为网友接受。
表二 若干博主的 “ 微数据 ” 影响力和微熵指数
4. 结语
如前所述,新浪微博推出“微数据”分析工具可喜可贺。如果实现商数转换和参数试验调试,则更具实用性。希望新浪微博能采用社交网熵指数算法,用微熵指数来表征“微数据”影响力。本文中的“微数据”影响力和微熵指数转换只是初步试算,需要和有关部门一起,进一步分析微博数据,调试计算模型和参数,以得出更科学的微熵表达。
有一种情致叫友谊,有一种感觉叫理解。笔者真切感谢支持社交网络成员影响力-网熵指数信息系统研究的网友们。
参考资料
[1] 智商,百度百科词条,accessible in June 2011。
http://baike.baidu.com/view/2640.htm
[2] 吴霁虹,担忧中国正在成为“低IQ社会”,千人计划网超搏,2011。
http://www.1000plan.org/superblog/454/262
[3] Beibei Li, Anindya Ghose and Panagiotis G. Ipeirotis,Towards a Theory Model for Product Search. Proceedings of the 20th International World Wide Web Conference (WWW 2011),
[4] Li Weigang, Zheng Jianya and Daniel Li, Analysis of the W-entropy index's properties of Impact on Social Networks[C], to appear in IADIS WWW Internet Conference, Rio de Janeiro, Brazil, 2011。
[5] 情商,百度百科词条,accessible in June 2011。
http://baike.baidu.com/view/305.htm
[6] 中国历史上影响最大的10首诗,新华网,2008,accessible in June 2011。
http://news.xinhuanet.com/book/2008-04/11/content_7957254.htm
[7] 李伟钢,Web传情 点击相许,千人计划网超搏,2011。
http://www.1000plan.org/superblog/2597/215
[8] 社交网熵指数,百度百科词条,accessible in June 2011。
http://baike.baidu.com/view/5973165.htm
[9] Shannon, Claude, Communication Theory of Secrecy Systems[J]. Bell System Technical Journal, 1949, 28 (4): 656–715.
[10] 李伟钢,复杂系统结构有序度--负熵算法[J]. 系统工程理论与实践,1988, 8(4): 15-22。
[11] 商数,百度百科词条,accessible in June 2011。http://baike.baidu.com/view/889533.htm
[12] 新浪微博, accessible in June 2011,http://weibo.com/
[13] 36氪,关注互联网创业,新浪微博推出社交影响力产品「微数据」,accessible in June 2011。http://www.36kr.com/weibo-data/
[14] Klout, 2011,accessible in June 2011。http://corp.klout.com/