跳转到路径导航栏
跳转到正文内容

新算法可以预测Twitter用户性别 识别假冒者

http://www.sina.com.cn  2011年07月29日 17:49  新浪科技

  新浪科技讯 北京时间7月29日下午消息,据《大西洋月刊》网站报道,研究人员编写出了一种新算法,该算法仅凭借140字内微博就可以预测Twitter用户的性别。

  据悉互联网用户性别的判定可为Twitter带去经济收益,语言学家德利普·劳(Delip Rao)表示:“营销是一个主要刺激因素,我听说Twitter也在内部进行类似人口统计并确认算法。”

  新算法不但可以预测用户性别,它还可以识别假冒身份。比如,一位年长的大叔假冒成女同性恋博主,该算法就可以识别出来。

  该算法之所以可以预测用户性别,其中的关键在于女人使用语言的差异性。如果微博中包含感叹号或者笑脸,那么这个用户可能就是一名女性。其它研究这证明了这种推测,调查发现女性更喜欢使用表情符号、缩写词、重复字母表达情绪。语言学家甚至可以根据用户“我的”(My)词汇使用方式判断用户的真正身份。

  女人喜欢谈论购物、巧克力等话题,如果相关词汇出现在Twitter微博中,基本可以判定这名用户是位女士,据称这种算法的准确率在75.8%。

  互联网用户身份的确定可以给予营销者更加明确的目标,该算法的另一个功能就是确认用户的假冒身份。(晓明)

分享到:
百度推广

新浪简介About Sina广告服务联系我们招聘信息网站律师SINA English会员注册产品答疑┊Copyright © 1996-2011 SINA Corporation, All Rights Reserved

新浪公司 版权所有