阿里图像识别揭秘:每秒可扫描501本康熙字典汉字量

2017年10月12日 16:47 新浪科技

微博 微信 空间

添加喜爱
郑秀芳阿里巴巴首席平台治理官郑俊芳郑秀芳阿里巴巴首席平台治理官郑俊芳

  新浪科技讯 10月12日下午消息,在云栖大会“数据力量-社会治理的共享与共治”分论坛上,阿里巴巴平台治理部首次集中向公众展示大数据带来的社会治理变革。据介绍,通过“雷音识字”技术,对淘宝和天猫宝贝详情图平均识别准确率为97.6%,“已接近人眼识别能力。”

  “2016年淘宝新开店铺为1020万家,有成交的就超过300万家,这其中约35%卖家是24岁以下的年轻人,30岁以下的创业者就占到超60%”,阿里巴巴首席平台治理官郑俊芳表示,在这个繁荣多样的生态中,“我们既要考虑消费者保护,要保证市场活跃,营造健康的创新创业环境,也要为品牌权利人提供服务保障权益。”

  论坛上,阿里巴巴集团资深技术专家贾梦雷首次向公众披露“雷音识字”技术。据介绍,新广告法实施后海量的商品描述有了违规风险,而平台上90%的商品描述在图片里,比如说“顶级”、“最优质”、“极品”等。“‘雷音识字’技术需要监控全网近20亿商品,并将违规商品揪出来”,贾梦雷说,目前技术对宝贝详情图平均识别准确率为97.6%,“已接近人眼识别能力。”

  那么阿里的图像识别能力到底有多强?

  平台治理部公布的一组数据指出,2016年全年阿里超强的图片识别技术已累计计算1000亿张图片,每日为20亿在架宝贝的图像安全保驾护航。每日计算商品图片约6亿张,每年计算图片面积约4.26平方公里,相当于 48 个澳门特别行政区的土地面积。每秒扫描图片文字23,546,287个,相当于每秒可扫描识别501本《康熙字典》的汉字量。

  目前,该图像识别技术以审核包括身份证、发票、营业执照、专利证书在内的23种资质图。“像专利证书的识别率高达99.3%,这让快速合法合规成为了可能”, 贾梦雷说。(韩大鹏)

推荐阅读
聚焦
关闭评论
  • 关于阿里达摩院1000亿的四个疑问

    未来,国家间的科技竞争直接体现在大公司之间的竞争 [详细]

  • 鹿晗现象背后,是被妖魔化的流量偶像与粉丝

    铁打的流量,流水的偶像。鹿晗会老,粉丝也会老,但不可否认的是,随着世代的更替,付费的观念和 [详细]

  • 愈演愈烈的苹果电池门,到底跟三星有没有关系?

    你想让苹果的麻烦越多越好,那就好好准备小板凳看戏。这一次首爆不知道各位爷是否满意? [详细]