搜狗砸4000万参加“一站到底” 网友:我可能看到了假的机器人
来源: | 2017-02-24 15:48:47

 自去年AlphaGo大战李世石后,多家科技公司借“人机大战”展示人工智能技术。最近,搜狗耗资4000万元让机器人“汪仔”亮相江苏卫视“一站到底”,与人类选手对决。自开播以来,两期节目均以汪仔战胜人类落锤,但是,搜狗机器人的表现从第一期开始便引发了巨大争议,“赛前背题库”、“假AI真营销”等传闻一度甚嚣尘上。

  2月6日,江苏卫视“一站到底”播出首场人机对战节目,有细心网友发现汪仔答对的题目几乎全部是在往期节目中出现过的老问题,而绝大多数新问题汪仔都没有抢答正确。无独有偶,第二期人机对战同样出现历史题目比例较高的情况,有超过三分之一的问题来源于网络题库。这使得外界质疑汪仔所谓的语义理解、知识搜索等能力存在较大水分,能够赢得对战可能是赛前背题库的结果。

  此外,号称搭载了搜狗“立知”系统的汪仔机器人在节目中作出的回答与立知搜索结果也存在较大出入。以第二期节目为例,当主持人问到“‘你无情,你冷酷,你无理取闹’,这句台词最早出自哪部电视剧?”时,汪仔给出的答案是“还珠格格”,而但据搜狗立知显示,搜狗早在2014年5月30日就已经明确给出了正确答案是“情深深雨蒙蒙”,令人匪夷所思。

  从提问形式上看,“一站到底”的问题也存在刻意降低难度、迎合搜索的痕迹。两期节目中,主持人提问时采用的均为固定的封闭式问句,如“世界上面积最大的内陆国是哪个国家?”“土耳其海峡连接的两片海域分别是黑海和哪片海?”“我国第一支水彩颜料是由哪家知名企业生产?”等,这些问题对搜索引擎来说仅需要非常简单的语义理解和关键词匹配,便能直接检索到答案,背后并不能体现高级的人工智能技术。例如,通过试验发现,当问题修改为开放式问句,如“世界上面积最大的内陆国是?”,搜狗并不能直接给出答案。

  除了问答题目,号称体现汪仔“语音识别”能力的对话环节也被质疑提前串词。从现场表现来看,汪仔与选手的对话非常“人性化”。例如,在没有任何“唤醒词”的情况下,汪仔能准确判断选手与主持人的话是对谁说,进而选择“说话”或者“沉默”,且从对话的识别准确度、反应速度和对话内容看来,汪仔表现出了惊人的“智能”,表现远超行业水平。然而,正是因为“太真了”,反而让人怀疑,什么样的训练数据能训练成这样?想来只有“背台本”能完美实现。

  严格来说,所谓人工智能是由机器学习、计算机视觉等不同领域的技术组成的,研究使命是赋予机器可模拟人类思维、意识和信息处理的能力,进而使机器可以完成那些过去只有人类才能完成的工作。相比之下,“一站到底”比拼的是选手的知识储备和快速应变能力,并不考察人工智能模拟人类思考这一根本属性,搜狗所谓的语义分析、问题理解、信息抽取等其实还是传统意义上的关键词匹配搜索。

  将信息输入搜索框,在后台进行准确的理解、分析、检测和匹配,是搜索引擎近二十年来的主要研究方向。搜狗借汪仔的壳将搜索结果换了一种形式呈现,在技术上没有明显的进步和创新。对于这次“人机大战”,搜狗其实是在搜索技术上包装了“人工智能”的外壳,对外宣称汪仔使用的多项高新技术不过是放卫星式的超前宣传。而且,无论是苹果siri,还是Google Now,语音问答技术早已被科技公司摸熟、玩透,搜狗拿这项技术来炒冷饭,反倒显得有几分敝帚自珍的意思。

  高端技术的研发离不开企业在人、财等方面的巨大投入,搜狗与一线科技公司在人工智能领域的投入上本就存在很大差距。与谷歌、IBM、Facebook等科技巨头相比,搜狗鼓吹的4000万研发费用好比是阵毛毛雨,几乎可以忽略不计,而当这些财力雄厚的科技公司已经吸纳了一批顶级人工智能专家时,搜狗拿得出手的科技明星还只有频繁出没于商业活动根本无法潜心技术的CEO王小川一人。搜狗能否拿得出真正集语音识别、图像识别、语义分析、知识搜索、语音合成等功能于一身的机器人,可想而知。

  此前,搜狗就曾在乌镇互联网大会上自导自演实时机器翻译表演,却因现场BUG频出被戳穿是“人工”智能。而此番“一站到底”的尴尬表现也似乎正逐渐坐实外界对搜狗人工智能“败絮其中”的猜测,4000万元的研发费用不算少,希望没有都花在营销上。(来源:中国资讯网)

精彩推荐