对于科技届人士而言,今年的春晚出现了一个让人稍为兴奋的热点:机器人。
刚刚过去的春节联欢晚会不仅缺乏亮点,甚至缺乏槽点,因此被不少人讥讽为“史上最无聊的一届春晚”。不过话也不能说绝,对于科技届人士而言,春晚还是出现了一个让人稍为兴奋的热点:机器人。
在春晚舞台上为孙楠伴舞的540个机器人可以说是2015年该产业的一个缩影:机器人不断出现在人们的视野中,逐渐成为消费级产品,走入寻常家庭。
据中国机器人产业联盟2015年的统计数据显示,中国已连续两年成为全球第一大机器人消费市场。在工业机器人消费居高不下的同时,服务机器人和家用机器人也迎来了发展的爆发期。2015年短短一年时间内中国人工智能领域已有近百家创业公司,其中约65家获得投资、共计29.1亿人民币,覆盖了工业机器人、服务机器人、智能硬件等产品领域。
“2015年大家关注度最多的是家用机器人。”机器人OS开发商、图灵机器人创始人兼CEO俞志晨向界面新闻记者表示,中国服务机器人产业的发展态势良好,自2015年起“人工智能+机器人+互联网”的融合模式已成为未来服务机器人的大趋势。
图灵机器人今年1月20日刚刚拿到了奥飞动漫5000万元投资,估值达10亿元。作为“不做机器人”的机器人公司,图灵机器人要做的是一个基于云端的机器人“大脑”——图灵机器人OS。图灵机器人累计机器人开发者合作伙伴超过13万,最多时一天超过400家公司或开发者接入“大脑”开发产品,因此中国市场大部分机器人公司俞志晨都接触过,对该领域有着独特的理解。
“早于2012年我们就开始做自然语言处理、语意理解,包括知识引擎,当时做的一款类似Siri的产品虫洞语音助手,希望能够让手机变成一个机器人产品。”俞志晨回忆道,由于起步较早,市场上亦缺少同类产品,因此微软、三星、HTC、小米、华为、中兴等厂商均找上门成为了他们的合作伙伴。
不过自2013年起,俞志晨便开始涉足人工智能及机器人方向,他毕业后从事自然语言处理和机器翻译,很快就看到了整个智能硬件产业的发展前景,毅然转向家用智能机器人的方向,并于2014年11月发布了图灵机器人的第一代产品。
转变大方向,是因为俞志晨认为,中国整个家用机器人产业环境比任何一个国家,包括日本、美国、德国都要强很多。
“首先大环境上,无论政府还是资本都很支持这个产业,尤其是国家希望将低端制造转向智能制造,从而实现创新变革。其次,工业机器人的许多核心技术,包括关节技术、伺服器、舵机、减速器和关键模组等,均掌握在日本和德国这些传统工业强国手中,中国工业机器人基本没有核心技术,很难突破;但在服务机器人上,人工智能、机器人技术、互联网三个关键并行因素国内产业融合得比较好,发展起来大有希望。”俞志晨说。
然而,虽然虚拟服务是国内市场最典型的人工智能应用场景,但让机器人真正带有智能化的个人触感并不是一件容易的事情。目前国内市场不少机器人原型机让人失望,部分所谓的成功原型机也只有一些有限的角色,只适用于很局限的场景。更拟人、更个性、更高效的语音交互和语义理解,是市场对家用机器人最大的需求。
而这,也是图灵机器人为什么要做OS的最主要原因。
图灵机器人COO郭家对此是这么解释的。他认为,目前很多机器人直接使用手机芯片和安卓系统,做出来的相当于“手机的增强版”,也就是“机器人外壳”的Siri。“语音助手实际上是通过关键字把搜索结果的第一条展示给用户,非常像Google主页的‘试试手气’,它是非常不智能的,得出来的效果也是很同质化的。但机器人OS能够真正依靠NLP技术开发对话能力,当语音转化为文字后,让机器人理解它,根据机器人自己的个性设定,给出不同的答案。”
让机器人拥有不同的性格,是图灵机器人最大的创新尝试之一。一般的机器人厂商,每家只有一种机器人,性格、身份也只有一套;图灵机器人不一样,它开放了20多个属性给合作伙伴,其中包括姓名、出身、身份、父母、它的好朋友、爱好等等。20多个属性自定义完后,一个拥有独特性格的机器人就诞生了。
“比如我们的合作伙伴之一哆啦A梦,他的好朋友是大雄,他的职业就是陪伴大雄的一个家用机器人,他喜欢吃铜锣烧,讨厌害怕老鼠——不同的属性改变了这个机器人的定义,这样的开放才更有意义。”
除此之外,机器人OS的意义还在于实现多模态交互。目前市面上大多数的机器人只能够识别语音,但图灵机器人认为,真正的智能机器人大脑,不应该仅仅能处理语音、文字,更应该具有处理视觉乃至触觉等其他交互模式。
“人是有听觉、触觉、视觉、味觉、嗅觉,机器人也有很多的感官,它能听、能看、也有触感,甚至它还有很多其他的传感器,如红外、超声波、雷达、重力感应陀螺仪、GPS等等。比方说机器人有摄像头,他看到我之后就知道我是谁,跟我熟不熟,应该说什么样的话;我拍他一下,他知道疼了以后做什么反应,如’哎呀我疼’或’你真讨厌’——这样的语言不是用户通过语言命令让它产生的,而是它看到了用户或者用户接触它而产生的。把机器人的各个感官进行统一处理,就把语意理解上升到一个真正的理解层面。”郭家向界面新闻记者解释道。
简单来说,图灵机器人希望做到的是尽可能地将“人”的运作模式搬到机器人的身上。比如跟陌生人相见,根据双方情感程度,结合自身的经验经历等因素,表达打招呼的含义,转化为语言,说:“初次见面,请多多关照”。
“传统来说可以根据’你好’匹配几个答案,排个序,优先级高的反馈给用户。我们现在是更进一步,当看到’你好’的时候,机器人先要理解这个意思,然后再去组织语言,把想表达的语言组出来。其实我们现在在做的已经不是搜索,而是在合成语句,到这个层面就已经跟人是很接近了,因为人也是这样运作的。”郭家说。
通过表情、眼神、动作等情绪识别,机器人甚至可以根据不同的维度辨别人语音里面的情绪,包括高兴、愤怒、悲伤、疑惑或者平静等等,然后将自身的情绪根据语气语调和集体动作等反馈给人。
俞志晨同样认为,传递信息本身就应该是多维度的,从手机到机器人的交互模式已经发生改变,虽然操作系统本身有一些共性,但图灵机器人OS跟安卓或其他手机系统的最大区别,就在于它是完全按照机器人的习惯、场景、交互方式、体验来设计开发的。
目前图灵OS以开放的方式与众多厂商合作,图灵机器人提供智能系统以及技术服务,厂商自行生产硬件。未来俞志晨打算通过附加AI服务而非软件授权的形式收费。
1月份与奥飞动漫的合作便是他们最新的尝试。奥飞发布的乐迪机器人,定位为“学龄前儿童陪伴机器人”,搭载图灵OS的它具备语音识别、语义分析、情感识别、视觉识别、自学习的能力,可以让机器人听得见、看得懂、会思考决策、能察言观色,和孩子们一起成长。
跟奥飞的合作也反映了俞志晨的另一个思路。家用娱乐机器人在过去一年已经涌现了数百个新品,但是真正让消费者记住的产品寥寥无几,因此俞志晨认为在家庭环境中IP是很重要的一个环节,好的IP能够切合消费者的心理需求,将新技术与各种应用场景多元、深度融合到一起,形成互补的双赢局面。
据BBC预测,人工智能市场未来几年将保持高速增长,2020年全球AI市场规模约为1190亿人民币,其中2015年中国人工智能市场规模约12.6亿人民币,根据全球规模及主要公司市场增长率预测,2020年中国人工智能市场将达到91亿,年增长率约50%。可以预见,未来服务机器人有望成为继电脑、手机之后的新一代智能终端,成为虚拟世界联系物理世界的重要人工智能载体。
为了早日让智能机器人走进每个家庭,俞志晨希望2016年把机器人多模态交互和机器学习算法做得更完善,尽量把更多的产品推到消费者的手中。
“到时候,我们见到的机器人跟现在的机器人就真的不一样了,他不会再像一根柱子那样戳在那儿等你跟他交互,完全没有生命感,而是会生动起来,主动跟你聊天,聊累了他也会坐下歇会。这一点做到了,就是机器人产业的一个重大突破。”俞志晨说。