格物行业洞察 > 人物专访 > 正文

对话物联网|三角兽亓超:人工智能技术要真正的落地到产品,提升技术的边界,才能发挥更大的作用

来源:物联网资本论 时间:2018-01-02

微信图片_20180102123657.jpg

亓超,三角兽创始人 CTO

前微软小冰,百度度秘开放域聊天技术创始人,NLP 和人机对话专家,前度秘聊天及人机辅助负责人,是少有的 BAT 微软通关的资深算法工程师。


在人工智能的众多领域中,自然语言处理、机器视觉、大数据这三大领域得益于海量数据以及基于数据的算法改进、实际应用,在人工智能10多个领域中发展较为迅猛,也更受资本市场的推崇。

 

三角兽成立于2016年2月4月获得洪泰基金和天善资本1000万人民币天使投资。9月获得君联资本和赛富2000万人民币投资。2017年1月,获得东方网力旗下博雍基金、恒生电子和索道资本5000万人民币投资。在短短10个月时间内完成三轮融资,共计8000万,估值达到3.5亿

 

显然,三角兽已经成为国内人工智能语义领域发展最快,融资最多的创业明星公司。

 

三角兽解决的是在人机交互场景下“听得懂”的问题,基于大数据和深度学习算法,提供了一套对话式交互解决方案和端对端交互系统,为不同垂直场景中的合作方提供智能交互的能力,让用户更自然的获取陪伴、获取信息、获取服务。

 

实际上,国内最早的自然语言处理创业公司,经过这些年的发展,已经在很多领域获得比较大的成果,在识别技术上体现出来的差异性并不是太大,但语音识别、语义识别技术更加重视场景的垂直,在这方面,不同公司有不同的定位和建树。

 

市面上做人工智能技术的公司不少,但绝大多数号称“人工智能”的公司,只做到了其中的一半:人工。三角兽创始人兼 CTO 亓超有着清晰的商业定位——人工智能技术要真正的落地到产品,深入到不同场景和实际应用中,获取第一手的数据资源,提升人工智能技术的边界,才能发挥更大的作用。

 

作为人工智能语义理解的先行者。亓超是微软小冰团队初创人员,2014年5月29日发布的第一代小冰,亓超是当时小冰团队唯一负责核心算法的工程师,创造了开放域聊天技术,区别于用关键字、模板或者人工参与的传统聊天技术,之后也被百度聘请,领导度秘聊天功能。

 

“创办三角兽不是一次冲动的创业,十多年来一直从事人工智能语义识别工作,对我来说想换一个新的环境,在更理想的状态中去建构一个新的世界:将人工智能技术用于有意义的产品。”亓超表示。

 

成立一年多来,有赖于锤子新一代手机Big Bang功能的核心算法模块,小米电视模糊语义识别模块服务,Rokid机器人聊天系统等合作伙伴,三角兽日渐成为人工智能领域的“网红”,也在竞争激烈的市场中占有了不小的市场。

 

目前,三角兽主要面向To B 企业输出四大技术能力:开放域聊天、任务驱动的多轮对话、跨域中控、智能问答。


1,开放域聊天


其价值在于陪伴+引导,指的是可定制的聊天机器人,依靠开放域聊天技术,为用户定制不同性格的聊天机器人。在底层技术方面,与小冰、度秘并不太多差别。不同之处在于语料,三角兽会大量抓取网络上公开的语料中人和人之间的对话,目前从抓取到的500亿条语料中清洗出150亿,系统学习了大概70亿。这就保证了比其他同类型聊天机器人更为通用。

 

亓超介绍,三角兽提供成人和儿童两套聊天机器人解决方案。与成人聊天和APP聊天室采取的技术不同的是,儿童主要依赖于故事机,三角兽与百度度秘合作,采用捆绑打包的形式,抓取大量的儿童故事书、动画片的字幕,把儿童可以听得懂、可以听的句子当成白名单,过滤成人聊天中的数据,在此基础上生成一个概率的模型,保证儿童聊天机器人绝对安全,这种机器学习语料的不良率在0.006%。

 

2,任务驱动的多轮对话


其价值在于信息+服务,指的是可泛化的统计对话引擎,通过基于非结构化语义表示的模糊语义识别技术,能够更精准地满足用户获取信息和服务的需求。

 

相比于传统电视100多个频道,只需遥控器0到9,上下左右键就能选择频道,如今,智能电视发展到一定阶段,拥有几千个网络资源的视频内容,就这催生了语音交互的需求。

 

亓超举例说,通常情况下,在识别同样的语音时,不同的机器可能会作出不同的反应,这就取决于机器对于语义理解的区别。肖申克的救赎,这是一部非常知名的电影,但是很少有人会把它说完整,这时候如果不做语义理解,可能你就搜不到这部电影。再如《神探夏洛克》和《夏洛特的烦恼》,“克”和“特”,交互的精准性对语义理解的能力要求很高。如果用户说错或者有口音,你想看的英剧《神探夏洛克》,可能会推送成成《夏洛特的烦恼》,因为夏洛特更普遍。

 

3,跨域中控


其价值在于全面了解并反馈用户多远需求,三角兽的团队从零建设了百度度秘中控,跨领域鲁棒决策极强。

 

在亓超看来,人机对话解决两个问题,一类以闲聊为目的,比如微软小冰;另一类则以完成任务、解决实际问题为导向,比如各类智能助手。

 

对于闲聊来说,对话的通顺连贯与“有趣”是关键,专业性似乎不重要;而对智能助手来说,解决问题是第一要务,因此系统需要能很好地利用相关数据库与外部知识。


4,智能问答


其价值在于垂直及开放域知识类精准回答。基于深度学习的问题泛化,庞大的行业知识库支撑,高效高准确率回应问题。

 

在产品的业务方面,三角兽选择了企业服务、IoT和泛娱乐三大领域,与合作方共同打造产品交互体验。

1,三角兽在企业服务领域的核心应用场景是解决交互方式僵化和有效信息利用不足等问题,包括提供智能客服、政府央企、媒体等信息平台,为企业入口注入生命,加入bot交互能力和主动学习反馈的能力。

2,在智能终端领域,相当于为智能硬件装上大脑,让机器听懂人话并作出回应,满足用户直接和潜在的需求,提供陪伴、信息和服务。主要应用在智能家居、智能车载、智能手机、智能机器人、智能音箱等方面。


3,在泛娱乐领域,例如模仿人物性格,赋予游戏、动漫角色、虚拟偶像“生命”,以及明星偶像的机器“分身”,每个粉丝都能可以随时与喜欢的角色互动。


对三角兽来说,做智能客服业务颇具挑战。前来咨询或投诉的用户本来就带着问题,已经非常不满了,智能客服交互方式一旦没有解决其问题,用户会更不满。但是在娱乐和游戏场景下,人们对机器人的期待比较低,将聊天机器人进行性格定制,赋予人物设定的角色,与粉丝进行聊天互动。

 

那么,三角兽的自然语音处理技术到底深入到了哪些场景和实际应用中,又是如何应用的呢?

案例:三角兽与华为麒麟970联合演示芯片级语义处理方案


在手机解决方案中,把日常看到的文本中的意图、关键信息提取出来,跟手机操作结合在一起,可以减少操作路径。对手机厂商来说,希望借助这样的一些功能,更加了解用户怎么去使用手机,能更好的为用户提供更好的推荐,或者更好的一些指引一种状态的输出。


近日,三角兽与麒麟970联合演示本地快速处理智能语义意图及信息提取、智能表情生成、智能自动回复等功能,强化手机终端精确语义认知的能力,打造极致手机操作和交互体验。


1.智能语义意图及信息提取


智能分析文本隐含的语义意图并提取关键信息,对应到相关的功能和服务,以此优化用户文本编辑的效率,减少操作路径。


在我们日常使用手机的过程中,我们经常遇到以下场景:


朋友推荐了一个不错的餐厅,希望得知它的价格、环境或导航去它的位置;

看到感兴趣的歌手的新闻,希望了解TA的更多新闻或收听TA热门的歌曲;

一篇文章中提到的电影,想买一张它的电影票去附近影院观看

一个感觉不错的商品,想了解商品详情或价格;


手机在收到大段信息之后,不管是地址还是吃喝玩乐等信息,都可以同样的一键识别,秒懂你的需求。


微信图片_20180102123707.jpg


跟朋友聊天、提到了某个餐厅时,选择这段文本,系统就可以识别提取出该餐厅名称,并结合大众点评等app获取它的详细资料,一键直接得知其价格、地址、环境等信息。


2、智能表情生成


智能分析文本隐含情绪意图,辅助用户选择最合适的表情。


聊天机器人并不罕见,但是一个能准确了解你的心思,还能帮你回复表情表示复杂情绪的机器人,是不是就比较稀有了?装备了智能表情生成功能之后,通过模型,聊天机器人可自行计算判断对话中体现的情绪意图,并在回复时列出概率最高的表情作为备选项,进行便捷回复。

 

2.jpg

收到消息后,用户只需轻松点击对话文本,选择智能表情回复,就可以点选表情进行回复了,省去了在大量表情库里苦苦寻觅可用表情的麻烦。


目前三角兽能够智能生成回复的表情包括20个,除了常规的开心、难过等简单类别,更能通过计算判断回复尴尬、惊恐、卖萌等复杂表情。


3、智能自动回复


智能理解文本内容,自动生成回复建议供用户选择回复。


这个功能赋予了系统智能自动回复的能力。当用户收到某条信息时,系统可以智能理解文本内容,生成几个选项,作为可回复句子的备选,让回复消息也变成了动一下手指就能解决的事情。这在大大为用户提高了回复效率的同时,也能保证回复质量:使对话持续且有效地进行,避免答非所问的“尬聊”,实现对用户问题的有效而精准的回复。

 

3.jpg

在忙碌的生活中,我们经常会有不方便与其他人进行聊天的情况。而这时,借助智能自动回复的能力,聊天也变成了一键可实现的事情:只需要选中文本,选择智能回复功能,并在备选项中选择自己想回复的内容条目,便可直接进行回复。

 

发展不到两年时间,采访当天,三角兽新晋两位算法工程师,员工人数首次破百。作为人工智能自然语言处理领域融资速度最快、产品应用场景最多的创业公司,三角兽的壁垒和优势靠的是团队的过硬技术。

 

“三角兽需要给团队一段稳定的时间,有时候手里的项目比研发人员还多,一方面希望项目能深入到不同场景和实际应用中,获取第一手的数据资源,从而提升人工智能技术的边界。另一方面,由于产业链过长,三角兽为电视提供语义交互的解决方案,不可能生产电视,做手机语义交互解决方案,不可能生产手机。因此,三角兽成立沈阳团队,为北京算法团队做集成和实施,希望未来有更多机会三角兽可以稳扎稳打的打磨好产品,让人工智能技术在时间中沉淀,应用于更有意义的产品。”亓超坚定的表示。


标签: 三角兽 亓超 人工智能

关注 物联网资本论 微信公众号 了解物联网行业最新趋势、产业政策、企业及企业家专访、投资机构及投资事件,参与更多物联网行业线上线下活动。