从《星球大战》、《星级穿越》再到《超能陆战队》,人们已经对各种各样的机器人产生了浓厚的兴趣。本网站已经报道过不少关于机器人的皇家线上官网(中国)有限公司,比如主打家庭场景的 Rokid。而近日,Rokid 也在一次活动中亮相。
据了解,Rokid 的名字由来是这样的:Rokid=“Robot”+“Kid”,意为产品本身具有生命感会成长学习。外观上,Rokid 使用了高曲率的非球面壳体作为显像界面,其中间是全向型阵列的 8 颗数字麦克风,下方为一个铝合金箱体全向型音箱,最上方是它的 1200 万像素的摄像头。
在 Rokid 的壳体内部隐藏一个 WVGA 级别的 DLP 投影机与全色域 LED 阵列组合。结合可以深度学习的自然语音、准 3D 的 UI、灯光和音效来实现交互试听。
就像之前报道中提到的,Rokid 有多项识别技术:声纹识别、人脸识别、手势识别、动作识别、远场语音识别、声音寻向以及 ACE 自身音源消除等。语音交互尤其是机器人体验中最重要的一环,在问及为何不与第三方语音语言技术方案商合作时,其 CEO Dan 对动点科技表示语音库的很多数据都是消噪的,而在正常的家庭使用场景中,机器人接收的语音信息都是夹带周边噪音、语气的。
“我们希望从最底层开始收集正常家庭场景的语音数据,跟用户的交流增多的同时,也有利于 Rokid 的成长中带有用户自己的个性。”据介绍,基于声纹和图像识别,Rokid 会分辨家里的每一个成员,根据不同的人来进行个性化的服务。 在现场,记者试了一下通过 Rokid 来开启扫地机器人、拉窗帘等家庭应用场景,体验还是不错的。而这些应用也会通过其底层通信协议与开发者合作来实现。另外在家庭娱乐功能上,Rokid 已经接入虾米音乐、墨迹天气等数据,未来还会在儿童教育等方面有所拓展。
在硬件系统上,Rokid 使用了 8 核 CPU 及多核协处理器支撑所有的高速运算,硬件接口的可扩展性可便于开发者使用。需要补充的是,Rokid 还提供了一个可进行二次开发的图形化工具,以便降低在这个平台上进行二次开发的门槛。
在体验的过程中,“Hey 若琪,帮我…”的指令来实现与 Rokid 的交流,不过可能是当时 WiFi 环境的缘故,Rokid 起初并未很好地识别出语音指令。不过这也语言语音指令也是一个不断积累的过程。Dan 表示目前的 Rokid 形态是一个初步亮相,在正式发布时还会在多方面进行改进优化。不过 Rokid 不是可移动的,Dan 认为家庭机器人是不应该动的,更多的层面应该是提供个性化的场景解决方案。
对于价格方面,由于此次不是正式发布,对方没有公布。
其实,目前很多机器人的场景体系大都不是非常完善,而要实现自由对话相信也是整个行业的一个需要不断努力和突破的课题吧,最后我想用一段与 Rokid 有意思的对话作为结尾。
“Hey 若琪,我们结婚吧。”
“我是机器人,你这个禽兽。”