用户中心

资讯 > ARC专栏

Kinect=鼠标3.0,软件的下一代用户界面

作者:Ralph Rio,ARC顾问集团2011.03.31阅读 7020

        概述
        Xbox360 新型体感设备Kinect 当属本季假期的一款热门游戏。针对其核心技术展开的一项调查表明,除在游戏世界外,该设备在其他领域也大有用武之地。Kinect 运用了新一代尖端技术NUI(自然用户界面),扫描3D 影像和音视频输入。几乎所有的大型商用软件都含有多维数组,像ERP,EAM,GIS 和HR 等,拥有3D 导航技术的NUI,可满足三个或以上关系数据表的应用。继GUI 之后,NUI 时代已经到来,这一重大变革将造成市场断层,为最先应变而动的商家创造 大好机遇。
        3D 显示的重要组成部分——输入设备
        对于含3D 物体或数据的相关应用而言控制工程网版权所有,像CAD/CAM 设计创作工具、GIS 绘图、石油勘探、矿区规划、3D 电影制作等等,3D 显示为其使用性能的提升带来了极大希望。而显示器仅仅是输出设备,位于平面上的鼠标作为输入设备却无法很好地转化进3D 空间。当我的女儿说服我给她买了一台Kinect 作为假日礼物时,我抑制不住内心的好奇,想要探究清楚这设备的工作原理。我相信,这一技术为未来工业和商务软件的用户界面开辟了种种新可能。

        用户界面的革新历程

        用户界面的发展新趋势
        人类与软件之间的交互方式一直在发展进步,每一次方式转变都会带来严重的市场间断。上世纪80 年代,用户界面由命令行界面(CLI)转型为图形用户界面(GUI)。近年来,随着iPad,彩屏电子书和智能手机等移动设备 一路走红,MUI(移动用户界面)已在市场上站稳了脚跟。预计2011 年,MUI 设备的单位销售额会超过GUI 电脑。NUI 技术即将融入进更多的产品,Kinect 的问世为未来开发用于导航3D 应用的“鼠标”划出了起点。
        关于Kinect
        Kinect 集成传感器、处理芯片和软件中间件在内。其中,传感器又包括:
        • 红外激光(也有人称之为“结构光”),用于三维点云捕捉,像素为640 x 480,含像素深度。
        • 基于点云的彩色影像(像素为1600 x 1200)能够显著改善视觉效果
        • 可进行语音识别的音频麦克风这些信号的处理离不开一项核心技术,这包括由PrimeSense公司(总部位 于以色列、靠风险投资组建的一家公司)生产的芯片和软件中间件。其中,软件中间件包括:
        • 参考设计获取三维影像的深度
        • NITE 中间件,处理深度数据(特征检测和姿势识别)
        Kinect 输出的是红外激光视程范围内各表面的三维地图。该视野宽为58 度,高为40 度,深度为2.6 -11.5 英尺(0.8-3.5 米)。对于远在6.5 英尺(2 米)左右的物体而言,X 和Y 空间维上的空间精度是1/8 英寸(3 毫米),Z 空间维上的空间精度为0.4英寸(1 厘米)。这样的精度对于对象模型和软件程序导航已经绰绰有余。
        要让静态麦克风和室内随意走动的人们之间实现完美组合,在语音识别上出现了诸多特殊难题。为解决这些困难,在进行设置时,语音识别功能会根据房间的反射性创制一幅音频分布图。音频处理器则利用这幅图来执行多通道上的回声消除,以提高对声音命令的解读能力。
        仅有一台Kinect 时,物体背后的情景未能被检测出来。于是有人编写了演示软件,即如何同时使用多台Kinect 得到更为完整的点云(可在谷歌搜索“同时使用两台Kinect” 查看演示视频)。
        规模经济
        自上世纪80 年代始,音乐CD 的盛行催生了规模经济,为媒体和商家降低了成本。1985 年,这一技术首先在用于数据存储的只读光盘驱动器(CD-ROM)上获得应用,并迅速取代其他用于管理软件和归档文件的计算机介质。NUI 技术在游戏领域的应用也同样产生了规模经济。随着NUI 应用范围越来越广,其成本也越来越低,自然而然进入一种自我强化的良性循环。
        过去,网络摄像头是独立设备,要依靠USB才能接入电脑。现在CONTROL ENGINEERING China版权所有,摄像头嵌入在手提电脑和个人电脑的显示器上。我们可以预见,与Kinect相似的三维NUI 也会经历这 样一个过程。我们也可以预言,这一领域的改进将层出不穷,集成电路元件的芯片数量会愈益减少,额外的处理资源促进精确度会日渐提高www.cechina.cn,凡此种种都将降低设备成本。

        NUI 视野及应用

        自然用户界面的应用领域
        当前,传统的电脑游戏限定了Kinect 的应用空间。静止不动的传感器为局部环境(如,游戏玩家们所在的房间)提供了三维视野。在未来,人们可以期待传感器在其他 场所以其他视野享有更广阔的应用机会。
        在墨西哥湾发生BP 石油泄漏事件期间,深海机器人的作业员曾一度受制于导航困难。他们看到的平面视频无法在深度上提供参考。 结果,作业员虽然能看到机器臂上的工具已经放到了应放位置的右边,却无法确定这一工具是在前面、侧面还是后面。期间确实出现了错误,而且有几处错误还导致工作延迟。 在深海机器人身上添置像Kinect 这样的传感器将能帮助其感知深度,从而使其手臂及其所持工具的运作更为自然。而且,再考虑一下把这一 技术应用到作业员的显示器上以进行头部位跟踪的情形。作业员只需移动头部就能看到物体后面的情形,身临其境般获得真实体验,而实际上由于成本太高且过于危险,人类是不会置身于深海的。
        即将到来的市场断层为业务带来新机会
        我这份报告不过是抛砖引玉,关于如何扩展新的应用www.cechina.cn,有心之人自然会有无限创意。现在CONTROL ENGINEERING China版权所有,我们暂且把关注点放在下一代鼠标三维NUI 上。对于那些三维CAD 设计的物体,其显示和操作我们都可以轻易看清。但是,对于那些数据密集的商务应用www.cechina.cn,我们使用二维GUI 的体验却会限制我们的思维。
        假设一位维修调度员正在给一位电工分配一项工作任务。这位调度员还打算在同一地区给这位电工分配一些其他的工作任务以填满其8小时一班的工作时间——减少电工在路上穿梭的时间可以增加其有效工作时间。我们设想一下,在工厂的3D模型上置有许多工作任务编号,带有三维NUI 的EAM 应用系统会将这些编号展示出来,并通过语音命令重点展示那些位于附近区域、需要电工服务的工作任务。调度员会选择合适的工作任务并将其放入存储筒内,存储筒同时会计算一位电工要完成所有这些工作任务所需的时间。8小时过后,调度员把存储筒移到这个电工的图像那里,就把他这8小时内所完成的工作存放好了。
        调度员的显示器包括关于工作任务、资产位置、HR 技术证书和工厂模型的所有资料——其中,每一项的工作表都存在关系数据库里。几乎所有的大型商用系统(ERP、EAM、GIS、HR 等)都有多维数据数组。任何应用,只要用到有三个或以上工作表的关系数据库,三维NUI 均适用。
        结语
        将软件从2D 推向3D 需要两种硬件。3D显示器业已应用多年,但过去缺少3D鼠标。ARC 认为,这项基于游戏、用于Kinect 的最新技术会填补这个空白。微软若要推出一款3D 游戏的话,可能会是拉动3D 电视销量的“杀手级应用”。
        •IT 界专家应该逛一逛有演示Xbox 和Kinect 的电子商店,在那里好好玩一玩——我是当真的。你们得体验一下三维NUI 才能充分领略它的美妙。
        • 软件供应商们则应该买台Kinect,以供其卓有创意的工程师展示之用。Kinect的展示驱动程序(hacks)在所有操作系统上均可使用。
        人类拥有双手和手指,非常适于使用滑动手势的MUI(移动用户界面)。我们的双眼也有3D 立体视觉,适于NUI(自然用户界面)。人们可以预见,这两种用户界面的相关应用有交集,并且会朝两个方向发展。一类是移动应用,滑动手势的MUI。 另一类是静态的,针对用到3D 和NUI 技术更为复杂的应用。软件界面从GUI 到MUI 和NUI 的巨变会带来市场断层,这将为最先应变而动的商家成长为新一代的市场领军者创造大好机遇。

版权声明:版权归控制工程网所有,转载请注明出处!

频道推荐

关于我们

控制工程网 & CONTROL ENGINEERING China 全球工业控制、自动化和仪器仪表领域的先锋媒体

CE全球

联系我们

商务及广告合作
任小姐(北京)                 夏小姐(上海)
电话:010-82053688      电话:18616877918
rendongxue@cechina.cn      xiashuxian@cechina.cn
新闻投稿:王小姐

关注我们的微信

关于我们 | 网站地图 | 联系我们
© 2003-2020    经营许可编号:京ICP证120335号
公安机关备案号:110102002318  服务热线:010-82053688