本文是Techfans.net的增强现实系列文章的一篇,这个系列文章的列表请查看 这里 。本文将介绍增强现实技术在娱乐中的应用。
在国际图形年会SIGGRAPH上,有多个参展方展出了‘虚拟盒子’,盒子中实时的将真实的演员和虚拟的背景结合起来并且在3D中显示。演员们站在很大的蓝色屏幕前,由一个电脑控制的移动摄像头进行拍摄。由于摄像头的位置被记录下来了,并且演员的位置也是知道的,所以把演员自然的融入到3D虚拟背景中就成为可能。例如,演员要站在一个虚拟的圆环中的话,那这个虚拟圆环的前半部分就会遮住演员,而圆环的后半部分则被演员遮住。娱乐产业把这视为节约成本的一种方法:因为制造和储存虚拟的物体总是要比制造一个实实在在的家伙便宜的多。MIT Media Lab的ALIVE 项目就旨在自动生成虚拟环境,环境中还要有虚拟的智能生物能对人们的动作做出反应。
本文是Techfans.net的增强实境系列文章的首篇,这个系列文章的列表请查看这里 。本文将对增强现实下定义,探讨什么是增强实境/增强现实/Augemented reality。
增强现实,又被译为增强实境,英文叫做Augmented Reality (AR)。
所谓增强现实,是虚拟现实(Virtual Environments/Virtual Reality,以下简称VE)技术的升级技术。使用VE技术的用户,将完全沉浸于一个虚拟的合成世界中,这个时候,用户是无法看到他所处的现实世界的。而AR却可以让用户看到虚拟事物和信息与现实世界重叠的二维世界。也就是说,AR是使用信息技术对现实世界的一种补充和增强,而不是用虚拟化技术制造出一个完全虚拟的世界来取代现实世界。因此,在用户看来,虚拟和现实在同一个空间得到了结合,就像电影‘谁陷害了兔子罗杰’中的情形一样。图1是用来说明上述观点的一个很好的例子。图中有一个真实的桌子和一个真实的电话,同时还有两个虚拟的椅子和一个虚拟台灯。这些物品在三维空间中结合在一起,所以虚拟的台灯遮住了部分真实的桌子,而真实的桌子也部分遮住了两个虚拟的椅子。所以说,AR技术可以被认为是VE技术(完全虚拟)和远程呈现技术(completely real,完全现实)的中间态技术。
图 1: 带有一个虚拟台灯和两个虚拟椅子的真实桌子。
一些研究人员从头戴显示技术(Head-Mounted Displays HMDs)的角度去定义AR,而我们认为这是不恰当的。为了防止AR技术被一些特定的技术所限制,这篇文章将从以下三个角度去定义AR:
结合现实与虚拟
实时交互
3-D
这样的定义可以让AR必要的组件得到保留,同时也允许了一些除了HMDs之外的其他的技术。举例子来看这个定义,它可以把电影和2-D overlays排除在外。像‘侏罗纪公园’这样的电影虽然把虚拟物品和真实环境在3D中混合在了一起,但是它并没有互动功能。实时视频中的二维虚拟覆盖(2-D virtual overlays)虽然可以实现互动,但是它却不是在3D中和现实世界相结合的。当然,这样的定义也允许基于显示器的接口,单眼系统,透视头戴式显示系统和其他的许多综合技术。
所谓增强实境(Augmented reality,下面简称AR),是一种结合虚拟化技术再来观察世界的方式。
直接来看,AR能为我们提供现实中无法直接获知的信息。但是,更深层次来讲,这种信息实际上又让每个人眼中的世界更加多样性。同样的大楼在我们的AR视线里,会披上完全不同的‘信息外套’,这或许又是一种‘长尾现象’。另外,海淀的百货大楼和朝阳的百货大楼,在地理上没有任何关联,可是却在AR中可以以信息的形式连接到一起。这些都是目前AR已经显现出来的一些特点。当然随着技术的发展,未来的AR可能会更加先进。
上段文字摘自这里 。
本文是Techfans.net的增强实境系列文章的一篇,这个系列文章的列表请查看 这里 。
位于加拿大蒙特利尔市的麦吉尔大学(McGill University )的研究人员们最近开发出一种很神奇的地板砖,这些地板砖可以模仿沙地、雪地、草地的环境(包括视觉、听觉、感觉等)。这些地砖可能被用于一些增强实境的应用,包括电话会议、远程培训、远程医疗等等。
这个地砖系统是由虚浮在一个平台上的一些可变形的盘子组成。在盘子和平台之间有很多的用于感应用户脚部力量的传感器。这些盘子可以震动,以模拟步入不同环境中的感觉。还有一个从上到下的投影与一个扬声器,用于给出视觉与听觉的反馈。
麦吉尔大学智能机器研究中心的研究员Yon Visell (同时是本论文的第一作者)说,‘这些地砖既可以用于人机互动,也可以用于沉浸式的虚拟实境中’。
这个地砖系统还能被用作一个巨型的由脚控制的触摸屏,例如,可以用作一种导航投射在建筑物大厅或者公共广场的巨型地图的方法。同时还能被用于游戏和娱乐之中,增加人机之间的互动性。
这篇论文在2010 IEEE Haptics Symposium 会议上发表。
研究人员研究出全球首个锗激光器,为激光计算机铺路。真正的激光芯片不再遥远。
使用光来传输数据会让计算机变得更加高效,但是要把光学器件集成到硅芯片上可不是那么容易的。MIT的研究人员们最近的研究成果向这一目标又迈进了一步,他们制造出了第一个可以发射适合数字通信波长激光的锗激光器。和常规激光器所用的材料不同的是,锗很适合芯片制造的过程,已经有不少制造商把它放到了硅芯片上。
这是第一个可以在室温下工作的锗激光器,之前的一些锗激光器都要在接近绝对零度的时候才能正常发射出太赫兹(THz)频率。这也证实了被称作‘非直接频带隙’(indirect-band-gap)的半导体材料可以用来制作实用激光器件。
在一个半导体晶体中,对电子增加能量会让它脱离之前的能态,并进入所谓的导电带(conduction band)。进入导电带后,电子可以自由的在晶体中移动。这些电子可能会处在两个状态,这决定了当它们从导电带出来的时候剩余的能量的去处。在第一个状态,这个过程会释放出一个光子。在第二态,它会发出热能。
在‘直接频带隙’的材料中,第一态要比第二态的能量低。而在诸如锗这些‘非直接频带隙’材料中,则是第二态的能量低。一个活跃的电子当然会去占到最低的能量态。所以在‘直接频带隙’材料中,电子更趋于进入可以发射光子的状态。
MIT的研究人员们通过在锗中加入磷原子,从而把锗电子引入到发射光子的状态。每个磷原子的最外圈有5个电子,而锗只有4个。这个磷中多出来的一个电子进入到导电带的低能态,并刺激活跃的锗电子溢出到高能态,并发射出激光。而在之前很多科学家曾经一度以为‘非直接频带隙’材料‘永远发不出激光’。
研究人员的理论成果表明,在每立方厘米锗中添加1020 个磷原子会达到最佳效果。如今他们在实际中已经可以在每立方厘米锗中添加1019 个磷原子,并且已经能发射出激光了。
Lab of Materials,MIT
science professor Lionel Kimerling ‘65, PhD ‘69
research associate Jurgen Michel
postdoc Jifeng Liu, PhD ‘07
这个系列文章是Technology Review今年评出的最重要的十项创新技术。点击这里 查看该系列所有文章。
查看原文。
云计算为我们提供了无限的计算和存储资源。然而程序员们似乎并不知道该如何充分的利用这些资源。
大部分的程序员们都倾向于尝试把已有的程序改造成可以在云端运行,而不是直接去编写一个为云量身定做的应用。而且,在跟踪数据和获取程序运行状态方面, 云做的还不够可靠。其实只要这些问题能够得以很好的解决程序员们就可以更加充分的去利用好云了。比如,对于在线音乐零售商们来说,在云端,他们可以更好的管理社会化媒体:当一个歌手突然成为社会热点的时候,该歌手的唱片的促销活动的广告可以挂满整个网站,从而迎合当下消费者们最大的兴趣。
来自加州大学伯克利分校的Joseph Hellerstein觉得,他可以通过开发一套软件来很好的实现数据跟踪和实时关注云端发生了什么,使得编写复杂的云端应用不再那样的复杂。他的想法是通过修改各种数据库编程语言,从而让程序员们能够很快的搭建任何一种云端应用 ——社会化网络、通讯工具、游戏等等。通过好几年的测试和修改,这些结果修改的语言现在已经可以很好的从大数据库中读取和写入数据。如果这其中任何一种语言可以很好的实现云端友好化,那么程序员们就真的不用再去花大量的时间在处理各种细微的数据上了,而直接关注他们所要的结果。
这个主意的挑战是,这些语言设计的初衷是要处理那些静态的分批的数据,现在需要用他们来处理动态的变化的数据(比如传感网收集到的数据)。Hellerstein的方案是在语言中加入一个概念:数据可以是动态的,即使在数据被处理的时候,数据也同样可以改变。这可以使得程序为可能会晚来、或者永远不会来的数据做好准备。
Hellerstein的主意当然已经结了果实:Bloom语言。Hellerstein的团队已经使用Bloom语言实现了对诸如Hadoop(一个可以管理大量数据的工具)等进行迅速的重建以及增加多项功能。通过降低应用开发的难度,这种语言可以让更多程序员们参与到云应用的开发中来,从而创造出更多更强大云应用。
Hellerstein团队将在2010年晚些时候发布Bloom。他们也将用Bloom给出一些实时的应用,来演示在线的多玩家游戏,或者用于监测地震或者海啸。
点击这里查看视频:
Watch Hellerstein talk about his approach to cloud computing.
研究人员:
Joseph Hellerstein
(University of California, Berkeley) Better software for building cloud applications
OTHERS WORKING ON CLOUD PROGRAMMING
Yahoo Research, Silicon Valley, CA
Microsoft eXtreme Computing Group, Redmond, WA
IBM Research, Yorktown Heights, NY
Cornell Database Group, Ithaca, NY
HP正在开发一种既能使用在电子阅读器上,又能使用在平板电脑的柔韧、全彩并且能耗、成本极小的显示器。这个将e-ink和液晶的优点都吸取过来的新技术,将和高通的mirasol形成正面竞争。
HP实验室的研究人员们正在投入大力气研发一种柔韧且能支持全彩的显示技术,和mirasol一样,它是通过反射环境中的光线来减少能耗的。
负责该项目的Carl Taussig 说:‘我们的目标是发明一种显示效果和纸张类似,并且成本低于每平方英尺$10的显示技术’。据估计,这个每平方英尺$10的价格,能极大促进‘反射显示技术’在户外广告牌(如分众传媒的户外显示器)等地方替代纸张的趋势。乐观的Taussig估计这个过程只需要一到两年。再进一步,HP希望这项技术能被用在‘电子阅读器’和‘平板电脑’上。可以说,无论从显示原理还是市场定位,都会和高通的mirasol正面竞争。
目前,电子阅读器屏幕主要使用E-Ink 技术。E-ink技术不需要背光,显示效果和纸张类似,每个像素在切换到黑色或白色模式后就不需要消耗任何能量,因此能耗不大。但是e-ink技术还是有不少缺点,主要有:
不能显示彩色
不能在黑夜中阅读
显示切换速度太慢,因此不适合用于视频显示
Apple最近推出的iPad使用的则是常见的液晶显示器。它的显示色彩丰富,但是同时造价昂贵、能耗较大并且对视力伤害较大。另外,因为液晶是在玻璃的基础上制造的,它也不能卷曲,并且容易破碎。目前大部分的厂家任然对低能耗反射显示技术的广阔市场充满信心,并投入大量资金进行研究。
e-ink公司正在开发他们的彩色显示技术,它采用并行的红色、蓝色、绿色的滤波器。也就是说,每3个像素为一个单元,在某一时刻整个显示器只能在其1/3的面积上反射光线。这极大的减弱了显示器的亮度,很可能成为这项技术的致命弱点。
HP的目标是在1个像素单位内植入红蓝绿三种颜色。如果你想显示红色,你可以把整个的显示器都显示红色,而不是e-ink技术的1/3。据称,目前该技术已经基本完成研发,具体推广商用日期还不得而知。
位于‘创新之源’硅谷的Willow Garage是开源机器人平台领域的领先企业,今天他们又一 次带给我们创新的惊喜!昨天该公司宣布他们正在开发一个基于浏览器的接口,使得人们可以在任何地方远程控制你的机器人ROS,而这一切只需要一个网页浏览器。你可以直接在浏览器中,对机器人下达诸如"Go plug in(去把插头连上)" 或者 "Go tell everyone it’s soccer time.(去告诉大家该去踢足球了)"的指令。目前的指令数量还不是很充足,但是在未来WG不断新增指令,直接集成到接口中。
这意味着,在未来只要你能接入到互联网络,不论是PC浏览器还是手机浏览器,你都可以完成对机器人的远程指挥。
在这之前,WG公司已经在美国加州使用智能手机控制了一个日本水产交易市场的机器人。除了普通的控制外,浏览器接口还能允许开发人员进入到机器人代码内部,对代码进行修改。这样就方便了团队的协作开发。
可以看到机器人也在不断的‘云化’。在未来,很有可能所有ROS的代码都是在浏览器上完成,就像现在的Palm OS。如果能再进一步,人们可以将代码也都放置到云端,就如Salesforce或者Google app engine。不知道这一天还有多久。
官方blog消息,参照http://www.willowgarage.com/blog/2010/04/07/pr2-works-you-247
许多公司都会在产品投放市场之前,总是要花费大量的人力物力在市场调研上。而今MIT的研究人员们,正在尝试用高科技工具来收集用户在测试产品时的感受。
研究组的负责人Rosalind Picard表示,许多公司在市场调研中大多数使用问答的方式,而被提问者的口答很多时候是心口不一的。这个系统的目的就是为了突破口头问答式的市场调研方式,最准确的获得用户‘心里’对产品的感受,而不是‘嘴上’的感受。总结一下,这个系统通过收集、分析用户在品尝‘咖啡’(或使用其他产品)时的面部表情,直接判断出用户‘心中所想’。
项目组的Picard教授说:‘一些公司通过不让用户知道他们在被监视,来增加调研结果的可靠度。但我们不是这么打算的。’他们打算发明出一种更有效的工具,能在任何情况下判断用户们的感受,而不必受什么因素限制。而这些很多的技术都在以前MIT多媒体实验室的其他项目中有所积累了,他们已经发明出了工具能通过用户的面部表情,自动识别‘开心、困惑、生气……’等感受。
或许这个系统在未来也可能成为为推销员们制造的‘读心仪’。
关于这个项目的MIT官方网站:http://www.media.mit.edu/news/external-links/2010/01/reading-consumers’-faces-make-better-taste-test
本文是Techfans.net的增强实境系列文章的一篇,这个系列文章的列表请查看 这里 。
所谓增强实境(Augmented reality,下面简称AR),是一种结合虚拟化技术再来观察世界的方式。
直接来看,AR能为我们提供现实中无法直接获知的信息。但是,更深层次来讲,这种信息实际上又让每个人眼中的世界更加多样性。同样的大楼在我们的AR视线里,会披上完全不同的‘信息外套’,这或许又是一种‘长尾现象’。另外,海淀的百货大楼和朝阳的百货大楼,在地理上没有任何关联,可是却在AR中可以以信息的形式连接到一起。这些都是目前AR已经显现出来的一些特点。当然随着技术的发展,未来的AR可能会更加先进。
今天要给大家介绍一些AR目前的应用。最近,美国Marine公司就是将AR技术在装甲炮塔上进行测试。他们使用的系统叫ARMAR(Augmented Reality for Maintenance and Repair),大概意思是‘AR辅助维修’,该系统由哥伦比亚大学图形和用户界面实验室设计制造。通过为维修人员装备头戴式显示器,维修人员可以在维修时轻松获取对他们有用的很多帮助信息(如上图)。目前该系统也被用在了军事上。
请访问哥伦比亚大学图形和用户界面实验室网站(http://graphics.cs.columbia.edu/projects/armar/index.htm ),查看ARMAR更多详情。
阅读全文…
这已经不再是科幻小说中的场景了。打开手机的摄像头,将它对准一本书,Google goggle就能帮你直接搜索到书的详细内容。
Google labs最近推出了可以在Android phones上使用的Google visual search产品Google goggle。Android用户可以到market搜索Google goggle下载到。
目前的Google Goggle还比较初级,只能拍摄特定类型的物品,而且一定先拍摄照片才能搜索。未来他们计划让用户通过设备的摄像头得到当前的实时画面,用手指点击触摸屏画面中的任何部分进行搜索,这实在是太科幻了!
Google goggle官方网址:http://www.google.com/mobile/goggles/#landmark
或者查看CNBC视频了解更多:
Visit msnbc.com for breaking news , world news , and news about the economy
最近评论