设为首页收藏本站桌面图标福建网址会心一笑 繁体中文

安全生活学习-祈安网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

点击进入授权页面

用百度帐号登录

AlphaGo之父:下个版本会让电脑从零学围棋

2016-3-12 18:42| 发布者: 一生平安| 查看: 750| 评论: 0|来自: 新浪科技

摘要: 谷歌人工智能AlphaGo战胜韩国棋手李世石引起巨大轰动,美国科技媒体“The Verge”在比赛结束后对AlphaGo背后的DeepMind公司联合创始人德米斯·哈萨比斯进行了长篇访谈,哈 ...


  问:当时,游戏是否是人工智能唯一显而易见的应用?

  哈萨比斯:是的,我认为是这样。实际上我认为,当时我们正在开发技术极其领先的人工智能。我想说的是,那时学术界还停留在90年代,而所有新技术都尚未普及,也没有得到大规模应用,例如神经网络、深度学习和强化学习。因此,最优秀的人工智能技术存在于游戏之中。

  当时的技术不同于我们目前开发的学习型人工智能,而更多的像是有限状态机。但这些系统很复杂,并且具有自适应性。类似《Black & White》的游戏采用了强化学习技术。我认为这是到目前为止游戏中最复杂的人工智能应用案例。不过到2004至2005年,很明显游戏行业走上了与90年代不同的发展方向。90年代的游戏很有趣,具有创新性。当你想到一个点子时,就可以将其开发出来。而到00年代,游戏更强调图像、内容IP,类似FIFA的游戏大行其道。因此,游戏行业不再有趣。

  在游戏行业,我做了能做的所有一切,在成立DeepMind之前我需要收集好必要的信息。这就是神经科学。我希望从大脑解决问题的方式中获得灵感。因此,没有什么其他方式比攻读神经科学的博士学位更好。

  问:这些或许是唾手可得的果实。你是否会将人工智能的技术进步应用在今天的游戏中?

  哈萨比斯:我认为将会很有趣。实际上,近期EA也有人联系我,我们应该去做这件事。但现在的情况是,我们有很多事情可做!这些技术通用性很强,我愿意去做这件事,但问题是人的精力有限。目前,我们的关注重点是医疗和推荐系统,以及诸如此类的应用。但或许未来我们会去做游戏,这对我来说这形成一个闭环。实际上,在游戏中设计自适应的人工智能对手将创造一个巨大的市场。我认为,相对于为每款游戏开发新的人工智能技术,开发者会更喜欢这种模式。或许他们只需要针对每款游戏去训练通用的人工智能即可。

  问:我可以想象,当你在家里打电子游戏时,相对于我,游戏中虚拟人物的表现会更让你失望。

  哈萨比斯:是的,大型多人游戏和其他类似游戏总是令我感觉失望。我从来都无法真正融入游戏,因为虚拟人物看起来傻傻的。他们没有记忆,不会改变,也与环境无关。如果有学习型人工智能,那么游戏质量将提升至新的水平。

  关于医疗

  问:本周你谈到,人工智能未来的主要用途将是医疗、智能助理和机器人。能否详细谈谈。例如关于医疗,IBM“沃森”已经在癌症诊断领域有过一些尝试。那么,DeepMind能带来些什么?

  哈萨比斯:目前还处于起步阶段。几周前,我们宣布了与NHS(英国国民医疗系统)的合作,但我们最开始将建设支持机器学习的平台。根据我的理解,沃森与我们所做的工作有很大不同,更像是一个专家系统。因此,这是一种类型完全不同的人工智能。这类人工智能所做的是基于医疗图像的诊断,或是追踪生命指标,以及长期的“量化自我”,帮助人们养成健康的生活习惯。我认为,强化学习非常适合这一领域。

  问:关于与NHS的合作,你们宣布了一款应用,但这款应用似乎没有用到太多的人工智能和机器学习技术。背后的考量是什么?NHS为何要用你们的应用,而不是其他公司的软件?

  哈萨比斯:据我所知,NHS的软件相当糟糕,因此我们要做的第一步就是让软件具备21世纪的设计。这些软件并不存在于移动端,与用户目前习以为常的产品也很不相同。我认为,这令医生和护士们感到失望,也妨碍了他们的工作进度。因此,第一步是帮他们获得更实用的工具,例如可视化和基本的数据统计。我们将开发这样的工具,看看我们的状况,随后再引入更复杂的机器学习技术。

  问:销售难度会有多大?很明显,在英国,医疗资金是一个持续讨论的话题。

  哈萨比斯:我们目前是免费去做,因此推广难度不大。这与大部分软件公司都有所不同。目前,开发这类软件的大多是跨国公司,因此它们并不是非常关心用户。我们的开发方式更类似于创业公司,你会去倾听用户的反馈,并与他们共同设计。

  关于智能手机助手

  问:让我们来谈谈智能手机助手。我看到你在演讲幻灯片中贴出了一张来自电影《她》的剧照。这代表了最终目标?

  哈萨比斯:不是这样。我的意思是,电影《她》是主流人群看待智能助手的一种简单方式。我们需要智能手机助手变得更智能,更好地理解环境,并对你正在从事的工作有更深的理解。目前,大部分这类系统还很简单:一旦你脱开预设的模板,它们就变得毫无用处。因此关键在于让这样的助手具有更好的适应性、灵活性,同时更强大。

  问:这方面的发展需要什么样的突破?我们为何不能立即着手去做这件事?

  哈萨比斯:实际上我们可以,你所需的只是不同的方法。这里再次出现了预编程和后天学习的不同。目前,许多智能手机助手针对专门的应用场景进行预编程,因此只能处理预编程范围内的逻辑。现实世界非常复杂,用户会从事各种各样难以预料的事,你不可能提前预测。DeepMind认为,实现智能的唯一方法在于从头开始学习,并确保通用性。这也是我们生存的基本法则。

  问:在起步之初,AlphaGo被教给了许多棋型模式。考虑到用户的输入信息多种多样,这种技术将如何应用至智能手机?

  哈萨比斯:是的,数据量很大,你可以利用数据去学习。但就AlphaGo的算法而言,我们认为可以不再规定受控的学习起点,完全放手让其自学,从零起步。我们将在未来几个月进行这样的尝试。这会花更长的时间,可能是几个月,因为不按棋谱随机下棋意味着更多的尝试和试错。但我们认为,这种纯粹依靠自学的模式是可行的。

  问:出现这样的可能性是否是由于算法已发展到目前的程度?

  哈萨比斯:不是的。我们之前也可以这样做。这样做不会让程序更强大,这只是为了尝试纯粹的自学,摆脱人为控制的部分。我们认为,这一算法可以在不受控的情况下运转。我们去年让人工智能去玩Atari的游戏,人工智能从像素点的研究起步,这其中没有掺杂任何人类知识。人工智能从屏幕上的随机像素开始。

  问:让人工智能玩游戏更简单,这是否因为游戏中的失败条件很明显?

  哈萨比斯:玩游戏更简单是因为分数更有规律。在围棋比赛中,你只能得到一个分数,这就是结束时胜负。这被称作“信度分配问题”。在围棋比赛中,你做出数百次行为,但却不知道哪一次会带来胜利或失败,因此信号强度很弱。在Atari的游戏中,你所做的大部分操作都会带来得分,因此你会有更多的信息反馈,帮你知道如何去做。

  问:能否给一个时间表,即人工智能何时能给普通人使用的手机带来明显不同?

  哈萨比斯:在未来2到3年里,你就会看到这些。不过,起步之初的情况可能会比较微妙,某些方面还需要改进。而在4年、5年,或是5年之后,你将看到性能的大幅提升。

  关于谷歌

  问:在你提到的未来所有可能性中,智能手机助手与谷歌整体的关联度最大?

  哈萨比斯:是的。

  问:谷歌是否暗示过你们,期望你们的技术如何融入谷歌的产品路线图,或是整体商业模式?

  哈萨比斯:不,我们有很高的自由度,可以按照我们自己的意愿去优化研究进展。这是我们的使命,也是我们加入谷歌的原因。加入谷歌使我们得到加速,过去几年的情况已然如此。当然,我们会开发谷歌的许多内部产品,但这些产品都处于极早期的阶段,因此还没有到讨论的时机。我认为,智能手机助手将是非常核心的产品,而谷歌CEO桑达尔·皮查伊(Sundar Pichai)也说过,这将是谷歌未来的最核心。

  问:谷歌也有Google Brain等其他项目,同时也推出了诸如Google Photos搜索等面向用户的机器学习功能。

  哈萨比斯:这类技术无处不在。

  问:你们是否与Google Brain有过互动,双方的关注点有没有重合之处?

  哈萨比斯:我们的互补性很强,每周都会沟通。Google Brain专注于深度学习,而他们有杰出的工程师,例如杰夫·迪恩(Jeff Dean),因此他们将技术传播至公司的每个角落。这也是为何我们看到Google Photos搜索等强大产品的原因。他们的工作成果是现象级的。他们常驻加州山景城,因此与产品集团的联系更多,并采用12至18个月的研发周期,而我们更多地关注算法开发,周期通常为2到3年,且我们在起步之初并不直接关注产品。

  问:谷歌对AlphaGo的支持有多重要?如果没有谷歌,你们还能不能取得这一成就?

  哈萨比斯:非常重要。AlphaGo在比赛中并没有使用庞大的硬件,但我们需要大量的硬件资源去训练它,并制造多个版本,让它们在云计算平台上对弈。只有获得庞大的硬件资源才能高效地做到这一点。因此如果没有谷歌的资源,我们不可能在当前这个时间段就取得这样的成果。

  关于机器人

  问:关于机器人。我常驻日本,而日本自认为是机器人的精神家园。在日本,我看到机器人的用途有两方面。一方面,发那科制造了工业机器人,被用于多种场合。另一方面,我们也看到了类似软银Pepper的礼宾机器人,这些机器人有着远大的目标,但使用场景很有限。对于这一领域,你的看法是什么?

  哈萨比斯:正如你所说,发那科的机器人在“肢体”上非常强大,所欠缺的是“智力”。礼宾机器人则有点类似智能助手。不过我所见到的这些机器人都经过预编程,只是按照模板做出响应。如果超出模板,那么机器人就不知所措。

  问:我感觉,最显而易见的问题就是,机器学习之类的技术将如何提高机器人的能力。

  哈萨比斯:这将是一种完全不同的方式。你需要从头开发,让机器人学习新东西,处理不可预期的事件。我认为,这才是在现实世界中机器人和软件与真实用户互动的方式。它们需要这类能力,从而发挥用处。因此,应当为机器人制定适当的学习路线。

  问:你认为,学习型机器人短期内会有什么样的使用场景?

  哈萨比斯:我们还没有太多地思考这一问题。很明显,无人驾驶汽车就是一种机器人,但目前这基本是一种狭义人工智能。不过,计算机视觉利用了学习型人工智能的某些方面,例如特斯拉就采用了基于深度学习的标准计算机视觉技术。我可以肯定,日本已经在思考诸如老人看护机器人,或家政机器人之类的产品,这对社会,尤其是老龄化社会来说很有意义。

  问:对于这些使用场景,基于学习的方式为何更适合?

  哈萨比斯:你只要想想这些问题:为什么我们还没有这样的技术?为什么我们还不能让机器人来帮你打扫卫生?问题在于,每个人的家中布局和家具都不相同。而即使是同一所屋子,每天的状态也在改变。某些时候乱糟糟,某些时候又很整洁。因此没有任何一种方式可以对机器人进行预先编程,针对你的屋子提供解决方案。你甚至还希望加入自己的偏好,例如你希望衣服怎么叠放。这是一个非常复杂的问题。这些事对人来说很简单,但实际上这些任务相当复杂。

  问:问个个人问题,你用扫地机器人吗?

  哈萨比斯:我们有一个,但用处不是太大。

  问:我自己有一个,确实不是非常有用。我会去看看它扫的不干净的地方,并再去打扫。因此我很好奇,我们何时会看到更先进的机器人,所谓“足够好”的转折点将于何时出现?

  哈萨比斯:是的,我是说有可能。我认为,所有人都会以合理价格买一台机器人,帮他们收拾盘子洗碗。这种简单的扫地机器人很流行。实际上它们并没有任何智能性。我认为,在这一发展道路上的每一步都是有用的。

  问:未来,对于人类、机器人和人工智能之间的互动,你有什么样的预期?很明显,人们会想到科幻小说中的场景。

  哈萨比斯:我个人不是很关注机器人。我关心的是将这样的人工智能应用至科学,推动科学更快地进步。我想看看由人工智能辅助的科学研究。届时人工智能将成为研究助手,去完成大量冗繁的工作,找出有趣的文章,在海量数据中找到数据结构,将这些信息呈现给人类专家和科学家,帮助他们更快地取得突破。几个月前,我曾向欧洲粒子物理研究所(CERN)做过一次演讲:相对于地球上的其他人,他们制造出了更多数据。我们都知道,在这些海量数据中可能会蕴藏新粒子的信息,但由于数据量太大,没有人能完成分析。因此我认为,如果某天人工智能可以参与寻找新粒子,那么将会很酷。(边策 维金)

  谷歌联合创始人谢尔盖:围棋是一种美学

  谷歌联合创始人谢尔盖·布林,他说:“围棋是一种美学,非常高兴展现了如此精彩的对局,比起国际象棋,围棋能让我们更多领悟人生,看到最强棋手在盘上表现出来的那种美。我们因能在计算机方面展现那种美而非常开心。站在这里看到AlphaGo与李世石的对局非常荣幸”。

  AlphaGo之父是如何炼成的?



鲜花

握手

雷人

路过

鸡蛋

相关阅读

爱淘宝 厦门鹭岛网络-361000.net ,翼企魔方,厦门企业邮局,厦门域名注册,虚拟主机,厦门软件定制|厦门网站建设!

|申请友链|网址导航|网站导航|小黑屋|扫一下二维码进入手机版|祈安网 ( 闽ICP备06000414号-7 )|公安备案号35052402000130

JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!

GMT+8, 2024-5-9 08:29 , Processed in 0.343633 second(s), 49 queries , Gzip On.

请加为QQ好友再交谈

返回顶部