微信文章 >科技微信号文章 >差评 >去了 Google 亚太地区峰会,我看见了未来。

去了 Google 亚太地区峰会,我看见了未来。

2017-11-20 20:22:07来源:

世间怪奇胜书籍

恨已不明眼前疑



差友们,这次差评受邀去东京参加 Google 的亚太地区记者招待会,今年的主题是 AI & ML( 人工智能和机器学习,以下都用 AI & ML 表示)


这一次咱们作为中国大陆仅有的几家受邀媒体(一共七个人),差评君看到了很多有意思的东西来和大家分享一下~


这次活动的主题语 # MadeWithAI,这盒子里装的是零食。。。


不得不说 Google 办公楼真的很会挑地方,直接坐落在东京闹市区,窗外这个景色无敌好看。。。


在这里办公应该也挺爽


作为一家科技公司,洗手间的马桶也很高级,差评君靠近的时候它自己打开了,吓尿了(咦?感觉正好。。。)


东京的 YouTube 中心搭建了许多场景,录制设备也非常专业,让视频创作者能发挥自己的创意。


总而言之,Google 的办公环境这么酷,让差评君也很想体验在那儿工作的感觉。


Google 在之前全球直播的 Pixel 2 发布会上其实也主打 AI 产品,不过那场发布会的中心思想在于介绍他们用 AI 来提升过的自家产品,让消费者们感受到科技的美好。


而这一次,Google 在记者招待会上告诉了差评君他们用 AI & ML 技术默默地做出了哪些努力,他们相信像差评一样的科技媒体能意识到这些努力的重要性,并且去发声让更多的人知道。


有幸见到男神 Jeff Dean,还和他合了个影~

(关于 Jeff Dean,如果你不了解他,可以看世超写的这篇文章


Jeff 一上来直接介绍了谷歌现在正在使用的神经网络,这个系统靠数据样本可以学习,最终实现想要的功能。


打个比方,开发人员在训练一个图像识别系统的时候,会 “ 喂 ” 很多图片样本给系统来做识别,最终当一张新的图片进来的时候,系统能够准确的认出来,那这个系统就算能用了。


你可能需要稍稍记一下上面提到的这玩意儿,因为下面的内容会告诉你它能做多少事情。


首先,AI & ML 如何让产品更有用。


他们重点介绍了谷歌的翻译服务,Google Translate。( 其实这个产品新功能出来有一段时间了,只不过他们没有大肆宣传 )


虽然图片里的中文语法依然惨不忍睹


以前谷歌翻译用的是单词比对,翻译质量很差不说,效率也不高,而且开发维护起来也不方便,现在谷歌翻译用上了神经网络,可以做出一些堪比黑科技的效果。。。


例如下图这个 “ STOP ” 标志,演示人员用英译韩模式,并且开启了相机模式,手机上会直接替换标志里的文字,你要是截个屏别人可能真会以为上面本来就是韩语。


为了证明这不是 PS,差评君用手上的 Pixel 2 亲自试了试,这次选择的模式的日译英。


为了更好地演示,Google 日本公司还在演示区搭了个吧台,菜单各种语言都有,你得用这个摄像头翻译功能来点饮料。


吧台的 Google 工作人员小姐姐们特别漂亮,所以就不给你们看照片了~

除此之外,谷歌翻译的语音识别功能也很好用,你可以通过这个软件和外国人轻松对话。


有了上面两个功能,你出国旅游的时候,带个手机就相当于带了个随行翻译~


谷歌地图现在不光能导航,还能在你接近目的地的时候引导你找合适的车位,原理是用 AI 分析大量数据,来判断某个时间段某个地点的停车场应该有位置,在美国有 25 个城市已经实现这个功能了~


你也可以拍个街景来找到位置~


Google Assistant则是一个功能强大的个人助理,与一般的手机语音助手不同,它是个在学习自然语言的 AI。


谷歌认为,就像你和人类交流一样,一个好的助手和主人的交流应该是以对话的形式,而不是命令。


举个例子,它可以理解上下文意思,你问一句 “ 北京天气如何 ”,得到答复后,可以直接问 “ 那上海呢 ”,而不用再次提及 “ 天气 ” 这个关键字。


这个个人助手和其他产品紧密结合,差评君在演示中看到,一位工程师直接和助手说看看他儿子的照片,助手于是在他谷歌账号下的照片库里找了出来,然后他说 “ 给我看他在体育场里的照片 ”,于是助手再次筛选了照片,跳出他儿子在体育场里的照片。


上面这个场景,与 AI 和 ML 相关的技术就有语音识别,语言处理,还有人脸识别,场景识别等等,为了实现这么方便的场景,Google 的工程师背后做出了很多努力。


Google Pixel 2 的人像背景虚化也是 AI 和 ML 的应用。


Google 产品照相功能产品经理 Issac,差评君坐在下面的时候 Pixel 2 XL 的相机死机了,差点冲上去和正在演讲的他吐槽。。。

手机的镜头没有那么专业照相机那么强大,所以有的厂商采用双镜头来实现背景虚化,但是 Google Pixel 靠 AI 来判断照片中物体的距离,用软件来模拟这个虚化效果。


有时候想拍个相片或者镜框里的东西,因为光线反光的问题会拍不好,例如下图↓


Google 推出了一款软件,叫 PhotoScan,你只要依次扫过相片的四个角,软件就能通过算法补出一张不带反光的图~


其他的产品功能差评君觉得和 Pixel 2 发布会内容有些重复,这里就不多啰嗦了,想了解的同学们可以戳我以前写的发布会文章(传送门),里面提到的 Google Lens,Pixelbuds,Google Home 都是很棒的产品。


其次,AI 和 ML 让其他人创造价值。


Google 想让全世界的人都能上网用上他们好用的产品,让人拉近距离,共享知识。


但是这很难,因为全世界大约有 6000 种语言,400 多种语言的用户在一百万以上,除此以外还有数不清的方言。。。


而互联网上的不同语言的信息量其实很不平衡,大约一半以上的内容是英文,也许有的互联网企业觉得把英文服务做好就够了,不过谷歌显然不想止步于此。


把一门语言做到电子设备里其实比想象的要难,如今国际主流的语言转换成机器码的格式是 Unicode。


但并不是所有的语言都适合这套模式,更麻烦的是,有的小语种地区科技发展并不算太差,但是他们在建立自己的系统时完全没有使用 Unicode,让他们更换标准就更难了,几乎等于重新点科技树。


而且还得开发字体。。。


Google 克服了大量挑战,做了很多语言的键盘,不是所有的语言都可以用 26 个字母的键盘来输入的(题外话,这么一看拼音真是个伟大发明。。。),有的人也许会想当然,但是 Google 不会。

见都没见过的语言。。。


而且,Google 一直觉得语音功能非常重要,不是所有人都会打字,也不是所有人都识字,更不是所有语言都有文字。


强大的语音识别可以做什么呢?


他们举了个例子,有个叫 Aum 的人,从小在一个小语种国家被雇作非法童工,如今一个字儿不识,但是在一次很偶然的机会下他讲话的时候暴露在了一台连接互联网的设备中,被 Google 语音识别发现了,最终结束了他痛苦的劳工生涯。


Google 在多语言化上还做了更多努力,他们在执行一个项目,叫 Project Unison。


这个项目的主旨是给小语种制作一个标准化的语音,而且还开源了,让全世界开发者也能把这些标准化内容当作样本来训练 AI,从而为小语种用户提供服务。


当全世界人能互相理解的时候,也许会少很多矛盾,从而共同创造价值。


除了个人用户,Google 的开源 AI 框架 TensorFlow 还让一些企业智能化转型。


在记者会上,一位日本的食品公司负责人讲到了他们现在用 AI 来检验食品原料。


以前他们检查土豆块的质量时,靠工人在流水线上拣出质量不好的;现在通过 TensorFlow 开发了一套 AI 系统,通过大量好的土豆块样本来训练它,如今这套系统已经可以做出比人更准确的判断了~


差评君觉得这个例子的意义不小,你可以训练 AI 识别土豆块,自然也可以训练 AI 做其他对别的企业很有帮助的事情。


工业革命让机械解放了劳力,现在Google 让 AI 解放不必要浪费的脑力,人可以空下来去创造别的价值。


AI 就像一个新生儿,潜力几乎无限。


最后,靠 AI 解决人类难题。


海牛是一种濒危动物,科学家们一直致力于保护这些水生哺乳类。


但是要保护他们首先要能够找到他们,在 Google 的 AI 介入科学研究之前,科学家们寻找海牛的方法主要从航拍中自己找。。。


现在,通过样本学习训练一个 AI,成功率有了明显的提高,这样的一个系统无论是对于物种保护还是科学研究都有很大的价值。


能源问题一直以来困扰着我们,谷歌的数据中心的能源控制用了一套机器学习系统,它使数据中心能耗有了明显的降低。


糖尿病视网膜病变是一种糖尿病的并发症,这种病的诊断方式主要是检验视网膜是否有出血点。


在印度,大约有 12.7 万的眼科医生缺口,因为医疗资源稀缺,45 % 的糖尿病视网膜病变患者失去了视力。

传统的诊断方式由医生亲自完成,观察上图这种视网膜的医学影像来确诊,而通过 TensorFlow 搭建的 AI 系统,人们可以 “ 喂养 ” 大量样本来训练一个诊断系统,通过 AI 来完成疾病诊断。


(如今,AI 的确诊正确率比医生要高 (取中位数))

AI 诊断非常适合这种场景,因为它能很好的弥补医疗资源不足的问题。


现在, Google 已经和一些医学研究机构和专业摄影器材企业也达成了合作,打算把这个成熟的研究成果搬到临床,在人类健康问题上做出实际的贡献。


在健康方面,癌症一直以来都是一个人类难题,很多人被确诊的时候往往错过最佳治疗时间,花费了大量时间和金钱,每年都有很多孩子因为乳腺癌失去了母亲。


一张专业医学影像里大约有 10 的 10 次方 个像素,病理学家通常需要做出很大的努力才能做出准确的判断。


而 AI系统可以去掉图像里的噪点,精确地找到肿瘤。


Al 的确诊概率现在要高于病理学家的判断

Google 的努力在医学领域也受到了很大认可,上面提到的研究论文在 JAMA ( 美国医学会杂志)发表。


来到现场的演讲者里,还有一个来自新西兰的鸟类保护研究者 Victor。


新西兰的鸟类动物非常多,但是因为人类影响栖息地如今受到了破坏。


为了保护这些鸟类,新西兰政府建造了鸟类保护区,而且学者们为了追踪鸟类栖息地,2年时间,不间断地录制了 15000 小时的鸟叫声来让他们以往的系统来辨别不同的鸟类。


如今, Victor 通过 TensorFlow 建立了一个神经网络系统,大大的减少了研究所需的样本,这套 AI 系统现在能够在有大量噪音的自然环境中准确识别各种鸟叫,为鸟类保护做出了很大的贡献。


总而言之,在解决人类问题上,谷歌用 AI 和 ML 在环境,能源和健康等领域都做了不少努力。


除此之外,他们在现场还做了一些好玩的 Demo。


画画让 AI 来猜,然后 AI 会根据你画的内容给你个相应的图标


Geek 们也许搞不懂艺术,但是他们可以写个 AI 来搞艺术。。。


还能和 AI 合奏一曲钢琴曲~



这次被谷歌邀请的时候稍稍有些意外,但是差评君觉得不虚此行。


总的来说,这次活动因为并没有直接面向消费者,所以没有发布会那种 “ 卧槽这个黑科技好好玩儿! ” 的感觉,但是差评君感觉看到了未来。


尤其是会议的第二部分和第三部分,在帮助他人创造价值和解决人类问题上,这份伟大感是之前的发布会没有的。


例如在解决全球语言问题上,差评君想到了一个故事。


在《圣经》 中,人类一开始语言相通,他们想要在巴比伦制造一座通天塔,但是上帝觉得尊严被挑战了,人们齐心协力还有什么事情干不成?于是他改变了人类的语言,人们因为沟通不便放弃了这个伟大的工程。


Google 试图逆向这个传说,让人类不再因为语言而隔阂。


而且他们鼓励各种企业使用 AI,一起改变世界~


例如开源 TensorFlow,提供 ML 技术课程。


在解决人类问题上,Google 更是以身作则,告诉我们科技不仅仅能为他们的消费者带来什么,还可以为全人类带来什么。


这还不算完,Jeff Dean 在问答环节觉得接下来他们要做的事情还有很多,Google 正在试图自动化机器学习的过程,这样一来,小企业和研究机构对于 AI 人才的需求就会降低,能够更快更方便地使用 AI 技术。


很少有企业拥有这样的责任感,这样有责任感的企业很少有像 Google 一样影响力巨大还很 Cool。


能够和 Google 在同一个时代,一起改变世界,想想就觉得很棒~



“ P.S. 日本真好玩儿~


最值得关注的微信公众号