从2014年开始,人工智能得到了前所未有的关注。但对于人工智能的发展,业界仍然存在两种截然不同的看法。尤其是EronMusk和霍金的“人工智能恶魔论”在学术界和产业界引发了激烈争论。但这丝毫没有阻止行业巨头对人工智能市场的热情。从市场披露的投资数据分析,在2011年到2015年的五年时间,人工智能领域的并购资金从2.82亿美元增长到2015年的23.88亿美元,而并购数量也从67起增长到397起。以谷歌、苹果、IBM、微软、Facebook为代表的等行业巨头正在通过并购进行产业布局。本文将谷歌、微软、Facebook和IBM、英特尔、苹果、百度、腾讯、阿里巴巴、Salesforce等10家公司在人工智能领域的布局和研究成果进行盘点。
1、谷歌
KK在谷歌创业初期跟拉里佩奇聊过,已经有一个性能不错的搜索引擎,为什么还要做一个?拉里佩奇说,不是要开发新的搜索引擎,我们要做的是人工智能。而对于“一家科技公司如何才能保住主导地位?”佩奇认为,最好的方式就是投资未来。佩奇希望继续增强对未来科技的布局,继续以最不可思议的方式改变世界,而人工智能就是其中非常重要的一个方向。
1)对DeepMind的收购及后续运作
2014年年初,谷歌以4亿美元的架构收购了深度学习算法公司——DeepMind,公司创始人哈萨比斯是一位横跨游戏开发、神经科学和人工智能等多领域的天才人物。7月,谷歌以DeepMind为主体与牛津大学的两支人工智能研究队伍建立了合作关系。
DeepMind也很快发布了研究成果,它在10月份公布了一种新的模拟神经网络,旨在模仿人类大脑的工作记忆原理,拥有更加强大的归纳整理和联想演绎等逻辑处理能力,从而带来更快的任务处理速度,还可以通过训练去自行处理任务,这种全新的深度学习算法可用于计算机视觉和语音识别等领域。
DeepMind最杰出的代表成果就是阿尔法狗,在2016年3月的世界围棋大战中,阿尔法狗以4:1大胜世界排名第一的李世石,人工智能再次战胜人类,也进一步引发了用户对人工智能发展的关注。
2)自动驾驶汽车
奇点大学的网络与计算部门负责人BradTempleton认为,在接下来的10-20年里最具改变世界潜力的技术是自动驾驶汽车,而谷歌在这方面要领先于传统汽车厂商。谷歌的自动驾驶汽车战略的起步是从收购510Systems及其姊妹公司Anthony’sRobots开始的,2011年谷歌收购了这两家公司。
2011年10月,510Systems悄然加盟谷歌,成为谷歌神秘部门GoogleX“moonshot”的关键组成部分。改装后的Pribot整合了谷歌的强大软件,也一并被谷歌收购。2012年夏天,普锐斯被换成了新款雷克萨斯SUV。此后,谷歌的自动驾驶汽车已经完成了总计70万英里的高速公路无人驾驶巡航里程。在此基础上,谷歌于2014年7月份推出了100辆原型车来执行小规模的市区道路测试,这是自动驾驶行业首次进行的规模化城市道路测试。谷歌的原型车安装了17个感应装置,搜集来的信息能快速建立起一个半径200公尺的3D信息图,让车辆对外部环境进行分析判断,实现360度的全方位防护。
为推动无人驾驶汽车的发展,谷歌也在申请无人汽车上路而努力。2016年2月份,谷歌赢得了重大胜利,NHTSSA(国家公路交通安全管理局)裁定,按照联邦法律导航无人驾驶汽车的AI系统可以被认为是司机。规定为未来扫清了道路,以后的无人驾驶汽车没有方向盘、刹车、加速油门,以及人类用于控制汽车的其它组件。
3)以Nest为基础的智能家居生态系统建设
谷歌于2014年1月份以32亿美元收购了智能家居制作商Nest,该公司主要提供智能恒温器和智能烟雾探测器,并已经拥有100多项专利,200多项专利已在美国专利局备案,另有200多项专利准备备案。6月份,谷歌通过Nest花费5.55亿美元收购了基于云端的家庭监控公司Dropcam,10月份,又收购了智能家居中枢控制设备公司Revolv,该公司将参与Nest的开放计划“WorkswithNest”。Nest对于产品的研发也是马不停蹄,于2014年年底一口气发布了四款产品,包括一款室内自动恒温计、两款网络监控摄像头和一款烟雾警报器。
2016年5月,谷歌推出的第二款智能家居硬件GoogleHome。除此之外,谷歌去年布局的智能家居底层操作系统Brillo和Weave通讯协议,都在彰显着谷歌想做智能家居老大的野心。有人说Brillo我不知道,其实AndroidM以上系统都可以找到它。
谷歌已经意识到智能家居领域将是未来人工智能应用的一个重要市场,所以通过一系列并购、开放平台的建立、软件硬件一体化来打造这个生态系统,而Nest创始人TonyFadell一篇文章的标题《欢迎回家》也反映出了谷歌在智能家居领域布局的前瞻性和决心。
4)在图形识别和语音识别研究领域的重大进展
2014年,谷歌开始了开发一套能够整合公司海量数据的语音系统,这个正处在测试阶段将会使计算机从本质上“听懂”和“思考”人们向谷歌设备输入的语音。这个团队将前馈神经网络替换成了递归神经网络,提高了系统对语音信息的存储和处理能力,并能够使用上下文、物理定位及其它方式对谈话者的真正含义进行预测,就像人在谈话时大脑所做的一样。
在图像识别方面,谷歌在2014年8月份收购了一家图片分析公司Jetpac。Google研究院也发表了一篇文章,表明未来Google的图形识别引擎不仅仅能够识别出照片的对象,还能够对整个场景进行简短而准确的描述。除此之外,谷歌一直在积极吸引图像识别和计算机视觉方面的专家参与到谷歌的项目研究中来,比如说向研究计算机视觉和模式识别的助理教授DeviParikh授予了谷歌内部研究奖项FacultyResearchAwards和9万美元的无限制基金,并允许她直接同谷歌的其他研究者和工程师进行合作。
根据德勤发布的一份报告显示,Google在2014年将语音识别的精准度从2012年的84%提升到如今的98%,移动端Android系统的语音识别准确性提高了25%;计算机视觉技术也取得了突飞猛进的发展。如果以计算机视觉技术研究者设置的技术标准来看,自2010年到2014年,图像分类识别的精准度提高了4倍。
5)Google神经机器翻译系统(GNMT)
2016年9月28日,谷歌在上发表论文《Google`sNeuralMachineTranslationSystem:BridgingtheGapbetweenHumanandMachineTranslation》介绍谷歌的神经机器翻译系统(GNMT),随后谷歌ResearchBlog发布文章对该研究进行了介绍,还宣布将GNMT投入到了非常困难的汉语-英语语言对的翻译生产中,引起了业内的极大的关注。
6)总结
总体看来,谷歌在人工智能的布局依然符合它“将全世界的信息联系起来并给出最佳处理结果”的使命,在这一目标下,谷歌的行为可以大致分成两个路径,第一是覆盖更多的用户使用场景,从谷歌传统业务覆盖的互联网、移动互联网延伸到智能家居、自动驾驶、机器人等领域,从而抓取到更多信息,这可以看做是信息积累和输入的过程。第二个方面是不知疲倦的做好底层人工智能技术的积累,研发更加高级的深度学习算法,增强图形识别和语音识别能力,从而能对第一阶段收集到的信息进行更好的处理和反馈,这可以看做是信息的处理和用户服务的输出过程。在这两个过程下,谷歌就将人工智能渗透到了其各种产品的方方面面,从而为用户带来更多的使用场景和更加智能的功能。
2、百度
中国的搜索巨头百度公司与谷歌有些类似,都是以互联网搜索为基础,都是技术导向型公司,而且在人工智能领域的布局也是走在互联网行业的前列。在文章《搜索引擎到人工智能的终极演进》中提到了目前本身积累的用户和数据,再加上云服务、深度学习等技术,很有可能实的搜索引擎看以看作是未来人工智能的雏形,依托于搜索现从传统的互联网搜索服务向人工智能高级形态的进化。而百度的AndrewNg也在演讲中提到了人工智能的正循环——拥有深度学习算法之后,将不再惧怕海量数据,反而会因为数据的增长而取得更好的效果,而这些效果将直接体现在图像搜索、语音识别等具体的互联网服务中,从而为用户提供更好服务并吸引更多用户,这又会产生更多数据。因此,百度在人工智能领域的布局既表现出了其作为技术公司的敏感性和前瞻性,同时也可以看做是百度走向未来的必由之路。
1)引进AndrewNg及组建北美研究院
2014年5月,深度学习专家AndrewNg(吴恩达)加盟百度,并负责同期成立的北美研究中心。由于相对于传统互联业务,人工智能的技术门槛相对较高,而对于相关技术人才的引起也就显得尤为重要。在谷歌和Facebook相继聘用了GeoffreyHinton和YannLeCun之后,百度将另一位人工智能大师AndrewNg引入,这体现出百度与美国互联网巨头谷歌和Facebook在人工智能领域展开竞争的勇气和实力,而北美研究中心的建立也表明百度将继续与硅谷的互联网巨头争夺人工智能领域的人才。而AndrewNg与余凯、张潼、AdamCoates、徐伟等组成的顶尖团队将会成为百度发展人工智能坚强后盾。
2)大数据积累和平台开放
大数据是人工智能的基础,而作为天然的大数据企业,百度拥有强大的数据获取能力和数据挖掘能力,百度副总裁王劲更是将百度技术布局描绘为一张剑形图,人工智能、大数据等技术化作剑锋。百度除了做好数据积累和挖掘以外,还加快了大数据平台的开放步伐,于2014年4月发布了大数据引擎,向外界提供大数据存储、分析和挖掘技术,而且在医疗、交通和金融领域有了具体应用。
2014年7月14日,百度凭借自身的大数据技术14场世界杯比赛的结果预测中取得全中的成绩,击败了微软和高盛。2014年9月,百度正式发布整合了大数据、百度地图LBS的智慧商业平台,旨在更好在移动互联网时代为各行业提供大数据解决方案。
到2015年,借助积累已久的海量数据和技术能力,百度大数据+平台面向行业用户提供了六大行业解决方案、七大产品组件、三大智能模型。可以说百度的大数据+战略是规模体系极为完整的。
3)语音识别和图像识别
2014年12月,美国《福布斯》发布文章称,吴恩达及研究团队发明了一种新的语音识别方法,这款基于深度学习的名为“DeepSpeech”语音识别系统可以在嘈杂环境下实现将近81%的辨识准确率。卡耐基梅隆大学工程学助理研究教授IanLane对其的评价是“百度研究院最近的工作有可能颠覆语音识别在未来的应用效果。”吴恩达表示,该语音识别系统采用深度学习算法取代了原来的模型,在递归神经网络或者模拟神经元阵列中进行训练,让语音识别系统更加简单。同时这套系统还使用了Nvidia等芯片制造商出品的多枚图形处理器(GPU),这些处理器通过并行连接,能够用比普通计算机处理器更快的速度训练语音识别模型,从而提高工作效率。
在图像识别方面,余凯称摄像头成为连接人和世界信息的重要入口之一。而百度也一直在利用深度学习技术来提高图像识别的精度。2014年9月,百度云结合百度深度学习研究院提供的人脸识别及检索技术,推出云端图像识别功能。11月,百度发布了基于模拟神经网络的“智能读图”,可以使用类似人脑思维的方式去识别、搜索图片中的物体和其他内容。
4)人工智能算法和云计算
百度大脑既需要人工智能算法,也需要云计算中心提供硬件支持。百度大脑通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,构建了世界上最大规模的深度神经网络。
百度在国内拥有十几座云计算中心,为满足人工智能在计算和存储上的高要求,还投入使用了4万兆交换机,并在探索10万兆交换机。百度还是全球首家将GPU用于人工智能和深度学习领域、并规模化商用ARM服务器的公司。百度将这些整合在一起,就形成强大的存储计算能力,从而可以进行多样的并行计算,支持生成、配置针对不同应用和场景网络结构,从而为人工智能提供有力的硬件支持。
5)自动驾驶项目
2014年9,百度宣布已经与宝马正式签署合作协议,共同研发自动化驾驶技术。其中,百度的三维地图及相关数据服务也将被融入宝马的车辆导航系统中,为自动驾驶汽车提供技术支撑。双方计划在接下来三年时间内,合作研究高度自动化驾驶在中国道路环境下面临的技术挑战,通过智能技术加强道路行驶安全性,减少交通事故及人员伤亡。
6)总结
百度在人工智能领域的布局可以总结为三点,第一,具有战略眼光,与世界科技巨头保持同步;第二,自身技术基因又使其非常注重技术人才的引进和人工智能底层技术的积累;第三,互联网入口的地位和丰富的产品线使得人工智能技术能够迅速落地,转化成具体的产品和服务。也正因如此,2014年11月首届百度技术节才会以“奇点临近技术引领未来”为主题,展望如何通过人工智能来改变世界。
3、Facebook
Facebook在人工智能领域的布局主要围绕着其用户的社交关系和社交信息来展开,在2013年加入公司的深度学习鼻祖YannLeCun的帮助下,公司的图像识别技术和自然语言处理技术大幅提升。
YannLeCun是纽约大学终身教授,是卷积神经网络领域的重要推动者,而该技术的最主要应用就是图像识别的自然语言处理,这与Facebook的需求和已经积累的数据类型非常匹配。在YannLeCun的帮助下,2014年Facebook的DeepFace技术在同行评审报告中被高度肯定,其脸部识别率的准确度达到97%。而他领导的Facebook人工实验室研发的算法已经可以分析用户在Facebook的全部行为,从而为用户挑选出其感兴趣的内容。而不久后,那些算法还能够分析用户在状态帖子中输入的文本,进而自动提示相应的标签。他还表示,想在Facebook中建立一个智能助手,如果用户上传的照片中又令人尴尬的内容会进行识别和提醒。用LeCun的原话来说就是——Facebook人工智能实验室的职责就是给予用户更多的在线身份控制权,而不是削弱你的控制。
4、IBM
IBM目前看起来可能没有谷歌和Facebook这样酷,但其在人工智能领域有着丰富的底蕴,并在2014年采取了若干举措。主要是开放了Watson平台和发布了模拟人脑芯片SyNAPSE。
1)超级计算机沃森的开放战略
2014年1月初,IBM宣布组建“WatsonGroup”,旨在进一步开发、商用及增强“Watson”及其他认知技术,还将给其投入10亿美元资金用于研发和其他投资。现在,IBM宣称如今的Watson比2011年参加《危险边缘》“智能”了2400%,而且尺寸也已经从过去的卧室那么大缩减成三个披萨盒那么大。同时,IBM还推出了两项Watson数字顾问服务,一项用于帮助企业从海量数据获得洞见,另一项则旨在使得数据可视化。Gartner预计在2015年之前,将会形成一个由Watson衍生出来的巨大的智能顾问市场;而法国农业信贷银行预测那些系统创造的收入将在2018年占到IBM总收入的12%以上。
2014年3月,已经在医疗和金融行业都有所应用的Watson又开始与纽约基因中心(NewYorkGenomeCenter,NYGC)的合作。8月,IBM声称Watson即将被用于科学研究,目前,测试科学假设和理论常常需要花费几天甚至几个月时间。不过,借助沃森的“DiscoveryAdvisor”项目,这样的工作可以更快地完成。
2014年5月,IBM通过WatsonGroup收购了人工智能创业公司Cognea,该公司开发了一个认知计算和对话式人工智能平台,为用户提供个性化虚拟助手服务。IBM对于Cognea的定位是能够理解用户的个性化需求,将互动提升至一个新的水平。
本年,Watson也被部署在IBM去年收购的云计算基础设施业务Softlayer上,成为IBM与亚马逊、谷歌、和微软、等大型科技公司在云计算领域展开竞争的武器。
2)人脑模拟芯片SyNAPSE发布
2014年8月,IBM再度发布能模拟人类大脑的SyNAPSE(SystemsofNeuromorphicAdaptivePlasticScalableElectronics,即“自适应塑料可伸缩电子神经形态系统”)芯片,相比前一代原型,新的芯片已达到量产要求,并且拥有100万个“神经元”内核、2.56亿个“突触”内核以及4096个“神经突触”内核,而功率则仅有70毫瓦,该芯片能够模仿人脑的运作模式,更擅长进行模式识别,而且低功耗,在认知计算方面要远远穿过传统计算架构。
3)总结
IBM在人工智能领域的布局还是在围绕着Watson和SyNAPSE做文章,这代表着他们在人工智能领域长时间技术积累,同时IBM也在越来越开放,希望能像其他科技巨头一样,建立一个真正的开放性的技术平台,真正组建一个生态系统,因为人工智能领域的技术门槛相对较高,所以在这个时代来临时,或许会成为IBM逆转的好时机。
5、微软
面对谷歌和IBM在人工智能市场的布局,微软的在人工智能市场动作缓慢一直倍受市场诟病。但从2014年开始,微软通过推出智能机器人小冰、语音助手Cortana以及增强现实头显HoloLens,已经初步显现出其强大的雄心和实力。
2014年5月,微软小冰诞生在中国,背后团队是微软(亚洲)互联网工程院小冰项目组。小冰诞生时面临的首个难题是:跟随传统做个人助理机器人,还是另辟蹊径做看似不“实用”的聊天机器人?项目负责人李笛和其他三位STC工程师决定让她主打“情感计算”,试图与人类建立强烈的情感纽带。小冰与真人的平均对话(CPS)已经达到了23个回合,这就让她能够进一步优化原有的数据库。除了文字、语音聊天,现在的小冰还可以看“图”说话。
此后,2014年7月,微软在北京召开WindowsPhone8.1Update中国区发布会,正式发布Cortana中文版,并将其命名为“微软小娜”。小娜和小冰的区别在于小娜能提供智能语音服务。而在发布了微软学术搜索之后,小冰、小娜还将能跟你聊学术。尽管微软小冰推出之初因为种种问题而广受诟病,但围绕微软小冰的改进工作一直在进行中。
在今年的开发者大会上,微软CEO萨提亚纳德拉正式宣布了“对话即平台”战略。很显然,在“对话即平台”的新战略中,小娜和微软小冰处在核心位置。
6、阿里巴巴
阿里巴巴集团CTO张建锋曾表示,不论是人工智能还是其他前沿技术,都离不开高质量的数据、强大的计算平台和高效的算法平台,只有把这三项结合在一起,才能真正取得突破。目前,阿里巴巴已经基本具备了三个要素基础。
2015年8月,阿里云宣布推出国内首个人工智能平台“DTPAI”。开发者可通过简单拖拽的方式完成对海量数据的分析挖掘,以及对用户行为、行业走势等的预测。平台集成阿里巴巴核心算法库,包括特征工程、大规模机器学习、深度学习等。“DTPAI”运行在阿里云之上,开发者可按使用情况弹性付费,可支撑百亿级的预测吞吐量。同时,阿里巴巴核心算法库即开即用,未来还将集聚更多优秀数据科学家为应用开发者提供算法服务。
在语音识别交互和情感分析领域,阿里巴巴也加强了布局。2016年8月9日,阿里云在云栖大会北京峰会上正式推出人工智能ET。这款由阿里智能聊天软件小AI演变而来,有点类似于微软的小冰和小娜,ET的优势并非仅仅是陪人说学逗唱,更多体现在全局洞察和实时决策上。ET基于阿里云强大的计算能力,正在多个领域不断进化,目前已具备智能语音交互、图像/视频识别、交通预测、情感分析等技能。
7、腾讯
1)从Dreamwriter到微宝机器人,软件到硬件的跨越
2015年9月,在百度度秘、阿里机器人客服上线之际,一则名为《8月CPI同比上涨2%创12个月新高》的消息却抢先占据了话题榜。它的作者,正是腾讯财经研发的自动化新闻写作机器人Dreamwriter。不过,与其称它是机器人,不如称其为一种智能算法。基于数据抓取,Dreamwriter每天可生成上百篇财经类稿件,并第一时间输出研判,1分钟内将资讯传达给读者。Dreamwriter之后,腾讯开始试水硬件领域,推出了智能球型机器人微宝。
微宝由智能玩具研发商Orbotix打造的Sphero2.0“进化”而来,它采用一体化设计和密封技术,由两个半球组合而成。半透明聚碳酸酯塑料的外壳,打造出光滑且坚固耐磨的表面。微宝的身体里,配置了工业级的发光元件,可设置上万种LED色彩。腾讯还为它重新定制了卡通图案及拟人化眼睛,让它更符合本土化审美。而微宝所做的,则是将虚拟游戏搬到现实世界,或把现实游戏还原到虚拟场景。这是一次智能硬件与AI的结合,也是第一次通过实体智能娱乐设备与游戏APP的连结而实现的人机交互。
2)腾讯云宣布将旗下顶级的图片处理技术
2015在9月,腾讯云宣布将旗下顶级的图片处理技术——优图开放给业界,通过“优图人脸识别”和“万象优图”两个产品,移动开发者可拥有世界一流的图片处理能力。作为腾讯内部专注于图像处理、模式识别、机器学习及数据挖掘等领域的核心技术队伍,优图团队自2012年起,就逐步积累了人脸检测、五官配准、特征提取比对及活体检测等世界顶级的人脸技术。结合语音、唇语及面部表情,“优图人脸识别”可对照片、视频及人头模型等攻击进行立体化防范。
3)腾讯智能计算与搜索实验室
腾讯智能计算与搜索实验室成立于2015年,专注于搜索技术、自然语言处理、数据挖掘和人工智能四大研究领域。作为实验室对外开放的第一个产品,云搜可对公司内部各大垂直搜索业务进行高度抽象和整合,为用户提供可视化的数据定制服务。同时,它还具有联想词推荐、高级纠错、人工干预、按域检索、个性化分词等附件组建功能。而另一产品文智中文语义平台,则拥有强大的中文语义分析功能。基于它提供的API,用户可进行搜索、推荐、舆情、挖掘等语义分析应用,也能定制具有产品特色的语义分析解决方案。
8、苹果
全球市值最高的公司苹果,一直被认为在人工智能领域严重落后,除了语音助手Siri,似乎没有更多作为。但真实情况或许与外界猜测的完全不同。因为苹果对技术如此熟练又如此低调。直到最近苹果在AI领域加大了招聘力度,做出了一些高调的收购,人们才意识到苹果正在积极布局,但苹果对此一直守口如瓶,很多AI行家也不能完全明白它在人工智能领域的战略意图。
汽车应用与自动驾驶
对于苹果设计制造自动驾驶汽车的传言已经由来已久(甚至已经有了iCar的说法),但苹果对此从来没有正面做出过评论。现在谷歌、Uber和百度等互联网公司以及特斯拉外加一众传统汽车制造商正纷纷向自动驾驶领域进军,而苹果的汽车计划一直处于秘而不宣的状态。
去年12月,福特汽车和苹果公司宣布一项新合作。福特2011年后出产的搭载SYNC功能的汽车都可以升级到苹果的CarPlay,这也意味着你可以用Siri来给你的爱车发命令。
据报道,这次合作将使得苹果的Siri安装到福特的500多万汽车上。另据了解,那时候苹果公司就已和超过30多家汽车厂商达成了合作,进一步推广CarPlay。而虽然苹果从未口头上承认过自动驾驶研发计划的存在,但苹果在相关领域的招人挖角上一直动作频频。
据《华尔街日报》去年援引多名消息人士的话报道,苹果首席执行官TimCook大约2年多以前批准了汽车研发项目,并指定分管产品设计的副总裁SteveZadesky领导研发,授权他组建一个最多1000人的研发团队,在距离苹果公司总部数公里的一个基地工作,主要研究方向是机器人技术以及和汽车制造相关的金属和材料分析等。
苹果今年初还聘请了原黑莓旗下QNX汽车软件业务部门的CEODanDodge加入苹果汽车业务团队,Dodge将和苹果汽车计划(ProjectTitan)负责人BobMansfield一起发展自动驾驶汽车技术。
据传言称,苹果公司的目标是2020年左右发布一款苹果汽车。但是该计划可能受到一些高层的离职、技术推迟以及公司政策方向的变化等因素影响。
教育与医疗健康
由于在教育市场面临谷歌母公司Alphabet施加的竞争压力,苹果开始全面发力教育市场,甚至为美国上百所学校免费提供iPad,还派驻专员帮助他们解决各种问题,甚至连高管都亲自出面一对一帮扶各所学校。
苹果的这些付出并不是没有回报的。随着其所积累的用户数据越来越多与在线教育的兴起,苹果有望通过这些历史所积累的数据发展自己的个性化教育方案,从而占据学生群体这一未来增长的动力源泉。
而医疗的智能化也是科技巨头们看上的一块未来「大蛋糕」,谷歌、IBM、微软和苹果等都已入场。2014年WWDC上,苹果推出了全新的健康平台Healthkit。凭借苹果公司遍布全球的数亿iPhone用户,苹果可以获得来自手机/手表传感器和大量第三方配件的健康数据,这也构成了苹果在医疗健康领域内野心的数据基础。
今年五月份,苹果还聘请了Nest前首席技术官YokyMatsuoka加入该公司的健康产品团队。YokyMatsuoka的来头可谓不小,她曾是GoogleX实验室的共同创办人,后来又于2010年加入智能家居公司Nest担任技术负责人。
音乐与多场景
早年凭借着iTunes和iPod等应用和设备,苹果就已经在音乐市场占据了不可忽视的一席之地。而拥有数亿用户的iOS平台上的AppleMusic的发布(尽管苹果也推出了AppleMusic的安卓版本,但安卓用户对此兴趣不大)更是帮助苹果几乎瞬间就成长了音乐市场的庞然大物。
为了和Pandora与Spotify等音乐服务提供商竞争,靠手机预装当然是不够的。为了为用户提供个性化的服务,帮助用户找到他们所喜欢的音乐。据了解,和Pandora等较小的公司所采用的纯算法的推荐方式不同,苹果采用了半人工操作的解决方案。
正如谷歌在原始地图里面添加元数据(比如街道名称、单行线/双行线、公司名称等等)一样,苹果也在音乐播放列表里面手工添加音乐的元数据信息。之后,苹果公司会针对一个用户筛选出他们喜欢的数据,然后推荐10个、20个或是30个音乐播放列表。
语音、语义识别
Siri无疑是苹果最为重要的语音产品,2010年以2亿美金的价格购入无疑是一笔非常划算的买卖,之后苹果在语音识别和NLP方向的收购举措均基于Siri而展开。
2014年4月,苹果收购的Novauris是一家自动化语音识别技术公司,Novauris是由Nuance旗下的DragonSystems创始人创办,而Nuance曾是Siri的基础语音技术提供商。他们的核心产品是基于服务器的可扩展语音识别系统NovaSystem,特点是能够同时处理多个语音访问请求。虽然苹果拒绝透露如何使用Novauris团队,但从Siri和Nuance的合作关系来看,苹果此项收购意在摆脱对Nuance的依赖,利用Novauris团队开发自己的语音技术。
一直以来,Siri只能识别最基本的指令,无法做出匹配度较高的回答,这导致它成为一款娱乐属性的娱乐产品。2015年10月,苹果通过收购VocalIQ予以解决此项问题。VocalIQ能够利用深度学习来理解语言的环境,从而使得人机对话变得更加自然。开发者在Siri中嵌入VocalIQ的人工智能技术后,利用这个平台来储存和学习用户的交流信息,实现准确识别用户的指令并提供更加智能的对话。
除此之外,苹果的触角也已经伸入了虚拟/增强现实(已经收购了多家相关的公司)、物联网等领域,但相关领域还没有什么成型的产品(甚至传言都很少),此处便不再过多涉及了。
9、英特尔
深度学习对计算力资源的需求到底有多高,其实谁也不知道,这就像个「计算黑洞」,也使得异构加速技术在过去几年成为该领域应用广泛的技术,作为计算芯片领域最大的厂商,英特尔需要做的事情是构建具备高性能机器学习和人工智能的下一代处理器架构。
1)围绕机器学习,从算法和硬件上寻求突破
2015年12月,英特尔完成了对可编程逻辑器件厂商Altera的收购。这是英特尔公司历史上规模最大的一笔收购,这也让英特尔成为第二大可编程逻辑器件厂商,并且将Altera的FPGA纳入到英特尔的产品线中。所谓FPGA(Field-ProgrammableGateArray,现场可编程门阵列),是一种介于专用芯片和通用芯片之间,具有一定的可编程性,可同时进行数据并行和任务并行计算,在处理特定应用时有更加明显的效率。
众所周知,英特尔在业界的影响力建立在PC、服务器的CPU基础之上,但在PC销量持续下滑的残酷面前,英特尔的收入和利润都将受到很大影响。在服务器层面,包括Facebook、Google在内的主要客户,其对大型网络服务计算的需求不断增长。传统意义上,英特尔会在每块硅片上集成更多晶体管,不过随着摩尔定律失效,这种方法也越来越难以满足客户需求。FPGA则有望给英特尔带来新的业务增长点,那就是机器学习。
将Altera的FPGAs和英特尔处理器结合在一起的「一个很激动人心的领域就是机器学习,它是影像识别、目标探测、发现大数据规律的关键要素。」具体来说,英特尔会把FPGAs和英特尔处理器封装到一颗芯片里,当用FPGAs来运算一些机器学习的任务时,就像CNN影像识别算法,这些算法能大大提高它的性能。根据英特尔并购副总裁文德尔布鲁克斯2015年接受采访时的说法,相对于传统的处理器和FPGA独立组建,新的一体化芯片最初将带来30%至50%的性能提升,而最终的性能提升将达到2到3倍。
在软件尤其是算法层面,英特尔想做的则是通过2015年发布的数据分析加速库DAAL来帮助第三方开发者更好地在英特尔的底层硬件上进行机器学习模型的搭建和训练。与此同时到2017年,英特尔会在另一个名叫「数学核心函数库」的产品中发布神经网络API,上述资源会让开发者直接调取,极大地降低了开发者入门机器学习的门槛。
总体上说,英特尔的确在为机器学习,尤其是深度学习做了很多布局,但也真如深度学习还处在早期发展阶段一样,英特尔的各个产品(硬件、软件/算法)也并不成熟,但在另一个层面来看英特尔对于人工智能发展的思考,则别具深意。
2)把感知能力赋予机器人
所谓实感技术,就是一整套软硬件解决方案,硬件层面由色彩传感器、红外传感器、红外激光发射器和实感图像处理芯片等部件组成了3D摄像头。软件方面,这个摄像头可以捕捉物体的色彩、计算物体深度和运动轨迹,并且还支持3D建模、实时渲染等。简而言之,就是通过摄像头把感知能力和理解能力赋予新一代的计算设备。
首先,将实感技术武装到机器人身上。机器人自然需要「眼睛」感知世界,不过过去缺乏一种让机器人「看见」周遭世界的方法。因此,英特尔希望通过实感技术机器人开发工具包,让机器人拥有一双「眼睛」。这个工具包集成机器人开发主板和R200相机,这是一个交钥匙方案(所谓「交钥匙」,是承包公司为客户方建造工厂或其他工程项目,一旦设计与建造工程完成,包括设备安装、试车及初步操作顺利运转后,即将该工厂或项目所有权和管理权的「钥匙」依合同完整地「交」给对方,由对方开始经营。英特尔已经在多个领域启动「交钥匙」方案)。
其次,推出英特尔实感技术SDK,提供了更多API,包括姿态识别、人脸跟踪、3D扫描、场景感知,还有SLAM,并且真正实现了跨平台操作,为纵深相机提供开源的驱动程序,支持Linux、Android、OSX和Winows。这些跨平台的API也为机器人操作系统ROS提供了交互界面,对于未来机器人的开发有重要意义。
第三,把实感技术放入无人机平台(AeroDroneBoard)。这块主板的中间有个100针的接口,可以通过上面的FPGA对它进行再编程、再优化。而主板的外围设备支持包括SSD存储、LTE通讯网络、RealSense视觉。它运转YoctoLinux软件,可以和大量商用的飞行控制器连接。
总结
以硬件擅长的英特尔选择提供计算能力和感知能力,这既是对原有业务的延续和补充(毕竟,芯片还是该公司的支撑业务之一),也是英特尔最熟悉的商业模式——打造生态系统,与平台上各个链条的合作伙伴共同推动产业发展。从新一代计算芯片到新一代视觉感知,英特尔为人工智能布下的这两个棋子,未来将带来多大的产业影响力,我们不妨拭目以待。
10、Salesforce
对于Salesforce来说,机器学习也变得越来越重要,原因很明显,Salesforce对手中掌握的数据越来越重视,也希望尽量利用起手中的数据。早在收购MetaMind之前,Salesforce就已经展开了一系列收购和挖人行动。
收购MetaMind,瞄准动态记忆网络
2016年4月4日,MetaMind的CEORichardSocher在博客上发布一条重磅消息:公司被Salesforce收购。公司将于5月4日停止服务,但并未透露具体收购细节。「Salesforce计划将MetaMind技术整合进公司服务,」「对未付费网页用户,MetaMind产品会于5月4日停止服务。付费服务将于6月4日停止。4月11日后,我们开始删除上述用户业已储存在公司的所有数据。」
在此不久前,MetaMind发表了一份论文,提出了动态记忆网络。这篇论文中表示,其研究人员在软件对于QA;的能力上有了进一步的突破,问题包括文字文档和数字图片的相关内容。在这篇近期的论文中,MetaMind的研究者提出了公司的新方法,也就是动态记忆网络,该方法能够同时处理输入的声音、图像和文本。MetaMind软件的设计证明了神经网络软件正在变得越发复杂,他们的系统既可以记住语句的序列,又能聚焦于图片的各个部分。
MetaMind正在将他们的技术应用于商业领域,包括自动化的客户服务。此外,保险公司还向MetaMind咨询过,他们的技术是否能够附上照片(比如说那些遭到破坏的汽车和其他财产)回复邮件。Salesforce的平台和业务正好为这些新技术的应用与拓展,提供了舞台。
2014年7月,Salesforce花3.92亿收购RelateIQ。这家创业公司可以从日历,邮件收件箱以及电话记录和更新记录中获取有关销售人员如何与领导及现有客户共事的信息,将原本需要耗费人力的处理过程自动化。
Salesforce也建立起自己的数据科学团队,主要成员来自LinkedIn。这些数据科学家们可以根据公司提供的数据,分析产品使用情况,研发新产品和功能。
2015年,收购并关闭了智能日历应用TempoAI。在此之前,微软收购了日历应用Sunrise,谷歌收购了Timeful。
2016年2月,Salesforce收购了机器学习创业公司PredictionIO。PredictionIO成立于2013年,位于加州PaloAlto,2014年,募集了250万,公司拥有通用(general-purpose)开源机器学习软件,旨在扩展和简化机器学习技术的研发工作,拥有超过8000名研发人员的社区,客户包括Dropbox。这家公司和H20.ai一样,致力于开发出新型的面向更广泛市场需求的机器学习或深度学习架构,或将新的工具和技术打包到市场上原有的成熟产品中,并最终提供给终端客户。
产品创新数字化最权威的微媒体
设置首页-搜狗输入法-支付中心-搜狐招聘-广告服务-客服中心-联系方式-保护隐私权-AboutSOHU-公司介绍-网站地图-全部新闻-全部博文
搜狐不良信息举报邮箱:
推荐: