(原标题:人工智能里程碑事件:谷歌率先实现视频内容识别)
在日前的一个云计算技术大会上,谷歌对外展示了一个新技术:可以识别视频中的物体和内容,这也是机器学习研究的重大新成果。
过去,诸多公司已经能够利用人工智能技术,对于图片文件中的人脸或物体进行识别,比如Facebook公司就推出了人脸识别,从而搜寻出含有自己面孔的好友照片,或是对手机拍摄的海量照片进行分类管理。
日前谷歌举行了云计算相关的一个大会,在大会上,谷歌负责人工智能和机器学习研究的负责人李飞飞女士,介绍了谷歌人工智能研究的新成果,以及可以供外部开发者利用的新接口等。
李飞飞在大会上展示了“视频智能API”。通过这一技术,谷歌能够识别视频当中的各种动物、物体、风景等内容。比如在一个演示中,谷歌很快识别出视频中出现了一条达克斯狗。
在另外一个视频搜索演示中,用户搜索“沙滩”,则谷歌列出了所有含有沙滩风景的视频内容。
从功能上,这些识别技术和过去的图像识别、人脸识别存在相似之处,不过谷歌已经把识别提升到了视频的新领域。
据报道,视频识别依然是一个新技术。目前许多互联网公司无法识别视频内容,要求用户在上传时提供诸多的标签,从而利用标签作为搜索依据。未来,和图片文件的标签一样,视频的标签将成为一种落后技术。
李飞飞表示,通过视频识别技术,“我们将开始给数字星空中一个黑暗的物质照亮光芒。”
过去,谷歌已经把许多机器学习的技术及时变成了软件开发接口,让开发者应用到自己的软件产品中。据悉,谷歌也正在把上述的视频内容识别变成接口,对外开放。
视频识别将具有重大的应用场景,比如在安全、打击恐怖主义等领域,政府或者警方可以对视频画面进行实时的监控和分析,快速抓捕恐怖分子。
另外,宽带的发展已经让互联网进入了网络视频时代,短视频、视频直播等新应用不断出现,但是与此同时,视频搜索的长期落后,成为行业的一个短板。不少消费者已经发现,在一些搜索引擎的视频搜索服务中,出现了准确率太低的现象,主要原因是搜索企业对于视频内容完全无法识别,他们只能根据视频周边的文字内容、视频标题等附加信息进行搜索,这导致差错率大大提高,也影响了用户发现更多精彩的视频内容。
值得一提的是,在人工智能、机器学习和图像识别方面,谷歌和Facebook展开了一场军备竞赛。在去年的一次开发大会上,Facebook相关团队负责人也曾经表示,Facebook已经具备了成熟的图像识别技术,目前正在进行视频识别的研究,希望能够尽早识别出视频中的人脸,方便搜索好友之间发送的大量视频。
在中国方面,人工智能的进程也在加速,今年两会的政府工作报告明确提出,加快培育壮大新兴产业,全面实施战略性新兴产业发展规划,加快新材料、人工智能、集成电路、生物制药、第五代移动通信等技术研发和转化,做大做强产业集群。
这是“人工智能”首次被写入政府工作报告。这表明国家对新兴产业的重视,将人工智能提高到促进经济发展的新高度,而资本市场的表现则反映了投资人对人工智能的看好。
另外,在2月3日,《纽约时报》发表了一篇名为《China Gains on the U.S in the Artificial Intelligence Arms Race》的文章,该标题可以翻译为“中国在人工智能的军备竞赛上正在赶超美国”,文中对中美科技公司以及政府政策等诸多环境进行了对比,其中各项数据指标显示,中国的人工智能实力正在一定程度上超过美国。根据此前美国白宫发布的报告显示,从2014年开始,在深度学习领域(目前人工智能的主要进展),论文发表数量和被引用的次数两个标准上,中国均已超过美国。高盛在2016年12月发布的一份有关人工智能的报告中也提及“人工智能的前沿重要参与者可能会继续来自于美国和中国”。
1.深度学习的反超
深度学习从各国每年发表的“深度学习”及“深度神经网络”相关主题论文数量,中国在最近五年内的学术论文呈现出绝对赶超之势,而在2014年第一次超越了美国,进入到领先位置。此外,2014年谷歌首席科学家、深度学习领域顶级专家吴恩达加入到百度,也从侧面说明了中国人工智能发展的潜力。而2017年前微软全球执行副总裁陆奇也宣布加入百度,同样也是看到了中国人工智能的巨大机会。2016年微软声称其开发的某套软件,语义理解已经达到人类水平,而来自百度硅谷实验室的AI专家表示,他们在两年前就完成了具有同样技术水平的中文软件。
2.语音技术率先普及
在去年2016年的百度Deep Speech2深度语音识别技术,被《麻省理工评论》列为十大突破性技术之一,与生物技术、航天技术、纳米技术并列,也是唯一一家入选的中国公司。在去年的百度语音开放平台三周年上,百度加大了在语音开放的力度,向开发者开放了情感合成、远场方案、唤醒二期技术和长语音方案技术。
除了百度和科大讯飞之外,国内还有云之声、出门问问、搜狗语音、思必驰等诸多公司群雄逐鹿,竞争猛烈程度远超美国,也正说明了中国有着更大的市场需求,激烈竞争之下也必将催生出更一流的语音技术。
再反观美国,语音技术的竞争远远不如国内激烈,在开放平台方面只有微软与Nuance比较积极以外,其他巨头都有些意兴阑珊,例如谷歌直到去年的云计算大会上,才向第三方开发者提供了语音开放API,而IBM viaVoice虽然在2003年就入场,但是目前则早已退出。
3.政策吸引力更大
2017年特朗普正式当选美国总统,也为各行业带来了巨大的不确定性,而对科技界的影响也尤为巨大,早先特朗普就一直要求苹果公司将工厂搬回国内,另一方面也在加强人口的流动限制。此前颁布的“穆斯林禁令”要求90天内停止向指定7国发放签证,这引发整个科技圈的集体不满。对于其他科技企业来说,该种举措也会影响到其人才引进,而日后如果继续加强该政策,那么还会影响人才稳定。
但反观国内,政府与科技公司的关系向来较好,科技公司经常协助政府完成各种政务工作,例如微博问政、微信问政,大数据交通规划等等,在一定程度上不断减轻政府工作负担,因此“互联网+”的鼓励政策也会应运而生。
同时我国也更为欢迎技术人才的引进,近几年很多硅谷技术人才,尤其是华人工程师们,都开始纷纷来到机会更大的国内发展,吴恩达、陆奇这两位华人人工智能领域的领军人物加盟百度,则有着标志性意义,未来阶段更多人工智能领域顶级华人回归国内,也是大概率事件。
相关新闻: