(原标题:百度大脑开放日第三期发布四大AI开发新平台)
5月31日,第三期百度大脑开放日在深圳举行,在本期开放日中,百度大脑全新发布了四大平台、两大场景方案并升级了九个AI开放能力,邀请百度大脑的合作伙伴分享了有关AI技术助力安全的热点案例。
百度大脑此次在AI开发平台方面共发布了4个平台,分别为EasyDL定制视频分类平台、智能视频监控开发平台、一站式内容审核平台以及iOCR财会版。
其中,EasyDL再度更新,在之前图像分类、物体检测、声音分类、文本分类的基础上,又新增了定制视频分类功能,面向视频分析场景,通过标注每类50个、10s左右的短视频片段进行训练,从而实现 “需要连续图片帧组合判断”的视频内容分析。全流程可视化界面操作,只需4步,最快1个小时即可获取API服务;并且每个分类,只需50-100条视频片段,模型精度可达95%以上。EasyDL视频分类还即将推出一系列工具组件,支持端到端业务。据悉,截至目前,已有近1.5万企业客户在EasyDL上创建了超过3万个模型。
在视频监控领域,虽然百度大脑开放了一系列的模型和能力,但从AI模型到业务平台的开发成本依然很高,包括摄像头对接与管理、视频流的处理、前端业务系统、模型调用与业务逻辑处理等复杂的工作。针对此问题,百度大脑全新发布了智能视频监控开发平台,这是一个可以零开发成本快速搭建多路视频智能监控系统的平台,不仅预置了工业、教育、园区安防等9个场景经过实际项目验证的检测技能,同时还提供一套完整可用的客户端管理系统组件,实现了摄像头管理、人脸库配置功能,部署完成即可直接使用。
在内容审核领域,人工和常规的机器审核都面临较多问题。百度大脑全新推出的全面、实时、易用的内容审核平台,它可以支持图片、文本、语音等多种媒体内容,并内置广告检测、质量检测、暴恐识别等20多个维度的审核模型。同时,该平台有很高的灵活性,可以支持自定义黑白库、支持自由配置审核规则。同时平台预置了海量的图像/文本黑库,并紧跟热点实时更新,帮助平台提升内容质量。通过全方位审核能力、灵活的策略配置、实时的策略迭代,百度大脑内容审核平台可以一站式满足所有审核需求。
百度大脑还发布了iOCR财会版,该平台具备票据检测与智能裁剪、票据自动分类、多种预置票据识别模板、场景化高精度自定义模板能力等核心功能,其中平台内置7种报销用票据、四大行&招行的银行回单和对账单识别模版,预计可满足80%以上企业财税报销场景的票据识别需求。iOCR财会版可有效解决金融财税场景下的对OCR的特殊需求,大大提升金融财税场景票据结构化的效率和精度。据悉,iOCR是国内首个自定义模板文字识别平台,自2017年12月上线以来,目前已有将近2万个企业客户在iOCR平台上创建了近4万个识别模板,在多个行业场景中落地应用,助力企业办公实现自动化。
两项全新场景方案也首次亮相:呼叫中心语音场景方案和虚拟真人助理解决方案。其中,呼叫中心语音场景方案包括呼叫中心场景专属语音识别模型和语音合成专属音库;适配MRCP标准协议,与对话系统深入配合,灵活支持打断等需求;全双工流式交互,提供低延迟、高并发的企业级语音服务。而虚拟真人助理方案,可广泛应用于虚拟主播、智能客服、趣味互动视频等场景。
此外,大会还为开发者介绍了5月中旬全新发布的智能对话训练和服务平台UNIT3.0,通过9大核心特性的全面升级,UNIT3.0可大幅降低对话系统定制成本。
截至目前,百度大脑AI开放平台已开放178项AI技术,达到24小时快速集成,开发者规模持续快速增长并突破120万。百度大脑面向广泛的企业和开发者提供最先进、最全面的AI能力,不断降低着AI应用落地的门槛。
百度大脑开放日自2019年3月开始举办,每月一期。百度大脑开启的产品技术更新的月度定期交流活动,每月都带来一轮涉及数十项产品的更新升级。