AI开发基础知识
目录
AI概念及基本原理
人工智能(Artificial Intelligence,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能企图生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理等。
在EasyDL平台背后主要使用了深度学习的技术,深度学习是机器学习(ML, Machine Learning)领域中一个新的研究方向。通过学习样本数据的内在规律和表示层次,最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
AI模型训练的基本流程介绍
- 分析业务需求
在正式启动训练模型之前,需要有效分析和拆解业务需求,明确模型类型如何选择。这里我们可以举一些实际业务场景进行分析。
举例:原始业务需求—某企业希望为某个高端小区物业做一套智能监控系统,希望对多种现象智能监控并及时预警,包括保安是否在岗、小区是否有有异常噪音、小区内各个区域的垃圾桶是否已满等多个业务功能。 针对这个原始业务需求,我们可以分析出不同的监控对象所在的位置不同、监控的数据类型不同(有的针对图片进行识别、有的针对声音进行判断),需要多个模型综合应用。 监控保安是否在岗——通过图像分类模型进行判断 监控小区是否有异常噪音——定时收集声音片段通过声音分类模型进行判断 监控小区内各个区域垃圾桶是否已满——由于监控区域采集的画面可能会存在多个垃圾桶,此处需要通过物体检测模型进行判断。
- 采集/收集数据
在通过上述第一步分析出基本的模型类型,需要进行相应的数据收集工作。数据的主要原则为尽可能采集真实业务场景一致的数据,并覆盖可能有的各种情况
- 标注数据
采集数据后,可以通过EasyDL在线标注工具或线下其他标注工具对已有的数据进行标注。如上述保安是否在岗的图像分类模型,需要将监控视频抽帧后的图片按照【在岗】及【未在岗】两类进行整理;小区内各个区域垃圾桶是否已满,需要将监控视频抽帧后的图片标注其中每个垃圾桶的【空】【满】两种状态进行标注。
-
训练模型
训练模型阶段可以将已有标注好的数据基于已经确定的初步模型类型,选择算法进行训练。通过使用EasyDL平台,可以可视化在线操作训练任务的启停、训练任务的配置。可以大幅减少线下搭建训练环境、自主编写算法代码的相关成本。
- 评估模型效果
训练后的模型在正式集成之前,需要评估模型效果是否可用。在这个环节上EasyDL提供了详细的模型评估报告,以及在线可视化上传数据测试模型效果的功能。
- 部署模型
当确认模型效果可用后,可以将模型部署至生产环境中。传统的方式需要将训练出的模型文件加入工程化相关处理,通过使用EasyDL,可以便捷地将模型部署在公有云服务器或本地设备上,通过API或SDK集成应用,或直接购买软硬一体产品,有效应对各种业务场景所需,提供效果与性能兼具的服务。