所有文档

          白皮书

          客户案例

          百度移动游戏

          百度移动游戏仅投入低资金和短时间,便通过百度智能云大数据方案在T级别日志文件分析中为数亿用户实现了个性化推荐功能,在低资金成本、短时间的前提下,实现了个性化推荐功能,提升用户体验、提高游戏的点击转化率,为企业显著提高营业收入。

          业务场景

          百度移动游戏是手机游戏娱乐平台,提供“搜索引擎+应用商店+媒体社区”多核驱动的游戏发行服务。百度移动游戏依托百度搜索及手机百度,通过PC端和移动端入口为游戏分发导量。通过与国内外数千家移动游戏研发商、发行商的合作,承载从单机到网游,从动作、休闲到策略、卡牌等全类型移动游戏的运营与推广,为用户提供精彩的掌中娱乐服务。百度移动游戏用户覆盖份额在2014年Q4达42.48%,已连续四个季度位居中国安卓渠道第一,成为中国最大的移动游戏平台,为手游分发带来直接的巨大的分发价值。

          百度移动游戏面对数亿用户,每天接受数亿次请求,产生T级别日志文件。如何充分挖掘这些数据的价值,为用户推荐心仪的游戏,提升用户体验,从而提升变现能力,已成为燃眉之急。

          解决方案

          初始方案是购买多台服务器搭建计算集群以处理海量数据、招聘机器学习人才开发算法和优化模型、招聘运维人员维护集群。但这个解决方案存在很大的问题:

          • 购买服务器需要一个周期,不但需要花费大量资金,而且无法适应增长迅速的业务。
          • 招聘员工维护计算集群,成本是相当高的,要维护24乘7的可用性更是难上加难。
          • 招聘人才、新员工熟悉环境到开发算法、优化模型、模型上线需要耗费非常长的时间,不能解决燃眉之急。百度移动游戏最终选择了百度智能云的大数据解决方案:使用百度MapReduce(BMR)来清理数据,以及百度机器学习(BML)来做推荐。

          最终,百度移动游戏选择了百度大数据分析解决方案,上述问题全部迎刃而解。

          首先,百度MapReduce在降低成本和机器运维能力均有显著优势:

          • 全托管的Hadoop以及Spark服务,提供全天候的运维。
          • 按需调整集群规模,适应弹性的计算需求。

          其次,百度机器学习具有强大的挖掘数据潜在价值的能力:

          • 全托管的计算平台,提供多种分布式并行算法,实现从模型训练、评估到在线预测一站式服务。
          • 依托海量搜索数据和优化的机器学习算法,为客户提供营销大数据,丰富客户原有数据,提升客户的优化效果。
          • 提供专家咨询,由经验丰富的一线研发人员组成专家咨询团队,快速响应客户提出的问题。

          百度外卖

          百度外卖平台应用BML做商户点击率的预估,根据预估点击率做主要排序因子,提升了模型训练效率,基于海量数据做到了模型的每天更新,上线后转化率相比原有排序有明显的提升。此外,BML基于分布式内存计算,应用大量的通信和计算优化技术,数百G的数据在一小时内完成百轮迭代。并通过数据和模型迭代优化,进一步持续提高转化率。

          业务场景

          百度外卖是由百度打造的专业外卖服务平台,覆盖众多优质外卖商家,提供方便快捷的网络外卖订餐服务。百度外卖于2014年5月20日正式推出,主打中高端白领市场,支持全国一二线城市。百度外卖具备得天独厚的定位优势和强大的搜索功能,品牌餐饮的批量入驻形成了独特的资源优势。截止2015年10月, 百度外卖开通城市100+个,全国接入商户10+万,用户数达1000+万,最高日订单100+万。

          百度外卖每天需要面对海量用户的点击浏览,如何在用户浏览页面上对接入的商户排序具有很大价值。更优的商户排序结果,对于合作商户,能够提供公正的上升通道,让优质商家能够得到更好收益;对于用户,能够更便捷的找到满足用户不同场景下的需求;对于百度外卖平台,能够促进良性生态发展。而传统的人工排序和规则排序等策略,存在负责人收取好处修改排名的风险,难以满足不同用户在不同场景下的需求。百度外卖亟需:

          • 让真正优质的商户排名更靠前
          • 满足不同用户在不同场景下的需求
          • 提升外卖平台的多样性和动销率

          要解决以上问题,需要依赖海量用户的真实浏览、点击、购买行为,预测用户的点击行为,让最有可能满足用户需求的商户获得更靠前的排序。

          解决方案

          由于每天会产生海量的商户展现数据和点击数据,百度外卖首先借助BMR这个全托管的Hadoop服务,定时进行数据筛选以及清理工作。百度MapReduce提供了以下特性:

          • 全托管的Hadoop以及Spark服务,提供全天候的运维。
          • 按需调整集群规模,适应弹性的计算需求

          关于商户排序,百度外卖曾经尝试使用单机版的机器学习算法来训练商户排序的模型,不过经过筛选和预处理后的样本数据量近300G,样本数上亿条,有意义的特征上十万,单机的算法无论时间消耗和内存消耗上,都无法满足模型训练需求,而为单机缩小数据量后模型预测结果不理想,对用户的点击率预估较差。

          在调研了百度机器学习BML和其他开源机器学习项目后,使百度外卖最终决定使用BML来进行模型训练以实现商户的自动化排序,因为BML能够带来以下的优势:

          • BML提供高效且丰富的分布式机器学习算法,能够满足海量数据上的模型训练,模型训练耗时短效率高,可以采用最新的数据进行模型日常例行更新。
          • BML的数据和模型可复用,并提供配套的评估预测流程,能够根据测试数据来评估机器学习模型的效果,可以方便的进行模型反复实验评估。
          • BML提供RESTful API调用,只需要发送HTTP请求便能完成整个模型训练监控和评估预测的过程,机器学习可以很方便地嵌入百度外卖平台自身的业务流程中。
          • BML还为百度外卖提供了非常给力的技术支持,不但帮助进行调研、REST API的接入,而且分享了多年积累的广告推荐、点击率预估等业务的深厚经验,在模型迭代调优和训练数据处理方面给出了很多有价值的优化建议,帮助最终的商户排序效果提升。

          CSDN学院

          CSDN是中国最大的IT社区和服务平台,为中国的软件开发者和IT从业者提供知识传播、职业发展、软件开发等全生命周期服务。CSDN学院是CSDN最新推出的一个面向软件开发者的IT技术职业培训平台,旨在提供优质的IT视频课程,创造更为方便、快捷的学习方式。经过对国内外多家云计算厂商多轮对比测试,百度智能云凭借着在稳定性、高效性、安全性等方面的优异表现,最终赢得了与CSDN的合作。 CSDN学院使用了百度智能云的对象存储BOS、音视频转码MCT和内容分发CDN产品,其平台架构图如上图所示。CSDN学院正在计划将更多的应用系统迁移到百度智能云平台上,同时依托百度智能云平台的丰富功能,开发更多的新服务。

          目前CSDN学院已在不足1年时间内达到了500,000学员,400余认证讲师,发展非常迅速;同时依托于百度智能云构建的培训系统非常稳定,为众多学院提供稳定、可靠、高效的在线教育平台,并且从多方面降低了成本。百度智能云降低成本体现在两个方面。

          上一篇
          百度智能云典型应用场景
          下一篇
          资质认证