第四范式亮相世界人工智能大会，发布自动化AI应用构建平台_中关村网-直击中关村创业大小事|中关村创业大街新闻网|老牌IT科技网站

第四范式亮相世界人工智能大会，发布自动化AI应用构建平台

2018-09-18 来源: 中关村网作者：lisa 次阅读

近年来，随着AI技术的不断成熟，企业纷纷往AI转型，逐步实现业务智能化，且从长远利益来看，企业更为偏向于自建AI应用。与语音、图像等感知类技术不同，企业若想在市场营销、供应链管理、风险控制、服务运营等高价值决策类场景下应用AI，则面临更大挑战。因此，如何降低企业构建AI应用的门槛与成本，实现企业智能化决策是现阶段亟需解决的问题。

9月17日， 2018世界人工智能大会在沪盛大开幕。作为AI领域的领军企业，第四范式发布了重磅产品——AI Prophet AutoML（自动机器学习）。该产品是一款低门槛、自动化的AI应用构建平台，基于“学习圈”理论构建机器学习闭环，助力企业低门槛规模化拥有自主可控的AI能力，帮助企业在营销整合、风险控制、客户体验、资源分配等多个高价值高难度决策类场景，做出更好的判断与决策。

学习圈理论打破企业自建AI困局迈向人工智能2（平方）时代

目前，企业AI应用主要分为感知类与决策类两个方向。在感知类问题中，AI化身为企业的眼睛和耳朵，从一定程度上，提高了企业的业务效率。而在决策类场景中，则需要AI变为业务中枢，帮助企业做出更加明智的决策，进一步帮助企业“降本增效”。

在实现智能化的道路上，企业经历了三个阶段。第一阶段为人工阶段，主要依靠业务专家的经验，提炼规律撰写专家规则，做出自动的判断，但因人类写出的规则维度较低，可以应对头部情况，而无法应对长尾情况。第二阶段为人工智能阶段，AI专家利用场景数据进行人工建模，用AI提炼规则作出决策。相较于专家规则，AI模型维度与效果均大幅提升。然而，企业想要真正拥有AI，又面临认知、数据、人才、工具、技术等多个门槛，阻碍了AI在企业中的落地。以人才为例，拥有AI专业背景知识与研究经验的人才年薪动则几百万，且非常稀缺，而培养一个合格的AI人才也需要6-10年的时间。

因此，若想推动AI的普及，降低企业应用门槛是重中之重。AutoML技术应运而生，企业智能化也迈向第三阶段——人工智能2时代，利用AI技术自动生成AI应用。其核心在于将企业的数据自动变为模型，大幅降低了AI应用门槛，使业务专家升级为AI应用者，解决AI人才短缺且无法规模化应用的问题。同时，基于自动特征工程，使模型维度较以往进一步提升，也有望实现更优的效果。目前，Google、微软、百度等巨头纷纷在该领域发力。

在第四范式看来，让机器产生智能与人思考学习的过程类似。此前，在人类心理学研究史上，有一个著名的“库伯学习圈”理论，该理论认为人类学习的过程是由“行动、经验、反思、理论”这四个阶段构成。简单来说，人们通过行动产生经验，再通过反思经验，学习、总结其中的规律，在新的行为发生时可找到最优决策。对应到AI上，“行动”是过程数据，”””“反馈”是反馈数据，“反思”是基于算法与计算资源基础之上的模型训练，最终形成的“经验”即模型应用。

此次发布的AI Prophet AutoML便是基于“库伯学习圈”理论所打造，将第四范式AI核心方法论以产品化的形式输出到企业中，大幅降低了企业应用AI的门槛，从而推动企业低成本、高效率的向AI靠拢。目前，第四范式的AutoML产品已经应用于金融、科研、医疗、互联网等多个行业，在营销、推荐、风控、广告、疾病预测等多个场景有优异表现。

全流程、全自动、低门槛产品助推企业实现智能化

众所周知，机器学习已在推荐系统、在线广告、金融市场分析等诸多领域取得了成功，但是在几乎所有的案例中，人类专家参与了机器学习的所有阶段。然而，这些任务的复杂性往往超出了非机器学习专家的能力范围。

AI Prophet AutoML的出现打破了这一困局，它通过简洁、易理解、易操作的方式覆盖了从模型调研到应用的机器学习全流程，打通了机器学习闭环，其中包括：收集数据、特征工程、调整模型超参数，评估模型性能、模型应用等环节。用户只需“收集行为数据、收集反馈数据、模型训练、模型应用”4步，无需深入理解算法原理和技术细节，即可实现全流程、端到端的AI平台构建。

保证全流程的同时，AI Prophet AutoML还将低门槛、自动化技术发挥到了极致。首先，AI Prophet AutoML支持行为数据与反馈数据的自动拼接，为后续的模型自动更新做好数据准备。在机器学习最具门槛的特征工程、算法选择、调参等环节，AI Prophet AutoML基于自主研发的AutoML技术，可自动分析数据，完成基本特征构造，再利用自动特征组合，提升模型效果，同时利用多算法自动完成调参、模型对比。在模型训练方面，AI Prophet AutoML可将前期探索出的最佳训练方案，一键上线模型自学习，同时周期性利用新数据进行模型自动更新，不断提升模型在实际应用中的效果。

除了流程上的简化，AI Prophet AutoML还针对企业应用进行了设计与优化。首先，该产品提供了数据、模型管理功能。以模型管理为例，在模型工厂中，可查看模型训练方案、正在运行的训练任务及运行次数、已训练完成的模型评估报告等。其次，在模型应用中，提供了批量预估与在线预估两种方式，并自动将预估请求回流为行为数据，实现数据闭环。AI Prophet AutoML还提供了贴近业务的Dashboard，包括运维指标监控（预估需求量、资源监控）、业务指标监控（正样本率、线上AUC）、模型指标监控（模型AUC、模型PK）等。此外，通过深度优化，AI Prophet AutoML具备高可用、高稳定性等企业级特性，为企业中

规模化应用AI提供坚实保障。

与此前需要大量编码构建AI不同，AI Prophet AutoML提供了“傻瓜式”的交互界面，让企业免去编码定义建模的过程，将开发AI应用的周期从以半年为单位缩短至周级别。在降低门槛的同时，AI Prophet AutoML还展现出了超高的模型水准。经在十余组的测试数据、以及疾病预测、金融反欺诈、互联网推荐等几十个实际业务场景的数据验证中，AI Prophet AutoML做出了接近甚至超过顶级数据科学家的模型效果。

创新技术造就产品卓越性能

作为人工智能领域的佼佼者，第四范式从很早便开始关注并深耕AutoML领域。通过从解决客户业务核心增长的角度出发，构建了反欺诈、个性化推荐等业务场景下的AutoML，并将其赋能给企业的普通开发人员。目前，第四范式已经研发了自动特征组合（FeatureGo）、自动时序特征（TemporalGo）、自动深度稀疏网络DSN（Deep Sparse Network）等AutoML支撑技术。

其中，FeatureGo算法实现了机器自动组合特征的功能，有效解决了人为添加组合特征门槛高、耗时长等问题，并增加了模型的可解释性。在实现特征组合的过程中，线性分形分类器（LFC）算法通过将连续特征多层次离散化，使特征具备一定的非线性表达能力。在GBDT（一种常见的非线性模型）不能应用于大规模离散特征场景的前提下，将非线性的特征加入到线性模型中，从而加强了特征描述的能力。从实际效果上看，LFC能够更好的捕捉细粒度特征，并在预测效果和计算稳定性上显著优于LR（Logistic Regression）。与此前高阶特征中，无效特征居多导致模型效果不升反降相比，FeatureGo以LFC在内的多项关键技术为基础，可自动选择有效的组合特征，亦能够明显提升后续模型效果。经测试，FeatureGo的特征组合最多能达到十阶以上，而人工的特征组合一般只能到达5到6阶。

此外，DSN更是为AutoML提供了强有力的支持。与Google Cloud AutoML仅支持深度学习模型不同，DSN将“宽”和“深”做了更全面的融合，算法底层是上千亿大小的自适应宽度稀疏网络，上层是一个非典型的深层次网络，既可以记住更多信息，又能刻画所有特征（包括宏观特征和微观特征）之间更复杂的关系。在参数规模上，DSN支持的参数规模已达到十万亿级，这意味着随着数据量的增大，模型效果还将有更大的提升空间。

作为企业自建AI的利器，AI Prophet AutoML以先进的方法论及强大技术作为支撑，从根本上解决了企业AI应用落地难、挑战大的行业通病，在降低AI门槛的同时，大幅提升了AI的应用效率。未来，第四范式还将加大研发力度，全面扩充AI Prophet AutoML能力，进一步扩展AI的应用边界，普惠各行各业。