【学界】史上最实在的综述:数据驱动的进化优化

【学界】史上最实在的综述:数据驱动的进化优化

文章作者:王晗丁
责任编辑: @文雨之
文章发表于微信公众号【运筹OR帷幄】:【学界】史上最实在的综述:数据驱动的进化优化
欢迎原链接转发,转载请私信 @留德华叫兽 获取信息,盗版必究。
敬请关注和扩散本专栏及同名公众号,会邀请全球知名学者发布运筹学、人工智能中优化理论等相关干货、知乎Live及行业动态:『运筹OR帷幄』大数据人工智能时代的运筹学

今天要特别介绍一篇数据驱动的进化优化的综述(网红丁是作者之一,脸红),因为这篇综述基本上是EPRSC项目和芬兰国家技术创新局的项目的一个总结。三年来,几个单位(University of Surry、University of Jyvaskyla、东北大学等)的同行们不断努力,才有今天这个冷门但是很实用的方向上有一点点小水花。

  • Y. Jin, H. Wang, T. Chugh, D. Guo and K.Miettinen, "Data-Driven Evolutionary Optimization: An Overview and Case Studies," in IEEE Transactions on Evolutionary Computation.

数据驱动的进化优化

Data-Driven Evolutionary Optimization

是立足于实际工业应用而来的,我们知道工业生产中的优化过程里面对于目标的评价往往是没有显示解析式的,一些情况下评价是基于仿真或物理实验的,这使得经典的优化方法(需要显示表达式)无能为力,虽然进化计算是一个善于求解黑盒问题的算法,但是却需要成千上万的评价次数,冗长的仿真过程以及昂贵的实验代价像一个噩梦蚕食着进化计算的美好优势。数据驱动的进化优化就是将评价看作是数据驱动的,充分挖掘有限数据背后可利用的信息,将进化优化搜索开展下去。数据驱动的进化优化是利用机器学习技术挖掘数据背后的信息减少评价次数,它是位于进化计算、机器学习和数据科学的交叉方向。

这样看来,和评价相关的数据是给优化造成挑战的源头,相对于代理模型surrogate model而言,这篇综述里面将数据分成了两类:

  • 直接数据:数据本身就是在决策空间的采样及其函数评价值,这类数据可以直接建模代理模型来代替进化优化中的函数评价。
  • 间接数据:数据参与到每一次函数评价,间接影响代理模型的建立。

此外,又由于应用场景的不同,优化过程能可能有或没有新的数据进来,这样可以将数据驱动的进化优化分为离线的和在线的,所以相应的方法论方面也是有所区别的。

离线方法

由于没有新的数据,优化方法特别容易受到数据本身的不理想特征和数据量的大小所影响,解决方法方面还很不成熟,主要是尽量做一些数据预处理、数据挖掘和产生人造数据。

在线方法

除了离线方法会遇到的问题之外,还要特别考虑如何处理在线数据,目前很多工作都集中在如何有效的添加新数据方面。


为什么说这篇综述很实在呢?因为除了介绍问题、总结相关工作之外,为了方便理解,这篇文章还附赠五个不同的实际工程优化问题的case studies,在这个满世界跑benchmark肆意PK指标的时代里,简直是业界良心了,有木有?

数据驱动的进化优化还处在一个非常早期的阶段,应用问题的特点五花八门,有大量的公开问题需要解决,如果你是一个务实的人,那么网红丁裂墙推荐你阅读这篇新综述。


文章来源申明:本篇文章来自史上最实在的综述:数据驱动的进化优化
如需转载请在公众号后台获取转载须知

知乎LIVE】牛津海德堡大学博士(后)讲述理工科转行AI,将于北京时间2018年9月23号星期日下午16:00与大家见面,一小时综述转行人工智能学界/业界经验,问答环节至少半小时 (门票只要9.9 RMB)。入口如下:理工科的你想要转AI?快上车!

送门票活动链接牛津 ,海德堡大学大学博士(后)邀您参与理工科转AI知乎live---门票免费送!

可以在 本公众号后台 回复关键词:“学界”获取大量由我平台编辑精心整理的学习资料,如果觉得有用, 请勿吝啬你的留言和赞哦!~

【学界】版块招募责任编辑1-2名,要求有运筹优化/数据分析/机器学习背景,有阅读前沿的英文文献能力。如果对这个板块感兴趣,可以点击下图,记得备注【学界】板块哦!期待你的加入。

『运筹OR帷幄』长期招收志愿者,如果你有一技之长,爱分享,欢迎加入我们。点击下方图片即可了解详情!


点击查看『运筹OR帷幄』志愿者招募介绍及加入方式

点击查看【骥寻伯乐】板块说明及投稿方式

扫二维码关注『运筹OR帷幄』公众号:

编辑于 2018-09-20

文章被以下专栏收录