十二年结出的硕果 工业大数据分析案例集锦 一 (十二年 结婚)

前奏

我从1990年开始从事工业过程数据分析。当时我从浙江大学数学系毕业后,进入化工仿真教研室,在胡上序先生的指导下,进行了几项与工业数据分析相关的工作。这些研究在学术意义上或许算成功了,但我对算法的可靠性心存疑虑:仅仅有逼近能力是不够的,还要能够通过数据方法找到逼近,除非数据非常密集。

因此,我在硕士本文中研究了需要多少数据才能得到真实的结果。我还意识到工业数据的噪声太大,模型的误差几乎都来自于数据的噪声。于是,我想出了一种用平均值估算模型真实精度的方法。

这些研究的学术水平一般,但当时的思维方式伴随我来到宝钢:对模型可靠性的关注、对数据量和数据质量的关注、用平均值的办法估算模型实际精度、模型精度高不等于正确。

首战告负

1997年,我博士毕业来到宝钢。当时,技术中心自动化所刚刚成立,我成了老领导任德祥先生之外技术自动化所的第一个员工。我们提出了8个项目。我负责的连铸过程优化控制项目在探索中不断调整目标,其中一个子目标是把生产数据收集起来,建立成分、工艺与连铸坯质量之间的函数,去指导生产。

但是,这个子目标实际上是失败了。对于这个子项目的失败,我进行了反思:

  1. 业务目标问题。我当时的想法是,通过分析建模,弄清楚工艺参数和质量之间的关系,从而优化工艺参数。但实际上,对于很多情况下,质量不是制约拉速的主要瓶颈。即便是得到拉速与某个质量指标的关系,也不会作为控制手段。
  2. 高精度预报的可行性问题。问题太复杂、数据质量差,导致很难预报精确。系统性的干扰太多,需要分组研究。但分组后,每个组内的样本数目就大大降低了,分析效果就不合适。数据质量差也表现在很多地方,比如某些人工检测的缺陷,不同班组的差别有好几倍。

这个项目的失败给我的启示是:做一件事之前,应该首先去研究如何应用研究成果。还有,对于复杂的问题,数据质量和数据量非常重要。

本文原创来源:电气TV网,欢迎收藏本网址,收藏不迷路哦!

相关阅读

添加新评论