IBM：传统企业如何快速应用AI技术

左小木 | 2018-01-10 14:42:33 阅读：20376

随着人工智能（AI）相关技术不断加强和深入，智能语音助手、智能音箱，甚至扫地机器人这类简单的消费类AI产品已经逐渐融入到我们的生活。与以消费者为主导的市场不同，医疗、工业等以企业为主导的市场发展AI面临着更多难题。近日，《电子产品世界》编辑在“AI时代的移动技术革新”大会上采访了IBM全球技术研究院院士林咏华女士，就AI在医疗、工业等企业为主导的市场推广及应用中存在的问题及相关突破点作了深入的探讨。

消费市场与企业市场需求决定者不同

我们现在接触的大部分比较成熟的AI产品都是消费类产品，而以消费者为主导的市场，需求实际上是由互联网公司决定的，互联网公司在AI上考虑创新的时候，更多的是要考虑消费者需要有什么样AI的能力，而在推出相关产品后，消费者则会去学习怎样使用。相较而言，企业市场的需求是由企业来定的，因此，怎样把AI技术应用到不同的企业中则是IBM等直接面对企业客户的公司所面临的挑战。

企业市场AI创新面临的三大问题

当下想要用AI来提升企业业务价值主要面临人才、数据和经济性三方面问题。

人才问题

像BAT等互联网企业已有自己的AI团队，相较而言，今天很多工业界在生产制造、能源、交通等领域的企业，他们有专注自己业务的人才，但是并没有AI方面人才。

数据问题

AI之所以在最近几年发展得很火，深度学习在其中起到的作用是不可忽视的。2012年深度学习开始进入AI的算法领域，而深度学习的应用需要海量数据，像谷歌、Facebook、BAT等互联网公司，正因为手中有大量的互联网上的数据，因而得以在AI方面有相对较快的发展。但是这些数据与企业今天要解决问题的数据是完全不同的，包括医疗、生产制造等领域中的数据对于企业来说都是小数据级，不是海量数据。

经济性问题

对于企业而言，经济性问题也是必须考虑的。如果要拥有AI的能力意味着把成本提高十倍，企业自然是很难接受的。而这其中需要考虑的不仅是算法上的创新，而且要通盘考虑系统的优化、系统的创新，如何使在加入AI能力的同时，成本可以没有太大的浮动。

IBM的破局之力

人才问题

提供配备AI能力的硬件平台需要有深度学习的开发团队，而提供公有云的模式又只能提供一些固定的模型，这些固定的模型提供的API内容与今天很多企业数据不相关，难以匹配企业实际需求。

针对此，IBM开拓出第三种业务能力——构建一个“AI大脑”，这个大脑既可以部署在企业内部，也可以部署在云端，同时，它面对的开发者并不是需要具备丰富深度学习开发经验的开发者，而是企业中大量的应用开发者，以此来解决企业人才问题。

应用开发者可以利用“AI大脑”，不需要做任何深度学习的开发，就可以在上面用机器针对企业的数据去训练应用到企业里的数据模型，并且通过“AI大脑”可以自动的提供很好的、很高的精度，这是我们希望能够达到的，林咏华女士介绍道。

IBM推“AI大脑”其实是事后的人才培育，事前的方法是要加大深度学习的教育，尤其是在本科领域。现在很多高校的电气、能源等学科，应该将深度学习作为其必修的基础学科来教学。从而使得这批人才在走上工作岗位时，至少懂得怎样应用深度学习，从而可以更好地结合到产业中。

数据问题

在企业市场中，很多时候相对较少的不正常的数据更有价值。以医疗图片为例，针对某一疾病，一万个病人中有九千九百多个病人的数据是正常数据，相对于这些正常数据，那一小部分不正常的数据更为关键。无论是在医疗，还是智能制造，这样的不正常的数据会更少。

针对此，IBM新推出计算机视觉领域的Power AI Vision平台，该平台在解决“小数据”问题上有以下两种不同的方法：

数据增强，即通过正常数据模拟故障数据来训练数据集。某些特殊数据需要在特定条件下才能采集到，Power AI Vision平台中有加噪、旋转、对称等模拟选项，从而满足未来遇到不同非正常场景。例如自动驾驶做模拟测试时，无法测得恶劣天气下的行驶数据，这就可以通过加噪来模拟恶劣环境测试拿到数据；医疗方面，很多时候会检测细胞，其实细胞可以是多方位不同角度，因此数据增强可以做随机旋转；摄像头在拍摄公路上汽车时可能无法看到各个方位，由于车是对称的，可以通过镜像功能拿到完整汽车行驶数据。因而数据增强可以提供倍增的不同情况的数据。

迁移学习。迁移学习的前提是企业已经有一个较好的基础模型，将这个基础模型放到迁移学习框架中，输入的数据可以是少量的数据，输出的会是很好的结构。而企业可以通过网上公开数据集训练的数据或是其他企业已经训练好的数据模型经测试没问题后，拿来作为企业的基础模型。

AI产业链上下游配合

AI整个产业链大致分成三部分：1.下游硬件厂商；2.中游的AI芯片软件及平台厂商，需要调用下面的硬件，然后卖给上游；3.上游是行业企业，需要为AI技术付费，也是用AI产品去赚钱的企业。

如果对产品的性能或复杂性要求不高，现在的整个产业链还是可以实现的，例如一些玩具类AI产品。但是如果对性能和复杂性要求较高的话，就需要整个产业链的深度融合和各方面大规模的优化。例如GPU是否是最好的硬件，我们用一个经典的算法做一个模型的话，英伟达最新的V100 GPU也只能同时支持四路视频的实时性，这导致分摊到每一个摄像头上的成本达一两千美元，而每个摄像头的成本也就是一两百美元，如果考虑大规模应用的话，这样的方案则无法实施。

另外，如果上游市场不能达到足够大，下游厂商是无法为这一领域进行相关定制化配置的。例如，现在有很多为自动驾驶提供的专用芯片，这是因为现在自动驾驶领域已经足够大。国内很多中小企业很难出现单个中小企业就有下游公司帮助定制这样的硬件，这时候就要去看是否有多个中小企业有这样的需求，从而驱动下游企业做集中定制化，这也同时要求下游厂商对市场有比较深入的了解。

初创公司如何进入AI市场

AI要想大规模应用，就要求其有高可靠性，同时能力要比人强。大公司会兼顾不同的产品方向和领域，却很难在每一个领域达到100%的精准，这就为初创公司留出了机遇，而这些机遇又可以分为技术创新和技术配套两类：

在技术创新方面，初创公司要进入AI市场，需要考量两方面因素：一旦做了会有比较大的市场价值，而且这个领域不是已经被做熟的市场。例如现在在Face++出来之后，仍然有人在进入人脸识别的市场，初创公司选择这样的领域，好处是市场需求已经被拉动起来，但是也很难在其中取得一席之地。

在技术配套方面，AI在不同的行业相关配套算法及方案需要做很多配套的技术，初创公司也可以选准一个方向，成为这其中的专才。

AI领域难以实现数据共享

目前来看，企业做AI的话，数据本身就是区别于竞争对手的壁垒。现在互联网上有很多的公开数据集，例如用来做图片分类、自然语言处理、计算机视觉，但是这些数据集并非来源于企业，而是来源于网络。企业中的实际数据与这些数据集是完全不同的。如果你有高价值的数据，而别人没有的话，这就意味着你在AI领域比竞争对手要走得更快。对于想要做AI的企业，实际上是不愿意将数据共享的，因为一旦共享，这样的优势就不再存在，除非你能够保证一定比同领域企业能够在技术上领先一到两年，否则就是在培育你的竞争对手。

以生产制造为例，有些企业希望用AI做质检，用AI提高产品的良品率，如果将瑕疵数据进行分类公开，竞争对手也会利用这些数据，无形中就无法形成领先的市场地位。

深度学习并非万能

如今，很多人已经意识到深度学习要学一个简单的东西仍然需要海量数据，效率太低。深度学习不是万能的，不是最好或最适合的，之后一定会有更好的技术，但是现在还远未到新技术聚合出来的时间。

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。