风险投资人眼中的 AI 初创公司

　　本文最初发布于 Scott Locklin 的博客，经原作者授权由 InfoQ 中文站翻译并分享。

　　在今年主要的创投公司中，Andreessen-Horowitz 一直是头脑最冷静的那个。当其他公司在生物技术初创公司上加杠杆时，他们在悄悄地继续投资理智的公司（也包括像 soylent 这样的垃圾 Bugman 产品）。我认为，他们实际上是在倾听一线人员的声音，而不是他们的风投伙伴告诉他们的东西。也许他们只是比其他人更聪明，思想更独立。他们最近对“人工智能”投资与软件公司投资的不同之处进行了评估，结果相当残酷。我非常确定，大多数人都没有抓住要点，所以我要针对其中的重点做些说明。

　　他们使用了所有流行词（“人工智能”这个词在他们那的意思就是“机器学习”），但他们终于注意到了某些事情，虽然这些事情对任何在这个领域工作的人来说都是非常明显的。例如，使用“云”计算的深度学习初创企业的毛利率很低，这主要是因为他们使用云计算。

　　在以前内部部署软件的时代，交付产品意味着淘汰和交付物理媒体——运行软件的成本，无论是在服务器上还是在台式机上，都由买方承担。如今，随着 SaaS 占据了主导地位，这一成本被推给了供应商。大多数软件公司每个月都要支付大量的 AWS 或 Azure 账单——软件要求越高，账单就越高。事实证明，人工智能要求相当高：

　　训练一个人工智能模型可能要花费数十万美元（或更多）的计算资源。虽然人们很容易将其视为一次性成本，但人们日益认识到，再训练是一种持续成本，因为提供给人工智能模型的数据往往会随着时间变化（这种现象被称为“数据漂移”）。

　　模型推断（在生产中生成预测的过程）在计算上也比操作传统软件更加复杂。执行一长串的矩阵乘法需要比从数据库中读取数据进行更多的数学运算。

　　人工智能应用程序比传统软件更可能操作图像、音频或视频等富媒体。这些类型的数据消耗的存储资源比通常的软件要多，处理起来成本也更高，而且经常会遇到感兴趣区域问题——应用程序可能需要处理一个大文件才能找到一小部分相关片段。

　　人工智能公司告诉我们，云操作可能比传统方法更复杂、更昂贵，尤其是缺少好的工具来在全球范围内扩展人工智能模型。因此，一些人工智能公司不得不经常在云计算区域之间转移训练好的模型，以提高可靠性、延迟和法规遵从性，这将增加进入和退出成本。

　　总的来说，AI 公司在云资源上的支出通常占其收入的 25%甚至更多。在极端情况下，有的初创公司发现，如果待处理的任务特别复杂，手工数据处理实际上比执行训练好的模型更便宜。

　　这适用于所有有大量计算和数据问题的机器学习。“云”价格体系旨在从数据量大或计算需求大的人身上获取最大收益。云计算公司更愿意将一个硬件的时间卖给 5 到 10 个客户。如果你足够幸运，拥有一个运营数百万行数据和 GBM 或随机森林的初创公司，这可能根本不是真的，很少有初创公司如此幸运。除非购买自己的硬件，否则那些使用最新的 DL 模型来处理其所需的庞大数据集的企业将会面临巨大的计算开销。出于一些对我来说毫无意义的原因，他们大多数人不买硬件。

　　在许多问题领域，为了获得更高的精度，需要指数级的处理和数据。这意味着——正如我们之前所提到的——模型的复杂性正在以令人难以置信的速度增长，处理器已不太可能跟上。摩尔定律都不够。（例如，自 2012 年以来，训练最先进的人工智能模型所需的计算资源已经增长了 30 万倍，而 NVIDIA GPU 的晶体管数量只增长了大约 4 倍！）分布式计算是解决这个问题的一个引人注目的解决方案，但它主要解决的是速度，而不是成本。

　　除了他们所说的深度学习模型的大小（这对于有趣的新结果来说无疑是正确的），我们很少听到（尽管最近经常听到）人们承认 GPU 芯片的计算能力并没有真正快速地增长。大家都认为摩尔定律会拯救我们。实际上，NVIDIA 确实可以做出明显的性能改进，但事情的规模是如此之大，扩大模型的唯一方法是堆积更多的 GPU。如果你是从一家营利性公司租来的“云”里做这件事，那是财务自杀。

　　“人在回路（Human-in-the-loop）”系统有两种形式，对于许多人工智能初创公司来说，它们都会降低其毛利率。

　　首先：训练当今最先进的人工智能模型涉及到对大型数据集的人工清洗和标记。这一过程既费力又昂贵，而且是人工智能得到更广泛应用的最大障碍之一。另外，正如我们前面所讨论的，模型部署以后，训练并不会结束。为了保持准确性，需要不断地捕获新的训练数据、标记并反馈到系统中。虽然像漂移检测和主动学习这样的减肥技术可以减轻这种负担，但非官方数据显示，许多公司在这个过程中花费了高达 10-15%的收入，并且通常还没有把核心工程资源计算在内。此外，持续不断的开发工作会超过传统的 Bug 修复和特性添加。

　　第二：对于许多任务，尤其是那些需要更强认知推理能力的任务，人类经常会实时地介入人工智能系统。例如，社交媒体公司雇佣数千名人工审核员来增强基于人工智能的审核系统。许多自动驾驶汽车系统会包含远程操作人员，大多数基于人工智能的医疗设备会与医生配合成为联合决策者。随着现代人工智能系统的能力越来越被人们所理解，越来越多的初创公司开始采用这种方法。许多原计划销售纯软件产品的人工智能公司，正越来越多地在内部引入服务功能，并预定相关成本。

　　这个行业的每个人都知道，如果你在使用很有意思的模型，即使假设存在无限精确标记的训练数据，“人在回路”问题也不会完全消失。机器学习模型通常是“人的加强（man amplified）”。如果你需要某人（或者更有可能是几个人）每年赚 50 万美元来维持你的神经网络产生合理的结果，你可能会重新考虑你的选择。如果它每年能做出几百次人类层面的决定，那么对人类来说，使用更好的用户界面、人工做出这些决定可能会更容易，成本也更低。更好的用户界面被严重低估了，例如，你可以看下 Labview、Delphi 或 Palantir 提供的高效用户界面。

　　由于可能的输入值范围非常大，每个新客户部署都可能生成以前从未见过的数据。即使是看起来相似的客户，也可能需要本质上不同的训练数据，例如两家做缺陷检测的汽车制造商想在他们的装配线上放置摄像机。

　　解决业务问题的软件通常可以根据新客户的需求扩展。执行一些数据库后端的繁重工作，然后将其插入就实现了。有时候，你必须调整流程以适应软件的可接受用途，或者花费大量的精力调整软件以适应你的业务流程，SAP 在这方面就声名狼藉。这样的周期会耗费大量时间和人力。显然，至少在某些时候是值得的。但是，尽管 SAP 声名狼藉（甚至导致其他健康公司破产），大多数人还没有意识到，面向 ML 的流程几乎不可能像比较简单的应用程序那样伸缩。你将面临与使用 SAP 相同的问题，前期有大量的工作要做，并且一切都是定制的。我大胆地断言下，大多数前期的数据管道和组织变革可能比实际的机器学习部分更有价值。

　　在人工智能的世界里，技术差异化更难实现。新的模型架构主要是在开放的学术环境中开发的。参考实现（预训练模型）可以从开源库中获得，模型参数可以自动优化。数据是人工智能系统的核心，但它通常属于客户，属于公共领域，或者随着时间的推移成为一种商品。

　　那就对了，这就是为什么像我这样的独狼，或者一个小团队，可以做得和一些拥有 100 倍员工和 1 亿风投支持的公司一样好，甚至更好。我知道最新的模型有什么优点和缺点。更糟糕的是：我知道从商业的角度来看，一些基本的东西，如朴素贝叶斯或线性模型，可能会解决客户的问题，就和最新的 GigaWatt 神经网络一样好。这家风投支持的初创公司可能把赌注押在了他们的“特殊工具”上，将其作为一个令人兴奋的 IP。如果数据没有正确的标记，ROC 曲线上的几个百分点的差异并不重要，它已描述了你实际遇到的大多数数据。

　　毋庸置疑，ML 是有用的，但很少有初创公司有“特别的佐料”，比你从 Git 库生成的分支好 10 倍或 100 倍。人们不会为内部临时的数据科学解决方案支付额外的费用，除非它代表了真正改变游戏规则的结果，这项技术可以让所有人大吃一惊。但如果它只比 MAPE 好 5%，这就无关紧要了。很多“人工智能”并不比通过“group by”查询生成的直方图更好。增加的复杂性不会使它变得更好：有时候你的数据中没有信息。

　　对于“人工智能”技术人员来说，有一些点需要注意：

　　尽可能消除模型的复杂性。我们已经看到，在为每个客户训练独特模型的初创公司与能够在所有客户之间共享单个模型（或一组模型）的初创公司之间，存在着巨大的销售成本差异……

　　能这样做很好，但非常罕见。如果你发现了这样的问题，你最好希望你有一个特殊的、令人兴奋的解决方案，或一个使它可能成为独一无二的数据集。

　　仔细地选择问题域（通常是狭窄的），以减少数据复杂性。使人类劳动自动化是一件非常困难的事情。许多公司发现，人工智能模型的最小可行任务比他们预期的范围要窄。例如，一些团队发现，在电子邮件或招聘信息中提供简短的建议是成功的，而不是提供一般性的文本建议。仅仅围绕更新记录，在 CRM 领域工作的公司就已经发现了非常有价值的人工智能利基市场。有很多类似这样的问题，对人类来说很难解决，但对人工智能来说相对容易。它们往往涉及大规模、低复杂度的任务，如审核、数据输入/编码、转录等。

　　这在很大程度上承认了“人工智能”的失败。所有关于“人工智能取代就业岗位”的甜言蜜语，都像往常一样，在小精灵的烟雾中蒸发了。真的，他们说的是廉价的海外劳动力，而像 Yang 这样的人却反反复复地说，“人工智能要抢走你的工作”。在这种情况下，AI 实际上代表“外来人口（或）移民”。是的，它们确实提供了在一些有限的领域中使用 ML 的可能性，我同意这种说法，但是风投资本支持所需要的曲棍球棒曲线，以及让它发挥作用所需要的大批博士，并不能很好地与那些市场有限的有限领域相结合。

　　拥抱服务。它所处的市场有巨大的机会。这可能意味着提供全栈翻译服务而不是翻译软件，或者运营出租车服务而不是销售自动驾驶汽车。

　　换句话说，你可能无法把一个能解决各种问题的大脑装进一个罐子里，能做到这一点的话，你可能会成为一家咨询和服务公司。如果你不熟悉估值数学的话，这里可以举个例子：服务公司的年营收约为 2 倍，软件和“技术”公司的收入是 10-20 倍，这就是为什么 wework 一直试图把他的金字塔传销定位为一个软件公司。这有巨大的影响：A16z 提升了“人工智能”的市值，而与他们想法相似的人的估值会低得多。如果现在还不清楚的话，他们又说了一遍：

　　总结一下：在传统意义上，当今的大多数人工智能系统并不完全是软件。因此，人工智能业务看上去与软件业务并不完全一样。它们涉及持续的人力支持和举足轻重的可变成本。它们通常不像我们想象的那样容易伸缩。强大的安全性——对“一次构建/多次销售”的软件模型至关重要——似乎也不是免费的。

　　这些特点让人工智能在某种程度上感觉像是一个服务行业。换句话说：你可以取代服务公司，但你不能（完全）取代服务。

　　既然是这样，我还要再说一下：服务公司的价值不像软件公司那么高。风投热爱软件公司，提前努力解决问题，然后永远赚钱。这就是他们获得 10-20 倍收入估值的原因。服务公司？你为什么要投资一家服务公司？它们的增长受到劳动力成本和捉摸不定的潜在市场问题的内在制约。

　　这并不是一个“人工智能的冬天”的新公告，但对于那些声称提供世界一流的“人工智能”解决方案的创业公司来说，现在是秋天，冬天即将来临。“人工智能”的承诺一直是取代人力，增加人类应对自然的力量。实际上，认为 ML 是“人工智能”的人，认为机器会以某种方式自动学习，不需要人类。然而，这在经济上或物质上都不现实。

　　事实上，有一些有趣的模型可以通过训练有素的 DBA、数据工程师、统计人员和技术人员应用到业务问题中。这类事情最好在现有的大公司里进行，以提高生产率。如果公司已僵化，则可以聘请外部顾问，就像他们一直做的那样。A16z 的投资组合反映了这一点。撇开他们对自动驾驶汽车的押注（这些押注看起来并没有很大的“人工智能”成分），以及对一些至少拥有线性回归层数据科学的医疗科技押注，我只能确定他们只资助了两家与数据科学相关的初创企业。比起“人工智能”，他们更喜欢加密货币和区块链。尽管有不同的说法，但他们的资金显示，“人工智能”公司看上去并不那么抢手。

　　为了获得边际收益，深度学习的计算成本很高。机器学习初创公司通常没有令人兴奋的或有意义的特殊资源。机器学习初创企业大多是服务企业，而不是软件企业。在数据和流程效率低下的大型组织中，机器学习最有效。