ASCII码 ASCII码

30人NLP公司获4000万美元投资,杜兰特也入股了

发布于:2021-03-15 11:33:45  栏目:技术文档

  梦晨发自凹非寺

  量子位报道公众号 QbitAI

  NLP 界鼎鼎大名的 Hugging Face(抱抱脸)公司刚刚完成 4000 万美元B轮融资。

  投资者除 Betaworks 等著名孵化机构外,NBA 球星里的投资鬼才凯文·杜兰特也在其中。

  Hugging Face 在 2016 年以娱乐型聊天机器人起家,当时只有 5 人。

  后转型成专注 NLP 的技术公司,在 GitHub 上发布了开源 NLP 库 Transformers,2 年多来已获 4.2 万星。

  2020 年,Hugging Face 开始做面向企业的定制 NLP 模型,包括其客户包括彭博社和高通等 100 多家公司,并且今年以来一直处于正现金流状态。

  Hugging Face 总融资额已达到 6000 万美元,据称,上一轮 1500 万美元中的 90% 至今还躺在银行里。

  除了在商业和开源领域的成功外他们的论文也登上过 ICLR、NeurIPS 、EMNLP 等国际顶会。

  Hugging Face 在 EMNLP 2020 上获得最佳演示论文奖

  如此厉害的公司,到现在也只有 30 名员工。

  想做机器学习界的 GitHub

  Hugging Face 的 CEO 与联合创始人 Clement Delangue 认为,大部分资源都集中在几个大机构手中是机器学习领域面临的一大问题。技术的民主化是确保小型机构也能受益于人工智能的关键。

  Hugging Face 也曾收到过来自大型公司的收购意向,但一直坚持独立运行,并把精力投入到运营开源社区上。

  目前,Hugging Face 开源社区中,已有超过 6000 个模型和近 800 个数据集,涵盖 300 多种语言。

  Hugging Face 还曾一口气发布 1000 多个机器翻译模型,涵盖 140 种不同语言组合,为小语种 NLP 做出巨大贡献。

  迁移学习是未来的关键

  迁移学习,通过对预训练模型做出微调就能用于解决相似的问题,而不必从头开始训练。增加了可用数据资源的范围,减少训练成本。

  在 NLP 领域,使训练模型不必依靠难以大量获取的已标注数据,而可以利用互联网上不断产生的未标注数据。

  预训练 NLP 模型在性能测试中的表现已超过人类基准。

  Hugging Face 认为迁移学习和预训练模型彻底改变了 NLP,也在改变着计算机视觉和语音文字转换等其他 AI 相关领域。

  最终,迁移学习将为整个机器学习提供动力。

  而 Hugging Face 想成为这些迁移学习模型的动力。

  在去年底发布了自动训练 NLP 模型的开源工具 AutoNLP 后,Hugging Face 准备将业务扩展到计算机视觉等其他领域。并打算把机器学习上的投入增加到原来的三倍。

  参考链接:

  [1]https://venturebeat.com/2021/03/11/hugging-face-triples-investment-in-open-source-machine-learning-models/

  [2]https://techcrunch.com/2021/03/11/hugging-face-raises-40-million-for-its-natural-language-processing-library/

相关推荐
阅读 +