不久前,由Aidan Gomez、Ivan Zhang和Nick Frosst于2019年创立的Cohere获得NVIDIA、Oracle、Salesforce Ventures等投资的2.7亿美元新融资,成为20亿美元独角兽,也是基础大模型领域排名第三的公司(前两位是OpenAI和Anthropic)。
Aidan Gomez分别在多伦多大学(本科)和牛津大学(博士)学习,他还是谷歌的学生研究者时就是《Attention Is All You Need》这篇大模型奠基性论文的主要作者之一。
Cohere专注为企业客户提供文本搜索、文本分类和文本生成等于大模型的AI能力。他们产品的特点是高性能,高安全性,多云适应性和数据可控性,这些特性正好解决目前商业客户对于AI的普遍担心,也是他们能够与OpenAI等差异化竞争的关键。
近日,Cohere的创始人Aidan Gomez和总裁Martin Kon(前Google/YouTube高管,管理过数十亿美元的业务,2022年加入Cohere)接受了媒体采访,他们不仅聊了对融资背后的考量,坚持多云适应性的思考,还以创业视角分享了对大语言模型的幻觉,闭源与开源,以及大语言模型使用工具等话题的洞见,对于在大语言模型领域的创业者是很好的参考。
用多云适应保证独立地位,明智的融资策略
问:今年二月,Aidan和我聊到Cohere一直保持低调。由于新的融资,你觉得这种情况现在完全改变了吗?
Aidan Gomez:我认为我们正在取得进步,但我仍然觉得我们非常低调。我们在某些圈子里很出名,但在广泛意义上,我们还有很多工作要做。我们仍在努力讲述我们的故事,让人们了解核心模型,以及我们适合的部署场景,即数据私密和多云适应性。
Martin Kon:我同意Aidan的看法。我认为我们上一轮融资是一个很好的证明点,展示了世界上最受尊敬的企业如何看待我们,以及他们多么想支持像Cohere这样的独立、多云适应性、拥有最先进LLM的公司,无论是在财务上还是作为合作伙伴。这不是一个声明,而是在市场上得到证实;但在普及意识方面仍有很多工作要做。
问:你们经常谈论Cohere是独立的、多云适应的。这让我想起NVIDIA,因为它们与不同的云公司建立合作关系。你是这样看的吗?
Kon:我们确实是多云适应的,当然,NVIDIA的技术在所有云服务提供商上都可用。其中一些也有专有的芯片,但NVIDIA无疑是从计算角度来看比较灵活的选择。所以,对我们来说,能够在每个云环境中部署,并使用一种可以移动的技术是很重要的。
Gomez:我们不受任何大型云服务提供商的控制,对于我们的客户来说,这是一个关键的战略优势。很多大型企业都是多云的。即使他们是单一云服务,他们也希望保留谈判的能力。使用Cohere,你可以在云服务提供商之间切换,并同时在所有云服务上运行Cohere模型。
问:你认为对OpenAI来说,这是一个弱点吗?如果客户只能使用Azure,比如说?
Kon:不同的企业会有不同的重要考虑因素。我们当然从市场上听到了反馈——自从加入Cohere以来,我已经与超过100位高管和企业进行了交谈,以深入了解对他们来说什么是重要的。他们中的很多人说数据隐私、数据保护、在我们的安全环境中定制数据的能力,以及我们的数据驻留要求、数据保护要求、访问和权利要求,这些似乎非常非常重要。因此,我们选择的方向似乎是肥沃的土地。
问:Cohere的投资者名单越来越长,从Oracle和NVIDIA到Salesforce和风险投资公司,以及像Geoffrey Hinton和Fei-Fei Li这样的研究人员。这种多样性有多重要?
Gomez:我认为这对Cohere来说是一个巨大的资产。在最新的融资中,我们的整个目标是聚集一群国际性的战略和机构投资者来支持我们现在和未来的发展。我认为这是非常特殊和独特的。没有很多公司能够在战略和机构方面汇集一群国际投资者。在我们的领域,你会看到很多大型战略单一玩家的投资,比如一个大型公司实体在一家大型语言模型公司背后投入一些资金。我们明确地想要避免这种情况,创造一种对我们的未来更加财务健康的东西。
问:彭博社前几天报道说Cohere正在谈判筹集更多资金。你能透露一些关于增加投资者范围的信息吗?
Kon:我很惊讶已经有传言出现。我还没有读到那篇文章。但我们不对猜测发表评论。正如Aidan所说,我认为我们的主要投资者不仅通过投资获得回报,而且他们投资以真正支持这种独立的提供商。我认为这些公司非常关注安全性。例如,Oracle一直非常关注安全性,我们在数据保护方面有很多共同的优先事项。我们很高兴找到这样的合作伙伴,希望向市场发出信号,展示他们对我们的方法的信任。
怎么帮助商业客户理解和控制大模型的风险
问:Aidan,鉴于你和Cohere联合创始人Nick Frosst都来自Google Brain,而Geoffrey Hinton是你们的投资者名单之一,你对他最近关于AI风险和离开Google Brain的评论有什么看法?
Gomez:我喜欢Geoff。我认为他是全球AI和深度学习的专家。所以我非常尊重他的想法和意见,并且非常认真地对待他们。当Geoff讲话时,我会倾听。话虽如此,我们在这项技术的风险概况上确实有不同的看法。我认为他更关注对人类的风险,或者有些人称之为x风险,或者是生存风险。我认为这些风险的优先级低于另一类风险,即更近期或中期的风险,比如合成媒体和虚假信息的传播。像在风险过高的情况下部署这些模型的风险。我的关注点更倾向于那些实际的风险,而不是假设性的未来风险。
与此同时,我们需要人们关注风险的各个方面。我认为Geoff引起人们对这一方面的关注是很好的。我希望人们能花更多的时间关注那些更实际、更现实的风险,而且坦白说,这些风险对政策制定者和公众更相关。
问:关于这个问题,我对一项调查研究感到惊讶,该研究称大约42%的首席执行官实际上相信AI可能在未来10年内导致人类灭绝。你在公司与人们交谈时听到过这种说法吗?
Kon:我从未听说过。我认为我们一直在与他们交谈的高管们是有担忧的,但他们关心的是Aidan刚刚提到的一些问题,以及像偏见这样的问题。如果你看一下Sara Hooker(她领导Cohere的AI研究小组)和她的团队所关注的所有内容,以及她召集并汇集的全球数百名研究人员的网络,这些都是现在正在发生的风险,这些系统现在正在部署。
问:我对像幻觉和偏见这样的问题感到好奇,这些问题现在正处于新闻的焦点。你如何向客户解释,可以控制或处理大型语言模型中的这些问题?
Gomez:我认为这是一个教育项目,我们当然正在努力推动任何向我们询问LLM应用程序想法的客户。你试着谈论机会,这项技术有很多方面做得非常出色。但是有些地方不适合部署。因此,你只需要教育客户了解这一点——让他们了解失败模式可能是什么样的,以及他们可以在他们那边实施的系统和流程来减轻这种情况,比如不断对模型进行基准测试和评估。
我们每周都会发布一个新的模型版本。我们不希望客户采用一些可能会让他们的用户体验变差,或者以他们不希望的方式提高风险的东西。因此,我们教育他们在自己这边建立测试集,不断评估模型的每个新版本,并做出决定:我是否要接受这个新模型并将其推向生产?还是我这周想要等一等?此外,我们还一直在倾听客户的声音。因此,如果他们观察到某种漂移或某种行为变化,对他们的体验产生负面影响,我们会立即着手诊断为什么会发生这种情况,我们这边发生了什么变化,导致他们那边发生了变化。
大模型将对工作流带来什么影响?
问:你怎么看大语言模型(LLMs)直接使用软件或工具这件事,它会对工作流带来什么影响?
Gomez:虽然LLMs在2年内能够使用像Excel这样的应用程序的可能性越来越大,但“仍然需要进行一系列的完善。我们将拥有第一代可以使用工具的模型,这些模型将是引人注目但脆弱的。最终,我们将得到梦想中的系统,我们可以给模型提供任何软件,并附上一些描述,比如‘这个工具是用来做什么的,你应该怎样使用它’,然后它就能够使用它。一旦我们能够用特定和通用的工具增强LLMs,它解锁的自动化类型将是我们领域的瑰宝。”
问:关于企业使用开源模型在自己的数据上实施模型与使用像Cohere这样的东西,你对整个辩论有什么看法?
Gomez:我的看法是开源非常棒。我认为他们在技术上取得了很大进步。话虽如此,开源和我们的模型之间仍然存在差距。而且,这些模型从来不是静态的。就像我刚才说的,我们每周都在发布,随着时间的推移,会有持续的改进。而对于开源,一年内可能会有几次新模型的发布,这个模型可能有让你使用它的许可,而另一个可能没有。而且它们在训练数据中可能有不同的偏差,使它们的性能在某种程度上偏向这个或那个。而使用Cohere,你得到的是在非常快的节奏上影响我们模型方向的能力。因此,你将得到一种在你关心的任务上表现更好的东西,并且你实际上会对底层训练本身有一个可信的影响。所以,虽然我认为开源是非常棒的,但我仍然认为企业提供了一个完全不同的价值主张。这就像是完全不同的产品。
问:你对那些说像Cohere、OpenAI和Anthropic这样的公司的LLM是一个黑盒子的人有什么看法,他们看不到你的训练数据或你在幕后做什么?
Gomez:我的意思是,我们尽量做到透明,但不泄露知识产权。对于我们的客户,每当他们询问我们的模型是如何工作的,我们会尽量提供信息。我们有一个非常强大的客户支持团队,可以回答任何问题。我们也有一个非常强大的技术团队,可以解释我们的模型是如何工作的,以及我们是如何训练它们的。
但是,我认为这是一个更广泛的问题,不仅仅是针对Cohere。这是一个整个行业的问题,即如何在保护知识产权的同时提供透明度。我认为,这是一个我们作为一个社区需要解决的问题,而不仅仅是Cohere。
结尾
Aidan Gomez是一位年少有为的非凡创业者。
在学术上,他是重要奠基性论文的作者,对大模型有非常透彻的理解,也具有技术的前瞻性。
在创业方面,他能够很明智的根据公司的定位和需求选择到NVIDIA、Oracle、Salesforce Ventures这样的投资者(他的目标是聚集一群国际性的战略和机构投资者来支持公司现在和未来的发展)。
他选择了商用大模型的路线,避开了与赛道前两名OpenAI和Anthropic的竞争,并且很好的解决了商业客户的需求(高性能,可定制化)和他们的担心(数据可控性)。
他还能根据自己相对偏学术的背景,请到了Martin Kon(30年经验,待过咨询,管过数十亿美元的大业务)这样经验丰富的商业老手帮助他进行商业的管理和开拓。
回到中国的AI创业,阿尔法公社认为中国大模型拼算力不适合一般的创业者,懂人工智能的创业者机会很大(Aidan Gomez显然属于这一类)。因为不用从最基础模型开始蛮拼算力,比的是知识积累、团队工程能力和迭代速度。对浅表层产品创新,这类创业者是降维打击。
本文由阿尔法公社原创编译自VentureBeat。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。