大模型比武场战火纷飞了半年有余,左有OpenAI动作频频,右有meta开源Llama2,开闭源方面,均被巨鳄占领山头,创业投资也已经进入了新阶段。
现在再下场,会不会晚了?
会者不晚。
因为就在最近,又一重量级大牛入局创业。量子位获悉,微软全球合伙人、副总裁、前微软亚洲研究院首席科学家姜大昕出现在最新名单中。
这位在微软工作16年有余、曾作为微软必应搜索引擎和Cortana智能助手自然语言理解负责人,近期被曝已经从老东家离职,下一站,自己创业,剑指大模型领域。
而且据说姜大昕还不是一个人战斗,他背后还有两位MSRA故旧,一位是地位卓然、微软华人旗帜的AI大牛,另一位则是年少有为、知名AI独角兽的CEO。
他们,将在AI高地上海的助推下集结。
姜大昕是谁?
姜大昕,2005年获纽约布法罗州纽约州立大学计算机科学博士,在机器学习、数据挖掘、自然语言处理、生物信息等领域有丰富的经验和工程经验。
迄今为止,他发表论文100余篇,被引用次数接近1万次。
现在的领英网站上,姜大昕的职业动态还停留在年初的更新。
“2023年3月起,担任微软副总裁”,所在部门为STCA(微软亚洲互联网工程院)。
从2007年3月加入微软到2023年,姜大昕已经和这家公司携手度过了16个年头。
姜大昕本硕分别毕业于中国科学技术大学和中国科学院软件研究所,当他远赴美国攻读计算机博士学位,做生物信息领域的数据挖掘研究时,恰逢深度学习方兴未艾。
博士毕业后,他选择了前往南洋理工大学担任助理教授,为研究生和本科生教授数据挖掘和生物信息学课程。
2006年12月,他从南洋理工离职,并在次年3月成为MSRA(微软亚研院)的副研究员。
他在MSRA工作了四年,负责数据挖掘、机器学习和信息检索等领域的应用研究,从事着个性化和上下文感知搜索等工作,一路从副研究员做到研究员再到首席科学家。
此期间,他在SIGKDD、SIGIR,WWW和WSDM等会议上发表了多篇文章,获得SIGKDD 2008最佳应用论文奖,还担任多个期刊和会议的副主编和PC成员。
2011年开始,姜大昕转入STCA工作。
STCA主要负责微软全球产品的研发工作,包括必应搜索引擎、智能语音助手Cortana、Azure认知服务以及Microsoft 365的自然语言理解系统等。
6年后,姜大昕的title已经升为了微软全球合伙人,STCA副院长、首席科学家。
2023年3月,姜大昕正式升任为微软副总裁,同时兼任亚洲软件技术中心WebXT S+D(网络体验、搜索和分销)集团总经理。
此时,姜大昕的工作重点是带领400多名应用科学家和工程师,为微软必应开发算法和基础结构。
同时,姜大昕团队还为各种Microsoft产品(如Office,Xbox和Microsoft认知服务)提供NLP模型和算法。
大模型创业进程中的微软系
姜大昕并不是第一位出身微软的大模型创业者,细数起来,不少头部玩家都有微软背景。
李开复,前微软全球副总裁,也是MSRA的创办者之一。
3月底,李开复开始筹备、塔尖孵化创业公司零一万物,走自研大模型路线,核心业务集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。
已加入的联创团队成员,包含前阿里副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁,算法和产品团队背景均来自国内外大厂。
目前,零一万物正自建平台,构建数千卡GPU集群进行训练、调优和推理,提高数据有效参数量,以及使用的高质量数据的密度,以构建连续、可控、科学化的训练能力。
筹备至今,该公司已经实现百亿参数规模的模型内测,正往300到700亿参数规模扩大。
周明,MSRA前常务副院长,旗下创业公司名为澜舟科技,于2021年6月成立。
公司选择了大模型的轻量化路径,并且瞄准To B赛道,聚焦于金融、营销、文化创意、机器翻译等场景。
今年3月,澜舟科技完成了Pre-A+轮融资,融资金额数亿人民币。由北京中关村科学城公司领投,斯道资本和创新工场跟投。
同时,澜舟发布了语言生成模型——孟子MChat可控大模型,具有类ChatGPT能力,加上原来澜舟科技孟子大模型N个项目功能引擎,既有对话能力,又具备翻译、生成、信息搜索等能力。
MChat背后依托的孟子大模型,是澜舟科技自研技术研发的大规模预训练语言模型,于2021年7月推出。
李笛,微软亚洲互联网工程院(STCA)前副院长、前微软全球资深合伙人,目前是小冰公司的CEO。
小冰公司前身是微软亚洲互联网工程院的人工智能小冰团队,于2013年12月在北京组建。2020年5月,小冰公司“单飞”,微软将小冰分拆为独立实体。
早在2014年,小冰就发布过一款名叫“小冰”的AI聊天机器人。并且一直沿着生成式AI的框架和路径前进。
今年2月,小冰一度短暂上线了内测版本的小冰链(X-CoTA,X-Chain of Thought & Action)。
小冰链同样是个大语言模型,通过对话的方式帮人们解答问题。其核心,是利用大模型技术,实现下一代的控制中枢。
与ChatGPT等不同,小冰链的数据来源是实时的,并且仅仅用GPT-3参数量2%的模型,就实现了思维链,能够把AI的思考过程完整、透明地呈现出来。
5月16日,小冰公司宣布启动“GPT克隆人计划”,基于小冰框架大模型、神经网络渲染及超级自然语音技术,进行实时情感交互、提供AIGC能力。
聂再清,MSRA前首席研究员,现为清华大学国强教授、AIR(智能产业研究院)首席研究员。
其在AIR主导的项目,在今年7月孵化出了初创公司水木分子。
水木分子专注生物医药垂直行业大模型的研发与应用,以及构建新一代对话式生物医药研发助手。
7月初,公司宣布完成千万级种子轮融资。同时宣布了联合创始人、CTO的人选,乔木。
3个月前,团队开源了轻量科研版BioMedGPT-1.6B。
BioMedGPT1.6B从研究层面验证了将文献、分子、蛋白、测序、知识图谱等数据,压缩到统一的多模态大模型框架内,可使模型在分子性质预测、药物-靶点亲和力预测等方面,具备“融汇贯通”的能力,
梅涛,MSRA前资深研究员,今年3月成立AI创业公司HiDream.ai。
公司走多模态路线,尤其专注视觉与语言多模态交互与生成。
HiDream.ai在今年4月完成种子轮融资,投资方包括阿尔法公社和中喝大种子一号基金。
官方解释称,HiDream.ai的目标,是要在基础模型上超越Stable Diffusion最新版本,在产品上则要赶超Midjourney。
公司目前正在开发一个生成式视觉多模态基础模型,该模型不仅能够支持文生图,还能支持文生视频、图生视频以及文生 3D 等功能。
袁进辉,MSRA前主管研究员。
其公司一流科技,在2017年1月成立,立足于通用性深度学习标准框架的研发和推广使用。
公司从事大模型的研发业务,主要围绕数据处理、执行体、分布式数据、决策系统、拓扑图等技术领域展开。
今年3月,一流科技与王慧文创立的光年之外达成并购意向,交易以换股形式进行。
4月中旬,一流科技完成工商变更,光年之外成为一流科技的最大股东,持有约 46.52% 股权。
后来,王慧文因病辞任,美团于6月29日发布公告称,已完成光年之外境内外主体100%股权的收购,一流科技也一并转归美团麾下。
张家兴,MSRA前研究员,公司据传代号深度空间,IDEA研究院理事长沈向洋担任公司顾问。
大方向是打造大模型底座,希望瞄准B端市场打造企业级应用。
今年4月即有消息称,该公司首轮估值在数亿美元左右。据悉,该公司的融资进程仍在持续。
不难发现,在清华系创业公司占据国内大模型头部梯队半壁江山时,微软系也是不容小觑的一股力量。
而姜大昕此番从微软出走,入局大模型创业,要锚定领域中的具体什么方向?除了背后的两位AI大牛,有哪些技术或商业骨干选择加盟?迎来新一名重磅玩家的大模型战事,又会发生怎样的变局?
大约只有假以时日,才能知道答案。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。