又双叒一清华系团队入局大模型创业!蚂蚁领投,主打多模态 / 头条资讯

7月前 阅读 / 42 来源 / 原创 文 / 越读党订阅

衡宇 发自 凹非寺量子位 | 公众号 QbitAI清华计算机系教授朱军,终于正式站在了大模型创业赛的擂台上。多方消息证实,他带领新团队成立新的AI公司,冲进大模型混战场——这是朱军继瑞莱智慧后,带领的第二支创业团队。新公司生数科技,基于底...

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

清华计算机系教授朱军,终于正式站在了大模型创业赛的擂台上。

多方消息证实,他带领新团队成立新的AI公司,冲进大模型混战场——这是朱军继瑞莱智慧后,带领的第二支创业团队。

新公司生数科技,基于底层多模态通用大模型,面向图像创作、3D资产创建等场景打造垂类应用。

量子位进一步获悉,它刚刚曝出完成了近亿元天使轮投资,目前市场估值达1亿美金。

蚂蚁集团是这次融资的领投方,BV百度风投和清华系专看AI的VC卓源资本紧随其后。

这是ChatGPT诞生后,蚂蚁集团第一次下手投资大模型公司,也是自今年1月7日阿里从蚂蚁集团实际控制人“身退”之后,蚂蚁集团对外曝光出的与AI初创公司第一次亲密接触。

(哪怕阿里和蚂蚁集团刚刚合作提出了VideoComposer,通过组合式生成范式,在视频领域同时实现时间和空间双维度的可控性,狗头.jpg)



打造可控多模态通用大模型

量子位进一步获悉,生数科技这家公司,由蚂蚁、BV百度风投,以及朱军第一次创业时成立的瑞莱智慧RealAI联合孵化而来。

目标是“致力于成为全球领先的生成式人工智能基础设施及应用建设者”。

据悉,生数科技研究团队主要来自清华大学人工智能研究院,主要来自朱军带领的课题组。

该课题组致力于贝叶斯机器学习的理论和算法研究,是国际上最早研究深度概率生成模型的团队之一

工作主要面向针对深度生成式模型的骨干网络、高速采样、可控生成、大模型训练等全栈底层原创研发。

而目前推进中的业务,是聚焦AIGC,打造可控的多模态通用大模型,覆盖文本、图像、3D模型、音视频等多个模态。

要覆盖的商业场景,包括艺术设计、游戏制作、影视后期、内容社交等。



生数科技大模型目前已处于迭代中,现阶段已经开始落地实践图像生成、3D内容生成和视频生成等业务。

业务水平究竟怎样?

面对量子位的上门追问,生数科技给出如下回答:

论视频生成,团队目前聚焦于文本的视频自动化编辑。

△生数科技视频生成效果(中)和Runway生成效果(右)

论3D生成,团队提出新算法ProlifcDreamer,从贝叶斯建模和变分推断的角度,重新形式化了text-to-3D问题。

该技术能够在无需任何3D训练数据的前提下,通过文本描述,自动生成高质量带纹理的三维网格与NeRF图。



包括生成复杂效果和360°场景、根据同样的描述生成不同形式的3D内容。

以及首个实现了基于三视图自动生成高质量的3D内容,“是目前业内最接近产业级应用的3D生成效果”。

论图像生成,团队旗下多模态大模型UniDiffuser,今年3月开源,是首个基于Transformer的多模态扩散大模型。

能够很好地在构图、风格、画面精准度等方面把握用户意图。



现状,是“正自研新一版的产业级模型,其中,图像生成效果已超过Stable Diffusion最新版基础模型水平”;

计划,是“将于年内赶超Midjourney最新版本”。



并且透露道,过去两年,生数科技团队在ICML、NeurIPS、ICLR等计算机顶会发了20多篇相关论文,扩散模型是团队的主要发力阵地。

先后提出的采样算法Analytic-DPM、DPM-Solver等成果,被DALL·E、Stable Diffusion等应用。

论文成果颇丰,生数科技接下来的任务,就是把基础科研推向应用市场。

生数科技背后团队

生数科技领兵冲刺的带头人朱军,IEEE Fellow,现任清华大学计算机系教授。

同时也是清华人工智能研究院副院长,清华智能技术与系统国家重点实验室主任,智源首席科学家。

求学期间,他在清华计算机系拿下本科和博士学位,师从中国科学院院士、清华计算机系教授张钹。



△朱军

2011年,在张钹的邀请下,朱军回到清华计算机系任教。

去年,师徒二人围绕扩散概率模型合作的工作《Analytic-DPM: an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models》,拿下ICLR 2022杰出论文奖。

朱军长期从事机器学习、贝叶斯方法、深度学习、数据挖掘等方面的研究,在顶会ICML、NIPS、IJCAI、AAAI、 JMLR、PAMI等发表论文100余篇,连续多年担任ICML、NeurIPS领域主席。

(贝叶斯方法是自然语言处理、机器学习、图像识别等AI领域的重要基础。)

2020年,朱军团队发布深度强化学习平台Tianshou天授。

这是一个针对强化学习的灵活可靠的基础设施,能够以极简代码极速实现强化学习的诸多算法和功能,在GitHub上有用6.4k+星星。



话说回来,生数科技不是朱军在科研和产业之间的第一次尝试。

他的首次创业要回溯到2018年。当时,他支持自己的学生田天创办了公司瑞莱智慧RealAI,专注提升人工智能的安全性。

并且和张钹共同担任该公司的首席科学家。

这一次正式入局大模型,朱军再次选择站在新公司“运筹帷幄”的位置上。

而根据企查查App资料,成立于3月的生数科技,在4月时进行了一次法人变动,从“田天”变更为“唐家渝”。

唐家渝其人,现在是生数科技的联合创始人兼CEO。

他同样毕业自清华大学计算机系,师从NLP组教授孙茂松。

此前,对唐家渝外界的主要公开身份是瑞莱智慧的副总裁,先后负责公司产品团队、AI安全产研团队及业务。

而从再往前的简历可以看到,唐家渝曾在腾讯优图实验室工作。



△唐家渝

最新能公开的消息是,生数科技团队近期在扩散模型工作上,提出了一种新的训练策略,能够尽可能用较少的标注,持续优化多模态生成效果。

如此看来,生数科技的多模态大模型可能武力值要再+1了?

以及不得不感慨一句,清华系AI初创公司在这一波大模型创业中,真的是风头无两。

哪怕单纯从数量上说,生数科技也已经是又双叒叕一个了~

参考链接:
[1]https://github.com/thu-ml/tianshou
[2]https://www.cs.tsinghua.edu.cn/info/1121/3551.htm
[3]https://www.qcc.com/firm/3903aa13076b2df3918d75f504bb9395.html


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关阅读
#杂志目录

《今古传奇·人物版》杂志2022年06期最新目录订阅

目录卷首语丨正青春百年前,中国革命的红船从浙江嘉兴南湖启航。一群青年的宣誓穿透了20世纪旧中国的黑暗,将革命的火种带向全国。中国的历史从此开启全新的篇章。 小小红船,见证了中国共产党的诞生,成为中国革命源头的象征...

#杂志目录

《高中时代》杂志2019年12期最新目录订阅

目录卷首语丨重复和局限里也有广阔图景每到年底的时候,人总免不了要去想想时间的意义,对于我们究竟意味着什么? 我们总是很容易沉没于生活日复一日的重复,或者投入到自己所追求的事业上,以至于忘记了自己所做的事情其实在...

#杂志目录

《教育传媒研究》杂志2021年06期最新目录订阅

目录卷首语丨立鸿鹄之志 成经纬之才新闻与传播学科是一个比较年轻的学科。我们的目标十分明确,就是要积极地回应社会和行业的需求,培养有思想、有情怀、有操守的卓越传媒人。新闻传播学科的学生不一定全部进入传媒行业,只要...

#杂志封面

《时代金融》杂志_时代金融2020年第14期杂志封面

《时代金融》杂志_时代金融2020年第14期杂志封面

#杂志目录

《中小学管理》杂志2020年11期最新目录订阅

目录卷首丨构建充满生机活力的现代化教育体系党的十九大开启了我国优先发展教育、加快教育现代化、建设教育强国的新征程。《中国教育现代化2035》在实现教育现代化的路径中明确指出,“要充分发挥基层特别是各级各类学校的积极...

#杂志目录

《阅读(低年级)》杂志阅读(低年级)年阅读(低年级)期最新目录订阅

目录晨曦微微丨春雨盼pn望wnɡ了le整zhěnɡ整zhěnɡ一y个ɡ冬dōnɡ季j,终zhōnɡ于y,你nǐ来li了le。 看kn着zhe你nǐ,我wǒ的de目...阅读长廊丨小草坪我wǒ家jiā门mn前qin,有yǒu一y块kui小xi...