首页 > 资讯 >

计算机行业:谷歌发布多模态模型PALM-E 智能化水平提升较大|世界热闻

2023-03-09 11:17:03 来源:广发证券股份有限公司


(相关资料图)

核心观点:

2023 年3 月6 日,谷歌和柏林工业大学共同发表论文,对其已开发的PaLM-E 多模态大模型的训练方法、训练环境及通用化效果进行了详细阐述。拥有的5620 亿参数的PaLM-E 大模型是在语言类模型PaLM(5400 亿参数)和视觉类模型ViT(220 亿参数)的基础上开发的。

通过在预训练的语言类大模型中嵌入图像、状态、感知等多类型数据,PaLM-E 模型不仅具备通用化语言能力,还能执行视觉问答、感知推理、机器操作等复杂的任务。

谷歌在AI 多模态大模型的训练方法上的探索已经初见成效,其成功经验可总结为:1、在同一时间段同时经过多种数据集、多种任务训练的多模态模型的泛化能力显著好于分时间段训练单一类型数据、单一任务的模型。2、利用虚拟场景补充日常现实场景中较少出现的任务,有利于提升训练数据的数量和质量,有效提升模型的训练效率。

PaLM-E 模型应用潜力较大,商业化前景较好。相较于经过单一类型数据训练的AI 模型,PaLM-E 多模态模型与人交互的方式不仅局限于语言、文字,还可以进行图片、三维物体的交互。PaLM-E 在训练时经过了文字、图像、感知、状态等多维度信息的训练,可交互的信息类型较多,通用性得到了大大增强,可应用的场景有较大拓展。未来,我们看好PaLM-E 在生活助理、仓储物流、服务机器人等场景的应用。

AI 大模型技术快速迭代,行业竞争愈发激烈。在ChatGPT 推出之后,谷歌、微软、百度等海内外科技公司纷纷加速了对AI 大模型的研发进度。在模型开发方面已经具有一定技术积累的情况下,我们预计各科技厂商推出AI 大模型的技术难度不大。未来,各科技厂商或将更加聚焦于AI 大模型的产品定位和商业化落地。在AI 大模型领域,各科技厂商能否探索出稳定、可持续的尤其是To B 端的商业模式并确定合理的产业链定位将会成为下一阶段竞争的关键。

数据质量和来源的广泛化与高质量是模型算法突破的重要基础条件。

在AI 大模型对于训练数据的数据量、场景覆盖面有较高要求的情况下,我们认为该领域的竞争将越来越集中在科技与互联网巨头群体内。

投资建议:建议关注百度、阿里巴巴在多模态模型领域的技术进展、商业模式的探索,以及生态链价值分布的趋势。

风险提示。技术处于发展早期,尚未形成成熟的商业化落地模式;研发投入较大与成果落地不及预期的风险;应用领域智能化升级需求不及预期。

关键词

最近更新