首页 > 资讯 >

传媒行业：GPT-4多模态模型推出关注应用端机会-环球精选

2023-03-24 08:14:21 来源：南京证券股份有限公司

(资料图)

ChatGPT关注度持续提升。2022年11月，OpenAI推出大型语言模型ChatGPT在全球迅速引起了广泛关注。相较于传统的搜索模式，ChatGPT能够回复多轮问题、承认错误、质疑、拒绝，能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列任务。其最大的创新在于文本内容生成，通过交互式对话来逐步理清用户的意图。科大讯飞副总裁、研究院执行院长刘聪表示，ChatGPT通过以下五个维度能力的显著提升，实现了初步的“智慧涌现”：海量高价值信息的全量在线记忆能力：自然语言输入的任意任务和多轮对话理解能力；复杂逻辑的思维链推理能力；多角色多风格的长文本生成表达能力；即时新知识学习应用与进化能力。

此外，因为引入了代码作为训练语料，ChatGPT还额外产生了自动写代码和理解代码的能力，到2023年1月末，ChatGPT获得1亿月活用户，而在此之前，抖音国际版达到1亿用户耗时9个月，Instagram则花了两年半的时间。

多模态预训练大模型GPT-4发布。3月15日凌晨，OpenAI发布了多模态预训练大模型GPT-4，此外还发布了技术报告和System Card，开放了GPT-4的API。GPT-4实现了几个方面的飞跃式提升：1）强大的识图能力。GPT-4能接受图像和文本输入，允许用户指定任何视觉或语言任务（包括带有文本和照片的文档、图表或屏幕截图上），输出文本内容。例如，给GPT-4一个长相奇怪的充电器的图片，问它为什么这很可笑，它可以识别出图片中给手机充电线是VGA：可以理解图表中数据的含义，并做进一步计算，如计算格鲁吉亚和西亚的人均每日肉类消费，计算平均数：可以直接上传物理题让它回答：可以理解一张照片里有什么不对劲的地方：可以直接把论文截图发给它，GPT-4可以按像素处理其中的文字和图片，并给出对整篇论文的总结摘要。2）文字输入限制提升至2.5万字。GPT-4的长度限制提升到32K tokens，即能处理超过25000个单词的文本，并且可以使用长格式内容创建、扩展对话、文档搜索和分析等。3）回答准确性显著提高。美国高考SAT试题，GPT-4在阅读写作中拿下710分、数学700分（满分800）；GRE几乎满分，逻辑能力超越GPT-3.5。4）在高级推理能力上超越ChatGPT。在律师模拟考试中，GPT-4通过了模拟律师考试，且分数在应试者的前10%左右；相比之下，GPT-3.5的得分在倒数10%左右。5）能够生成歌词、创意文本，实现风格变化。

关注应用端的落地及商业模式变革。ChatGPT的初步突破带来巨大影响和未来想象空间，是AIGC在文本生成领域的应用之一，开拓了AIGC在C端的广泛应用。在OpenAI官网上，罗列出48个使用场景，具体可分为回答、分类、代码、对话、总结、翻译和转换七类，基本涵盖日常所需的大部分文字使用场景。ChatGPT可满足使用者代码编写、语言翻译、回答问题、文本创作等办公场景需求：同时可以通过聊天、生成菜谱、生成健身建议等满足生活场景需求，迁移学习能力极大拓展了使用场景。从To B端来看，微软于2月8日发布了新版Bing搜索引擎，官方承认New Bing里的聊天是基于GPT-4模型的。此外，国内大厂也纷纷布局大模型的布局，百度即将在3月16日14时召开新闻发布会，正式推出大语言模型、生成式AI产品文心一言。多家影视、营销、新闻媒体、在线阅读、软件信息服务、金融等领域公司宣布成为百度文心一言首批生态合作伙伴，有望在B端快速建立生态。在商业模式上，OpenAI在2月初推出ChatGPT Plus试验订阅计划，价格为20美元/月，目前仅对美国用户开放。订阅者可以在流量高峰正常访问ChatGPT，享有更快的响应速度以及ChatGPT新功能使用优先权，有高峰时段使用需求的消费者可以通过订阅满足日常使用。ChatGPT plus订阅者可直接获得有使用上限的GPT-4的试用权，4小时内最多能发布100条信息。

投资建议：推荐关注拥有大模型搭建能力的龙头厂商，以及拥有应用端落地产品企业，关注广告营销、出版、影视、游戏、数字文化创意龙头企业。

风险提示：技术迭代不及预期；模型效果不及预期；政府监管趋严；伦理问题风险；商业化不及预期；行业竞争加剧等风险。

关键词