首页 > 资讯 >

传媒行业:GPT-4多模态模型推出 关注应用端机会-环球精选

2023-03-24 08:14:21 来源:南京证券股份有限公司


(资料图)

ChatGPT关注度持续提升。2022年11月,OpenAI推出大型语言模型ChatGPT在全球迅速引起了广泛关注。相较于传统的搜索模式,ChatGPT能够回复多轮问题、承认错误、质疑、拒绝,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列任务。其最大的创新在于文本内容生成,通过交互式对话来逐步理清用户的意图。科大讯飞副总裁、研究院执行院长刘聪表示,ChatGPT通过以下五个维度能力的显著提升,实现了初步的“智慧涌现”:海量高价值信息的全量在线记忆能力:自然语言输入的任意任务和多轮对话理解能力;复杂逻辑的思维链推理能力;多角色多风格的长文本生成表达能力;即时新知识学习应用与进化能力。

此外,因为引入了代码作为训练语料,ChatGPT还额外产生了自动写代码和理解代码的能力,到2023年1月末,ChatGPT获得1亿月活用户,而在此之前,抖音国际版达到1亿用户耗时9个月,Instagram则花了两年半的时间。

多模态预训练大模型GPT-4发布。3月15日凌晨,OpenAI发布了多模态预训练大模型GPT-4,此外还发布了技术报告和System Card,开放了GPT-4的API。GPT-4实现了几个方面的飞跃式提升:1)强大的识图能力。GPT-4能接受图像和文本输入,允许用户指定任何视觉或语言任务(包括带有文本和照片的文档、图表或屏幕截图上),输出文本内容。例如,给GPT-4一个长相奇怪的充电器的图片,问它为什么这很可笑,它可以识别出图片中给手机充电线是VGA:可以理解图表中数据的含义,并做进一步计算,如计算格鲁吉亚和西亚的人均每日肉类消费,计算平均数:可以直接上传物理题让它回答:可以理解一张照片里有什么不对劲的地方:可以直接把论文截图发给它,GPT-4可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。2)文字输入限制提升至2.5万字。GPT-4的长度限制提升到32K tokens,即能处理超过25000个单词的文本,并且可以使用长格式内容创建、扩展对话、文档搜索和分析等。3)回答准确性显著提高。美国高考SAT试题,GPT-4在阅读写作中拿下710分、数学700分(满分800);GRE几乎满分,逻辑能力超越GPT-3.5。4)在高级推理能力上超越ChatGPT。在律师模拟考试中,GPT-4通过了模拟律师考试,且分数在应试者的前10%左右;相比之下,GPT-3.5的得分在倒数10%左右。5)能够生成歌词、创意文本,实现风格变化。

关注应用端的落地及商业模式变革。ChatGPT的初步突破带来巨大影响和未来想象空间,是AIGC在文本生成领域的应用之一,开拓了AIGC在C端的广泛应用。在OpenAI官网上,罗列出48个使用场景,具体可分为回答、分类、代码、对话、总结、翻译和转换七类,基本涵盖日常所需的大部分文字使用场景。ChatGPT可满足使用者代码编写、语言翻译、回答问题、文本创作等办公场景需求:同时可以通过聊天、生成菜谱、生成健身建议等满足生活场景需求,迁移学习能力极大拓展了使用场景。从To B端来看,微软于2月8日发布了新版Bing搜索引擎,官方承认New Bing里的聊天是基于GPT-4模型的。此外,国内大厂也纷纷布局大模型的布局,百度即将在3月16日14时召开新闻发布会,正式推出大语言模型、生成式AI产品文心一言。多家影视、营销、新闻媒体、在线阅读、软件信息服务、金融等领域公司宣布成为百度文心一言首批生态合作伙伴,有望在B端快速建立生态。在商业模式上,OpenAI在2月初推出ChatGPT Plus试验订阅计划,价格为20美元/月,目前仅对美国用户开放。订阅者可以在流量高峰正常访问ChatGPT,享有更快的响应速度以及ChatGPT新功能使用优先权,有高峰时段使用需求的消费者可以通过订阅满足日常使用。ChatGPT plus订阅者可直接获得有使用上限的GPT-4的试用权,4小时内最多能发布100条信息。

投资建议:推荐关注拥有大模型搭建能力的龙头厂商,以及拥有应用端落地产品企业,关注广告营销、出版、影视、游戏、数字文化创意龙头企业。

风险提示:技术迭代不及预期;模型效果不及预期;政府监管趋严;伦理问题风险;商业化不及预期;行业竞争加剧等风险。

关键词

最近更新