首页 > 资讯 >

计算机行业深度报告:AI偏向科普性报告:围绕算法、算力、数据和应用-全球新资讯

2023-05-30 17:32:01 来源:东吴证券国际经纪有限公司


(资料图)

投资要点

大模型是AI 开发的新范式,是人工智能迈向通用智能的里程碑:大模型指通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型,本质依旧是基于统计学的语言模型,只不过“突现能力”赋予其强大的推理能力。现有的大模型的框架在本质上是一致的,几乎所有参数规模超过千亿的大语言模型都采取GPT 模式,但是不同类型的企业给予自己所在领域的优势,开发的大模型在功能上还是有所差异。技术对大模型的效果具有决定作用,因此未来竞争格局也依赖于技术突破。

算力是AI 时代的“石油”:大模型的训练和推理都会用到AI 芯片的算力支持,在数据和算法相同情况下,算力是大模型发展的关键,是人工智能时代的“石油”。我们假设GPT-3 训练时间为一个月,则需要843颗英伟达A100 芯片。我们假设GPT-3 每日日活为5000 万,则需要约16255 颗英伟达A100 芯片。GPT-4 为多模态数据,我们预计算力需求量是GPT-3 的10 倍以上。中国大厂相继布局大模型,我们测算,仅十家头部厂商大模型1 年内有望增加约20 万片A100 需求量。长期来看,则需求量有望超200 万片,新增算力需求将使算力市场增长2 倍以上。

2021 年,中国加速卡市场中Nvidia 占据超过80%市场份额,国产AI 芯片性能与海外仍有差距,国产大模型推出有望加快国产芯片发展。

数据资源是AI 产业发展的重要驱动力之一:数据集作为数据资源的核心组成部分,是指经过专业化设计、采集、清洗、标注和管理,生产出来的专供人工智能算法模型训练的数据。大规模语言模型性能强烈依赖于参数规模N,数据集大小D 和计算量C,训练数据主要来自于维基百科、书籍、期刊、Reddit 社交新闻站点、Common Crawl 和其他数据集,GPT4 依靠大量多模态数据训练。未来AI 模型的竞争力或体现在数据质量和稀缺性,发展数据要素市场,促进相关公共、企业、个人数据的进一步放开,将为国内AI 发展提供重要支撑。

AI 赋能各行各业,未来是AI 应用的星辰大海:AI 堪比第四次技术革命,本轮最直接的应用在内容创作领域,打开产业的想象边界。我们应该去寻找在AI 赋能下,应用功能显著改善、客户粘性显著提升,市场空间大幅提升的领域,主要有内容创作,办公软件,ERP,机器人以及芯片设计领域。当前部分大模型厂商已经开启产业化应用,但是算力依旧是限制AI 大规模商业化落地的主要原因,一旦解决,直接受益AI+的将是信息化行业,因此我们看好各行业信息化领域处于优势地位的龙头公司。

投资建议:算法上,我们建议关注已经有先发优势的大模型公司:三六零、科大讯飞、同花顺等,此外还有一些实施企业,如软通动力、润和软件、汉得信息等;算力上,我们推荐景嘉微、中科曙光、神州数码,建议关注海光信息、寒武纪、四川长虹、拓维信息等;数据上,我们推荐各细分赛道的信息化龙头企业,如久远银海、容知日新、中控技术,建议关注国能日新、千方科技等;应用上,我们推荐在具备“杀手级”

应用潜能的厂商金山办公、用友网络、恒生电子,建议关注广联达、石基信息等。

风险提示:政策推进不及预期;行业竞争加剧

关键词

最近更新