事项:
2022 年11 月30 日人工智能实验室OpenAI 发布全新聊天机器人模型ChatGPT,其是一款人工智能技术驱动的自然语言处理工具。自从ChatGPT 推出以来,受到市场广泛关注,当前每日用户超过1000 万人。
【资料图】
评论:
Chatgpt 成本主要可以拆分成训练和推理两个阶段。人工智能主要分为计算机视觉和自然语言处理两大基础方向,当前自然语言处理类任务基于大型语言模型(LLM,Large Language Model)演进出了最主流的两个主要方向,BERT(基于Transformer 的双向编码器表示技术)和GPT(基于Transformer 生成预训练技术),Google 属于BERT 技术方向,微软投资的OpenAI 属于GPT 技术方向。从计算过程上,人工智能计算主要可以分为模型训练与推理两个阶段,针对大语言模型LLM 更是如此,随着参数与数据规模的不断增大,将带动拉动算力需求的快速增长。
“token”是当前语言类模型的数据单位。当前的自回归语言模型是根据token 来作为单位进行数据处理和计算,分词(tokenization)就是将句子、段落、文章这类型的长文本分解为以token 为单位的数据结构,把文本分词后每个词表示成向量进行模型计算。例如在英文语境下,“happy”可能被分解为“hap”、“-py”两个token,中文语境下,“我很开心”可以分成“我”,“很”,“开心”三个token。
以英伟达DGX A1OO 服务器作为计算资源:(1)单台服务器售价20 万美元;(2)采用云服务单天成本约为460 美元。根据英伟达官网数据,英伟达超算GPU 系列从旧到新包括P100、V100、A100、H100等,其中,DGX A100 系列服务器为2020 年发布,是当前主流使用的超算服务器,单机有8 个A100 系列GPU,AI 算力性能为5 PetaFLOP/s,单机最大功率6.5kw,售价19.9 万美元;如果租用云服务,根据亚马逊数据显示,在亚马逊AWS 预定一年的A100 系列GPU,有8 个A100 的AWS P4 实例的平均成本约19.22 美元,一天的平均成本约为461.28 美元。
ChatGPT 上一个30 字的问题需要消耗计算资源0.12 PetaFLOP/S。最常见的Transformer 类语言模型在推理过程中每个token 的计算成本(以FLOPs 为指标)约为2N,其中N 为模型参数数量(20 年发布的GPT-3 拥有1750 亿参数,22 年谷歌发布的PaLM 拥有5400 亿参数,由于并未公布当前GPT3.5 的参数数量,当前假定参数数量为3000 亿),假设模型的FLOPS 利用率约为20%,粗略估计ChatGPT一个30 字(假设约40 个token,注:在英文语境下,一般1000 个token=750 个单词)问题需要的算力资源为2*40*3000 亿/20%=0.12 PetaFLOP/S。
推理成本:为满足当前用户访问产生的推理成本,自建IDC 初始投入约在4 亿美元,租用云服务每日成本约28 万美元。根据Similarweb 的数据,23 年1 月份当前ChatGPT 日活约1300 万人,每人平均1000 字左右的问题,因此合计产生约130 亿字(173.3 亿个token),假设24 小时平均分配任务,需要的A100 GPU 数量为173.3 亿*2*3000 亿/(20%*24 小时*3600 秒)=601.75 PetaFLOP/S,由于访问流量存在峰值,假定访问峰值是一天均值的5 倍,因此共需要602 台DGX A100 服务器能够满足当前的访问量。
(1) 自建IDC:服务器成本约占数据中心成本30%左右,为满足当前日常访问需求,前期一次性成本投入约为602*19.9/30%=3.99 亿美元;
(2) 云服务:假设每天租用亚马逊AWS 云服务,每天成本为461.28*602=27.77 万美元。
训练成本:训练阶段每个Token 的训练成本约为6N(推理成本为2N),由于每年训练成本都在快速下降,此处引用OneFlow 的测算结果,在公有云中训练OPEN AI 的GPT-3 模型需花费训练成本约140万美元,Google 的PaLM 模型需花费训练成本约1120 万美元。
预计在ChatGPT 结合Bing 搜索功能后,其对算力资源的消耗将成数倍增长。当前ChatGPT 模型可以理解为在一个在庞大训练数据集上训练的LLM,它会将训练期间的知识存储到模型参数中。在推理过程中(使用模型生成输出),LLM 无法访问外部知识,仅依靠模型参数进行计算;如果将ChatGPT 与搜索功能结合,如Bing 等搜索引擎,其计算过程将通过搜索引擎返回多个查询结果,并通过GPT 计算生成多个响应,在返回最高分的响应给用户,其对算力资源的消耗将成数倍增长,增长倍数取决于搜索和响应的个数。
投资建议:
当前处在以ChatGPT 为主线的新一轮人工智能创新周期,ChatGPT 为人工智能产业注入新活力,有望带动AIGC 类应用快速爆发,人工智能技术作为驱动数据经济的技术底层,有望迎来新的发展机遇。数据、算力与算法是人工智能时代的三大基石,三者相互促进带动AI+应用快速落地,ChatGPT 为首的自然语言处理类技术及应用,有望迎来全面爆发,建议重点关注人工智能相关赛道。
风险提示:
模型假设不合理对测算结果造成偏差,ChatGPT 商业化落地不及预期。
为您推荐
- (2023-02-14)人工智能行业点评:CHATGPT对算力的需求究竟如何?
- (2023-02-14)天天观热点:2023年2月USDA农产品供需报告:全球大豆、玉米产需均下调
- (2023-02-14)全球聚焦:拓荆科技(688072):薄膜沉积设备龙头 营收、业绩高速增长
- (2023-02-14)世界视点!欧克科技(001223):生活用纸设备龙头 锂电隔膜设备打开成长空间
- (2023-02-14)四方光电(688665):定点项目再添大单 车载业务上新台阶
- (2023-02-14)兴发集团(600141)公司深度报告:周期兼备成长 乘景气之风开新局 世界即时看
- (2023-02-14)深度*宏观*宏观经济:将债务比作鸦片错得离谱|热点评
最近更新
- (2023-02-14)世界快资讯:卓品智能挂牌新三板:主营汽车电子控制系统,2021年营收6131万元
- (2023-02-14)比本周CPI更让美国消费者头疼:新的通胀压力可能来自供应链
- (2023-02-14)化妆品巨头交卷2022年,持续加码中国市场 焦点热文
- (2023-02-13)视点!凯安新材(870979):拟定增2000万元
- (2023-02-13)科创新材:拟投资1.3亿建设年产 6000 吨新能源电池材料用碳化硅复合材料生产线
- (2023-02-13)北交所龙虎榜|天宏锂电今日成交1.19亿元,换手率达33.75% 世界关注
- (2023-02-13)全球即时:索克服务(832816):拟对外投资2000万美元设立全资子公司
- (2023-02-13)全球快报:东方红(834205):股东解除限售股票30.09万股
- (2023-02-13)凯雪冷链(831463):拟向银行申请贷款额度不超1.15亿元-当前最新
- (2023-02-13)硅烷科技接待19家机构的调研,公司2023 年预计硅烷产量在2200吨左右
- (2023-02-13)全球快资讯:开瑞物流(832879):信息披露人增持挂牌公司105.54万股股份
- (2023-02-13)意天物联(835405):拟定增1457.14万元,用于补充流动资金和偿还银行贷款
- (2023-02-13)盘面震荡收涨,次新股集体爆发、天宏锂电领涨 环球微速讯
- (2023-02-13)环球今热点:欧洲“碳关税”又进一步!关键委员会投票通过 距正式立法仅一步之遥
- (2023-02-13)北交所早盘收评:次新股全线爆发,乐创技术、天宏锂电大涨近20%_全球热头条
- (2023-02-13)头条:中企科信挂牌新三板:主营通信网络工程,2021年净利1155万元
- (2023-02-13)AI“红得发紫”,结局会“一地鸡毛”吗?这一次真的不一样 天天热头条
- (2023-02-13)后悔脱欧了?有爆料称英政府正私下起草重建英欧关系计划
- (2023-02-12)天天动态:预计盈利最高8.5亿元!多只北交所准新股业绩亮相,锂电池概念股盈利倍增
- (2023-02-12)“最严”银行资产分类标准落地,7月1日起实施
- (2023-02-11)热点!详解北交所24家公司业绩预告:逾六成预喜,6家净利翻倍
- (2023-02-11)顶尖原油交易员:市场要数月才会意识中国需求强劲,油价今年可达140! 全球报资讯
- (2023-02-11)北交所&新三板周报:北交所两融业务下周一正式启动;1月国内M2增速创6年新高;下周2只新股申购、3只新股上会-焦点热闻
- (2023-02-11)开门红如期而至!1月信贷新增4.9万亿创单月新高 消金、理财子等纳入金融统计有何深意?
- (2023-02-11)1月CPI同比涨幅重回“2时代”, PPI和CPI“剪刀差”走阔
- (2023-02-11)今日热文:1月车市下滑超三成:新能源车企业绩分化,业内对全年增长预期乐观
- (2023-02-10)【环球新视野】北交所两融业务将于2月13日正式启动
- (2023-02-10)连城数控:拟1.2亿元出售控股子公司股权
- (2023-02-10)环球观天下!恒立钻具接待1家机构的调研,工程破岩工具生产基地建设项目前正进行地勘及设计公司出图
- (2023-02-10)科达自控接待22家机构的调研,立体式”新能源充电业务预计在2023年公司收入中占一定比例 时快讯