颜媛媛

华为版ChatGPT被否认已提前上线

日前有报道称,华为将发布一款直接对标ChatGPT的多模态大模型产品,名为“盘古Chat”。预计华为盘古Chat 将在今年7 月7 日举行的华为云开发者大会上对外发布以及内测,产品主要面向政企端客户。

据中国商标网显示,华为技术有限公司于近期申请注册了两枚“HUAWEI NETGPT”商标,国际分类为科学仪器、网站服务,当前商标状态为申请中。此外,华为已成功注册多枚“盘古”“PANGU”商标。

此前在中关村论坛现场,针对记者提问华为是否有信心去承载ChatGPT 这类规模的应用,华为昇腾计算业务CTO 周斌回应称,完全没有问题。“我们已经服务了国内几十家合作伙伴的大模型,至少从底层技术软硬件的规模上来讲,华为不比ChatGPT 少,ChatGPT所需的算力需求,我们已经经过了大规模验证,是完全没问题的。”周斌表示。

周斌在人工智能开放生态建设分论坛的演讲中称,华为基于“昇腾+ 昇思”全栈软硬件整合能力,支持适配AI 开源大模型。华为在支持大规模模型的分布式训练上做了非常多的工作,尤其是基于MindSpore AI 框架做自动化并行处理,可以极大减少大模型开发和调试工作。

随着关注度的提升, 华为相关负责人对媒体表示, 在此次云开发者大会上, 华为不会发布“ 盘古Chat”。以后是否会推出相关产品尚不明确,但不对标ChatGPT。目前华为依旧在大模型上加强研发。

华为将利用AI做什幺?

AI 浪潮势不可当的背景下,华为将如何结合AI 技术发展业务?

据了解,目前,AI 团队分散在华为多个部门或业务线,比如华为云、计算产品线以及5G 相关部门等,并没有一个整体统一的AI 部门。

不过,早在几年前,华为就已开始布局大模型领域。

根据华为披露的时间表,华为盘古大模型从2020 年启动研发,2021 年4 月,华为发布了盘古NLP(中文语言)大模型、盘古视觉大模型、盘古科学计算大模型;2021 年9 月,华为推出用于药物研发细分场景的大模型;2022 年,华为与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。

目前,华为云盘古大模型已经在医药研发、电力、煤矿、气象、小语种等领域落地。去年,华为云就已交付了一个阿拉伯语的千亿参数大模型,盘古科学计算大模型也用在了气象预报、海浪预测等方向。

今年4 月,华为云AI 领域首席科学家田奇透露,过去几年,华为主要聚焦打造“盘古”系列的预训练大模型。大模型诞生分两个阶段:第一是预训练阶段,由海量数据来运行链路的通用底座基础模型;第二是针对下游的千行百业的具体任务,基于行业数据进行微调,同时华为也布局了第三步,即大模型迭代。

华为发布全球首款算力路由

相对语言模型,华为面向全球发布首款800GE 数据中心核心交换机——CloudEngine 16800-X 系列,正式开启数据中心800GE 时代。

算力应用的浪潮兴起再次引爆企业对于AI 的大力投入,由此带来计算能力等底层技术的升级,数据中心的吞吐量将被提升到全新高度。以互联网行业为代表的大型企业,急需网络满足大带宽、低时延、高性能等高要求。随着400GE 在超大规模数据中心应用的普及,数据中心网络正朝着更高的速度发展——800GE。根据研究机构DellOro Group 发布的《数据中心交换机市场五年期预测报告》显示,预计2025 年800GE 交换端口的速率有望超过400GE。

华为数据通信产品线副总裁邱月峰表示,据中国算力发展指数白皮书显示,预计2023 年智能算力占比将高达70%, 以ChatGPT 为代表的AI 大模型参数量将增长115 倍,预计2030 年AI 算力将增长500 倍。海量数据来袭,数据中心需要超强性能的设备来构筑行业智算“高速公路”。本次发布的业界首款800GE 数据中心核心交换机CloudEngine 16800-X 系列,具备业界288×800GE 端口数量,可高效支撑AI 训练等业务,100% 释放算力。