国产GPU谁能打破算力封闭推进我国AI高速开展？

若想了解更多请致电182-2185-4021

　　近来，英伟达在美国加州总部举办了面向软件开发者的年度技能峰会GTC。在会上，英伟达创始人黄仁勋披露了最新人工智能相关的软硬件技能，并在讲演中将“AI的iPhone时间”这句话重复强调了三遍。

　　事实上，英伟达与AI可谓是缘分不浅，到现在，英伟达的GPU芯片正在为全球绝大多数的人工智能系统供应最根底的算力支撑，而ChatGPT母公司OpenAI，就是凭借着10000片英伟达的GPU芯片，成功练习出了GPT-3大言语模型，震动了全世界。

　　那么，供应了全球高端人工智能多半算力的英伟达CEO黄仁勋，为何在此次大会中将ChatGPT带来的改变称为“人工智能的iPhone时间”？在“人工智能的iPhone时间”背面，又是哪些根底硬件设施与相关的企业支撑着AI职业不断前行呢？

　　本文将以英伟达发布会为切入点，介绍国内GPU职业相关企业的开展现状，从而叙述为何算力缺少的原因，以期为读者展现GPU职业的现状与未来开展。

　　作为全球算力硬件名副其实的龙头公司，英伟达每年的GTC大会都吸引着很多顶级科技工作者的目光，尤其是在2023这个ChatGPT的出圈元年，作为人工智能硬件的首要供应商，英伟达GTC的曝光量更是得到了明显的添加。

　　而在此次大会中，英伟达展现了其针对练习、推理、云服务等多维度的ChatGPT范畴布局。

　　依据GPU并行核算的特性以及英伟达在AI范畴的前瞻布局，英伟达在AI练习范畴具有肯定优势，一起十分重视人工智能赛道，不断提高其人工智能硬件的核算才能。

　　而且，跟着GPT大模型关于算力需求的提高，全球科技巨子均已开端或行将搭载英伟达的H100产品：Meta已在内部为团队布置了依据H100的Grand Teton AI超级核算机；OpenAI将在其Azure超级核算机上运用H100来为其继续的AI研讨供应动力。

　　而在此次GTC 2023上，依据Hopper架构及其内置Transformer Engine，英伟达H100针对生成式AI、大型言语模型（LLM）和引荐系统的开发、练习和布置都进行了优化，运用FP8精度在LLM上供应较上一代A100更快的练习及推理速度，助力简化AI开发。

　　而在AI推理范畴，AI视频、图画生成、大型言语模型布置及引荐系统也在加快布置。

　　在本年的GTC 2023中，英伟达推出了全新的GPU推理渠道：依据加快AI视频、图画生成、大型言语模型布置和引荐系统，形成了4种装备、1个系统架构和1个软件栈的产品系统。

　　其间H100 NVL GPU受到了商场较为广泛的重视：英伟达在GTC 2023揭露表明，该产品将装备双GPU NVLink，或将完结比现用A100快10倍的速度，可处理具有1750亿参数的GPT-3大模型，并支撑商用PCIe服务器扩展，适用于练习大型言语模型。

　　黄仁勋称，相较于现在仅有能够实时处理ChatGPT的HGX A100，一台搭载四对H100和双NVLink的规范服务器能将速度提高10倍，而且还能够将大言语模型的处理本钱下降一个数量级。黄仁勋也将NVIDIA DGX H100称作全球客户构建AI根底设施的蓝图。

　　黄仁勋也表明，ChatGPT仅仅是人工智能榜首个出圈的运用，也仅仅一个起点。在人工智能浪潮降临之时，全球范围内必将呈现一批进军人工智能大模型硬件的企业。但英伟达在短期内具有肯定的技能优势，未来也将继续发力。

　　毫无疑问，英伟达发布的最新硬件关于人工智能企业来说，是处理算力问题的最大福音，但关于我国企业来说，这却并非是一则喜讯。

　　2022年8月，美国监管组织以国家安全为由，对NVIDIA A100、H100两款GPU施行禁令，不得出售给我国企业，意在经过“卡脖子”的方法来下降国内AI模型的传输速度，延迟我国人工智能开展。

　　从长远来看，未来大模型的研制和布置是必然趋势，而每个大模型练习和布置的背面，都有几万个 GPU 芯片在支撑。因而，未来跟着这方面的研制和运用的遍及，通用 GPU 商场需求将会迎来爆发式添加。

　　而我国能获得的最佳代替品，则是英伟达专供我国的A800芯片，也是A100的“版”，其传输速度只要A100的70%，而在H100大规模供货后，中美AI公司的间隔则将进一步拉大。

　　但也正是在算力需求激增、硬件供应被堵截、难以真实“商场化”的布景下，国内才呈现了一批GPU的“火种”企业。

　　这些新式的企业中，中心团队根本都是业界顶尖专家，许多技能专家来自英伟达、AMD 等世界龙头企业。草创企业们连续完结新融资，并连续推出新品加快商业化。

　　首要，是借军工信息化之风迈向全面国产代替的GPU企业景嘉微。

　　景嘉微的技能中心团队来自于国防科技大学，公司事务也是依托军工事务图形显控模块芯片发家，继续投入研制布局全自主研制GPU芯片的图形显控传统事务。

　　在后续的开展中，伴跟着国家专项基金的支撑与企业芯片研制的推进，公司的GPU芯片事务逐步“开枝散叶”，浸透入了民用商场，在“8+N”个职业中进行着快速的开展。

　　截止现在，公司是国内首家成功研制国产GPU芯片并完结大规模工程运用的企业，也是国内仅有具有彻底自主研制GPU才能并产业化的上市公司，现在已具有267项专利，在图形显控范畴走在职业前列。

　　材料来历：中关村在线，芯参数，Nvidia 官网，公司公告，太平洋证券研讨院

　　而在与公司的沟通中，相关人员表明，之前的7系列分为多个版别，依据客户的需求、价格和价位承受才能来合作出货，所以获得了较大的成功。而9系现在还在谈价的过程中，也信任9系列会促进全球显卡价格的下行。

　　而且对方还表明，公司对标的是海外竞争对手几年前的产品，而当赢利低于必定程度后，海外的公司会自动抛弃商场。公司也会从相对的低端做起，跟着技能的前进，逐步追逐英特尔、AMD的脚步。

　　虽然现在景嘉微的产品与世界顶级GPU存在着极大的间隔，但作为一颗由我国企业彻底独立研制、选用正向规划、具有自主知识产权的GPU，现已迈出了国产自主道路上的一大步，成为我国算力的“期望之火”。

　　接着，是依托CPU、DCU双轮驱动，深度获益国产化代替的企业海光信息。

　　海光信息成立于2014年，主营事务为研制、规划和出售运用于服务器、工作站等核算、存储设备中的高端处理器，现在具有海光通用处理器（CPU）和海光协处理器（DCU）两条产品线。

　　而其间，DCU作为专心通用核算、单纯供应人工智能算力的产品，成为了企业新的成绩添加极。

　　海光信息于2018年切入DCU范畴，坚持自主研制，现在现已成功把握高端协处理器微结构规划等中心技能，并以此为根底推出了功能优异的DCU产品，具有强壮的核算才能和高速并行数据处理才能，功能根本能与世界同类型干流产品同台竞技。

　　选取公司深算一号产品和世界抢先的GPU厂商英伟达的高端GPU产品（A100）及AMD高端GPU产品（MI100）进行比照，在典型运用场景下，海光信息深算一号单颗芯片的目标根本到达世界上同类型高端产品的水平。

　　对标现在世界干流人工智能企业都在运用的NVIDIA A100产品，海光DCU单芯片产品根本能到达其70%的功能水平，一起，公司DCU产品的片间互联功能还有较大的提高空间。

　　而在硬件之外，海光信息也为打破CUDA生态专门制作了软件装备：海光 DCU 协处理器全面兼容 ROCm GPU核算生态，因为ROCm与CUDA的高度相似性，CUDA用户能够以较低价值快速迁移至 ROCm渠道，因而，海光DCU协处理器能够较好地适配、习惯世界干流商业核算软件和人工智能软件，软硬件生态丰厚。

　　此外，海光还积极参与开源软件项目，加快了DCU产品的推行速度，并成功完结了与GPGPU干流开发渠道的兼容。

　　近些年来，在国内许多创企的尽力下，GPU硬件的打破捷报频传，但现在我国CPU厂商间隔英伟达等世界头部厂商的间隔依然还有很远。

　　所以关于我国GPU企业来说，做好国产的Plan B，再寻求开展，或许才是正确的方向。

　　但能够确认的是，跟着科技的前进，我国GPU算力职业必定要、也必定会脱节被“卡脖子”的问题，让我国的AI企业用上我国的GPU，打赢这场算力之战。

　　上文谈到了英伟达的算力“肌肉”展现与国产CPU的奋勇赶上，那么，当时人工智能企业的算力需求终究几许？为何“AI芯片”榜首股英伟达，能在短短不到四个月的时间内，股价暴升83%？

　　以GPT-3.5为例，作为一种大型言语模型，有着海量的参数。即便OpenAI现在没有发布ChatGPT所运用的 GPT-3.5 的相关数据，但由图可得，跟着新模型的推出，参数量需求呈现翻倍式添加。

　　而在参数量的添加之外，ChatGPT的下一代GPT-4还能够经过多模态来拓宽运用场景。

　　GPT-4作为一个多模态大模型（承受图画和文本输入，生成文本），比较GPT-3.5能够更精确地处理难题，具有更广泛的知识和处理问题的才能，文本处理才能更是到达了ChatGPT上限的8倍。

　　不过，伴跟着人工智能的老练而添加的，自然是其背面的算力需求：OpenAI估计，人工智能科学研讨要想获得打破，所需求耗费的核算资源每3~4个月就要翻一倍，所以呈现了算力需求爆破式添加的状况。

　　在半导体职业中，一向有着这样一种说法：“当价格不变时，集成电路上可包容的元器件的数目，约每隔18-24个月便会添加一倍，功能也将提高一倍。换言之，每一美元所能买到的电脑功能，将每隔18-24个月翻一倍以上。这必规律提醒了信息技能前进的速度。”

　　这就是咱们所熟知的摩尔规律，实际上，我们身边最直观的感触就是每大约两年左右，你的电脑或手机就要面对筛选的地步了，尤其是当今的智能手机，根本干流装备的手机，2年就得预备换新了。

　　可是，伴跟着半导体制程的继续演进，短沟道效应以及量子隧穿效应带来的漏电、发热等问题益发严峻，寻求经济效能的摩尔规律现已日趋放缓，乃至挨近失效。

　　也就是说，哪怕在需求不变的状况下，算力根底设施就现已该走上添加数量的赛道了，更何况算力需求正在以指数爆破的速度添加。

　　因而， AI 模型练习算力需求添加与摩尔规律呈现了极不匹配的现象，这必然推进对算力根底设施需求的快速添加，而这，也是英伟达等很多GPU硬件企业被资金追捧的根本原因他们手中握着敞开AI年代的金钥匙。

　　或许正如黄仁勋所说，“人工智能的iPhone时间”现已降临，走向下一个年代的路，早就摆在了世人面前。

　　可是很多最顶级的人工智能企业，还在为AI年代的“入场券”而忧愁犯难，昂扬的算力价格、永久缺货的高端GPU，成为了企业最大的软肋。

　　由此可见，关于未来的数字经济而言，算力等根底设施的舞台将会成为AI企业们乃至国家之间的榜首个角力场。正如全球闻名出资组织a16z点评ChatGPT时所说，“根底设施服务商或许才是最大赢家，获得最多的财富。”

　　包含AI在内的新技能在获得打破后，要想走入“寻常百姓家”，完结大规模的布置和运用，算力的安全、高速、高牢靠、高功能等才能缺一不可。乃至能够说，算力的增强真实驱动了数字经济的添加。

　　而关于我国企业来说，短期的封闭或许是窘境，但从别的一个视点来想也未必不是机会，以景嘉微、海光信息为代表的的我国高算企业，也必将在层层封闭中杀出，以杰出的产品，推进我国滚滚的数字化大潮！

上一篇:喷嘴体组件-碳化硅浓缩器耐磨板管件齿环挡块三通-姑苏上春仪监测程控设备制作有限公司
下一篇:蒸腾器作业原理蒸腾器的作业原理（的、分类及长处）