端侧AI，如何化解国内算力之困？

2023-08-18 12:33:02

微信公众号：AI新智能

解决了算力之困后，端侧大模型将有可能*引爆本轮AI革命的盈利点。

算力和数据的天花板，决定了本轮的AI热潮究竟能走多远。

但不幸的是，对国内而言，其中的算力天花板，离“到顶”已经越来越近。

(资料图片)

就在8月初，美签署最新行政令，禁止美国对中国计算机芯片等敏感技术进行一些新投资，重点将在限制美国资本对于中国半导体设计软件和制造硬件的投资。

此消息一出，不少人顿感：国内算力危矣！

而机警的大厂，也开始了各自未雨绸缪的准备。

《金融时报》的一篇报道称，国内包括阿里、字节在内的科技巨头，已经订购50亿美元的英伟达的A800芯片，来面对训练大语言模型需要的算力挑战。

按照此前媒体报道，目前中国企业GPU芯片持有量超过1万枚的不超过5家，拥有1万枚A100的至多1家。

那么，在愈发紧张的算力之下，中国AI的前途、命运将如何发展？

短期来看，算力之困对于业内，似乎是个无解的问题。然而，技术的发展，有时就像生物的进化，当一种技术在面临“生存挑战”时，也会由于选择压力而发生一系列的突变。

而对国内而言，这样的突变方向，也许就是分散于各个终端里的端侧大模型。

1

端侧大模型，如何解算力之困？

端侧大模型的发展，对国内算力突围有着怎样的意义？这还得从目前云计算的需求说起。

当下，面对大模型高昂的算力成本，许多致力于涉足AI领域，但却算力匮乏的企业，往往都选择了租用云算力的方式，来满足训练需求。

在此背景下，昇腾AI集群这样的云服务平台也趁势而起，成为了孵化国内各个大模型的“母工厂”。

然而，即使是云计算本身，也需要大量的GPU支撑。

如果云服务商无法获取足够的GPU资源，那么它们也无法为国内AI企业提供高效、可靠的云计算服务。

而端侧AI最重要的意义，就在于分担了目前国内云计算的压力。

倘若我们将十几亿分散的智能手机，当成了一个个潜在的、拥有大量闲置算力的移动计算单元，那么部署在手机中的端侧AI，就能在这些设备闲置时间里，将这些碎片化、分布式算力利用起来，产生颇为可观的规模效应。

具体来说，联邦计算，就是这样为人熟知的分布式计算方式之一。

所谓联邦计算，简而言之，就是在数据源（例如用户设备）上进行模型的局部训练，然后将这些局部模型的参数或更新聚合到中央服务器上，形成一个“全局模型”。

相比于集中式的训练，这种分布式的方式可以更好地利用各个设备的计算能力，降低中央服务器的算力需求。

在这样的过程中，依靠终端设备（例如手机）的庞大数量规模，每个“全局模型”的训练成本，在无意中便被不断摊薄了。

因为每个“小模型”的训练只需要消耗端侧设备的计算资源，而不需要传输大量的原始数据到云端。这样，就可以节省网络带宽和云端存储空间，也可以减少云端服务器的计算压力。

更重要的是，与云端GPU这类高成本的训练方式相比，由于端侧AI芯片往往是针对特定的AI应用和算法，进行优化和定制，因此其往往有着相对更明确的“回血”途径。

例如，前段时间，爆火的妙鸭相机，大家应该都听说了。在其最受追捧的初期，成千上万的用户涌进应用中，高峰期一度有4000-5000人排队，需要等待10多个小时才能出片。

之后，是阿里云进行了紧急扩容，才勉强应对了这暴涨数百倍的算力需求。

但倘若用户不用在云端等待，而是直接在本地，或者通过端云协同的方式，就能实现这样的生成效果呢？

一种可能的方式，是先在端侧生成低分辨率的图片，之后再上传到云端，用较少的资源对图片进行清晰化处理。

如此一来，既降低了云端算力的负担，又在一定程度上保障了生成的质量、效率。

在当下的AI应用开发中，开发者不仅需要支付云端大模型API接口的成本，还得自己租用服务器，保证密钥安全。

如果是文字生成类AI，文字量大的话，相应的token也是一笔不小的开支。

而随着算力门槛的降低，众多AI应用的开发者，将不再被云端算力的成本所缚，而只需调用端侧大模型提供的开放API，就可以快速开发各类AI应用。

在此基础上，一个开放的、多样化的AI应用生态，就随着端侧大模型的普及，而应运而生了。

2

以“偏”补“全”的端侧芯片

AI应用井喷的时代似乎近在眼前，但要想让每台手机都标配一个大模型，前面还有道难以回避的门槛——硬件基础。

由于芯片架构不同，在端侧部署时，往往需要对模型网络结构进行一通修改才能勉强“上车”。

具体来说，目前GPT这类主流AI所使用的Transformer架构，往往部署于云端服务器。

这是因为GPU对于MHA结构（Transformer中的多头注意力机制）计算支持更友好。而端侧AI的芯片，则主要侧重于CNN（卷积神经网络）的结构。

如果将前者强行转移到端侧，带来的一个明显问题，就是模型精度下降。

那么有没有什么办法，能让大模型在进行端侧化改造的同时，仍能保证其精度呢？

爱芯元智推出的端侧芯片AX650N，似乎提供了一个可能的路线。

AX650N芯片拥有自研混合精度NPU和爱芯智眸AI-ISP两大核心技术，其对Transformer结构的网络进行了专门的优化，在其NPU中增加了专门用于自注意力计算的单元，可以大幅提升Transformer网络的运行速度和准确率。

凭借着这类针对端侧的优化技术，AX650N已经做到了在端侧部署原版Swin Transformer只需要5分钟，而跑起私有模型，只要1个小时就能搞定。

但尽管如此，受限于架构和内存，这样的优化，仅仅只是针对视觉大模型方向而言的，因为从硬件算力上来说，端侧AI芯片，始终难以做到GPU芯片那样“面面俱到”的通用性、兼容性。

既然如此，国内的大模型之困，是否就指望不上它了？

其实不然，从量的角度来讲，边缘侧、端侧的需求一定比云侧更大，毕竟边缘侧、端侧设备会更多。

而在这众多的需求中，只要使用了大模型的终端（如手机、智能音箱），能做到两点，那么国内大模型在应用层，就有盘活的可能。

其中*点，就是够降低人们获取信息、知识的成本。

倘若以后人们打开手机或者其他终端，就能获得一个诸如私人医生和律师、厨师的AI助理，能为我们提供成本低廉、快速的咨询服务，那么人们就会对其产生依赖。

因为从行为学上来说，人总归是有惰性的。

虽然目前的某些律所，也能为人们提供免费的咨询服务，但这其中却包含了无形的时间成本、沟通成本。

正如互联网出现后，虽然人们仍能通过纸制地图进行导航，但大部分人却再也离不开手机上的定位功能一样。

从某种程度上说，压缩了各种知识、智能的端侧模型，将会重复这一过程。

第二点，则是个性化功能的普及。

在“前AI时代”，个性化定制的大规模推广，是一件不可想象的事。

在没有AI技术支持的情况下，实现个性化定制通常需要大量的人力和时间投入。为每个用户提供个性化的产品或服务，往往需要大量的人工处理。

然而，随着本轮AI革命的到来，人们已经在应用层，看到了AI用于个性化、定制化服务的可能。

例如character.Ai一类的应用，支持用户根据自己的需求、偏好，量身定制一个“AI伴侣”。

试想一下，倘若这样的定制化服务进入到了端侧，端侧大模型就能不断收集用户数据，再进行反馈、训练，并最终打造出一个*的、贴身的AI助手。

而这样量身定制的体验，显然比大规模的标准化服务，更具吸引力。

3

总结

尽管在模型规模、性能等方面，端侧大模型目前还远无法与云端大模型相比，但分布式的算力格局，以及庞大的规模效应，都将大大降低目前国内云端算力的负担。

而在算力成本降低之后，大量基于API接口的AI应用，也得以通过一个个部署在本地的端侧大模型不断涌现。

在应用大爆发的背景下，一些捕捉到先机的应用，就会基于端侧大模型实时响应、个性化定制的功能，引爆本轮AI革命真正的盈利点。

而这，正是无数人在这股AI浪潮中苦苦追寻的。

关闭

相关推荐

端侧AI，如何化解国内算力之困？

向量在word中怎么输入向量符号怎么在word

QQ空间保存视频“被外星人劫走”？回应来了

麦克海尔：哈登15年训练营报到时很胖&不想打球他有备而来要炒了我

关键词：

精彩组图

最新速递

海口龙华法院扫除“执行障碍” 兑现2000余万元

科沃斯发布新款扫地机器人DEEBOT X2

国防军工板块强势崛起主力加仓龙头股超亿元机构建议重点关注三条主线

昆明提高二孩、三孩家庭住房公积金贷款额度最高104万元

机械键盘背景灯怎么调_机械键盘背景灯光怎么关闭

学生自救自护指导手册(关于学生自救自护指导手册简述)

qq怎样隐藏图标不让别人发现（qq怎样隐藏图标）

蓝蜗牛(关于蓝蜗牛简述)

多人 VR 剑斗游戏《Broken Edge》将于 9 月 19 日登陆 PSVR2 头显

“入秋吃八宝，健康身体好”，八宝指啥？顺应时节，为健康打基础

误闯单行道应该怎样处罚,法律怎么规定的

女人“下面松弛”，是亲热过多导致？这2个原因，男女都需知道

近代国人为何不关注“人种论”？

宝骏内涵比亚迪：前脚“在一起”，转头“捅一刀”？

菲仕兰全球 CEO 范晏德：对出生率提升有信心，持续渗透下线市场

国际贸易实务专业介绍（国际贸易实务专业简介）

撒拉弗和米迦勒谁厉害（撒拉弗）

网上贷款拖欠四十万超过3天利息怎样计算

识叹好玩广州花式留客

深水海纳: 关于拟续聘会计师事务所的公告

中国造不出世界主流水平的汽车发动机吗？

美国30年期按揭贷款利率涨至7.09%，创2002年以来新高

深耕服务实业新样板招商证券与招商期货打出“三板斧”

卧龙区光武街道：开展“安全伴我成长”安全教育活动

电脑调节音量的快捷键不显示（电脑音量快捷键怎么没了）

官方：今年剩余时间主场比赛，曼城将为球迷提供官方往返客运服务

上海一住户把鞋放外面，说什么都不收回屋里，让女子回家看到都烦

苏索不想罚点球？塞维主帅：不该换下拉梅拉，不想再谈论苏索

speak to sb speak to sb

免费！超67000名闵行人受益

青海省庆祝中国医师节大会在西宁举行

太8了！7月份全社会用电8888亿度太阳能装机容量超水电

广州发展集团参与起草的两项团体标准正式发布

岱勒新材拟定增募资不超1.5亿元

广西北流破获一起跨省非法制售伪劣电子烟案

专家称普通人每年会感染新冠1至3次具体什么情况？

【多彩新论】以“绣花功夫”建务实之功

顶流！手慢无！杭州动物园大熊猫馆试运行前三天里预约很紧张啦

清远汽车电子供应链大会活动即将举行

扬杰科技最新公告：GDR存续数量所对应基础股票数量不足中国证监会批复数量的50%

德科立: 无锡市德科立光电子技术股份有限公司关于以简易程序向特定对象发行股票申请获得中国证监会同意注册批复的公告

百闻不如一“件”｜新奇特！机器人申请添加你为好友……

战场特种救援机器人亮相重庆可自动驾驶还能自主导航搜救

伊莱特“牵手”清华大学研发高温气冷堆用整体筒节

直播带货的暴富梦，该醒了！

这可能是世界上最严格的“全身体检”了……

92号汽油多少钱一升_1吨汽油多少钱

东西问丨李昕：人民币国际化将给世界带来什么？

国家卫健委：围绕中医药养生保健推动人工智能进入临床试验

成都车展专业观众日和普通观众日的区别

晶升股份(688478.SH)发布上半年业绩，净利润1508.77万元，同比增长447.17%，拟每10股派2.5元

五菱之光最新报价

欠费致电厂停运黎巴嫩全国大停电

快讯！马斯克发推称“刚刚抵达日本”

微脉发布大语言模型健康管理应用“CareGPT”

MLF、逆回购双降房贷利率跟降猜想

会计分为几个等级?（会计分为几个等级）

宁德时代高焕：神行超充电池，开启全民电动新时代

影史第一！2023暑期档票房破纪录

规模提升约5倍！珠海机场新塔台“海之珠”开建

映宇宙上半年预计净利润1.8-2.0亿元，同比实现扭亏为盈

x9vivo上市时间(vivo X9正式上市时间确定)

区域发展新亮点丨“相互奔赴”暖消费共绘优质生活圈——粤港澳大湾区协同发展观察

大众的新运动跑车在新加坡车展上首次亮相

俄乌局势进展：约4.5万莫斯科人参与特别军事行动乌称年内无法获F-16战机

这下不用上班了！美国狱警零元购《宝可梦》卡牌入狱

三五互联：证券简称拟变更为“琏升科技”

残忍的定义是什么

光正眼科股价站上5日均线，阳包阴能否一扫颓势？看9次回测数据n

宜昌市未满16岁周岁未成年如何申请护照

商品日报（8月17日）：纯碱主力飙升近6%近月封板涨停生猪重回弱势跌超2%

隆基绿能遭沪股通连续10日净卖出合计净卖出31.54亿元

澳洲原切牛肉自由，超市招聘牛肉试吃员需一天吃10斤，成功入职后春节还送一头牛

2023中国杯花样滑冰大奖赛选手完整名单正式出炉，中国队女单：安香怡、陈虹伊、朱易

纽泰格(301229.SZ)：上半年净利增185.54%至3108.97万元

杭叉集团：业绩说明会定于8月29日举行

飞龙股份：新能源热管理产品可以应用在充电桩领域，目前已有多个项目开始小批量供货

话很多的22楼编辑部丨小孩不把花钱当回事？孩子缺乏金钱观怎么办

派能科技：董事长提议8000万元-1.2亿元回购股份

伊索寓言读后感400字优秀作文

辽宁沈阳：人才公寓成就青年与城市“双向奔赴”

印度JSW钢铁拟收购泰克资源煤炭业务多数股权，或面临嘉能可竞争

【财经分析】河北如何“解题”生物医药产业高质量发展？

邻水县：避暑游点燃夏日文旅活力

7月社零数据跟踪报告：7月社零同比增长2.50%，增速持续放缓

乳制品及植物奶新发展（系列一）：咖啡赛道的B端扩容

港服PS商店开启8月特惠《荒野大镖客2》终极版3折

数据复盘：17亿净流入证券龙虎榜抢筹信达证券

紧急通知！河北：雷暴、狂风、大雨、冰雹！强对流天气需要注意哟

长缆科技：2023年半年度净利润约2588万元，同比增加3.56%

董其昌行书精选(关于董其昌行书精选简述)

psp3000 6.60完美破解教程（psp3000破解教程）

“经典香港电影修复计划”启动

江苏考试信息网（关于江苏考试信息网的基本详情介绍）

伊朗外长阿卜杜拉希扬访问沙特阿拉伯

江苏省委全会后的首场调研，江苏省委书记关注了这些领域

月亮的女儿，用光芒照亮了世界

孕妇可以吃杏鲍菇吗早期（孕妇可以吃杏鲍菇吗）

广东省汕头市2023-08-17 16:45发布暴雨黄色预警

OPPO Reno10 Pro+手机手机充满电不断电

关于创商网 | 联系我们 | 投稿邮箱：920 891 263@qq.com 商务合作QQ：920 891 263

Copyright © 2008 - 2020 www.viltd.com. All Rights Reserved 中网

创商网版权所有

京ICP备2022016840号-26

1 360