专属客服号
微信订阅号
全面提升数据价值
赋能业务提质增效
虽然端侧AI优势明显、端侧大模型的布局热度正酣,但终端芯片受到体积和功耗的限制,对于更大的模型和调优等重度负载并非最优解,更加高阶或复杂的AI用例往往诞生于云端大模型。
那么,当终端用户偶尔需要超越端侧大模型的功能时,该如何获取?高通在《混合AI是AI的未来》白皮书中,提出了在云端和边缘终端之间分配并协同处理AI工作负载的混合AI架构。这种架构可以根据模型和查询需求的复杂度等因素,在云端和终端侧之间分配处理负载。
5G或未来6G的连接,是实现混合AI架构的关键。当终端大模型判断出现了终端无法处理的工作,可以通过5G连接,将数据上传到云端进行运算,之后再将结果推回到终端。5G或6G的高速连接,能够保障数据处理和结果反馈的实时性。如此一来,云端、边缘云的训练和计算资源,都将为终端大模型服务,保障了用户体验。
虽然6G尚未到来,但行业已经行至5G第二个阶段的演进——5G Advanced(以下简称5G-A)。相比5G,5G-A可实现网络能力的10倍提升,支撑10Gbps体验、全场景物联、通信感知一体、L4级别自动驾驶网络、绿色ICT等业态,进一步开发和释放5G的潜能。
最新一代骁龙8 Gen 3集成的骁龙X75是业界首个5G Advanced-ready调制解调器及射频系统,面向智能手机、移动宽带、汽车、计算、工业物联网、固定无线接入和5G企业专网等细分领域,提升网络覆盖、时延、能效和移动性体验。在11月8日于乌镇举办的“世界互联网大会领先科技奖”颁奖典礼上,高通5G Advanced-ready调制解调器及射频系统X75获得“世界互联网大会领先科技奖”。
内生AI被视为5G-A的关键技术之一,使网络更智能、灵活地按需提供功能。骁龙X75是业界首次在调制解调器及射频系统中采用专用硬件张量加速器,将AI性能提升至前代产品的2.5倍以上。骁龙X75还引入了5G AI套件,为连接速度、移动性、链路稳健性等5G性能和特性的优化提供更大空间。
5G-A的加持,除了让手机、PC等终端能够高效运行大模型,也为大模型进入XR(虚拟现实、增强现实等)、汽车等终端带来更多可能。5G-A提供的万兆体验,能够更有力地支撑VR/AR和车联网等需要高带宽、低时延的应用。例如微软基于云流媒体和第二代骁龙XR2芯片平台,在XR终端侧运行先进的算法,实现了将Windows体验安全传输到Meta Quest设备,用Azure远程渲染MR终端内容等用例,更有效地融合了XR云端和客户端内容。
混合AI架构以及5G+AI的协同工作,也为开发者在本地和云上的无缝开发大模型相关应用带来便利。今年9月,微软将AI助手Copilot接入Windows11,将生成式AI引入更多应用程序。微软Windows和设备副总裁帕万·达武鲁里在2023骁龙峰会表示,终端侧AI促进了客户端和云端之间的平衡,将使开发人员能够使用本地和云计算编写混合AI应用。“未来,我们需要一个能够模糊云端和边缘端芯片界限的操作系统,在合适的地方使用合适的芯片,从而实现最佳体验。这将让Windows成为一个跨应用、内容和图形的编排系统。”
万物互联,万物智能。AIGC提升了终端的智能上限,而5G-A和未来的6G拓展了智能的触达范围,两者将一起为终端的使用和交互体验带来更多可能。
本文为本网转载,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性,如涉及侵权,请权利人与本站联系,本站经核实后予以修改或删除。
请完善以下信息,我们的顾问会在1个工作日内与您联系,为您安排产品定制服务
评论