DeepSeek为人工智能AI产业带来一场革命,为企业级AI应用私有化部署场景(Private AI)注入强劲动力。作为企业级私有化AI Infra平台,云轴科技ZStack智塔携手昇腾AI实现了DeepSeek V3/R1/ Janus Pro三种模型的高效部署,并充分发挥DeepSeek开源模型和低成本高性能特点,为企业提供安全高效的AI基础设施方案,进一步推动AI的企业级商用进程。
从7B到671B模型尺寸,适配企业数据中心AI算力资源
AI Infra平台ZStack智塔在算力层提供计算、存储、网络、安全等基础资源和服务。智能异构调度引擎自动匹配硬件特性,高度适配昇腾算力资源,提供从高效蒸馏7B小模型到满血671B大模型的灵活选择,满足企业数据中心多样化算力需求。
昇腾310:作为面向边缘计算和推理场景的高能效AI产品,昇腾310具备出色的推理性能和功耗比。ZStack智塔充分利用昇腾310的优势,通过模型优化和算力调度,在 R1 蒸馏模型、Janus Pro 模型的推理任务中实现高效能比,为企业提供经济高效的AI部署方案。
昇腾910:昇腾910具有强大的浮点计算能力,适用于大规模模型训练。ZStack智塔通过优化计算资源分配和任务调度,充分挖掘昇腾910的性能潜力,加速DeepSeek等大模型的推理过程,满足企业对高性能AI算力的需求。
在资源利用方面,ZStack智塔通过多卡并发推理技术,实现多AI硬件联合推理,提升小显存硬件的可用性;通过AI硬件切分技术,对单AI硬件的算力进行精细化划分,提升大显存硬件的利用率;采用模型量化等技术,减少模型对显存的占用,实现更高效的算力资源使用。
支持DeepSeek三种模型,满足企业不同AI场景需求
AI Infra平台ZStack智塔在模型层提供模型开发和应用所需的各种基础工具和组件,支持开源和闭源模型的全生命周期管理。基于昇腾系列硬件支持,ZStack智塔可高效运行DeepSeek V3、R1和Janus Pro模型。
DeepSeek V3:适用于通用型自然语言处理任务。利用昇腾硬件的强大算力,V3模型能够在 AI Infra 上实现高性能的训练和推理,并通过多机互联提升模型的计算效率,满足企业对于大规模自然语言处理的需求。
DeepSeek R1:专注于复杂推理任务。借助昇腾硬件的强大算力和互联性能,R1模型在处理复杂计算和大规模数据时表现出色,提升推理速度和准确性,提供面向推理模型的长上下文。
DeepSeek Janus Pro:擅长多模态理解与生成。通过昇腾硬件的异构计算能力,Janus Pro模型可高效处理图像数据类型,实现跨模态的信息融合和生成,满足企业在多媒体内容分析、智能客服等领域的需求。
提供企业灵活性与定制化服务,构建新一代企业数智化平台
AI Infra平台智塔可以根据企业自身需求,基于昇腾在私有云或混合云环境中部署DeepSeek模型,从而确保数据的安全性和隐私保护;还提供裸金属、虚拟机和容器计算资源的弹性扩展,支持与多种硬件和软件的集成,使得企业能够轻松地将AI能力整合到现有系统中,满足企业级用户对AI应用的多样化需求。
AI Infra平台是企业加速释放AI生产力的关键引擎平台,它聚焦企业级AI应用的私有化部署场景(Private AI),是支撑人工智能应用开发、部署、运行和管理的一系列基础工具和软件平台。赛迪顾问在《2025中国AI Infra平台市场发展研究报告》中认为,2025年是中国AI Infra平台应用元年,预计2024年、2025年将分别达到19.4亿元和36.1亿元,2025年同比增长将超过86%。