栏目分类
你的位置:开云网页版登录(官网)登录入口 > 新闻 >
近日, 服气服(300454) AI 研发部总司理时文涛受邀出席“2025 年 GDC 全球设置者时尚大会”《AI 焕新, 塑医疗明天》论坛, 并以《模塑医疗, 共 WiN-AI》为主题, 发表了精彩演讲。在会议现场繁多行业同仁的共同见证下, 服气服与卫宁健康(300253)皆集发布了内置“双模 + 双应用”一体化寄托惩处决策 ——WiN-AI 卫信云。
时文涛指出, 医疗大模子在本色应用落地中的主要难点是“用不起”、“不会用”、“用不好”, 重心一经在“用”。有了模子, 并不虞味着简直作念好了应用, 大模子仅仅一个器用, 一种能力, 最终一经要追思到本色业务的应用。奈何将大模子能力与业务历程和应用有用结合, 这是宗旨者更应该心情的。
为此, 服气服与卫宁健康皆集打造了一体化寄托惩处决策 ——WiN-AI 卫信云, 以「线上线下(300959)一朵云」为基座, 通过线下智算升级与线上能力订阅, 为医疗用户提供从模子稽查、推理加快到应用鼎新的全栈做事。全新升级版 WiN-AI 卫信云, 可内置通用与专用双模子、AI 算力退换平台、算力资源, 以及卫宁健康 AI 双应用 (医疗大言语模子 WiNGPT 2.8、东说念主工智能医护助手 WiNEX Copilot 2.1 版块)。
更生动的彭胀性, 让明天模子不竭化繁为简
各大模子厂商你追我赶, 模子的能力日月牙异。从永久发展来看, 用户不成将我方阻挠于某一个基模子中, 更不成被某个固定版块所拘谨, 明天的发展需要的是生动与绽开, 是握续进化和无穷可能。服气服 AICP 算力平台大致有用不竭各式开源的基模子和版块, 以及客户的独有模子。岂论是基模子的获得更新, 一经二次微调与稽查、推理部署、业务高可用, 服气服 AICP 算力平台都能化繁为简, 让期间的激流在有序的河说念中奔涌。
全面优化推感性能, 体验更佳, 资本更低
服气服通过 AICP 算力平台的部署决策在多实例、并发推理场景中可完毕 5-10 倍的性能普及, 大模子并发度更高、狡赖量更大、推理反应延时更低。从而使 AI 加握下的 WiN-AI 卫信云大致全面普及用户的使用体验, 让用户在 AI 应用构建及本色使用时, 资源参预更低、体验更优。
1.资本重构:WiN-AI 卫信云内嵌推理优化模子, 通过算力资源精确退换, 完毕最大推理 GPU 资本下跌 75%, 资源旁边率达行业前沿水平。
2.性能跃迁: 相较开源决策 (如 Ollama), 在 32B 模子 64 并发场景下, 问答狡赖量普及 10 倍, 长文本处理稳健性普及 300%。
图注: 硬件资源:INT4 用 2*4090,FP16 用 4*4090
模子动态加密, 保险模子常识产权和安全
通过模子动态加密的神气, 翔实坏心膺惩和盗取, 让模子做事上线即安全, 性能损耗低于 5%。通过身份认证、数据集和模子文献静态落盘加密的神气, 为模子提供稽查全生命周期安全驻防。
1.模子动态加密期间: 接纳结构加密 (加多伪分支), 权重加密 (替换为伪权重), 算子加密 (加多伪算子) 的神气对模子结构进行羞辱加密, 保护模子入手态安全。
2.自相宜加密算法: 策画自相宜的加密算法, 大致针对不同模子, 自相宜诊疗和组合不同强度的结构加密 / 权重加密 / 算子加密期间, 保护模子安全的同期, 也保险了部署的可行性和推感性能。
皆集行业生态, 软硬深度优化, 完毕自主可控
服气服皆集了国内多家 GPU 厂商, 进行深度的软硬协同优化, 完毕了大致对标海外厂商的推感性能。从以下测试数据不错看出, 当承载斟酌大模子时, 在主流 34B 大模子下, 经过软硬协同优化后的国产卡性价比权臣高于海外厂商, 性能对比效果达到 137.5%!
在科技波澜奔涌的期间, 服气服与卫宁健康以领略的联结与深度的和会, 赶紧搪塞行业前沿期间带来的挑战与机遇, 接续升级优化皆集惩处决策:2020 年, 双朴直式发布了皆集打造的一体化惩处决策, 播下了“卫信云”的种子, 以“软硬一体化”的神气拓荒灵敏医疗新旅途。2024 年, 跟着业务需求的迭代, 这颗种子在鼎新的沃土中, 成长为全新升级的 WiN-AI 卫信云 —— 服气服面向 AIGC 的新一代云平台与卫宁健康 WiNEX 软件的鼎新和会, 性能、安全、寄托方便性完毕质的飞跃。2025 岁首, 两边再度以 DeepSeek 为基石, 推出内置“双模 + 双应用”的 WiN-AI 卫信云, 以更高效、更经济的神气为医疗行业注入智能化新动能。
咱们信赖, 惟有以自主鼎新为帆, 以生态合算作桨开yun体育网, 才能让信息期间在纷乱海洋中乘风破浪, 让百花皆放的科技之光, 照亮每一个边际, 赋予用户更多采纳, 让数字化的便利惠及万千全球。
