小米联合TileRT推出MiMo-V2.5-Pro-UltraSpeed,基于万亿参数大模型,在单台标准8卡GPU节点上首次将文本生成速度提升至1000+ tokens/s,峰值可达1200 tokens/s,无需定制专用芯片,大幅降低极速AI推理门槛。该版本同步上线运时API服务,定价为原版的3倍但速度提升约10倍,性价比突出。服务采用申请制,6月9日至23日开放试用,企业及开发者优先,普通用户可免费体验对话功能。性能飞跃依赖三大技术创新:FP4量化技术、DFlash区块并行预测解码和TileRT推理系统,重塑了AI应用场景,支持模型并行推演、自主纠错等,缓解代码生成等待,赋能高频交易、实时反欺诈等毫秒级决策场景。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。(反馈错误)