近日,中国多媒体大会(China Multimedia2024)在宁夏银川召开。本次大会由中国图象图形学学会(CSIG)、中国计算机学会(CCF)主办,快手受邀出席大会并分享了其在AI驱动多媒体创新方面的前沿技术和应用案例。
会上,快手副总裁、大模型团队负责人张迪发表《可灵AI视觉生成大模型及应用》主题演讲。他表示,一直以来,快手夯实基座模型硬实力,持续坚持技术创新,在大模型领域不断突破。张迪进一步分享了快手快意大语言模型、可图文生图模型、可灵文生视频模型、语音大模型等关键技术的比较新进展。
张迪介绍,快手将通过“升级理解、创新互动、探索生成”的大模型应用策略,在内容生产方面,打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验;在内容消费领域,升级快手的内容理解和分发体系,提升用户的消费体验。
值得一提的是,本次多媒体专委全体委员会议的一项重要议程是进行了多媒体专委常委增选,按照流程,经候选常务委员申请陈述、现场委员咨询和专委执行委员投票选举,张迪增选为中国计算机多媒体技术专业委员会常务委员。
在大会“未来视觉信息编码与智能技术”专题论坛上,快手音视频算法专家谷嘉文还围绕《智能编解码前沿探索与形态》主题,进行了重点分享。
随着深度学习和大模型的火热,其在视频编解码领域的应用也受到业界的持续关注。当前,深度学习算法在视频编解码压缩上发展迅速。然而,受限于昂贵的端上算力,智能编解码方向的应用和普及还存在一些距离。
对此,谷嘉文结合快手研发成果和线上业务场景,深入介绍了智能算法在音视频全链路上的应用,包含KVQ、快手KEP/KRP增强、KVC编码器等多项技术。在此基础上,他进一步介绍了端到端技术在处理和编解码核算法上的优化技术,并分享了当前一些可行性方向的探索和对未来智能编解码形态的展望。
除了用AI重塑平台内容与商业生态、坚定地为用户做最 好的AI技术外,快手也构建起日益完善的AI产学研生态,与行业学会、顶 尖院校等多方联合共建,大力推动技术创新与产业发展。
以大模型、编解码等技术创新和应用为核心,快手多年来持续推动产学研合作。在2024世界人工智能大会期间,CCF宣布与快手共同成立“CCF-快手大模型探索者基金”,并同步开启基金申请通道。该基金计划于年内推出12个研究项目,课题最 高可获30万元支持,旨在应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求,聚焦新一代大模型的关键技术研发。
快手的技术创新与研究成果也持续获得多媒体行业大奖的高度认可。在本届大会上,快手视频编解码关键技术(KVC)获得“中国多媒体企业创新技术奖”。而在CCF多媒体技术专业委员会、CSIG多媒体专业委员会共同举办的中国多媒体30年纪念活动中,快手更是荣膺“中国多媒体优秀服务贡献企业”。
面向未来,快手将继续加大在AI领域的投入,大力推动技术创新和成果转化,促进产学研生态进一步完善,携手多方共建繁荣发展的多媒体技术研发与产业应用新生态。