在短视频行业竞争白热化的今天,算法技术已成为平台突围的核心武器。作为国内首个实现多模态大模型与推荐系统深度融合的科技企业,快手AI平台算法负责人刘霁在近期专访中,首次披露了其技术协同创新的底层逻辑与实战经验。

一、技术协同的必然性:破解传统推荐系统的三大困局
传统推荐系统长期面临"语义理解匮乏""冷启动困境""长尾效应失效"三大难题。刘霁指出:"当用户搜索'适合油性皮肤的防晒霜'时,传统ID序列模型只能匹配商品ID,却无法理解'油性皮肤'与'防晒霜质地'的深层关联。"这种语义缺失导致推荐准确率长期徘徊在65%以下。
快手通过构建QARM V2系统实现突破。该系统采用三段式注意力掩码技术,将快意语言大模型转化为嵌入生成器,结合FSQ量化与残差聚类算法,使商品属性识别准确率提升至92%。在2026年"618"大促期间,该系统为美妆类目商家带来37%的转化率提升。
二、多模态矩阵的构建:从单一模型到生态化作战
不同于行业普遍采用的通用大模型路线,快手选择垂直领域模型集群战略。其技术矩阵包含三大核心:
1. 可灵视频生成模型:全球首个登陆图生视频赛道榜首的工业级模型,支持1080P高清视频生成,在2025年Artificial Analysis基准测试中以1000分满分夺冠
2. 可图图像生成模型:实现商品主图自动生成,将设计效率提升5倍,已服务超200万商家
3. 快意语言大模型:具备1000亿参数规模,在电商场景问答准确率上超越GPT-4 Turbo 12个百分点
这些模型通过"思维链决策学习"技术实现跨域协同。当用户浏览烹饪视频时,系统可同步调用可图生成菜谱图片,快意模型撰写步骤说明,最终由可灵合成教学视频,整个过程在3秒内完成。
三、推荐系统的范式革新:从精准匹配到价值创造
快手推出的生成式推荐系统OneRec,标志着推荐技术进入3.0时代。该系统具有三大突破:
1. 端到端架构:摒弃传统多阶段筛选模式,实现从用户行为到内容推荐的直通式处理
2. 动态语义理解:通过多模态深度问答生成技术,将商品描述转化为结构化知识图谱
3. 实时价值评估:引入强化学习出价范式G4RL,使广告ROI提升28%
在2025年双11期间,OneRec系统成功处理12亿级用户请求,将人均观看时长从47分钟延长至62分钟,同时将用户跳出率降低19个百分点。
四、技术落地的双轮驱动:AI治理与硬件创新
快手同步构建了AI治理体系与专用芯片生态:
1. 内容安全防线:通过多模态内容审核API,实现虚假宣传识别准确率99.9%,剧本炒作举报率下降61%
2. 延迟确定性芯片:自研DiPU架构使视频处理延迟稳定在8ms以内,较英伟达A100提升3倍能效
3. 3D近存计算:全国产堆叠技术将显存带宽提升至1.2TB/s,支撑可灵模型实时生成8K视频
五、未来展望:构建AI原生内容生态
刘霁透露,快手正研发下一代多模态理解框架,目标实现"三个一体化":
1. 创作一体化:让用户输入简单关键词即可生成包含脚本、分镜、配乐的完整视频
2. 交互一体化:通过AR技术使用户可"试穿"服装、"试用"化妆品
3. 商业一体化:建立从内容创作到交易转化的闭环系统,使创作者收入提升3-5倍
在采访最后,刘霁强调:"技术协同不是简单的模型叠加,而是要构建会思考、能进化、懂商业的智能体。快手正在打造的,是一个由AI驱动的内容生产-分发-消费新生态。"这场由推荐系统与多模态算法共同引发的革命,正在重新定义短视频行业的竞争规则。