Twitter Recommendation Algorithm推特推荐算法源码

联合创作 · 2023-09-28 03:57

推特推荐算法的源代码。推特推荐算法是一组服务和作业,负责构建和服务主页时间线。有关算法工作原理的介绍,可参阅博客

开源库中包含的推荐算法的主要组件有:

类型 成分 描述
特性 模拟集群 社区检测和稀疏嵌入这些社区。
  双核 用户和推文的密集知识图嵌入。
  信任和安全模型 用于检测 NSFW 或滥用内容的模型。
  real-graph 预测 Twitter 用户与其他用户互动的可能性的模型。
  tweepcred 用于计算 Twitter 用户信誉的 Page-Rank 算法。
  recos-injector 流式事件处理器,用于为基于GraphJet的服务构建输入流。
  图特征服务 为一对定向用户提供图形特征(例如,有多少用户 A 的关注点赞了用户 B 的推文)。
候选来源 搜索索引 查找网络内推文并对其进行排名。约 50% 的推文来自此候选来源。
  cr-mixer 用于从底层计算服务中获取网络外推文候选者的协调层。
  用户推文实体图(UTEG) 在内存中维护一个用户到推文的交互图,并根据该图的遍历找到候选者。这是建立在GraphJet框架之上的。其他几个基于 GraphJet 的特性和候选源位于此处
  遵循推荐服务(FRS) 为用户提供要关注的帐户的建议,以及来自这些帐户的推文。
排行 light-ranker 搜索索引 (Earlybird) 使用的轻量级模型对推文进行排名。
  heavy-ranker 用于对候选推文进行排名的神经网络。用于选择时间轴推文的主要信号之一。
推文混合和过滤 home-mixer 用于构建和服务主页时间线的主要服务。建立在产品混合器上
  可见性过滤器 负责过滤 Twitter 内容以支持法律合规性、提高产品质量、增加用户信任度、通过使用硬过滤、可见产品处理和粗粒度降级来保护收入。
  时间线排序器 旧版服务,它提供来自 Earlybird 搜索索引和 UTEG 服务的相关性评分推文。
软件架构 navi 用 Rust 编写的高性能机器学习模型服务。
  product-mixer 用于构建内容提要的软件框架。
  twml 基于 TensorFlow v1 构建的旧版机器学习框架。

包括大多数组件的 Bazel BUILD 文件,但不包括顶级 BUILD 或 WORKSPACE 文件。

浏览 13
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报