什么是 DeepWalk?
DeepWalk 是一种用于将图(Graph)结构数据中的节点映射到低维向量空间的无监督学习算法。它借鉴了自然语言处理中 Word2Vec 的思想,通过在图上进行随机游走(Random Walk)生成“句子”,然后使用 Skip-gram 模型训练节点的向量表示。
核心思想
- 随机游走:从图中某个节点出发,随机选择邻居节点进行游走,形成一个节点序列(类比为“句子”)。
- Skip-gram 模型:将节点序列输入到 Word2Vec 的 Skip-gram 模型中,学习每个节点的向量表示。
- 保留结构信息:相似结构位置的节点在向量空间中距离更近。
应用场景
- 社交网络中的用户分类与推荐
- 知识图谱的实体表示
- 异常检测与社区发现
- 生物信息学中的蛋白质相互作用网络分析
优势与局限
优势:无需标签、适用于任意图结构、计算效率较高。
局限:无法处理动态图、对稀疏图效果有限、忽略节点属性信息。