旅行者:通过自回归扩散模型实现具有旅行模式意识的轨迹生成
《Information Fusion》:Traveller: Travel-Pattern Aware Trajectory Generation via Autoregressive Diffusion Models
【字体:
大
中
小
】
时间:2025年10月02日
来源:Information Fusion 15.5
编辑推荐:
轨迹生成技术结合自回归时空模式建模与扩散空间生成,提出Traveller框架,通过提取个体空间锚点与时间模式约束,实现高保真且隐私保护的合成轨迹生成,适用于城市计算等应用。
轨迹生成(Trajectory Generation, TG)在城市管理和交通规划、疫情控制以及隐私保护的移动性分析等领域具有重要的应用价值。它能够模拟个体的移动行为,为研究城市空间与人群之间的动态关系提供数据支持。然而,现有的轨迹生成方法,尤其是无条件扩散模型,在生成高质量的时空轨迹时存在一定的局限性。这些方法往往忽视了个体移动行为中至关重要的旅行模式,如重复访问某些地点、移动范围以及时间上的规律性等。为了解决这些问题,我们提出了“Traveller”,这是一种融合自回归旅行模式建模(AR-TempPlan)和扩散式轨迹生成(TravCond-Diff)的新型轨迹生成框架,旨在生成符合真实世界旅行行为的高保真度轨迹,同时保障隐私。
在“Traveller”框架中,我们首先从轨迹数据本身提取出个体的特定旅行模式,而无需依赖外部的语义标签。这些模式由家庭地点和重新编码的掩码地点序列组成,分别作为时空约束中的空间锚点和时间模式。基于这些定义的旅行模式,结合自回归模型(AR)在捕捉时间动态方面的优势与扩散模型在空间建模中的强项,Traveller通过一种基于旅行模式的生成机制,实现了对时空动态的精确模拟。具体而言,AR-TempPlan生成时间模式作为条件,通过规划地点随时间的变化来反映真实个体的旅行行为;而TravCond-Diff则在时间条件和家庭地点作为空间锚点的引导下,通过离散的空间选择扩散过程,进行空间建模。这一过程通过引入“旅行模式扩散变换器”(TravDiT)模块,并结合“MeanClamp”操作,以对齐时空条件,确保生成的轨迹既符合真实世界的空间分布,也尊重时间上的顺序。
在实验方面,我们使用了来自北京和深圳的两个真实世界移动性数据集进行评估。这两个城市是中国的两个特大城市,具有不同的城市结构和移动模式。北京的城市结构呈同心圆状,人口流动具有相对稳定的模式;而深圳则呈现出多中心结构,沿着东西发展轴组织,形成带状的空间布局,且移动模式更为多样化。通过在这些数据集上的广泛实验,我们验证了Traveller在时空保真度和下游任务如下一站预测中的实用性,取得了目前最先进的性能表现。
“Traveller”框架的提出,不仅填补了现有轨迹生成方法在捕捉个体移动行为中的空白,也为城市计算中的跨域数据融合提供了新的解决方案。在城市计算中,跨域数据融合(Cross-Domain Data Fusion)是其核心组成部分,它涉及从多个领域获取异构和大规模的数据集,如环境传感器数据、基础设施使用数据和人类移动性数据等。这些数据集为研究城市空间与人群行为之间的复杂关系提供了丰富的信息支持。然而,获取高质量的个体级移动性数据仍然面临成本高昂、隐私法规限制以及政策约束等挑战。因此,轨迹生成作为一种合成数据技术,成为解决这些问题的重要手段。它不仅能够作为数据生成器,还能作为移动性模拟引擎,为数字孪生、犯罪风险评估、交通优化以及疫情控制等广泛领域提供研究和应用支持,同时通过合成数据保障隐私。
现有的轨迹生成方法主要分为机制驱动和深度学习(DL)两类。机制驱动模型通过一组具有物理意义的参数捕捉人类移动性的统计模式,如探索与偏好返回(Exploration and Preferential Return, EPR)模型,该模型通过平衡探索和重复访问行为来模拟移动。相比之下,深度学习方法则利用强大的神经网络架构,能够捕捉复杂的时空依赖关系。例如,基于生成对抗网络(GAN)的方法,如SeqGAN,已被应用于模拟时空轨迹,其优势在于能够建模序列依赖关系。同样,扩散模型在生成移动轨迹方面也展现出强大的潜力,能够准确捕捉复杂的空间移动模式。这些模型在生成轨迹时,能够基于大量数据学习到人类移动的规律性,从而生成具有现实意义的轨迹。然而,这些方法在生成过程中仍然难以完全对齐于真实世界居民的旅行行为,尤其是在个体行为的时空一致性方面存在不足。
为了解决这一问题,我们提出了“Traveller”框架,其核心在于将自回归模型与扩散模型的优势结合起来。自回归模型在捕捉时间上的动态模式方面具有显著优势,能够通过序列建模的方式,生成符合时间规律的地点转移模式。而扩散模型则在空间建模方面表现出色,能够通过离散的扩散过程,生成符合空间分布的轨迹。通过将这两类模型融合,“Traveller”实现了对时空动态的全面模拟。具体来说,AR-TempPlan通过生成时间模式作为条件,规划地点随时间的变化,以反映真实个体的旅行行为;而TravCond-Diff则在时间条件和家庭地点作为空间锚点的引导下,通过离散的空间选择扩散过程,生成符合空间分布的轨迹。这一过程通过引入“旅行模式扩散变换器”(TravDiT)模块,并结合“MeanClamp”操作,以对齐时空条件,确保生成的轨迹既符合真实世界的空间分布,也尊重时间上的顺序。
“Traveller”框架的设计充分考虑了个体移动行为的时空特性。家庭地点作为空间锚点,能够为轨迹生成提供稳定的参考点;而重新编码的掩码地点序列则能够捕捉个体在时间上的活动模式,如重复访问某些地点、移动范围以及时间上的规律性等。这些模式作为时空约束,能够确保生成的轨迹在空间和时间上都具有较高的保真度。通过将这些约束条件融入轨迹生成过程,“Traveller”能够生成符合真实世界旅行行为的高保真度轨迹,同时避免直接访问敏感的个体级数据,从而保障隐私。
此外,我们还通过实验验证了“Traveller”在实际应用中的效果。在两个城市的数据集上,我们评估了生成轨迹在时空保真度和下游任务中的表现。实验结果表明,我们的方法在生成轨迹的时空一致性方面表现优异,能够有效捕捉复杂的个体移动行为。同时,在下一站预测等任务中,生成轨迹的实用性与真实数据相当,为后续应用提供了可靠的数据支持。这些实验不仅证明了“Traveller”在生成高质量轨迹方面的有效性,也展示了其在城市计算中的广泛应用前景。
综上所述,“Traveller”框架的提出为轨迹生成领域带来了新的突破。它不仅能够生成符合真实世界旅行行为的高保真度轨迹,还能够保障隐私,避免直接访问敏感的个体级数据。通过将自回归模型与扩散模型的优势相结合,“Traveller”实现了对时空动态的全面模拟,为城市计算中的跨域数据融合提供了新的解决方案。这一框架的应用将有助于更好地理解和预测人类移动行为,为城市规划、交通优化和疫情控制等提供数据支持,同时推动合成数据技术在城市计算中的进一步发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号