为了深入了解这些问题,来自西班牙马拉加大学(University of Malaga)的研究人员 Mario Sierra Martín、Fang - Wei Chen 和 Pilar Alarcón Urbistondo 开展了一项关于远程医疗的研究。他们聚焦于 X 社交网络上用户发布的远程医疗相关评论,通过挖掘这些数据来揭示远程医疗用户的核心利益点,以及患者和专业人员关注的主要议题。该研究成果发表在《BMC Health Services Research》上。
研究人员在本次研究中主要运用了自然语言处理(Natural Language Processing,NLP)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)模型这两项关键技术。研究人员借助 Snscrape 库收集了 X 社交媒体上与远程医疗相关的推文,这些推文涵盖了葡萄牙语、西班牙语、意大利语和英语。经过筛选和清洗,最终将 109,662 条西班牙语推文纳入研究范围。之后,研究人员运用 NLP 技术对文本进行预处理,包括将文本转换为小写、去除非字母字符和停用词等操作,并进行词形还原。在此基础上,使用 LDA 模型构建主题检测模型,确定了推文的主要话题。