0591|榕城论坛|榕城网|福州网|福州论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1060|回复: 0
打印 上一主题 下一主题

芬兰研究人员通过ins预测流感利用社交媒体衡量人口健康趋势

[复制链接]

665

主题

665

帖子

2035

积分

金牌会员

Rank: 6Rank: 6

积分
2035
跳转到指定楼层
楼主
发表于 2018-12-1 19:00:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
12 月 1 号消息,本周二,一篇名为 "Predicting the flu from Instagram" ( 通过 Instagram 预测流感 ) 的论文在康奈尔大学 arXiv 服务器上发布,作者是来自芬兰坦佩尔大学医学院的 Oguzhan Gencoglu 和软件服务公司 Tieto,Ltd 的 Miikka Ermes。


芬兰的 AI 研究人员利用公共健康数据严格收集了这个国家的 500 万居民,在 Instagram 上比对 " 流感 " 标签,以及人们提出流感药物的图像,发帖与记录的流感爆发有显着的统计相关性,预测流感爆发的历史公共卫生数据。这是利用社交媒体衡量人口和健康趋势的一系列尝试中的最新举措。
作者提出他们的论点是 " 首项在社交媒体中使用图像来预测流感流行病的研究 ",但他们也列出了关于社交媒体的其他研究,例如关于抑郁症指标的 Instagram 帖子研究和烟草使用。
对于很多人关注的隐私问题,他们称只使用公开发布过的,基于 python 的网络爬虫程序收集数据,并且爬虫只记录了发布日期和主题标签,以及单个图像 URL,它没有记录用户名,也没有存储任何图像。
从 2012 年 4 月到 2018 年 5 月,调查人员在 Instagram 上收集了六年的帖子,超过 22,000 份,收集芬兰语中有关疾病的标签,例如芬兰语 "flunssa",意思是流感,或 "lihaskipu",意思是肌肉酸痛。对 Gencoglu 和 Miikka 这项研究来说,重要的是他们能够将搜索限制在 " 单一语言和国家 ",以便能够将帖子与单个国家的健康数据进行比较。


Gencoglu 和 Miikka 通过将帖子中的标签参考数量,与芬兰国家健康与福利研究所记录的官方流感发病率相关联,归类了 9 种不同的神经网络模型。他们对五年的数据进行了统计,然后用第六年的 Instagram 数据和健康数据来测试模型。


论文称,最好的临近预报模型的平均绝对误差为每周 11.33 次事故,测试数据的相关系数为 0.963。用于预测 1 周和 2 周的预测模型显示出统计显着性,同时达到相关系数分别为 0.903 和 0.862。这项研究表明社交媒体,特别是数字照片的公开分享,可以成为流行病学领域的宝贵信息来源。


这种社交媒体搜索的一个重要问题是,如何通过媒体本身来改变统计数据。作者指出谷歌 2013 年 " 谷歌流感 " 搜索趋势失败,因为 " 媒体对谷歌工作的高度关注 " 歪曲了搜索活动。因此,他们得出结论,在未来的工作中,将每周帖子数量 " 标准化 " 与人口中每周 Instagram 帖子的总数相比,通过考虑平台的受欢迎程度来提高预测性能。
论文链接地址


回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则





0591|榕城论坛|榕城网|福州网|福州论坛X
快速回复 返回顶部 返回列表
友情链接