【数据分享】百度迁徙指数OD版_update_230209_世界热消息

2023-02-21 19:02:18     来源 : 哔哩哔哩


(资料图)

——【基本信息】数据来源:百度地图迁徙大数据采集时间:2023年2月14-20日——【数据说明】截至2023年2月8日的百度迁徙指数,包括各省、市每日迁入来源地、迁出目的地的结构【官方注释1】迁徙规模指数:反映迁入或迁出人口规模,城市间可横向对比【官方注释2】城市迁徙边界采用该城市行政区划,包含该城市管辖的区、县、乡、村——【关于指数的换算】做过一个简单测试,用2020年春运期间11天的旅客发送量与同期指数相比考虑到迁入迁出都算人次,故再折半处理,每1点指数大约对应7万人——【覆盖天数情况】2020——47天(1月10日-2月25日)2021——158天(1月19日-3月8日、9月13日-12月31日)(其中缺11月26日)2022——130天(1月1日-3月10日、9月1日-10月31日)2023——39天(1月1日-2月8日)——【版本划分】根据处理程度,分为原始结构(00_Scale)、按城市迁徙指数(01_by_City)、按日期迁徙指数(02_by_Date)具体说明如下,使用前请务必仔细阅读:——【原始结构(00_Scale)】【116 MB】——【区划代码_省市类型_省市名称_迁徙方向_scale.txt】内容:每日迁徙指数结构处理:未经任何加工,只有比例几乎没法用,需要配合指数(https://www.bilibili.com/read/cv21732064)进行计算格式:TXT字段date:8位日期,YYYYMMDD字段from_city(或to_city):迁入来源城市(或迁出目的城市)字段from_prov(或to_prov):迁入来源省(或迁出目的省)字段percent:占当日迁徙指数的百分比(%)——【按城市迁徙指数(01_by_City)】【149 MB】——【区划代码_省市类型_省市名称_od_index.txt】内容:按城市汇总带OD的每日迁徙指数处理:基于迁徙指数和结构进行计算,并将每个城市迁入、迁出合并为一个文件。由于比例精度低(2位小数),同一个OD在不同城市文件中的指数略有出入,例如20年1月10日廊坊to北京,在北京的文件中数值为21281.0485,在廊坊的文件中数值为21280.3116—算法:当日指数×比例,扩大10000倍再保留4位小数,以减少精度损失(也为了避免出现科学记数)—算例1:20年1月10日,北京迁入指数=10.8355644,其中来自廊坊=19.64%,计算后=21281.0485—算例2:23年2月8日,北京迁出指数=8.1679752,其中去往大庆=0.13%,计算后=106.1837格式:TXT字段date:8位日期,YYYYMMDD字段O:起点城市字段D:讫点城市字段index:迁徙指数(注:非原始数量级,经过10000倍放大)——【按日期迁徙指数(02_by_Date)】【192 MB】——【YYYYMMDD.txt】内容:按日期汇总带OD的每日迁徙指数处理:进一步对同一个OD进行合并,对方向相反的OD进行分组,便于建立无向网络,并将同一个日期的OD合并为一个文件,便于按研究时段汇总—算法:不同城市文件中的同一个OD指数取平均值—算例1:20年1月10日,廊坊to北京,(21281.0485+21280.3116)/2=21280.68005—算例2:23年2月8日,北京to大庆,(106.1837+107.568)/2=106.87585格式:TXT字段date:8位日期,YYYYMMDD字段O:起点城市字段D:讫点城市字段index:迁徙指数(注:非原始数量级,经过10000倍放大)字段pair:OD分组序号(例如:廊坊to北京、北京to廊坊都是1)——【链接】(有效期:永久)https://pan.baidu.com/s/1LkOgDreX4BPgjyZq7EyC-A?pwd=7nduPS:提取码就写在链接里,直接访问即可,后续数据分享也会采用同一个目录——【关于转发】允许二次发布,请注明出处,不得设置额外的获取门槛,包括但不限于转发、集赞(互联网精神)——【关于赞助】如果觉得数据集有帮助,并愿意提供支持,欢迎通过爱发电(https://afdian.net/@junhuanliu)订阅我创作的学术文献解析笔记,或直接通过二维码进行捐赠(详见http://junhuanliu.ysepan.com/的【有偿服务说明文档】目录的“收款二维码.jpg”)

标签: 起点城市 关于转发

推荐文章

X 关闭

最新资讯

X 关闭