一种从航拍图像中自动构建道路地图的新方法
地图应用可能已经改变了我们的世界,但它们仍然没有映射所有这些。具体而言,绘制道路可能既困难又乏味:即使在拍摄航拍图像后,公司仍然需要花费很多时间来手动追踪道路。因此,即使像谷歌这样的公司也没有开始绘制全球超过2000万英里的道路中的绝大多数。
地图中的差距是一个问题,特别是对于为自动驾驶汽车开发的系统。为了解决这个问题,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员创建了RoadTracer,这是一种自动化方法,可以构建比现有方法准确度高45%的路线图。
使用来自航拍图像的数据,该团队表示,RoadTracer不仅更准确,而且比现有方法更具成本效益。麻省理工学院教授穆罕默德·阿里扎德(Mohammad Alizadeh)表示,这项工作对谷歌这样的科技巨头以及没有资源策划和纠正地图中大量错误的小型组织都很有用。
“RoadTracer非常适合绘制地图经常过时的世界地区,其中包括人口较少的地区和经常建造的地区,”Alizadeh说,他是一篇关于该地图的新论文的共同作者之一。系统。“例如,泰国农村等偏远地区的现有地图缺少许多道路。RoadTracer可以帮助他们更准确。“
例如,在查看纽约市的航拍图像时,RoadTracer可以正确地映射44%的道路交叉点,这比基于图像分割的传统方法的效率高出两倍,而传统方法只能映射19%。
该论文将于6月在犹他州盐湖城举行的计算机视觉与模式识别会议(CVPR)上发表,是CSAIL与卡塔尔计算研究所(QCRI)的合作。
Alizadeh的麻省理工学院合着者包括研究生Fayven Bastani和Songtao He,以及教授Hari Balakrishnan,Sam Madden和David DeWitt。QCRI的共同作者包括高级软件工程师Sofiane Abbar和Sanjay Chawla,他是QCRI数据分析小组的研究主管。
当前自动化地图的努力涉及训练神经网络以查看航拍图像并将各个像素识别为“道路”或“非道路”。因为航拍图像通常可能是模糊且不完整的,所以这样的系统还需要后处理步骤。试图填补一些空白。
不幸的是,这些所谓的“分割”方法通常是不精确的:如果模型错误标记了一个像素,那么该错误将在最终的路线图中被放大。如果航拍图像有树木,建筑物或阴影遮挡道路开始和结束的地方,则特别容易出错。(后处理步骤还需要根据可能并不总是存在的假设做出决策,例如连接两个路段仅仅是因为它们彼此相邻。)
同时,RoadTracer逐步创建地图。它从道路网络上的已知位置开始,并使用神经网络检查周围区域以确定哪个点最可能是道路上的下一个部分。然后,它会添加该点并重复该过程,逐步逐步追踪道路网络。
Bastani表示:“RoadTracer不是直接就各种像素是否代表道路的某些部分做出数千个不同的决定,而是专注于从我们所知道的道路开始时确定从哪个方向开始的更简单的问题。” “这在很多方面实际上与人类构建我们周围世界的心理模型的方式更接近。”
该团队在北美和欧洲六个国家的25个城市的航拍图像上训练了RoadTracer,然后评估了其在其他15个城市的测绘能力。
“对于地图系统来说,能够在未经过培训的城市中表现良好非常重要,因为自动映射最有希望的地区是现有地图不存在或不准确的地区,”Balakrishnan说。
Bastani表示,RoadTracer的错误率降低了45%,这对于让像Google这样的公司更加实用的自动绘图系统至关重要。
“如果错误率太高,那么从头开始手动映射道路与从推断的地图中删除不正确的段更有效,”Bastani说。
尽管如此,实施类似RoadTracer的东西并不会让人完全脱离循环:团队说他们可以想象系统会为大区域提出路线图,然后让人类专家进来仔细检查设计。
“这就是说,很明显,像我们这样的系统可以大大减少人类必须做的繁琐工作量,”Alizadeh说。
实际上,RoadTracer增量方法的一个优点是它可以更容易地纠正错误; 人工监督员可以简单地纠正它们并从中断处重新运行算法,而不是继续使用不精确的信息,这些信息会逐渐渗透到地图的其他部分。
当然,航拍图像只是拼图的一部分。他们不会向您提供有关天桥和地下通道的信息,因为这些都无法从上面确定。因此,该团队还单独开发可以从GPS数据创建地图的算法,并努力将这些方法合并到一个系统进行映射。