首页 人工智能正文

将人工智能技术扩展到新任务的算法可以帮助分析航班延误

人工智能 2019-09-17 09:04:10

许多人工智能研究都关注于找到变量之间的统计相关性:可见特征的哪些组合表明数字图像中存在特定对象?什么语音与什么词的实例相对应?哪些医学,遗传和环境因素与哪些疾病相关?

随着变量数量的增加,计算它们的汇总统计数据变得非常复杂。但是,如果您对数据的结构有所了解,那么这种计算可以大大简化 - 例如,对应于字母“T”的声音后面经常会出现与字母“R”相对应的声音,但绝不会是对应于字母“Q”的声音。

在12月份的神经信息处理系统基金会年会上发表的一篇论文中,麻省理工学院的研究人员描述了一种新技术,它扩展了可以有效推导出结构的数据集类。不仅如此,他们的技术自然地以一种使其更容易使用的方式描述数据。

在论文中,他们将他们的技术应用于几个样本数据集,包括商业航班的信息。该算法仅使用航班的预定和实际出发时间,可以有效地推断有关通过美国机场的航班延误传播的重要信息。它还确定了那些延误最有可能产生深远影响的机场,这使得对整个网络行为的推理变得更加简单。

在技​​术方面,研究人员的工作涉及概率图形模型。在此上下文中,图形是由节点和边缘组成的数学构造,通常分别描绘为圆形和连接它们的线条。网络图是一个熟悉的图形示例; 家谱是另一种。

在图形模型中,边缘具有关联的数字,其描述节点之间的统计关系。在语言示例中,表示对应于“T”和“R”的声音的节点将通过高度加权的边缘连接,而对应于“T”和“Q”的节点将根本不连接。

图形模型简化了数据关联的推理,因为它们消除了考虑某些依赖关系的需要。例如,假设您的人工智能算法在大量医疗数据中寻找诊断上有用的模式,其中变量包括患者的症状,其遗传信息,治疗历史和先前的诊断。没有图形结构,算法别无选择,只能一次评估所有变量之间的关系。但是,如果它知道,例如,基因“G”是疾病“D”的原因,其用药物“M”治疗,其具有副作用“S”,那么它有一个更简单的时间来确定是否,例如,“S”是先前未识别的“D”指示符。

从历史上看,图形模型只有在具有一些特定形状(例如树的形状)时才加速机器学习算法。树是一个没有闭环的图形:例如,在一个家族树中,一个闭环表示生物学上不可能的东西 - 例如,某个人同时是同一个人的父母和兄弟。

麻省理工学院电气工程与计算机科学系的研究生Ying Liu与他的顾问Alan Willsky共同编写了这篇新论文,Edwin Sibley Webster电气工程教授因为可以制作统计推断算法而产生问题。 Liu解释说,通常用于推断图形模型中统计关系的算法是一种“消息传递算法,其中每个节点仅使用本地信息和来自其他邻居的传入消息向其邻居发送消息。这是分配计算的一种非常好的方法。“

但是,如果图形具有循环,”节点可能会收到一些消息,但此消息部分来自其自身。所以它对这些信念过于自信。“

在之前的工作中,Liu和Willsky表明,高效的机器学习仍然可以在“循环”概率图中发生,前提是它具有相对较小的“反馈顶点集”(FVS) - 一组节点,其删除将循环图转换为树。在航空公司的航班示例中,FVS中的许多节点是航空枢纽,其中有飞往大量稀疏连接机场的航班。刘说,在目前应用机器学习的其他环境中,可以看到相同的结构,例如社交网络。

在新论文中,他们表明图形模型的结构可以通过类似的方法推导出来。无结构数据集等效于每个节点连接到每个其他节点的图。Liu和Willsky的算法遍历图表,依次删除破坏循环的节点,并使用他们之前演示的有效算法,计算结果图的统计依赖性与完全连接图的统计依赖性的接近程度。

以这种方式,算法为图形建立FVS。剩下的是一棵树 - 或者非常接近树的东西 - 允许有效的计算。在实践中,Liu和Willsky发现,为了使机器学习有效,他们需要一个FVS,其大小只是图中节点总数的对数。

德克萨斯大学奥斯汀分校电气和计算机工程助理教授Sujay Sanghavi也研究了学习图形模型结构的问题。在麻省理工学院研究人员的工作中,Sanghavi说:“他们将问题分解为两个问题,每个问题都可以单独解决,然后在两者之间交替。这是解决问题的一个更好的方法,而不是原来的问题。两个问题混合在一起。“

在已经确定FVS的情况下,Sanghavi说:“您可以轻松找到不包含这些节点的图表。这是一个可爱的观察,一旦你有这些节点,问题的其余部分很容易。另一个问题也很简单,也就是说,我只给你那些节点,这些节点数量很少,你只需要找到那些有一个端点作为那些节点的边。只是当你试图一起解决这两个问题时,它变得很难。这是本文的主要见解,我觉得它非常好。“

Sanghavi最近一直在使用图形模型来检查基因调控网络的结构,他很想知道MIT研究人员的技术是否适用于该问题。Sanghavi解释说:“一些基因会激发,它们会激发其他基因等等。” “你真正想要做的是找到基因之间的依赖网络,这可以被视为高斯图形模型学习问题。看看他们的方法是否表现良好会很有趣。“

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

头条推荐

评测三星A80和iPhoneXR以及Instagram将不再提供WP系统程序

评测三星A80和iPhoneXR以及Instagram将不再提供WP系统程序

评测65W SuperVOOC 2.0与One Vision新机的价值在哪

评测65W SuperVOOC 2.0与One Vision新机的价值在哪

图文推荐

评测插件完善应用以及vivo X20Plus屏幕指纹版的质感怎样

评测插件完善应用以及vivo X20Plus屏幕指纹版的质感怎样

评测荣耀畅玩7C和三星S10的性能怎么样

评测荣耀畅玩7C和三星S10的性能怎么样

评测努比亚V18与三星S10相机相比谁的拍照技术好

评测努比亚V18与三星S10相机相比谁的拍照技术好