北京时间4月23日消息,据物理学家组织网报道,当美国宇航局工程师失去同太空飞船或登陆车的联系时,我们往往听到的是太空任务宣告失败的坏消息。在其他类似情形下,会出现一些至关重要的系统失灵,导致任务遭受严重威胁。上述两种情况都是令人抓狂的假设,因为工程师若能在几分钟内诊断出太空飞船故障原因的话,就能够轻而易举对其实施修复。
阿里·阿克格鲁及他在亚利桑那大学的学生正在开发硬件/软件混合系统,这些系统将来能够通过机器智能,使太空飞船得以自我修复。阿克格鲁是该校电子与计算机工程助理教授,正使用现场可编程门阵列(FPGA)建设上述具有自愈功能的系统。
现场可编程门阵列结合了软件和硬件的优势,开发出能够在芯片级重新装配的“变形系统”。由于硬件的一些功能可以在芯片级发挥出来,软件就能被设计用于模拟硬件。这样,现场可编程门阵列的“固件”得以重新装配,用来模拟不同类型的硬件。
速度与灵活性大比拼
阿克格鲁这样解释这套系统:如今市场上有众多的通用系统,比方说台式计算机,它们能够在各式各样的应用软件上进行操作。然而不幸的是,即便是拥有3 GHz、双核处理器,这些通用系统同硬连线系统相比速度依旧慢得令人难以忍受。安装了硬连线系统,软件只能应用于特定的用途。
比方说,电脑工程师能够开发出在快速运行Microsoft Word的系统,不过在别的应用程序上它们就失去了效用。它们不能运行Excel和其他应用程序,但是在运行为其专门设计的程序上速度超快。阿克格鲁说道:“这种情况下,你将拥有速度超快的一套系统,但是它的适应性不强。当更新、更好的软件问世时,你只得重新研究设计流程,一切从零开始开发硬件。”
他说:“我们所需要的是处于中间状态的系统,它是两个世界中最好的,我正尝试用现场可编程门阵列解决这个问题。”自愈系统的开发工作作为阿克格鲁研究生班的一个项目开始于2006年。阿克格鲁的学生发表了有关这套系统的一篇论文,引起了美国宇航局的兴趣,后者最终提供8.5万美元经费资助他们的开发工作。
阿克格鲁及其学生现在正处于项目(可重复利用空间系统的可升级自我调整机构,简称SCARS)开发的第二阶段。阿克格鲁的研究小组正同喷气推进实验室合作推进SCARS项目的开发。目前他们正在测试五套硬件组件,这些硬件组件能够无线连接在一起。例如,它们就是火星上五个登陆车和漫游车的组合。他说:“我们故意制造实验故障,然后采用两种方式试图恢复。首先,组件重新对问题电路进行编程,尝试在节点级自我修复。”
如果这一手段不起作用,第二步是让组件使用冗余电路进行修复。不过,如果组件自身资源不能修复这些故障,网络级智能将接到警报。这种情况下,另一套组件将接管由故障组件实施的各项功能。阿克格鲁解释说:“第二套组件重新调整自身配置,以便能够实施自身承担的两项任务,和来自故障组件的重要任务。”如果两套组件均失灵不能自我修复,剩余的三套组件将分担上述任务。所有这些活动全部是在无人帮助下自动完成的。
快如闪电的处理速度
由于技术人员可以对现场可编程门阵列编程以同时完成各项任务,还可以为其添加新的配置,达到快速闪电的处理速度。阿克格鲁解释:“如果你在线圈上运行,它能运行一万次,你可以将线圈作为现场可编程门阵列‘N’次的处理元素进行复制。这意味着你拥有‘N’次加速度。”
这如同创造一个具有特定任务配置的超大、多核处理器。现场可编程门阵列传统上被用作电路原型,因为它们的固件能够重新编程。电脑工程师不仅能够制造出廉价的硬件电路,还能在现场可编程门阵列固件上快速、低廉地实践他们的想法。
阿克格鲁表示,过去五年,能够添加至现场可编程门阵列的电路量急剧增加,促使它们从简单的试验台变成自身的终极产品。Ridgetop集团目前也在与阿克格鲁合作开发这种自愈系统。这家位于图森的公司专门通过统计方法诊断电路故障。阿克格鲁说:“这是我们项目的下一个研究阶段。我们的目标是利用自愈系统在故障出现前预测出来。”经过不懈努力,他们或许能够开发出极为稳定的计算机系统,这些系统即便是长期使用也不会出现故障。
更多阅读