1

2023年的八大IT事故

 8 months ago
source link: http://www.d1net.com/cio/ciotech/580225.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

2023年的八大IT事故

责任编辑:cres 作者:Josh Fruhlinger |  2023-12-27 11:32:07 原创文章 企业网D1Net

一些前沿技术为今天存在的几乎每一家公司提供了便利,在大多数情况下,这种技术运行得很好,但当出现故障时,它可能比最奢侈的溢流马桶更尴尬(也更昂贵)。

我们收集了2023年冲击公司的八个重大技术失败的例子。当然,每个问题都是一个可以从中吸取教训的时刻,我们希望这些灾难可以作为警示故事,让你在2024年解决自己公司中潜在的IT问题。
航空领域的科技事故
航空业拥有造成真正可怕的IT恐怖故事所需的所有要素:它由大公司和大型政府官僚机构主导,它需要数千架飞机和数百万名乘客近乎完美的协调,任何延误都可能导致连锁故障,导致延误甚至更糟。由于现有的公司已经存在了很长时间,许多公司运行的IT系统包含一些几年或几十年的元素。老实说,这是一个奇迹,这个系统居然还能工作。美国联合航空公司和夏威夷航空公司在2023年都出现了由于软件升级不可靠而导致的服务中断,西南航空公司在前一年年末时将圣诞节旅行崩溃归咎于过时的系统。
然而,2023年最严重的IT航空灾难可能发生在政府方面。美国联邦航空局维护着一个名为通知空中任务(NOTAM)的数据库,该数据库提供了一个自动化的集中信息源,提供有关关闭的跑道或不同机场的设备故障,或不同航线上的危险等信息。1月11日,NOTAM坠毁,导致全国范围内的“地面停靠”,停止了所有起飞,但空中的飞机被允许继续飞往目的地。
停机被追踪到一个损坏的数据库文件,一个承包商正在努力纠正实时数据库和备份数据库之间的同步问题,但最终两者都被破坏了。这位工程师在“一个让国家损失数百万美元的错误”中“用一个文件替换了另一个文件”,这一事件为确保关键数据得到冗余备份提供了一些明显的教训,特别是在你要摆弄备份系统的情况下。
纽约证券交易所脆弱的备份过程
美国联邦航空局并不是唯一一个发现其备份过程本身就是一场灾难的组织,该过程本应有助于避免灾难。纽约证券交易所在1月份也面临着类似的危机,纽约证交所明智地将其备份服务器设在距离华尔街数百英里的芝加哥,作为一个数据堡垒,以防危机袭击曼哈顿下城。在某种程度上不那么明智的是,它的日常备份依赖于一个流程,员工必须在适当的时间物理地打开和关闭备份系统。
事实上,每天在完全相同的时间启动和停止数字进程是计算机相当擅长的事情,人们往往会时不时地搞砸,所以总有一天会出现危机,这可能是不可避免的。1月24日,当芝加哥的一名员工未能在适当的时间关闭备份服务器时,它就出现了。结果,当纽约证券交易所上午9:30开始交易时,纽约证交所的电脑们以为他们是在延续前一天的交易时段,而忽略了当天的公开拍卖,因为公开拍卖本应设定许多股票的初始价格。其结果是一系列剧烈的市场波动和大量错误价格的交易,这些交易不得不以高昂的代价被取消。教训是:永远不要派人去做计算机的工作,特别是如果计算机的工作很简单的话。
在太空中,没有人可以取消你的软件许可证
NASA是一个科学奇迹,它从事各种酷而鼓舞人心的太空活动,它也是一个庞大的政府官僚机构,有数千名员工和计算机系统在其保护伞下。不幸的是,与空间碎片相比,该机构更难跟踪所有这些计算机。OIG今年的一份报告关注的是NASA为甲骨文产品购买的大量许可证,以支持十多年前结束的航天飞机计划,结果不仅是该机构被甲骨文技术所束缚,而且糟糕的文档处理意味着NASA不确定他们实际使用了多少甲骨文系统。因此,该机构在过去三年里在其可能不使用的软件上花费了1500万美元,但不想冒着甲骨文软件审计的风险,因为甲骨文可能会处以更高成本的罚款。
此类问题的解决方案是实现一个软件资产管理程序,该程序可以帮助你准确地了解你正在使用什么软件,以及你需要什么许可证和不需要什么许可证。好消息是,美国联邦政府已经要求像NASA这样的机构实施这样的计划,坏消息是,根据OIG的报告,“实施企业范围的软件资产管理计划的努力受到了预算和人员问题以及该机构软件许可协议的复杂性和数量的阻碍。”
软件许可形势阴云密布
如果说NASA是一个过度谨慎的政府机构为软件付费的例子,那么它可能并不是为了以防万一,云服务提供商Nutanix在今年5月发生了一起丑闻,当时有消息称,该公司在软件许可方面采取了相反的方式。具体地说,Nutanix以“不合规的方式”使用第三方软件,这是一种委婉的说法,意思是“不付钱,即使他们应该付钱。”
该公司使用来自两家不同供应商的软件进行“互操作性测试、验证和客户概念验证、培训和客户支持”。不幸的是,他们使用的软件版本被标记为仅用于评估目的,这是一个持续多年的“评估”过程。这个问题是在一次内部审查中发现的,由于供应商需要为不符合规定的使用支付费用,Nutanix无法按时向SEC提交季度收益报告,因为它正在试图处理自己的欠款。这一失误导致这位CIO离开了公司,教训可能是,唯一比为你不使用的软件付费更糟糕的事情是,不为你使用的软件付费。
把灯关掉,派对结束了
从技术上讲,下一个故事是一个可以追溯到2021年的IT故障,但我们将在今年的综述中包括它,因为它是在2023年最终得到解决的。近10年来,马萨诸塞州米纳乔格地区高中一直快乐地运行着由第五光安装的“绿色照明”系统,该系统可以根据需要自动调节校内外的灯光。但在2021年8月,老师和学生注意到灯一直开到最大亮度。事实证明,该系统受到了恶意软件的攻击,并进入了后备模式,灯从未熄灭。
随之而来的是一系列发人深省的发现,为任何想要完全依靠软件来控制真实物理世界中的东西的人提供了教训。高科技的照明系统没有可以简单打开和关闭的手动开关,软件集成到其他学校系统中,不能轻易更换。最初的供应商已经不复存在,知识产权被买卖了好几次。新的所有者,一家名为Reflex Lighting的公司,花了几周时间才找到了解学校系统工作原理的人。最终制定了维修计划,但到那时,新冠疫情后封锁的供应链中断意味着新设备要几个月才能从中国运往马萨诸塞州。
最后,经过近18个月的持续亮灯(偶尔根据需要手动拧进灯泡),该系统今年进行了更新-是的,它配备了物理开关,可能一开始就应该有。
当崩盘意味着真正的崩盘
Minechaug地区高中的故事就是一个很好的例子,说明了为什么机械的现实世界的设备并不总是与软件很好地融合在一起,但机械和电气工程也不是没有问题——有时软件可以提供帮助。以澳大利亚使用的军用直升机MRH-90大班为例,2010年,一名飞行员在飞行中途尝试了所谓的“热启动”——关闭电源,然后重新启动引擎,导致发动机发生“灾难性”故障,这个机械问题在软件上得到了解决,澳大利亚国防部推出了一个软件补丁,旨在防止直升机热启动。
不幸的是,软件补丁的第一条规则是,只有当你真正推出补丁时,它们才能起作用。尽管这个补丁已经推出了十年的大部分时间,但并不是所有澳大利亚的大班都安装了这个补丁,导致今年4月在一次训练任务中,直升机因启动过热而坠毁。
下一步发生的级联电话故障
去年11月,澳大利亚发生了另一起备受瞩目的IT故障,该国第二大电信运营商Optus停机12小时,导致一半的澳大利亚人无法连接电话或互联网。故障最终可能归因于拥有Optus的新加坡公司Singtel发送的路由更改。这些信息显然是如此庞大的数据浪潮,以至于它淹没了Optus的路由器,然后不得不物理重启——考虑到澳大利亚的规模,这花了相当长的时间。
作为一家具有全国意义的服务提供商的问题是,当你遇到引人注目的IT故障时,你的高管会被拖到国家议会面前解释哪里出了问题,如果你告诉立法者这个问题是如此普遍和意外,以至于你没有处理它的计划,而且你的首席执行官携带着竞争对手运营商的SIM卡,以确保她在她负责的运营商倒闭的情况下仍能打电话,这肯定无济于事。或许并不令人意外的是,Optus首席执行官凯利·拜尔·罗斯马林很快就离开了公司。(我们认为,Optus大规模停电的教训是,为所有不同类型的灾难制定灾难计划,并正确配置路由器。)
AI,真正的失败
由于2023年是GenAI成为主流的一年,我们将用几个备受瞩目的AI灾难来结束这份清单。在其中一个比较引人注目的案件中,Levidow,Levidow&Oberman律师事务所的律师求助于ChatGPT,帮助他们起草与他们的一名客户就人身伤害起诉航空公司有关的法律摘要。对他们和他们的客户来说,不幸的是,ChatGPT做了一件越来越广为人知的事情:制作了一份极其可信的文件,其中包括一些事实错误,包括引用了多个不存在的法庭案件(AI术语中的“幻觉”)。律师史蒂文·A·施瓦茨向法官承认,这是他第一次将ChatGPT用于专业目的,他“没有意识到它的内容可能是虚假的。”在他的辩护中,他曾问ChatGPT它的引文是否是假的,这个聊天机器人坚持说,可以在LexisNexis和Westlaw等声誉良好的法律数据库中找到这些引文。(事实证明,这不是真的。)
AI的失败也打击了科技新闻界,CNET被迫撤回了35篇以上的报道,这些报道是在一种名为负责任的AI机器合作伙伴(RAMP)的工具的帮助下撰写的。不太负责的结果不仅让公司颜面扫地,还引发了员工的强烈反对。教训是,AI就像任何IT工具一样,如果你不了解它的工作原理,或者在你的特定用例中它仍然是半生不熟的,就不应该使用它。
企业网D1net(www.d1net.com):
国内主流的to B IT门户,同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。同时运营19个IT行业公众号(微信搜索D1net即可关注)。
版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK