
导语(钩子):近日,因人工智能训练与推理对大容量硬盘的抢购,全球大盘硬盘价格骤涨,导致非营利机构互联网档案馆(Internet Archive)用于支撑Wayback Machine的30TB级硬盘价格接近原价三倍并出现断货。谁在为“公共记忆”买单?何时受影响?影响范围已从美国扩散到全球互联网历史保存体系。 背景:Wayback Machine是什么 互联网档案馆的Wayback Machine是保存网页快照的在线档案,为学术研究、新闻溯源与司法证据提供历史记录。当前库存约210PB(约21万TB)配点网股票配资网址,每天增加约100TB。维基媒体等机构也面临类似存储压力,需要为数千万篇条目提供长期存储与快速访问。 现状:AI如何把硬盘“吃掉” 大模型训练、在线推理和向量检索等人工智能工作负载,需要海量冷/热存储与廉价每TB容量。数据中心因此大量采购30TB等超大容量机械硬盘。厂商订单暴增导致像西部数据等公司对外表示部分容量“售罄”,市面上大盘价格已涨至历史均价的约三倍,交付周期延长数月。结果是非营利档案机构扩容成本暴涨,扩展速度受限。 双重夹击:爬虫被封与存储紧张 更棘手的是,一些新闻网站为阻止被AI抓取,开始屏蔽互联网档案馆的抓取器。这既影响了档案的完整性,也加剧了保存工作的困难:一方面存储资源紧张,另一方面来源端又在缩小可捕获的历史内容,两者形成结构性冲突。 为什么不能简单换成磁带? 磁带成本低、适合冷备份,但随机访问时间长,不适合作为面向公众的“活”档案。互联网档案馆确有使用磁带做长期备份,但日常在线访问仍需硬盘支持,以保证检索延迟与并发响应。 短期应对与社区反应 机构正在通过募捐、接受硬盘捐赠、优化去重与压缩、分层存储和延缓非关键抓取等办法缓解压力。创始人布鲁斯特·卡尔呼吁社区支援,并与出版方就抓取策略展开对话。 长期路径:政策与技术并举 建议将数字档案视为公共基础设施,推动政府与基金会设立专项补贴或优先配额。鼓励出版社与档案机构达成有条件开放协议,既保护原创权益,又保障历史记录。技术上可探索分布式存储、学术与图书馆联合镜像等方案;产业层面可呼吁存储厂商对公益机构提供价格与交付缓冲。 普通读者为什么要关心 缺乏可溯源的网页历史,将削弱新闻事实核查与司法取证能力,也影响社会记忆与舆论监督。网页被删除或篡改后,普通人将难以还原事件真相。 读者可做的事(简短清单)
向互联网档案馆等公益机构捐款或捐赠硬盘;保存重要网页快照为PDF或MHTML;关注并支持数字公共物品保护的公共讨论。 结语:AI带来算力红利的同时,也无意中吞噬了保存过去的资源。这既是技术问题,也是社会选择题。若无共识与制度安排,未来的网史可能会变得碎片化、私有化且更难恢复。与此同时,无论是支持Apple、三星、华为等生态的云服务,还是企业级训练集群,都应在追求性能的同时,考虑对公共数字记忆的责任。财富牛配资提示:文章来自网络,不代表本站观点。