作者:Michael O’Rourke 来源:cointelegraph 翻译:善欧巴,金色财经
要实现开放数据的全部潜力,并享受低成本的大型语言模型(LLM)训练、便捷的研究数据共享和不可阻挡的 DApp 托管,我们必须将其从中心化基础设施过渡到去中心化架构。
目前,开放数据是全球新兴技术经济的主要推动力,市场估值超过 3,500 亿美元。然而,许多开放数据源依赖于中心化基础设施,这与 Web3 的自治性和抗审查性理念背道而驰。
要释放开放数据的全部潜力,必须向去中心化基础设施转变。一旦开放数据生态转向去中心化和开放的架构,用户应用程序的多个漏洞将得到解决。
去中心化基础设施的应用场景非常广泛,包括:
• 托管去中心化应用(DApp)
• 运行交易机器人
• 共享研究数据
• LLM 的训练与推理
深入研究这些用例,我们会发现,与中心化基础设施相比,去中心化架构对开放数据的利用更加高效且实用。
LLM 训练与推理成本更低
开源 AI DeepSeek 的发布,曾一度引发美国科技市场蒸发 1 万亿美元,充分展现了开源协议的力量。这是一个警示,表明我们应该关注以开放数据为核心的新全球经济。
目前,封闭的、中心化的 AI 模型训练成本高昂,这也影响了 LLM 训练和生成高精度结果的能力。例如,DeepSeek R1 的最终训练成本仅约 550 万美元,相比之下,OpenAI 的 GPT-4 训练成本超过 1 亿美元。然而,新兴的 AI 产业仍然依赖于中心化基础设施平台(如 LLM API 提供商),这与开源创新的理念相矛盾。
实际上,托管开源 LLM(如 Llama 2 和 DeepSeek R1)既简单又便宜。与状态化区块链(stateful blockchain)需要持续同步不同,LLM 是无状态(stateless)的,仅需要定期更新。
尽管 LLM 运行相对简单,但在开源模型上执行推理的计算成本依然较高,因为节点运行者需要GPU 计算能力。但值得注意的是,这些模型无需实时同步更新,因此在长期运行中能节省大量成本。
通用基础模型(如 GPT-4)的兴起,使得基于上下文推理的新产品开发成为可能。然而,中心化公司(如 OpenAI)不会允许任何随机网络访问其训练模型进行推理。
相反,去中心化节点运行者可以充当 AI 端点,向客户提供确定性数据,从而支持开源 LLM 的开发。去中心化网络通过授权运营商在网络上启动网关来降低进入门槛。
这些去中心化基础设施协议通过开源核心网关和服务基础设施,在其无需许可的网络上处理数百万个请求。因此,任何企业家或运营商都可以部署其网关并进入新兴市场。
例如,某个团队可以利用去中心化计算资源,在无许可协议 Akash 上训练 LLM,该协议可以以比中心化云服务提供商低 85% 的价格提供定制计算服务。
目前,AI 公司每天约花费 100 万美元用于基础设施维护,以运行 LLM 推理服务。这意味着AI 基础设施市场的年规模(SAM)可达约 3.65 亿美元。
数据表明,市场条件正指向去中心化基础设施的巨大增长潜力,未来 AI 计算资源的去中心化发展将为行业带来更大的创新空间。
可访问的研究数据共享
在科学研究领域,数据共享结合机器学习和大型语言模型(LLM)有可能加速研究进程并改善人类生活。然而,由于高成本的学术期刊系统,数据获取受到限制。这些期刊仅选择性发表其委员会批准的研究,并且大多隐藏在昂贵的订阅费用之后,难以广泛获取。
随着基于区块链的零知识(ZK)机器学习模型的兴起,数据现在可以在无需信任的环境中进行共享和计算,同时保护隐私,而无需泄露敏感信息。因此,研究人员和科学家可以在不去匿名化潜在受限的个人身份信息的情况下共享和访问研究数据。
为了可持续地共享开放研究数据,研究人员需要一个去中心化的基础设施,该基础设施能在数据访问方面为他们提供奖励,消除中介机构。一个激励性开放数据网络可以确保科学数据在昂贵的期刊和私营公司之外保持可访问性。
不可阻挡的 DApp 托管
亚马逊云服务(AWS)、谷歌云(Google Cloud)和微软 Azure 等中心化数据托管平台在应用程序开发者中非常流行。尽管这些平台易于访问,但中心化平台存在单点故障风险,影响可靠性,并可能导致罕见但合理的服务中断。
在科技史上,基础设施即服务(IaaS) 平台未能提供不间断服务的情况屡见不鲜。例如:
• 2022 年,由于 Infura 遵守美国制裁,MetaMask 暂时拒绝了某些地区用户的访问。尽管 MetaMask 是去中心化的,但其默认连接和端点依赖于中心化的 Infura 访问以太坊。
• 2020 年,Infura 客户也经历了中断。
• Solana 和 Polygon 在高峰流量期间,其中心化远程过程调用(RPC)服务过载,导致网络拥堵。
在一个蓬勃发展的开源生态系统中,单一公司很难满足各种开发者需求。目前,市场上有成千上万个Layer 1 区块链、Rollup 方案、索引服务、存储协议和其他中间件协议,涵盖不同的细分用例。
大多数中心化平台(如 RPC 提供商)持续构建相同的基础设施,这不仅造成摩擦,还减缓增长速度,并影响可扩展性,因为协议专注于重建基础,而不是开发新功能。
相反,去中心化社交网络应用(如 BlueSky 和 AT Protocol)的成功表明,用户对去中心化协议的需求正在增长。摒弃中心化 RPC,转向开放数据访问,这些协议提醒我们构建和采用去中心化基础设施的重要性。
例如,去中心化金融(DeFi)协议可以从 Chainlink 获取链上价格数据,而无需依赖中心化 API 获取价格信息和实时市场数据。
目前,Web3 市场约有 1000 亿次可服务的 RPC 请求,每百万次请求的成本在 3 至 6 美元 之间。因此,Web3 RPC 的总可寻址市场规模(TAM)约为 1 亿至 2 亿美元/年。随着新数据可用性层的稳定增长,每天的 RPC 请求量可能超过 1 万亿次。
为了顺应开放数据传输的发展,并进入开源数据市场,转向去中心化基础设施势在必行。
开放数据需要去中心化基础设施
长期来看,我们将看到通用区块链客户端将存储和网络功能卸载到专门的中间件协议中。
例如,Solana 率先推动去中心化存储,最早将其数据存储在 Arweave 这样的链上。因此,Solana 和 Phantom 再次成为处理 TRUMP 总统竞选 Meme 代币交易流量的主要工具,这是金融和文化历史上的重要时刻。
未来,我们将看到越来越多的数据流经基础设施协议,这将使中间件平台成为协议层的重要依赖。随着协议变得更加模块化和可扩展,这将为开源、去中心化的中间件在协议层集成创造空间。
让中心化公司充当轻客户端头数据的中介,在未来将变得不可行。去中心化基础设施无需信任、分布式、经济高效且不受审查。
因此,去中心化基础设施将成为应用开发者和企业的默认选择,推动一个互惠共赢的增长模式。
白话区块链|同步全球区块链资讯、区块链快讯、区块链新闻
本站所有文章数据来源:金色财经
本站不对内容真实性负责,如需转载请联系原作者
如需删除该文章,请发送本文链接至oem1012@qq.com