如果用一个成语来形容“东数西算”,会是什么?
承前启后。继往开来。
大军未动,粮草先行。
“从经济上来看,(东数西算)每年能带动投资4000亿元。”
4000亿元,相当于在整个“十一五”期间投资近三个南水北调工程。
南水北调工程“十一五”期间总投资约1405亿元;
西气东输一期、二期总投资2900亿元;
从2001年到2010年的十年间,西电东送总投资超过5200亿元。
东数西算为什么动静这么大?为什么说东数西算承前启后?它是哪支大军的粮草?
这要从近二十年的中国国运说起,再把接下来二十年的新国运置入视野。
21世纪前二十年:
2001年11月10日,卡塔尔首都多哈,WTO部长级会议上,主席卡迈勒一声槌响,让万里之外无数中国人为之沸腾——中国正式成为了世贸组织新成员。
图源:新华社
这一槌开启了接下来二十多年中国经济高速增长的繁荣国运。
同时,多哈以盛产石油和天然气闻名于世,在这里敲定的中国入世如同一个隐喻——能源将为中国国运输送强力支持。
入世前后www.cechina.cn,三大资源调配工程相继启动:西电东送、西气东输、南水北调。
2000年11月8日,贵州省洪家渡水电站、引子渡水电站、乌江渡水电站扩机工程同时开工建设,我国西电东送工程全面启动。
2002年7月4日,西气东输工程试验段正式开工建设。
2002年12月27日,南水北调工程正式开工。
接下来的20年,中国经济以惊人的增速发展——多年保持超过10%的GDP增长。
狂飙突进的经济发展和大型基建背后,是强大的能源支撑——尤其在中国入世后的头几年,中国全社会用电量增速几乎都超过了GDP增速。
中国GDP增速 图源:世界银行
中国社会用电量及增速 信息来源:中国政府网、国家统计局 制图:立方知造局
接下来的20年:
GDP增速放缓,各要素成本上升,中国工业面临全方位转型升级的需求。
无论是“中国制造2025”,还是工业4.0,数字化都是最核心的要素。
数据,已经成了新时代工业发展的水和电。
也正因为此,“东数西算”成了中国在下一个20年跻身制造强国的关键基石。
联合国《数字经济报告2021》中提到,全世界的超大规模数据中心,有一半在美国和中国,它们占据了过去五年人工智能初创企业融资总额的94%,世界顶尖人工智能研究人员的70%,全球最大数字平台市值的近90%。
苹果、微软、亚马逊、 Alphabet(谷歌)、Facebook、腾讯、阿里巴巴……全球最大的数字平台都来自中美两国。
新的大国竞速已经开启,既是跟发达国家,也是与自己——数字经济所收的成效,将直接影响到中国在世界格局中的地位。
01. 什么是“东数西算”?
“东数西算”的“数”指的是数据,“算”指的是算力,即数据处理能力。
简单来说,由于西部地区具有土地、电费和清洁能源优势,所以国家启动东数西算工程,把东部产生的大量数据,传输到西部地区进行运算。
数据中心占地面积非常大,例如中国移动(重庆)数据中心,占地总面积达217亩,总建筑面积约为13万平方米。
根据发改委等部门印发的文件,国家将启动建设:
8大算力枢纽节点:
京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏
10大国家数据中心集群:
张家口集群、长三角生态绿色一体化发展示范区集群、芜湖集群、韶关集群、天府集群、重庆集群、贵安集群、和林格尔集群、庆阳集群、中卫集群。
8大算力枢纽及10大数据中心集群分布图 图源:国家发改委
国家对东数西算项目的规划:
到2023年底,全国数据中心机架规模年均增速保持在20%左右,平均利用率力争提升到60%以上,总算力超过200 EFLOPS,高性能算力占比达到10%。国家枢纽节点算力规模占比超过70%。
新建大型及以上数据中心PUE降低到1.3以下,严寒和寒冷地区力争降低到1.25以下。国家枢纽节点内数据中心端到端网络单向时延原则上小于20毫秒。
(这里的PUE很重要,下文会详细解释)
02. 为什么说东数西算是必要的?
东数西算,是国家亲自下场,来平衡一次可能失控的数字生态。
一方面,东部地区土地、能源等资源相对紧张有限,而西部地区却资源充裕。
另一方面,现有数据中心大规模集聚在东部人口密集和经济发达地区,机架数量全国占比超过60%。相比之下,西部地区机架数量全国占比只有约10%。
除了数量悬殊,利用率差异也很大。
2019年,中西部超大型数据中心的整体利用率在30%-50%之间;而一线城市和周边城市数据中心的利用率达到了70%-80%,其中稳定运行的数据中心利用率通常可以达到80%-100%。
也就是说CONTROL ENGINEERING China版权所有,东部都已经“卷”起来了,西部却有力没处使。
这很像当年“西电东送”项目启动时的情况。
2000年,有个大新闻——二滩弃水事件。1991年开工、2000年完工的(四川)二滩水电站,总投资达285.5亿元,是中国20世纪建成投产的最大水电站。
但在建成后,二滩水电站的上网电价为0.45元/千瓦时,不仅高于国电公司系统0.25元/千瓦时的平均上网电价,甚至比当时全国到户城市居民0.42元/千瓦时的平均消费电价还要高。
过高的价格让二滩的经营陷入困境,甚至出现了宁可开闸放水、也不亏损发电的局面。
而背后的原因,直接来看是定价机制问题和负债过高,更深层次的原因,清华教授胡鞍钢认为是“各种既得利益集团包括行业垄断的地方保护主义已经成为中国经济发挥潜在增长需求的严重障碍。”
地方间的隔阂也体现在广东省的犹疑中。尽管高速发展的经济让21世纪初的中国东部频频出现拉闸限电,但当时的广东仍对使用西部电力兴趣索然,更希望自己买煤建大型火电厂来解决电荒,不但可控性高,还能产生税收和就业。
可想而知,如果不是国家从大局着眼推动西电东送,东西部很有可能在隔阂中“两败俱伤”。
东数西算需要国家来走这步大棋,原因也在于此。
03. “东数西算”能再给西部开发带来什么?
从国家维度来看,东数西算不是一个孤立事件,它既有绵延六十多年的历史纵深,也将为未来世界格局的变化埋下伏笔。
而从产业发展的角度,东数西算对于西部地区的建设,将产生巨大的带动作用。
中国的西部开发,可以找到三个重要节点:
一、外交困境中的自救
1964年,中央领导人发现中国的经济布局极其不平衡:
绝大多数工业和人口都在东部,而当时的中国,正同时承受来自两个超级大国——美国和苏联的压力。
为了确保国家安全,毛泽东提出了“三线建设”。
从1964至1980年,中国在三线地区所在的13个省和自治区的中西部地区投入了人民币2052.6亿元,占同期中国基础建设总投资的39.01%。
尽管当时国家领导人的主要用意是备战备荒,但三线建设也客观上开启了中国西部的建设之路。
用费孝通的话来说:“三线建设使西南荒塞地区整整进步了50年。”
在这个过程中,包括攀枝花钢铁基地在内的1100多个项目在西部拔地而起,给西部地区留下了成昆铁路、大河机床厂、庆阳油田等基础设施与新经济支柱。
1970年,攀钢第一期工程建成投产 图源:新华社
二、“全球化”背景下的西部开发
冷战结束后,到本世纪初中国加入世贸组织,西部大开发政策也被提上日程。
西气东输和西电东送工程,在这一时期启动。
这些工程不仅连接着国内东西部地区,也把管道伸向了更远的亚欧大陆。
西气东输除了国内的三条管线,还包括在建的四条与俄罗斯相通的管线,经由俄罗斯的管线,最远可以通向德国;
西电东送,国家电网正在研究论证一条从中国到欧洲长达4000-8000公里的亚欧输电通道及洲际联网;
而西部铁路建设中,也打通了中欧、中亚班列。
从武汉开往哈萨克斯坦阿拉木图的中亚班列 图源:新华网
当我们说到西部大开发的时候,很容易想到东西部之间的差距与协调,却很容易忽略西部地区对中亚、欧洲的桥梁作用。
而东数西算工程,则让所有中国人再次把注意力落在了西部地区。
三、东数西算,中国转型升级中的国运之争
看俄乌冲突新闻会发现,水电站、核电站、军事基地,这些往往是一次军事行动中首先要摧毁的地方目标。一旦这些设施被摧毁,更容易让对方不攻自破。
如果说在未来战争中还有什么会成为新的战略打击目标,数据中心一定会是其中之一。
从社会经济的角度,大数据、云计算、人工智能、自动驾驶…几乎所有近年来炙手可热的新技术新工业,都与东数西算密不可分。
而从军事角度www.cechina.cn,未来的战争都离不开精准的数字化作战。
数据和算力就像水和电一样,如果被截断,整个社会就会陷入瘫痪,眼睁睁等着来自对手的降维打击。
所以很多数据中心,例如腾讯贵安七星数据中心在建设上具备战时防护能力,可防相应级别常规武器乃至核武器的攻击。
建在山洞里的腾讯贵安七星数据中心 图源:环球网
04.既然西部有能源和成本优势,为什么不把所有数据中心都建在西部?
这就涉及到数据的“冷热”之分。
视频通话、游戏,或是金融证券、远程医疗、工业互联网、灾害预警等,对时延要求高,属于热数据,这些都适合布局在京津冀、长三角、粤港澳大湾区等东部枢纽布局。
而西部地区数据中心,受限于网络长距离传输造成的时延,以及相关配套设施等因素影响,不能满足所有算力需求,更适合温冷数据,例如存储在云端的文件,或是人工智能训练数据等,它们的特征是不需要高速调用。
05. 算力需求有多大?跟我有什么关系?
打车出门、点外卖、上抖音看直播…每天我们都在制造出新的互联网大数据,每天我们都需要更庞大的算力来支撑起这些早已习以为常的生活。
互联网发展到今天,平均每人每天都会产生1.5GB数据量。也就是说CONTROL ENGINEERING China版权所有,一个普通人两个多月生成的数据量,就是1992年整个人类互联网一天产生的数据量。(100GB)
一直被热议的自动驾驶汽车,未来其传感器每小时就会产生80GB的数据量,也就是每天5TB——相当于1200部高清电影。
预计到2025年,全球每天产生的数据量将达到491EB。
数据量越大,对算力要求越高。
这也是为什么人类要造出“超级计算机”——用变态级算力,来处理天文数字般的数据量。
1946年,世界上第一台通用计算机“埃尼阿克”的计算速度是每秒5000次,而现在,世界上最强的超级计算机美国“顶点”的浮点运算速度已经达到了每秒14.86亿亿次。
超级计算机和我们日常使用的电脑算力差别有多大?
举个例子:由于使用了超级计算机,电影《阿凡达》的后期渲染只用了一年的时间,而如果用普通电脑的话,需要一万年。
所以,如果没有庞大的数据中心和算力支撑,整个人类社会的数字化进程就会中断,虚拟人、智能汽车、元宇宙……都将成为泡影,看一部3D奇幻电影要等一万年。
06. 算力产业的规模有多大?
2020 年中国以计算机为代表的算力产业规模达到 2 万亿元,直接带动经济总产出 1.7 万 亿元,间接带动经济总产出 6.3 万亿元,即在算力中每投入 1 元, 将带动 3~4 元经济产出。
据预测,2025年全球物联网设备将超过400亿台,产生数据量接近80ZB,未来五年全球算力规模将以超过50%的速度增长,到2025年整体规模达到3300EFlops。
来源:同花顺iFinD 整理:立方知造局
07.提到算力,就会有人说起比特币,比特币和今天的东数西算有什么关系?
比特币的原理,简单来说,就是通过占用计算机的算力,来获取比特币奖励。计算的过程也就是所谓的挖矿。
这个过程产生了两种成本消耗:一是时间、二是电力。
并且越到后期,挖到一枚比特币所需要的算力越大,成本越高。
2009年,比特币诞生的时候www.cechina.cn,区块奖励是50个比特币。诞生10分钟后,第一批50个比特币就生成了。
一个朋友告诉我,大约十年前他发现淘宝网上一枚比特币只需要80元人民币,而他的配置普通的电脑,挖一枚比特币需要一周时间。当时他觉得太贵太费时间,所以既没有购买,也没有挖矿,现在他觉得有限的格局和眼界让自己生生错过了几个亿。
如果今天他“浪子回头”,用一台普通配置的个人电脑(而不是买专业“矿机”)挖矿,一枚比特币需要多久?答案是一万年以上。正好可以赶上PC渲染版《阿凡达》首映。
一台网上在售的二手矿机,算力100TH/S,标价33200元,按目前的挖矿难度,这台矿机挖出一枚比特币大约需要6年时间 图源:中关村在线
越挖越难的比特币,带来了巨大的耗电量:
根据剑桥大学的研究,截至2021年5月10日,全球比特币挖矿的年耗电量大约是149.37太瓦时(1太瓦时为10亿度电)。
这个耗电量,超过了三峡水电站一年的发电量(103.65太瓦时)。如果把比特币看作一个国家,它的耗电量可以排在全球25名左右。
人口4413万的乌克兰,2020年全国耗电量为127.3太瓦时,也是比特币的“手下败将”。
为了节省电费,比特币提前演绎了一场民间版的“东数西算”。
冬天,比特币“矿主”们一般在内蒙古、新疆等地用火电挖矿,一度电0.3元左右。到了春天,就通过把“矿机”运到川西地区,利用丰水期便宜的水电“挖矿”。如果和小水电站谈妥价格,电价可以每度0.2元左右。
挖1枚比特币要消耗184634度电,这个数字还在持续增长。
而近20万度电,可以织出200万米布,加工3000多吨面粉,生产300万瓶啤酒,供一辆电动车绕赤道跑4圈。
用来挖一枚比特币,除了让一个人的资产多出几万美元,并不产生其它社会价值。
号称去中心化的比特币,究竟是数字金融的新未来,还是虚耗社会资源的新黑洞、聚敛财富的新猎场?
2021年5月21日,国务院金融稳定发展委员会召开第五十一次会议,强调坚决防控金融风险,“打击比特币‘挖矿’和交易行为,坚决防范个体风险向社会领域传递。”
这被视为国家层面首次对比特币“挖矿”与交易明确提出打击要求。
严厉政策之下,众多“挖矿”项目被火速拉闸断电,退出中国。两个月间,中国在全球比特币“挖矿”活动中所需的计算能力所占份额从44%降至0,美国、俄罗斯、柬埔寨成为矿业新中心。而2019年,中国在全球算力中所占份额为四分之三。
好钢用在刀刃上,比特币所吞食的电力和算力,需要让位于更有价值的项目——东数西算。
08. 说完了比特币,号称“电老虎”的数据中心的用电量有多庞大?
数据中心被称为“不冒烟的钢厂”,电力消耗极大。2020年,中国数据中心年耗电规模超过了2000亿度,约占全社会用电量的2.7%。
这个数字比比特币的全球用电量还要多。
而一个大型数据中心为服务器供电和冷却所需的电能,可以占到数据中心总运营成本的57%。
面对数据中心如此巨大的成本压力,如何提升效率,避免浪费?
答案就藏在下面这个公式里:
PUE(数据中心效率)=输入数据中心的电能总量/IT负载消耗的电能
当我们浏览数据中心相关新闻时,“PUE值”这个词经常映入眼帘。它代表了数据中心对电能的使用效率,分子是总用电量,分母是实际用在设备上的电能。
在实际运作中,大量的电能被用在了服务器冷却、照明等环节。所以如果PUE越接近1,就表明用在IT设备上的电力越充足,浪费越少。
图源:施耐德电气-数据中心科研中心
面对这个公式,就需要同时在分子和分母上动脑筋。
首先看分子,数据中心的总用电量相对固定,从经济效益的角度,把数据中心安置在西部,可以节省电费;从社会效益的角度,中国西部有更加丰富的清洁能源,对环境更加友好。
分母则是改变PUE值的关键变量。从上面的图中也可以看出,各种能耗环节中,冷却是大头。
为了降低冷却成本,最常见的做法,就是直接把数据中心建在天气凉爽的西部和北部地区。
例如阿里的张北数据中心,年均气温仅为2.6℃,最低气温零下40度。只要将自然风新风通过风墙技术输送至机房,直接为服务器降温,一年就有300多天可以“免费”直接自然冷却。
张北的风能、光照资源也非常丰富,风电装机容量排名全国县级第二www.cechina.cn,年均可利用光照超过1600小时。
有以上这样的常规做法,也有人不走寻常路,把数据中心玩出花来。
例如阿里巴巴将一个数据中心建在了千岛湖旁,直接通过湖水制冷,常年恒定的水温让数据中心90%的时间都可以不依赖湖水之外的制冷能源,制冷能耗节省超过八成。
09. 目前哪些企业正重点布局数据中心?
数据中心产业链中游主要包括三大运营商和第三方IDC厂家,例如万国数据、光环新网、世纪互联、秦淮数据、中金数据等。
而在产业链下游,数据中心的核心使用者是“BATH”。
据统计,2021年第三季度中国云基础设施支出同比增长43%,达到72亿美元。其中,阿里、华为、腾讯、百度四大厂商合计占据八成市场份额。
百度:
百度数据中心主要布局在北京亦庄、酒仙桥M1、山西阳泉、江苏常州、贵州等地。
其中,阳泉数据中心上线服务器超过15万台,存储容量超过6EB,可存储的信息量相当于30多万个中国国家图书馆的藏书总量。
阿里:
阿里云在全球25个地域部署了上百个云数据中心,其中规划建设了5座超级数据中心,分别位于张北、河源、杭州、南通和乌兰察布,阿里巴巴已建成全国最大的数据中心集群。
超大型数据中心是指规模大于等于10000个标准机柜的数据中心;
大型数据中心是指规模大于等于3000个标准机柜小于10000个标准机柜的数据中心;
中小型数据中心是指规模小于3000个标准机柜的数据中心。
腾讯:
腾讯布局的数据中心有:贵安七星数据中心、怀来瑞北和东园数据中心、青浦数据中心、重庆数据中心、清远云计算数据中心、云仪征数据中心等。
2019年,腾讯宣布成为中国首家服务器总量超过百万的公司。
2022年,腾讯宣布在重庆打造西部云计算数据中心二期项目,未来装机容量提升至20万台服务器,将成为中国西部最大的单体数据中心。
华为:
当前,华为云在中国布局了五大数据中心。其中,贵安、乌兰察布是华为云一南一北两大云数据中心。
贵安数据中心于2021年9月一期投入使用,预计整体项目完成后将容纳100万台服务器。
10. 东数西算将带动哪些产业发展?
根据国务院印发的《“十四五”数字经济发展规划》,到2025年数字经济核心产业增加值占GDP比重将由2020年的7.8%提升至10%。
东数西算工程数据中心的产业链条长、覆盖范围广。包括土建工程、IT设备制造、信息通信、基础软件、绿色能源供给等。
随着数据中心的建设布局,将带动IDC、ICT设备、光模块、运营商、温控设备、光通信等领域需求的增长。
详见下图:
信息来源:中国信息通信研究院 制图:立方知造局
结语
纵观新中国历史,每一次把目光投向西部,所牵动的都是一场对未来国运的未雨绸缪。
在几十年的国家发展进程里,东部是帆,西部是锚;东部是一张拉开的弓,西部则是满满的箭袋。西部的广袤富饶让中国在面对任何情境时都更加淡定从容。
中国在长周期重大工程和基建上,最能发挥体制优势,三峡、高铁,莫不如此。
1964年,针对三五计划初步设想,毛泽东说:“不要以我们这些人的寿命来考虑事情,要以客观规律来办事。”
在近六十年后再回头看,这句话无疑是对东数西算、西部大开发最好的注解。