卫健委官网上有篇特别的文章,值得技术分析

卫健委官网上有篇特别的文章,值得技术分析

在卫健委的官方网站(nhc.gov.cn/)上看到一篇文章,1月14号发布,叫《国家卫生健康委召开全国电视电话会议 部署新型冠状病毒感染肺炎防控工作》,很有些意外。

为什么意外?因为1月14号召开的这个会议,一是强调了疫情的严重性,二是做了充分部署,如果真按会议布置的都重视了执行了,肺炎很可能不会蔓延,灾难很可能不会发生。

我们看看会上都说了些什么:

文章地址在这里,有兴趣的朋友可以自己看:nhc.gov.cn/xcs/fkdt/202

1月14号离武汉封城还有9天,如果会议精神落实到位,那很可能不会出现发热病人挤满医院交叉感染,也不会有许多高度疑似患者出市出省,万家宴也会被制止,许多悲剧很可能不会发生。

从实际情况看,1月14号的这些指示没有被严格执行。那是什么地方出了问题呢?会议没开?开了没说?说了没传达?还是传达了没执行?

这么重要的一个会议,看了那么多报道,怎么好像没见媒体提起过?

以我格物致知的习惯,打量了一下网页地址,中间有一串数字“202002”,这通常代表日期:2020年2月。

几乎所有网站,都需要一个叫CMS的系统,功能和界面类似于公众号的后台。区别在于,公众号后台用来发布微信公号,CMS系统用来发布网页内容。CMS每生成一个网页,都会入库,同时自动给网页分配一个网址,为了方便查询和管理,通常将网页入库的时间加在网址里。

如果202002代表2020年2月,说明这篇文章应该是2月份入库,显然跟文章正文里的“发布时间 2020-01-14”对不上,看来我判断错了?

我随机翻看这网站上几篇新闻,凡是2月份发布的,网址里会有“202002”,1月份发布的,网址是都有“202001”,如果是12月发布的,网址里是“201912”。看起来这串数字确实对应入库时间。

然后我回到这篇文章,看看网页源码,发现源码里有这么几行字:

这几行字叫网页的页头,它是CMS系统生成网页时自动添加的,如果想改动,得修改CMS系统,工作量不小。通常非IT公司的CMS系统都由外包团队开发,自己没能力修改,即使找回外包团队做改动,工作量不小,动辄几个月,另外还有稳定性安全性之类的问题,所以基本改不了,因此页头可以看成可靠的原始记录。

源码不好改,但修改正文显示的发布时间很容易,那通常是CMS的自带功能,随便改。

页头里有这么两行字:<meta name="PubDate" content="2020-02-21 08:39:34"/><meta name="others" content="页面生成时间 2020-02-21 08:39:34" />

有没有可能这是网页的最终修改时间而不是最初的入库时间呢?有可能。卫健委官网上“防控动态”里,有许多条新闻的发布时间跟页头不一致,例如网址里的数字串是200201、页头显示2月、正文写1月,说明网页1月入库,2月做了修改,页头里显示的发布时间自动变成了2月,但网址不变,因为网页一旦入库,无论怎么修改内容,网址都不应该变化,否则网站结构就乱套了。

这话有点绕,简单总结:页头里显示的“2020-02-21”是最后修改发布时间,网址里的字符串“202002”对应入库时间。

这说明什么呢?说明这篇文章是2月份入库,发布时间在2月1号和2月21号之间,然后正文的发布时间被手工改成1月14号。

我不知道这么做有什么用处,我只讨论技术问题。



作者:无名小卒

来自公号:生活组鹅

id:shenghuo_e

发布于 02-27

文章被以下专栏收录