杭州气象局:将风云变化尽收智能之眼
就像“人脸识别”一样,胡德云和他的同事们实现了 24 小时“天脸识别”,准确度不输于人工观察,杨焕强再不用每天必须守在观测场了。
近年来,受全球气候变暖趋势影响,各种自然灾害频繁发生。世界气象组织分析,所有自然灾害中 90% 都与天气、气候和水有关。而我国的杭州地处中纬度地区,是西伯利亚冷空气、副热带高压“争夺”之地,容易造成各种气象灾害。加上杭州西部多山,中有钱塘江,水汽充沛,局部雷雨大风也多见。因此,气象变化带来的环境影响,无疑是痛点之一,而气象观测显得尤为重要。
“在我们眼里,云是一串数字”
从南宋皇城遗址的凤凰山脚路一直向南走,只需要数百米就可以到馒头山,这里是杭州最老的社区——
相比山下的智能化设施遍地、互联网公司林立,馒头山社区更像是一下穿越回了 80 年代,到处可见的铁锈斑斑和吱嘎作响的竹椅似乎都在见证着时光的洗礼。
杨焕强和同事们所在的杭州环境气象中心就在馒头山顶。2006 年毕业后,杨焕强就住到了馒头山,这一住,就是 12 年。
作为气象观测业务人员,杨焕强的工作就是看云观天,用眼睛看,用仪器看,用探空气球“看”,最近又变成了用 AI 软件看……飘过杭州的每一朵云,杨焕强和他的同事们都见过。
把家安在山上的原因很简单:气象观测的工作时间是早上 7:00 到晚上 20:30,这还是近年调整之后的时间。杨焕强刚来馒头山时,面对的是 24 小时 3 班倒的工作模式,不把家安在山上,根本留不出给自己休息的时间。
过去的 12 年,除了偶尔去附近的钱塘江边跑跑步,杨焕强连过年都待在山上。他至今还记得自己第一次独自在山上过年的场景,以往都是和家人过团圆年,但现在陪伴他的只有三五个同事和布满整个场地的观测仪器。“这是岗位需要,但没点毅力还真坚持不下来。”杨焕强说。
“与星为伴,与云为伍,这在别人看来是件浪漫的事。但在我们眼里,它就是一串数字。”胡德云说。胡德云是杭州环境气象中心主任、高级工程师,在他和杨焕强这样的专业人士眼里,云,是可以量化的——
普通人眼里的白云、彩云、乌云,在他们眼里可以细分成三族十属二十九类,天空的云量可以细化到 11 个级别。而他们要做的就是准确地“认”出这些云,且识别准确率不能低于 80%。
馒头山与杭州市区平均海拔相差不大,但让人感觉气温比城区里低几度,花开也比外面晚一点。但胡德云的意识却一点也不慢,他的想法总是很超前:以前气象环境中心是 24 小时人工值守,现在大部分气象要素实现自动化了,那能不能把剩下的部分也实现自动化,让气象观测员从馒头山的气象观测场解放出来?
AI 实现“天脸识别”
天气瞬息万变,可人工的定时观测始终不能实现高时空密度的连续观测,这个时候,AI 帮到了胡德云和杨焕强。用高清视频摄像机图像结合人工智能算法,如果能够有一个云图的模型规范了不同形状的云图对应的结果,那么当产生新的云图时,只要输入模型进行比对,就能得出结果。为了验证这个想法的可行性,胡德云和他的同事在全国建立了 28 个站点,收集了内蒙古、青海、黑龙江、北京等多地不同的气候图片,从沙暴、扬尘到高原云状,他们全都“捕捉”到了,数量达 100 万张。
收集到足够多的图片样本只是第一步。之后,他们将精选的 2 万张气候图片,借助百度 EasyDL 定制化训练和服务平台进行训练,打造了一套能够智能“看云”的 AI 系统,这套系统里包括观察云状、云量、天况、霜露、雨凇雾凇、茶叶霜冻识别等气象图片的定制化模型。目前,已经对 20 多种云状、11 种云量,以及雾、霾、沙尘、霜露、结冰、结雪、雨凇雾凇、茶叶霜冻等天气状况进行自动观测。
在调试的过程中,经常会遇到一些难题。而这些困难,大多需要百度的工作人员帮助一起解决。胡德云说:“百度的工程师非常敬业,服务态度也非常好,这一点我们还是印象非常深刻的。”由于程序开发经常会在深夜进行,百度为了更好地提供服务,专门给杭州气象局的开发者们建立了一个微信群,方便小范围及时交流。哪怕是在深更半夜,只要他们遇到问题,百度的工程师也会积极响应。
经过不断的优化迭代,现在这套人工智能天气观测系统对 20 多种类型的云状识别准确率达 87.5%,云量识别实际准确率也在 85% 以上,霜露、雨凇雾凇识别准确率均在 80% 以上。
就像“人脸识别”一样,AI 帮胡德云和他的同事们实现了 24 小时“天脸识别”,准确度不输于人工观察,杨焕强不用再每天必须守在观测场了。胡德云说:“这套系统在五月份会在 3 到 5 个气象站进行试点,效果好就有机会推广到全国。”
未来,AI 技术在地面气象观测方面的应用体量还是非常广的。目前谁都不能做到完全无人化,气象观测毕竟是比较科学的预测,有一个比较长的过程。但通过人工智能的一些策略方法,对于短时间内的预测有一定的参考价值。
随着 AI 技术在市场上应用的不断深化,不光是在地面上的观测,我们也希望能够应用到天气的预测。比如短时临近的这种预警预测,观测与自动化能够联动起来,预测短时间内可能会出现什么样的天气。但对于中长期的气象预测,还是需要更多先进的 AI 技术,通过对全球的数据与资料进行分析处理,这将对城市气候的分析预测也有着重要作用。
专家点评
从尝试由卫星图像中识别云、雾、雪天气现象,到从雷达图像中识别强对流天气,再到利用摄像头图像识别下雨、下雪、路面结冰和低能见度等天气现象,人工智能在气象领域的发展渐入佳境。
在人工智能气象观测方面,百度大脑EasyDL定制化训练和服务平台进行训练,创造了一套能够智能“看云”的AI系统。在技术方面,借着人工智能领域中深度学习技术在图像场景分类领域吹起的“东风”,用高清视频摄像机图像结合人工智能算法,利用收集到的足够多的图片样本进行训练。在分析方法上,深度学习方法提高了模型的准确性和建模的效率;人工智能公共数据集和预训练模型为克服数据量级困难,提高天气现象识别效果发挥了重要作用。
经过多地实验和系统的更新迭代,百度大脑EasyDL对20多种类型的云状识别准确率均达到达80%以上,该系统的普及将大大的缩减气象观测员的数量。
——36氪研究院院长李晓晓