黄铁军: 让AI拥有超人“视力”



    爱国情 奋斗者

    “刚开完会,上午会议结束得晚,咱们边吃边聊吧。”第一次见到北京大学信息科学技术学院教授黄铁军是在一次会议间隙,正值午饭时间,快人快语的他直接招呼记者一起用餐。

    1970年,黄铁军生于河北省邯郸市大名县的一个普通村庄,和著名歌手邓丽君是同乡。若是身处在人群中,中等个子、衣着朴素的黄铁军,显然不会像邓丽君那样引人注目。但在人工智能(AI)机器视觉领域,他有着绝对的发言权。

    最近他的成果再次成为业界关注的焦点。前段时间,黄铁军牵头研制的超速全时仿视网膜芯片首次公开亮相。这款芯片采用光电技术,能“看清”高速旋转叶片上的文字,可充当AI的“超速电眼”。

    从农村娃到如今的AI大咖,在黄铁军身上,有着怎样的故事?

    高中时对编程感兴趣

    1986年,黄铁军上高二。那时很多人还没见过计算机,他却幸运地就用上了电脑。

    “当时正值国家在中学推广计算机学习,一些电脑被下发到部分学校。我所在的高中就有5台电脑,而后我参加了学校组织的计算机兴趣班。”黄铁军回忆道,自己对计算机“一见如故”,没学多久就开始自己上机编程。

    因为他程序编得好,老师把一台电脑拨给他专用。如今,黄铁军仍心存感激,高中时这段与计算机亲密接触的经历,为他日后的科研选择埋下了伏笔。

    1988年,临近高考,那时的他一心想探求世界本源,于是毫不犹豫地填报了北京大学物理系。遗憾的是,他高考发挥失常,没能进入心仪的大学。正在犹豫是否复读时,他收到了武汉工业大学(现为武汉理工大学)的补录录取通知书,随后进入该校计算机学院应用技术专业。

    1995年,黄铁军进入华中理工大学(现为华中科技大学)图像识别与人工智能研究所攻读博士学位,主要研究方向为双目立体视觉及其在虚拟现实中的应用。毕业后,1999年他进入中国科学院计算技术研究所进行博士后研究,研究方向为图像识别技术,合作导师是时任所长、现北京大学教授、中国工程院院士高文。

    “逼上梁山”转战视频编码

    从博士到博士后,黄铁军的研究都围绕图像识别展开。当时,他以为自己会沿着这条路走下去,但命运却把他引向了一条岔路——视频解码。

    2002年,数万台我国制造出口的DVD,由于未支付专利许可费,在欧盟地区被海关扣押。在专利大棒的打压下,集中在广东地区的相关生产工厂大量倒闭。

    “那是改革开放后,我国首次遭遇重大知识产权问题。”黄铁军说,制定中国自主知识产权音视频压缩标准,摆脱受制于人的困境,在当时变得十分迫切。

    彼时,主题为“宽带流媒体”的香山科学会议正在召开,大会主席安排黄铁军起草会议简报。会议期间,工信部、科技部相关领导明确要求成立数字音视频编解码技术标准工作组(AVS),解决音视频产品的知识产权问题,高文任组长。

    对黄铁军来说,视频编码是个“从未涉足过的领域”。但由于简报写得好,博士后刚出站的黄铁军就被任命为AVS秘书长。他自嘲道,自己是“被逼上梁山”的秘书长。

    “既然是国家需要,自己接下了任务,就得好好干。”黄铁军说,此后他的研究重心逐渐向视频编码方向倾斜。

    AVS工作组成立后,经历过一段艰难岁月。黄铁军说,2004年工作组制定的视频编解码技术标准送审,但直至两年后才发布。“因为产业化本身涉及芯片、软件、产品设备和端到端系统等众多关键环节,只有研制出符合标准的芯片,标准才能通过。”他说。

    矛盾的是,如果标准不发布,企业就不愿研发芯片。无奈之下,工作组最终决定自己组织芯片设计团队。15年来,这支团队伴随着AVS标准制定,研发出了一系列视频编码芯片。

    搞研究不走寻常路

    参与AVS工作的同时,黄铁军也开始了从图像识别转战视频编码的旅程。正因是“半路出家”,他的研究视角和长期在此领域研究的人不太一样。

    比如,黄铁军巧妙地捕捉到,监控视频具有背景相对不变的特点,提出了基于场景建模的视频编码方法。仅靠这项技术,就把视频编码的效率提高了1倍。“采用现行标准,全国3千万个摄像头采集的视频,若保质保量存储3个月的内容就需要2千亿元。用上这项技术后,等量的内容存储成本可降至500亿元。”他说。

    云计算改变了信息的应用和服务模式,但大量摄像头拍摄的视频很难传至云端,于是黄铁军又“脑洞大开”。




上一篇:Nature:重大进展!构建出人类肝脏的完整细胞图谱,鉴定出新的肝细胞亚型
下一篇:诺如病毒上热搜,据报道北京出现166起疫情,益