您的位置: 首页>民族语言文字>民族语文使用情况 > 详细页面

助力民族语文信息化跟上时代步伐 —— 记中国民族语文翻译局信息处副处长何燕龙

来源:中国民族报 作者:樊焓希 发布时间:2019年10月30日 浏览量:

何燕龙(右三)和同事探讨工作。 受访者供图

  何燕龙,中国民族语文翻译局信息处副处长、高级工程师,民族语文软件研发基地负责人。入选国家民委领军人才支持计划、创新团队支持计划,获保密科学技术奖二等奖、钱伟长中文信息处理科学技术二等奖。

  近年来,我国在国际自然语言处理领域的表现较为活跃,科研成果数量也在逼近美国,但就少数民族语文的信息化而言,还处在较低水平。

  “我从事了26年的计算机应用与民族语文软件研发工作。”何燕龙说,“民族语文翻译软件助力民族工作、服务国家大局的目标,始终引领着我工作的方向,并给予了我坚守这份事业的动力和信心。”

  搭建民族语文翻译的桥梁

  1987年,何燕龙以优异的成绩考入北京信息工程学院计算机系(现北京信息科技大学)。1991年毕业后,他被分配到航天部第一研究院101所,从事运载火箭自动控制工作。1993年7月,何燕龙调入中国民族语文翻译局,从事计算机应用与民族语文软件研发工作。

  调入中国民族语文翻译局工作后,何燕龙每年都会参加全国两会民族语文翻译组的工作。“因为要统一集中封闭办公,那会儿我的同事们每次都要背着大本小本的辞书,摆在楼道里,以便查阅。”何燕龙说,当时他就想,如果能研发出一款软件,可以让大家不背这些书,只带着软件上会,那该多方便。

  如今,20多年过去了,何燕龙实现了这个愿望。“我的同事们早就不背字典、辞典上会了。我们最新研发的翻译软件,在党的十九大和近年来的全国两会民族语文翻译工作中都发挥了重要作用。”何燕龙说。

  上世纪90年代末,民族语文信息化工作进入词处理阶段。该阶段的主要工作是构建语料库,搭建和训练自动加工处理模型。

  2000年前后,何燕龙出版了著作《北大方正书版实用手册》和《北大方正飞腾实用手册》。2007年左右,他开始研究民族语文输入法和校对软件,随后带领翻译局信息化团队,先后完成了多种民族语文翻译辅助软件的研发,其中包括蒙古、藏、维吾尔、哈萨克、朝鲜、彝、壮7种民族文电子词典及辅助翻译软件、校对软件,蒙古文正音正形、哈萨克文与斯拉夫文、朝鲜文与韩文等6款编码转换软件,汉文与7种民族语文对照查询系统,以及Windows7软件等,为今后的机器翻译打下了基础。

  2010年左右,民族语文信息化工作进入智能化产品及应用阶段,特别是深度神经网络技术的成熟与应用。这个阶段,民族语文翻译局建立了国内首个民族文多语种智能翻译及语音系统平台,被国家民委列为“民族语文软件研发基地”。

  作为信息化平台的工程师和研发基地的负责人,2013年以来,何燕龙主持研发了民汉对话通、语音转写通、民汉智能语音翻译软件、民汉实时翻译软件、民族文照相翻译软件、民族文手机输入法软件、民族文电子词典和校对软件等50多款民族文应用软件。

  2012年、2018年,团队研发成果“彝文、壮文电子词典及辅助翻译软件”和“维汉智能翻译系统及其应用”分别荣获该年度钱伟长中文信息处理科学技术二等奖;2018年,“专用计算机民族语言应用”项目荣获国家保密局科学技术奖二等奖,“藏汉智能语音翻译系统”和“藏汉语音转写通”荣获中国网络社会组织联合会应用工具类优秀作品奖。

  同时,在仅3年多的时间里,何燕龙还带领专业数据整理团队,积累了5000多万句多语种平行语料和上万小时的语音数据。在研发过程中,他们克服重重困难,开拓探索出了翻译局自有的语料收集方式。

  2019年,7个语种语音识别软件升级后,蒙古文语音数据从1200小时上升到3000小时,安多藏文从1500小时上升为2400小时,康巴藏文从1200小时上升到2000个小时,维吾尔文从2500个小时上升到4000个小时。此外,新收录哈萨克文1000个小时,朝鲜文600个小时,彝文840个小时,壮文400个小时。

  这些数据实现了民族语文信息化工作的飞跃,“翻译局信息化工作能有今天的成绩,要感恩中央对民族语文信息化工作的高度重视,也离不开各语文室同事们的大力支持和协助。”何燕龙说。

  做好民族语文信息化工作是爱好

  何燕龙认为,完美的研发没有捷径,他关注所有的细节。“民族语文信息化软件的研发过程要求非常严格,不允许有任何的偏差,甚至小的瑕疵。”何燕龙说。新入职的小伙子们,经常会因为网线接口不牢固而被批评。在年轻人看来,有些松动的接口一样可以使用,并不影响效果,但何燕龙却要求尽善尽美。

  身边的少数民族同事曾这样问何燕龙:“您是汉族,不会我们的母语,但您做起民族语文信息化研究,一点不逊色于我们本民族的专家学者,您是怎么做到的?”

  “能够做好民族语文信息化工作,不在于我是不是少数民族,这是我的爱好。做爱好的事,很幸福!”何燕龙这样回答。

  当今世界,大数据、人工智能等现代信息技术不断取得突破,数字经济蓬勃发展。近年来,中国民族语文翻译局积极适应民族工作和信息化时代新形势,加大了民族语文翻译应用研究和基础工程建设,在民族语文信息化建设方面取得了突破性成果,并已应用于国家安全、司法审判、新闻广播、扶贫驻村、双语学习与国家通用语言推广等领域,为国家需要和民族地区实际需求提供了及时有力的支持。

  “民族语文信息化建设前景广阔,我为自己能够从事这项事业感到荣幸。”何燕龙说,“同时我们也要清醒地认识到,民族语文信息化要跟上时代步伐,从跟跑实现并跑,再到领跑,还有很长的路要走,这需要我们加倍努力和更勤奋地付出。”

  作者:樊焓希

  资料来源:中国民族报

上一篇:
下一篇: