【媒开言笑】AI识方言,传承新出路

发布时间:2020-09-16浏览次数:241


语言是文化的载体,因此方言是地方文化里一个非常重要的标识。家乡的方言在默默地塑造着我们的表达能力,影响着我们的思维方式,也拉进了家乡人们间的距离。2015年习近平主席赴陕西考察调研时,还用陕北方言向乡亲们亲切介绍妻子彭丽媛说:“这是我的婆姨(陕北方言,意为妻子)。” 不过随着普通话的逐渐普及,方言的生存表现得岌岌可危。为了探索方言传承的新出路,了解目前方言语音识别技术发展状,2020“厦门国际银行”厦门大学经济学院、王亚南经济研究院“媒开言笑”实践队前往厦门天聪软件有限公司参观采访,探讨方言的生存现状和传承出路。

830日上午十点,天气晴朗,阳光明媚,实践队队员们来到了位于厦门软件园内的天聪软件有限公司,得到公司雷经理的热情接待。厦门天聪软件有限公司是一家成立于2005年的高新技术企业,获得过“中国通信与信息化应用银奖”等多项荣誉,专业从事声纹识别、语音技术和人工智能软件的研发与销售。目前,该公司与厦门大学人文学院助理教授许彬彬老师团队正在进行闽南方言识别系统的开发合作。



实践队队员们与雷经理对方言的现状与传承这方面进行了深入交流。雷经理耐心解答了队员们关于闽南语识别系统的一些问题。实践队中有个会讲闽南语的队员,体验了这一款小程序后发现,它在将闽南语转变成普通话时基本能表达出正确意思。雷经理强调,闽南语识别系统的重难点在于语料的采集,他们需要通过实地采集、软件采集等方式采集大量语料整理成数据庞大的词典。由于各种地方的闽南语方言还是有差别的,比如漳州和泉州的闽南语发音就不太一样,因此采集的语料时会尽量涵盖不同地区的不同口音。在做闽南语软件程序时,他们在厦漳泉地区、台湾、新加坡等地采集了大量语料,尽力涵盖不同地区的口音。而采集的对象包含不同年龄段不同地区的人,以那些会熟练讲闽南语的人作为主要采集对象。一些较为生僻的词句俗语比较难以采集,因此现在项目的工作一方面是要逐步补充完善生僻词,另一方面还要采集不同闽南语的不同发音,剔除无凭无据造出来的一些词。

谈及闽南语识别系统这个项目的初衷,雷经理表示,一方面是为了文化的传承,另一方面是由于市场的需求。每一代人都不希望文化传承到自己这一代时就终止了,但是随着时代发展,方言传承面临重重挑战。因此政府会有意识地扶持一些方言类的项目,让文化继续传承下去,这成为了市场需求的一部分。另外在闽南语比较集中的一些地方,如闽南或者海外像新加坡、菲律宾这一带地区,许多人对闽南语识别和合成这一方面很有兴趣。对于方言识别这一方面项目的现状和前景,雷经理表示,这先是从01的一个过程,接着是从1之后不断优化的过程。由于做方言这方面工作的人比较少,目前还缺少相关的人员之间的沟通交流,学术上的研究探讨。但是总要有人往前迈出一步,走过荆棘,走出一条康庄大道。



经过这一次对天聪软件公司的参访,实践队队员们对方言AI识别这一方面内容有了进一步的了解,并更加坚定了保护方言,传承文化的信念和决心。相信在政府,企业,社会各界人士的共同努力下,方言能够重焕勃勃生机。


/焦红平、方文睿、黄佳铭

/焦红平