多文种在线互译服务体系示范应用 | |||
内蒙古自治区呼和浩特市新城区新华东街**号教育出版大厦 | * | ||
内蒙古出版集团有限责任公司 | 双龙 | ||
萨日朗 | *********** | ||
**** | * | ||
新建 | |||
*、建设内容 本项目主要基于出版集团及所辖各出版社、数字传媒公司掌握的多文种纸质书刊、数字资源和各信息技术公司、合作伙伴在蒙古文书刊的数字化、标准化、全媒体发布研发方面的综合技术优势以及研究开发的基于翻译记忆库技术的汉蒙(教育资源)在线机助翻译平台研发成果,定制研发以蒙古文为核心的蒙-汉-西里尔-英*个文种互译功能的多文种网络互译转写平台,面向区内外教育、科技、文化、新闻出版广电行业的专业翻译人员提供专业化、高效率、低成本的多文种之间的多向在线互译、转写平台开发与运维服务,并通过***服务模式向第*方平台和国内外广大民众提供蒙-汉-西里尔-英文之间的多文种互译转写网络服务。 本项目主要基于出版集团及所辖各出版社、信息技术公司掌握的优势资源,在蒙古文书刊的电子化、数字化方面在全球范围的绝对优势,引领蒙古文信息技术高端应用研发与推广普及的发展方向,研究开发基于云计算、大数据、人工智能技术的多文种网络互译平台,面向各级各类机构和专业翻译人员提供专业化、高效率、低成本的汉蒙/蒙汉、西里尔蒙/蒙西里尔、英蒙/蒙英、汉英/英汉等多文种之间的双向互译、转写网络服务,面向国内外广大民众提供蒙汉西(西里尔)英之间的多文种、跨文种互译转写网络服务。鉴于蒙古文数字资源领域没有大数据的现状,本项目计划分*期完成:首先从汉蒙/蒙汉双向机助翻译系统研发和教科文行业汉蒙/蒙汉双语对齐语料资源建设入手,解决区内外急需的汉蒙/蒙汉在线翻译服务问题,然后逐步扩展并解决其他语种、其他行业的专业互译服务。通过专业化的多文种互译服务平台和语料资源的不断扩充建设和“共建共享”式服务,逐步过渡到基于人工智能技术的多文种机器翻译层面,面向国内外各行各业和广大民众提供多文种、跨文种互译网络服务。 *、规模(具体内容及数量) 技术平台及辅助工具研发 *.*.* 多文种在线互译与转写综合服务平台 基于现有的汉蒙(从汉文到蒙古文)在线机助翻译平台的基础上,研发两个系统及其服务接口: *) 多文种在线互译系统,采用包括在线机助翻译与机器翻译两个技术基础混合翻译机制的蒙汉西英多文种在线互译系统。能够通过翻译记忆库技术、模糊匹配算法实现蒙古文-汉文、蒙古文-英文、汉文-英文文本的在线多向翻译目标。 *) 蒙古文-西里尔文在线转写系统,能够利用蒙古文、西里尔文之间的海量对齐词典和构词法、缩略语对应关系,实现对蒙古文、西里尔文进行在线双向转写目标。 *) 多向互译与转写网络服务接口,能够向第*方系统提供通过***架构***服务技术的蒙汉西英多向互译与转写网络服务。 *.*.* 多文种对齐语料资源加工工具集 *) 蒙古文印刷体***识别工具,能够通过蒙古文印刷体文字(图片)的光学识别技术,实现蒙古文存量书刊文献的扫描识别输入目标。 *) 蒙古文脱机手写识别输入法,能够通过蒙古文脱机手写识别输入技术和**万条手写词语实现蒙古文内容的手写输入目标。 *) 蒙古文联机手写识别输入法,能够通过蒙古文联机手写识别输入技术和**万条手写词语实现蒙古文内容的手写输入目标。 *) 蒙古文语音识别输入法,能够通过蒙古语语音识别技术和***小时自然语音资源实现蒙古文早期文献内容的朗读输入目标。 *) 西里尔文智能输入法,能够通过西里尔文**万条联想词典技术实现西里尔文内容的智能联想输入目标。 *.* 多文种对齐语料资源建设 *.*.* 多文种对齐句语料资源 在目前正在加工的蒙古文-汉文对齐句***万条基础上,加工建设蒙古文-汉文对齐句***万条,蒙古文-西里尔文、蒙古文-英文对齐句各****万条。 *.*.* 多文种对齐术语语料资源 在目前正在加工的蒙古文-汉文对齐术语**万条基础上,加工建设蒙古文-汉文、蒙古文-西里尔文、蒙古文-英文对齐术语各***万条。 *.* 教科文行业资源多文种在线互译服务体系建设(自筹) 计划在集团汉蒙在线教育资源机助翻译网络平台的现有技术和对齐语料资源基础上,分两步完成:第*步,通过研发创建多文种双向互译网络服务平台和蒙古文、汉文、西里尔文、英文对齐语料资源,解决教育、科技、文化行业蒙古文-汉文、蒙古文-西里尔文、蒙古文-英文多向互译问题;第*步,通过专业化的多文种互译服务平台和科技、文化领域多文种(蒙古文、汉文、西里尔文、英文)对齐语料资源的不断扩充建设和“共建共享”式服务,满足教育、科技科普、经贸金融、文化传媒行业的跨文种、跨国界专业互译服务需求。为逐步过渡到基于人工智能、大数据技术的多文种机器翻译层面奠定基础。 | |||
有环保措施: 本项目是软件研发累的信息系统项目,需要在云计算环境独享虚拟服务器*台(刀片)、存储设备*套,共享网络设备*套等关键负载硬件环境,将会产生较低的噪音。通过云计算基地机房隔音环境,解决噪声对周围环境的影响问题。 |
|||
|